实时 AI 资讯

研究揭示：少数维基百科编辑者即可影响大模型价值观

新研究证明，名为PAW的动物福利倡导小组仅通过125次维基百科编辑，就能显著影响大语言模型在动物福利话题上的立场。

发布时间2026年6月25日 12:00（北京时间）/阅读次数 0

arXiv发布了一项引人深思的研究，探讨了维基百科编辑对大型语言模型（LLM）价值观的塑造效应。研究追踪了一个名为Pro-Animal Wikipedians（PAW）的倡导小组，该小组在115个页面上进行了125次编辑，为相关条目添加了有来源的动物福利内容。

研究发现，由于维基百科几乎出现在每一个主要语言模型的训练数据集中，且其权重高于普通网页抓取文本，因此一小群志愿者的编辑工作就能显著影响LLM在动物福利等话题上的回应倾向。研究使用了基于梯度的数据归因方法来追踪这一影响。

该论文于2026年6月25日发布于arXiv cs.CL。这项发现引发了对LLM数据供应链中编辑者权力的重要关切——谁在塑造AI的价值观？

为什么重要

揭示了维基百科作为LLM训练数据源的巨大影响力，以及少数人通过编辑即可影响AI系统价值观的现实。

arXivLLM AlignmentData Contamination

来源