郭震 AI公众号:郭震AI

实时 AI 资讯

研究揭示:少数维基百科编辑者即可影响大模型价值观

新研究证明,名为PAW的动物福利倡导小组仅通过125次维基百科编辑,就能显著影响大语言模型在动物福利话题上的立场。

发布时间/阅读次数 0

arXiv发布了一项引人深思的研究,探讨了维基百科编辑对大型语言模型(LLM)价值观的塑造效应。研究追踪了一个名为Pro-Animal Wikipedians(PAW)的倡导小组,该小组在115个页面上进行了125次编辑,为相关条目添加了有来源的动物福利内容。

研究发现,由于维基百科几乎出现在每一个主要语言模型的训练数据集中,且其权重高于普通网页抓取文本,因此一小群志愿者的编辑工作就能显著影响LLM在动物福利等话题上的回应倾向。研究使用了基于梯度的数据归因方法来追踪这一影响。

该论文于2026年6月25日发布于arXiv cs.CL。这项发现引发了对LLM数据供应链中编辑者权力的重要关切——谁在塑造AI的价值观?

为什么重要

揭示了维基百科作为LLM训练数据源的巨大影响力,以及少数人通过编辑即可影响AI系统价值观的现实。

arXivLLM AlignmentData Contamination

来源