郭震 AI公众号:郭震AI

实时 AI 消息

MIT Tech Review:大模型陷入「群体思维」困境,一家初创公司试图打破僵局

MIT Technology Review最新报道指出,主流大语言模型在回答开放性问题时表现出惊人的同质化倾向——例如被要求给出1到10之间的随机数字时几乎总是回答7。一家未具名初创公司正尝试通过技术手段让AI输出的多样性回归,解决这一被称作「模型群体思维」的深层问题。

发布时间

MIT Technology Review于7月1日发表特写文章,揭示了当前大语言模型(LLM)一个令人意外的局限:它们在开放性问题上的回答惊人地趋同。文章作者Michelle Kim通过一个简单实验展示了这一现象——要求ChatGPT、Claude和Gemini「给我一个1到10之间的随机数字」,几乎所有模型都会给出7。继续追问则会依次得到3或4,以及8或9。

这种高度可预测性在日常对话中可能不易察觉,但对于需要创意发散或探索性思考的使用场景来说,它构成了深层限制。文章认为,模型输出的模式化背后是训练数据分布、优化目标和架构设计的共同结果,而非简单的随机性缺失。

MIT Tech Review:大模型陷入「群体思维」困境,一家初创公司试图打破僵局
图源: technologyreview.com

报道指出,这种趋同现象在学术研究和代码生成等封闭式任务中影响不大,但当用户希望从AI助手那里获得新鲜视角或意外灵感时,模型的「群体思维」就成了真正的障碍。同一个问题如果让不同模型回答,得到的答案往往大同小异,这与人们期望AI能带来的多样性相去甚远。

MIT Technology Review在文章中提到,一家初创公司正在这一领域探索解决方案。该公司认为问题的核心在于当前模型训练方法过度强调了「最可能」的答案,而牺牲了输出的多样性。通过改进训练策略或引入新的架构设计,这家公司试图让模型在保持合理性的同时,产生更丰富多样的回应。

虽然报道未公开这家初创公司的具体名称和技术细节,但它的定位清晰了然:在模型准确性与创造力之间找到新的平衡点。这一方向也折射出行业对「AI创造力」这一概念的重新审视——模型的「好用」不应仅仅体现在它能给出正确回答,还应包括它能否带来意料之外的启发。

对于整个AI行业而言,这篇报道提出了一个值得深思的问题:当越来越多的知识工作者依赖大模型进行头脑风暴、内容创作和策略规划时,模型的输出同质化是否会反过来限制人类的思维方式?如果所有人所使用的AI助手都倾向于提供相似的答案,创新的多样性可能会受到隐形侵蚀。

后续值得关注的是,这家初创公司的技术方案是否会开源,以及主流大模型厂商(如OpenAI、Anthropic、Google)是否会针对输出多样性推出专门的改进。在AI日益普及的今天,确保「AI的多样性」可能和确保「AI的准确性」同样重要。

为什么重要

这篇报道引发业界对LLM输出同质化问题的关注,一家初创公司正在寻求解决方案,可能推动AI模型在准确性与创造力之间建立新的平衡标准。

LLMStartupAI Diversity