MIT Tech Review：大模型陷入「群体思维」困境，一家初创公司试图打破僵局

MIT Technology Review于7月1日发表特写文章，揭示了当前大语言模型（LLM）一个令人意外的局限：它们在开放性问题上的回答惊人地趋同。文章作者Michelle Kim通过一个简单实验展示了这一现象——要求ChatGPT、Claude和Gemini「给我一个1到10之间的随机数字」，几乎所有模型都会给出7。继续追问则会依次得到3或4，以及8或9。

这种高度可预测性在日常对话中可能不易察觉，但对于需要创意发散或探索性思考的使用场景来说，它构成了深层限制。文章认为，模型输出的模式化背后是训练数据分布、优化目标和架构设计的共同结果，而非简单的随机性缺失。

MIT Tech Review：大模型陷入「群体思维」困境，一家初创公司试图打破僵局 — 图源: technologyreview.com

报道指出，这种趋同现象在学术研究和代码生成等封闭式任务中影响不大，但当用户希望从AI助手那里获得新鲜视角或意外灵感时，模型的「群体思维」就成了真正的障碍。同一个问题如果让不同模型回答，得到的答案往往大同小异，这与人们期望AI能带来的多样性相去甚远。

MIT Technology Review在文章中提到，一家初创公司正在这一领域探索解决方案。该公司认为问题的核心在于当前模型训练方法过度强调了「最可能」的答案，而牺牲了输出的多样性。通过改进训练策略或引入新的架构设计，这家公司试图让模型在保持合理性的同时，产生更丰富多样的回应。

虽然报道未公开这家初创公司的具体名称和技术细节，但它的定位清晰了然：在模型准确性与创造力之间找到新的平衡点。这一方向也折射出行业对「AI创造力」这一概念的重新审视——模型的「好用」不应仅仅体现在它能给出正确回答，还应包括它能否带来意料之外的启发。

对于整个AI行业而言，这篇报道提出了一个值得深思的问题：当越来越多的知识工作者依赖大模型进行头脑风暴、内容创作和策略规划时，模型的输出同质化是否会反过来限制人类的思维方式？如果所有人所使用的AI助手都倾向于提供相似的答案，创新的多样性可能会受到隐形侵蚀。

后续值得关注的是，这家初创公司的技术方案是否会开源，以及主流大模型厂商（如OpenAI、Anthropic、Google）是否会针对输出多样性推出专门的改进。在AI日益普及的今天，确保「AI的多样性」可能和确保「AI的准确性」同样重要。