今日摘要
【AI预测能力大幅低于预期】据新浪财经报道,12款主流AI模型在24项预测任务中仅正确5次,准确率低于21%。测试覆盖经济、科技和社会领域,再次凸显AI在推理与判断上的短板。
Daily Archive
大模型、AI Agent、开源框架、AI 编程工具和基础设施动态。
日期按北京时间发布;海外访问时可能与本地日期存在一天以内的时差。
【AI预测能力大幅低于预期】据新浪财经报道,12款主流AI模型在24项预测任务中仅正确5次,准确率低于21%。测试覆盖经济、科技和社会领域,再次凸显AI在推理与判断上的短板。
【高校AI人才培养加速】兰州大学正式成立人工智能学院,加强AI学科建设与人才培养,进一步扩展中国西部高校在AI领域的布局。
Recent Signals
联合早报报道,此次更新大幅提升了模型响应效率。
打开这一期旨在降低推理成本、缓解计算瓶颈,多篇媒体(南华早报、Lapaas Voice)报道。
打开这一期【模型发布与监管】 OpenAI 于 6 月 26-27 日发布 GPT-5.6 系列,包含旗舰模型 Sol、Terra 和 Luna,性能超越 Fable5 成为最强基模。但应特朗普政府要求,初期仅限经批准的“可信合作伙伴”使用,OpenAI 表示此类政府审批不应成为常态。美国政府同时寻求优先访问 GPT-5.6,导致其公开部署推迟。此外,美国要求 OpenAI 限制其最强模型访问权限,并禁止向印度等国家提供 Anthropic Mythos。
打开这一期【Anthropic 动态】 美国政府部分解除对 Anthropic Claude Mythos 5 的限制,批准超 100 家美国公司和机构(含非美籍员工)使用。美国商务部长确认已有充分安全保障。Anthropic 此前因安全漏洞撤回模型。同时,美国接近允许 Anthropic 恢复 Fable 5 模型。
打开这一期Archive
Next Reading
中文版与英文版采用同一套首页阅读结构,优先展示当天最重要的大模型、智能体、开源框架和 AI 工具动态。 完整一期页面会保留更详细的来源、上下期导航和阅读统计。