OpenAI GPT-5.6发布反杀Claude Opus 4.8,编程能力王座再易主
OpenAI宣布发布GPT-5.6,直接回应Claude Opus 4.8在AGI Ranker编程排行榜上的领先。过去三个月编程能力王座三次易主,Sam Altman亲自站台预热,OpenAI内部已将夺回代码霸主地位列为最高优先级。
Daily AI Brief
大模型、AI Agent、开源框架、AI 编程工具和基础设施动态。
日期按北京时间发布;海外访问时可能与本地日期存在一天以内的时差。
OpenAI宣布发布GPT-5.6,直接回应Claude Opus 4.8在AGI Ranker编程排行榜上的领先。过去三个月编程能力王座三次易主,Sam Altman亲自站台预热,OpenAI内部已将夺回代码霸主地位列为最高优先级。
DeepSeek计划在首轮融资中从腾讯、宁德时代等投资方处筹集约500亿元人民币,投后估值预计达3500亿至4000亿元。创始人梁文峰将出资200亿元,腾讯和宁德时代分别拟投资100亿元和50亿元,凸显中国打造全链条AI产业的决心。
腾讯正在加速研发微信内嵌AI智能体,产品已进入原型测试阶段,定位为最高战略优先级。用户可通过右滑主界面调出对话窗口,自然语言指令调用小程序完成打车、外卖、订票、支付等任务,最快本月启动合规流程。
MiniMax推出首个开源推理模型MiniMax-M1,具有业内最高的100万token上下文输入能力,在部分任务中算力使用不到DeepSeek-R1的一半。该模型保持不限量免费使用,并以业内最低价格提供API。
Recent Signals
Meta宣布在收购WhatsApp 11年后正式开放广告投放功能,状态广告将在未来几个月全球推出。同时,Meta自研AI ASIC服务器项目预计2026年迎来关键突破,计划推出100万至150万片高规格AI芯片,挑战英伟达市场地位。
打开这一期宇树科技在GitHub上开源H1和G1两款人形机器人的数据集、强化学习代码和硬件规格。截至2025年11月,宇树超过40%的软件栈已公开可用,推动学术研究人员之间的交流合作和中国人形机器人产业发展。
打开这一期Google DeepMind发布Gemini 2.5 Pro Ultra版本,重点增强自主智能体(Agentic)执行能力,支持跨应用任务编排和深度研究模式。模型在GAIA基准测试中得分突破85%,并集成至Google Workspace套件实现端到端自动化工作流。
打开这一期NVIDIA在COMPUTEX 2026期间发布Blackwell Ultra GPU,作为B200的升级版本,专为大规模AI推理和Agent工作负载优化。单卡INT8推理吞吐量较前代提升4倍,支持1万亿参数模型单节点部署。配套推出NVIDIA Inference Microservices(NIM)2.0,简化企业模型部署流程。主要云厂商已开放预约。
打开这一期Archive
中文版与英文版采用同一套首页阅读结构,优先展示当天最重要的大模型、智能体、开源框架和 AI 工具动态。 完整一期页面会保留更详细的来源、上下期导航和阅读统计。