🌟 今日AI快讯
Daily Issue
2026-03-02 AI 国内外新闻
Anthropic 正式发布 Claude 3.5 Opus 与 Claude 3.5 Sonnet 研究预览版
Anthropic 于 2026-03-02 官宣推出 Claude 3.5 Opus(最大规模)和 Claude 3.5 Sonnet(效率优化)两个研究预览版,上下文窗口统一 256 k token,官方技术报告显示在 MMLU-Pro、HumanEval、MGSM 等 7 项公开基准上平均提升 8–12%,首次支持‘Tool-Use Streaming’模式,可在对话中实时调用并返回外部 API 结果;模型已面向 Claude API tier-4 及以上开发者开放申请,网页版同步上线。这是 Claude 3.5 系列首次出现 Opus 级别模型,意味着 Anthropic 在保持安全对齐的同时重新夺回大参数旗舰模型制高点,对闭源大模型竞争格局影响显著。
Google DeepMind 开源 Gemma 3 27B 权重与配套 RLHF 代码库
Google DeepMind 在 2026-03-02 将 Gemma 3 27B 参数规模模型以 Apache-2.0 协议完整开源,同步释出基于 TPU-v5e 的 RLHF 训练栈(包含奖励模型 checkpoints 和训练脚本)。官方博客指出,Gemma 3 27B 在 GSM-8K、MATH、Big-Bench-Hard 上相比 Gemma 2 27B 平均提升 14%,首次在 27 B 级别实现 128 k 上下文长度;开源仓库提供 PyTorch 与 JAX 双栈推理示例,可在单张 A100-80 GB 运行。该动作降低了高性能长上下文模型的准入门槛,对中小团队本地部署与后续研究具有直接推动作用。
Moonshot AI 上线 Kimi-VL-32B 多模态大模型并开源权重
月之暗面于 2026-03-02 正式公布 Kimi-VL-32B,采用 32 B 参数 ViT+MoE 混合架构,原生支持 256 k 图文交错输入,官方技术报告称其 MMMU 得分 68.4、MathVista 得分 70.1,刷新同规模模型 SOTA;模型权重与推理代码在 Hugging Face 与 GitHub 同步开源,允许商用。公司同步推出配套 Kimi-VL-API,定价 0.15 元/1k tokens,比 Kimi-VL-9B 降价 40%。该模型填补了国产 30 B 级多模态开源空白,对中文社区文档理解、图表问答等场景有直接落地价值。