OpenBMB开源MiniCPM-SALA,消费级GPU支持百万token上下文
OpenBMB发布开源模型MiniCPM-SALA,采用混合稀疏与线性注意力机制,在消费级GPU(A6000D/RTX 5090)上支持1M令牌上下文推理。该9B参数模型结合25% InfLLM-V2层与75% Lightning Attention层,在256K序列下推理速度达Qwen3-8B的3.5倍,训练成本降低约75%。模型已在Hugging Face开源并兼容SGLang框架。
Daily Archive
按日期整理大模型、AI Agent、开源框架、AI 编程工具和基础设施更新。
Recent Signals
OpenBMB发布开源模型MiniCPM-SALA,采用混合稀疏与线性注意力机制,在消费级GPU(A6000D/RTX 5090)上支持1M令牌上下文推理。该9B参数模型结合25% InfLLM-V2层与75% Lightning Attention层,在256K序列下推理速度达Qwen3-8B的3.5倍,训练成本降低约75%。模型已在Hugging Face开源并兼容SGLang框架。
智谱AI发布并开源旗舰模型GLM-5,总参数744B、激活参数40B,支持200K上下文。该模型在SWE-bench-Verified获得77.8分、Terminal Bench 2.0获得56.
Google DeepMind与Google Research发布论文,介绍Gemini Deep Think模式在数学、物理、计算机科学的研究应用。其中数学研究agent Aletheia在IMO-ProofBench Advanced测试得分最高90%,产出包括完全AI生成的算术几何特征值论文、自主解决Erdős猜想数据库4个问题。物理与计算机科学领域在18个问题中突破瓶颈,部分成果被ICLR 2026接收。相关主体为Google DeepMind。
OpenAI正式开放Codex Alpha Windows版早期访问候补名单,用户可通过官网表单申请,Linux版本也在计划中。Codex是OpenAI推出的AI编程助手,支持自然语言到代码的生成与编辑,Windows版Alpha测试预计本周末前后就绪。此举标志着OpenAI正加速将其AI编程工具从云端向本地桌面扩展。相关主体为OpenAI。
BOSS直聘Nanbeige LLM Lab发布开源模型Nanbeige4.1-3B,探索单一小型通用模型同时具备强大推理、偏好对齐与原生Agent行为。该3B模型在LiveCodeBench-Pro、IMO-Answer-Bench等推理基准表现显著,Arena-Hard-v2获73.2分,支持256K上下文与单次超10万token持续推理。
Soul旗下Soul-AILab推出开源歌声合成系统SoulX-Singer,基于4.2万小时数据训练,支持零样本生成与多语言演唱,兼容MIDI与F0调控。该系统旨在解决开源SVS在稳健性与零样本泛化能力方面的瓶颈,可在未见过的歌手音色上生成高保真歌声。代码已在GitHub开源,模型权重在Hugging Face提供。
Google旗下Stitch产品推出Ideate Agent,官方定位为项目初期的"设计伙伴"。该Agent通过深入思考、获取上下文和探索想法,在用户确定具体解决方案前提供创意支持,帮助探索各种可能性。这是Google在AI辅助设计领域的最新尝试,将Agent能力引入创意工作流程的早期阶段。相关主体为Google/Stitch。
Anthropic宣布扩大Project Glasswing项目,这是其专注于AI安全与对齐研究的重要计划。该项目旨在开发更可靠的AI系统,确保高级AI模型的行为符合人类意图。扩大后的Project Glasswing将加强在可解释性、鲁棒性和红队测试方面的投入,为Anthropic的Claude系列模型提供安全保障。相关主体为Anthropic。