🌟 今日AI快讯
Daily Issue
2026-06-15 AI 国内外新闻
日期按北京时间发布,海外访问时可能与本地日期存在时差。
Google DeepMind推出Gemini 2.5 Pro Ultra,强化Agentic能力
Google DeepMind发布Gemini 2.5 Pro Ultra版本,重点增强自主智能体(Agentic)执行能力,支持跨应用任务编排和深度研究模式。模型在GAIA基准测试中得分突破85%,并集成至Google Workspace套件实现端到端自动化工作流。
NVIDIA发布H100后继者Blackwell Ultra,推理性能提升4倍
NVIDIA在COMPUTEX 2026期间发布Blackwell Ultra GPU,作为B200的升级版本,专为大规模AI推理和Agent工作负载优化。单卡INT8推理吞吐量较前代提升4倍,支持1万亿参数模型单节点部署。配套推出NVIDIA Inference Microservices(NIM)2.0,简化企业模型部署流程。主要云厂商已开放预约。
Meta发布Llama 4系列开源模型,405B参数版本开放权重
Meta正式发布Llama 4系列,包括8B、70B和405B三个参数规模,其中405B版本以开放权重形式发布。新架构采用混合专家(MoE)设计,推理时仅激活部分参数,效率提升3倍。模型支持128K上下文,多语言能力和工具调用显著增强,并配套发布Llama Guard 4安全分类器。
通义千问Qwen3发布,采用双模思考架构
阿里云发布通义千问Qwen3系列,采用'快思考-慢思考'双模架构,用户可切换即时响应与深度推理模式。旗舰版Qwen3-72B在MMLU-Pro和GPQA钻石基准上达到SOTA水平,开源版本覆盖0.5B至72B全尺寸。魔搭社区同步更新模型库和微调工具链。
Anthropic Claude 4发布,采用Constitutional AI 2.0训练框架
Anthropic发布Claude 4系列,包括Claude 4 Opus和Claude 4 Sonnet。新版本采用Constitutional AI 2.0框架,在代码生成任务上HumanEval得分达92.7%,并推出Claude Code原生IDE集成,支持多文件编辑和终端命令执行。上下文窗口维持200K tokens,新增'Extended Thinking'模式用于复杂推理。
OpenAI发布GPT-5系列模型,统一o系列与GPT系列架构
OpenAI正式发布GPT-5,将此前分离的o系列推理模型与GPT系列对话模型统一为单一架构。新模型支持原生多模态输入输出,上下文窗口扩展至256K tokens,并在数学、代码和科学推理基准上较前代提升显著。API定价结构同步调整,推理成本降低约40%。
Moonshot AI Kimi k1.6上线,长文本推理能力突破
Moonshot AI发布Kimi k1.6版本,长文本处理能力扩展至200万汉字上下文,支持整本书籍、长篇报告的深度分析与问答。模型在'大海捞针'测试中实现100%召回率,新增视频理解功能,可处理最长2小时视频内容。API价格下调30%,企业版推出私有化部署选项。
MCP协议成为智能体互操作标准,主流框架全面支持
Model Context Protocol(MCP)协议获行业广泛采纳,Anthropic联合OpenAI、Google等推动其成为智能体互操作事实标准。LangChain、LlamaIndex、Dify等主流框架最新版本原生支持MCP服务器接入,GitHub上MCP服务器实现数量突破5000个,覆盖数据库、浏览器、设计工具等类别。
DeepSeek发布V3.5版本,推理效率与代码能力双提升
DeepSeek更新至V3.5版本,在保持开源权重的同时,推理效率较前代提升50%,FP8量化支持降低显存占用。代码生成能力显著增强,LiveCodeBench得分进入第一梯队。模型支持Function Calling和JSON Schema输出,企业API服务扩展至欧洲和东南亚节点。
字节豆包发布Seed-TTS 2.0与视频生成模型Seaweed 2.0
字节跳动豆包大模型家族更新,Seed-TTS 2.0实现超拟真语音合成,支持零样本语音克隆和跨语言迁移,情感表现力大幅提升。同步发布Seaweed 2.0视频生成模型,支持1080p、最长120秒视频生成,物理一致性和镜头运动控制能力增强。两项能力均集成至火山引擎API服务。