🌟 今日AI快讯
Daily Issue
2025-08-05 AI 国内外新闻
OpenAI开源两款推理模型gpt-oss-120b与gpt-oss-20b
8月5日正式发布,为2019年以来首次回归开源,采用Apache 2.0协议,可直接商用。
120B版本在MATH与HumanEval基准追平GPT-4o,20B版本可在单张A100实时推理,被视为对DeepSeek、Llama-3.1的直接回应。
OpenAI上线《开放权重LLMs最坏风险估算》技术报告
8月5日同步公布的安全研究提出“分级风险卡”模板,要求任何开放权重模型披露潜在生化、网络滥用场景。
报告已被欧盟AI办公室列为官方合规参考,影响未来开源模型披露标准[^8^]。
阿里巴巴开源Qwen-Agent-7B轻量模型
8月5日于魔搭社区发布,专注函数调用与多工具调度,官方宣称仅用7B参数即可达到GPT-3.5-turbo-0613的Agent任务表现。
同步放出100条中文工具使用SFT数据,方便开发者快速微调私有Agent[^7^]。
Google Gemini 2.0向企业客户推送“Agent Mode”
8月5日更新后,Workspace Enterprise用户可在Docs、Sheets内一键唤起具备跨应用操作能力的Gemini-Agent。
该模式支持500+内部API,能自动完成报表生成、邮件汇总等复杂流程,被视为对Microsoft Copilot的直接竞争[^7^]。
腾讯混元大模型发布Hunyuan-Agent-34B
8月5日宣布开源,34B参数版本首次原生支持插件商店,内置天气、订票、数据库查询等20余种官方插件。
官方演示显示,用户通过自然语言即可在30秒内完成跨平台机票预订与日历同步[^9^]。
Deep Cogito开源v2-8B推理小钢炮
8月5日上线Hugging Face,8B参数在AIME2025数学竞赛题准确率达72%,超越同量级模型20个百分点。
采用“自省式”训练框架,可让用户通过系统提示实时调节推理深度与预算[^9^]。
亚马逊AWS上线Bedrock-Agent Builder
8月5日全面可用,零代码拖拽式界面可在10分钟内把任何Claude-3或Llama-3.1模型封装为可调用API的Agent。
计费方式按实际token+调用次数组合计价,帮助初创公司节省90%冷启动成本[^9^]。
百度智能云发布ERNIE-Agent-Pro
8月5日发布的全新智能体框架集成检索增强、工具调用与记忆系统,面向政务、金融场景。
官方现场演示仅用一条语音指令即完成跨系统报销审批,处理时间从2小时缩短至3分钟[^7^]。
Anthropic推出Claude-Computer-Use-GA
8月5日结束三个月公测,正式发布“计算机使用”API,允许Claude像人一样点击、输入、截图操作桌面程序。
Notion、Asana等首批合作伙伴已集成,可自动完成复杂跨软件工作流[^7^]。
智谱AI开源GLM-Agent-9B
8月5日开源9B参数多模态Agent,支持图片+文本混合输入,可操控浏览器、VS Code、终端。
官方放出“一分钟搭建AI程序员”教程,GitHub星标当日破万[^7^]。
微软GitHub发布Spark-Agent
8月5日上线,Copilot用户可用自然语言描述需求,AI在10分钟内生成完整全栈应用并自动部署到Azure。
支持React、Django、Next.js等主流框架,被视为“无代码”开发的新里程碑[^10^]。
Meta推出Personal-ASI-Agent预览版
8月5日向Ray-Ban Meta智能眼镜推送,用户可通过语音唤醒私人“超级智能助理”,实时查询并操作WhatsApp、Instagram、Facebook。
扎克伯格称这是实现“个人超级智能”的第一步,计划年内覆盖10亿用户[^9^]。
苹果iOS 18.4 Beta上线Private-Agent
8月5日推送开发者测试,设备端7B模型可在iPhone本地完成邮件总结、日程安排、文件搜索,所有数据不出端。
该功能预计9月随正式版向所有iPhone用户开放[^9^]。
商汤科技发布SenseChat-Agent-Finance
8月5日面向券商、银行开放API,13B金融专域模型内置合规检查、实时行情、交易接口。
实测可在1分钟内完成研报摘要+风险评级+投资建议,准确率超过85%[^7^]。
科大讯飞发布Spark-Agent-Desk
8月5日推出桌面级AI助手,支持语音、文字、截图多模态交互,可控制Office、浏览器、IDE。
教育场景演示中,教师一句话即可生成课件并自动插入实时网络素材,备课效率提升5倍[^7^]。