直接爆了!阿里AI全球贡献第三,确实可以封神了!
今天搜索个人知识库RAG相关论文时,搜到了一篇最新的文献《2025年人工智能指数报告》,以下简称“2025报告”:
此报告由斯坦福AI研究中心,著名AI科学家李飞飞领衔发布,分量很足。所以今天这篇文章,咱们就聊聊此报告传达的最重要的三个核心观点。
1 中美AI大模型性能差距
报告一共456页,其中第4页列举了5个最重要的结论。其中第4个结论如下所示,报告指出中美大模型差距已经几乎抹平:
截图来自2025报告
有什么证据可以证明这个结论?
如下折线图来自2025报告,从2024年1月到2025年2月,从图中直观的就能看到,中美大模型差距正在逐步缩小,已经非常接近:
还找到了进一步的证据,2025报告还列举了当今最重要的(Notable Models) 大模型,其中Google 7个,OpenAI 7个,阿里有6个,如下红框所示:
图中看出,入选重要模型(Notable Models)榜单,阿里AI贡献全球第三!
同时,阿里AI贡献也是在中国科技公司,排名第一!
报告显示,阿里入选的6个重要大模型分别为:Qwen-72B、Qwen1.5-72B、Qwen2-72B、Qwen2.5-72B、Qwen2.5-32B、QwQ-32B
下面来分析其中一个大模型,比如阿里最新发布的QwQ-32B模型,参数量虽只有满血版DeepSeek-R1的5%不到,但是却有满血版几乎相当的性能表现:
5%的参数获得和满血DeepSeek-R1差不多的性能,就冲这点,就叫人觉得非常惊艳!这个带来的最切实际的一个好处就是,1张A100 80GB的显卡可以运行QwQ-32B,但是满血版DeepSeek就要最少8张这样的显卡,部署成本直接降低了87.5%.
目前基于阿里开源的大模型,衍生的模型综述已经破10万,102857个,超越Llama,成为全球第一开源大模型:
基于以上三点证据,可以下结论说,中美AI发展目前已经基本是齐头并进了。
2 国产大模型不再只是口号
之前说国产大模型强,很多人会觉得没有底气,可以理解,毕竟两年前确实有差距,这点我们必须得承认。
但是自从阿里通义千问系列,DeepSeek-R1系列模型相继迎来突破后,引起了国外很多同行、圈内人士的争相复现后,越来越多的人开始正视我们大模型的技术实力。
比如,QwQ-32B在上个月发布后,引起国外网友的强烈反响,觉得这是不可思议的:
一个很好的全新推理模型:
发布后有国外的网友在本地部署了QwQ-32B模型:
32B的大模型在本地电脑上部署是完全可行的,但是DeepSeek-R1,671B参数想在本地部署,基本不现实了。
再看看最近万众期待的Llama 4,发布后就有些翻车,402B参数的模型,被指能力不如QwQ-32B,甚至被国外网友嘲讽为“愚人节玩笑”,如下图所示:
以上是国外网有对我们大模型的一些反应举例,再看如今这几天斯坦福大学发布的2025报告,进一步说明了目前世界已经逐步认可咱们大模型的实力,是他们也在说咱们强。
3 国产大模型表现
之前大家目光普遍集中在国外如GPT等,但是自阿里Qwen系列衍生模型超过开源模型Llama,春节那段时间DeepSeek-R1推理能力惊艳了AI圈后,人们开始研究国产大模型。
国产大模型正在变得越来越强,比如下面是我使用Qwen系列模型,一次生成的贪吃蛇游戏,代码一次通过。键盘上下左右箭头,控制蛇的运动方向,测试下游戏过程,录制为GIF动画,限于公众号内GIF动画帧数限制,只能展示开始前5帧:
根据键盘箭头控制蛇上下左右运动,可以正常运行,并且吃到红色色块(代表食物)后,蛇形长度加1,游戏逻辑实现没有问题。
再比如使用Qwen系列模型生成的俄罗斯方块游戏,游戏逻辑更加复杂,但是也能轻松拿捏,如下所示录制了GIF动画,限于公众号帧数限制,展示其中几帧,看到通过调整方块形状能够在出现满行时,自动消行:
再检测下游戏其他逻辑,比如判断游戏终止逻辑,等碰到竞技场的上边界后游戏结束,并自动开始新的一轮游戏:
再比如生成这样的炫酷的粒子特效:
通过上面这些案例可以看到,阿里拿下重要模型贡献度全球第三,不靠PPT,而是靠的不断提升模型表现能力,靠的是不断迭代追求更好性能。
总结一下
这篇文章总结分析了《2025年人工智能指数报告》的三个核心观点。
1)中美大模型性能差距逐步缩小,2025报告显示,两国模型已趋近持平,阿里与DeepSeek在全球重要模型中排名靠前。阿里更是在重要模型榜单上,排名全球第三!
2)QwQ-32B展现极高性价比,仅用5%参数实现媲美DeepSeek-R1的性能,显著降低部署门槛,单卡即可运行。
3)国产大模型获得全球认可,从海外开发者主动部署到模型开源数量全球第一,国产模型正以技术实力赢得尊重。
大模型差距由17.5%逐步缩至现在的0.3%,意味着在最硬核的性能维度,咱们的大模型已站到最前排,为国产大模型点赞!