郭震 AI公众号:郭震AI

模型榜单

大模型榜单与模型选型

汇总大模型测评来源、中文场景选型、API 成本、本地部署和不同任务下的模型推荐。

适合需要在 ChatGPT、Claude、Gemini、DeepSeek、Qwen、Kimi、本地模型之间做选择的人。

大模型榜单模型排名AI 模型ChatGPTClaudeGeminiDeepSeekQwenKimi

Start Here

优先看的工具页和决策入口

Related Articles

站内相关文章

ai-news2026-05-311741

实测最新 Qwen3.7-Max,对比 Claude Opus 4.8,DeepSeek-V4,结果太意外了!

你好,我是郭震!

阅读文章
ai-news2025-06-262572

DeepSeek,4o,Qwen,Kimi,全被攻破!竟都回答OpenAI的CEO是Tim Cook?到底发生了什么!

首先跟大家汇报下DeepSeekMine(一个本地个人知识库管理软件)最新进度,大概在3天左右发布一个大版本,并且我们先临时下线了历史版本,想使用本地知识库的朋友,再等一下。

阅读文章
ai-news2026-03-201876

彻底爆了!阿里最新Qwen大模型,再次拿下第一!

你好,我是郭震!

阅读文章
ai-news2025-02-052399

Qwen2.5-MAX超越DeepSeek-V3,数学和编程登顶!

今天AI圈又传来一个振奋人心的好消息,国产大模型Qwen2.5-Max在权威大模型榜单登顶!

阅读文章
ai-news2026-05-052305

DeepSeek-V4接入Claude Code,实测离谱!

你好,我是郭震!

阅读文章
ai-news2026-05-211533

实测最新 Gemini-3.5,对比 DeepSeek-V4、GPT-5.5,结果出人意料!

你好,我是郭震

阅读文章
ai-news2025-07-242394

彻底爆了,最强编程模型Qwen3-Coder再次拿下第一!个人电脑部署教程来了!

你好,我是郭震

阅读文章
deepseek-study2025-02-143648

0 AI大模型零基础学习路线图

我重新看这篇路线图时,最想补的一点是学习顺序。很多人一上来就追参数、榜单和各种模型名,结果本地环境还没跑通,就已经被新名词绕晕了。我的做法是先把电脑能运行的小模型跑起来,再回头补 Transformer、RAG、微调这些概念,这样每个概念都有能落地的画面。

阅读文章
deepseek-study2025-06-052393

34 DeepSeek现在能直接生成Word、PDF、Excel了,还能一键导出,这个确实很赞!

Word、PDF、Excel 导出很实用,但验收不能只看文件能下载。标题层级、表格宽度、分页、中文字体和公式显示,都可能影响实际使用。尤其是给客户或同事看的文件,格式问题会直接影响信任。

阅读文章
deepseek-study2025-03-302367

28 DeepSeekMine个人知识库软件三个使用技巧

使用技巧最好来自真实重复场景。比如文件命名清楚、同类资料分组、问题里带上时间和范围,这些看起来小,但会直接影响检索和回答。工具越智能,资料管理越不能随意。

阅读文章
deepseek-study2025-03-262523

25 DeepSeek接入Mureka,直接生成好听的音乐,确实可以封神了!

音乐生成的门槛降低后,更要注意使用边界。试听好听只是第一步,能否导出、能否商用、歌词有没有问题、是否和已有作品过近,都需要单独确认。内容越容易生成,越要保留人工判断。

阅读文章
deepseek-study2025-02-252436

13 DeepSeek满血版, 这样部署确实可以封神了!

满血部署最容易被忽略的是恢复能力。模型跑起来只是第一步,还要知道服务挂了怎么重启、日志在哪里、端口是否被占用、显存是否被其他进程抢走。真实使用里,稳定性比一次成功截图更重要。

阅读文章
deepseek-study2025-02-132482

9 DeepSeek满血版,直接在线飞速跑,确实可以封神了!

在线满血版最吸引人的地方是省配置,但我会同时看三个指标:高峰期是否排队,长上下文是否稳定,费用是否适合高频使用。只看一次演示速度,很容易低估长期使用成本。

阅读文章
ai-news2026-05-101568

终于DeepSeek-V4 能本地部署了,普通电脑也能跑!

你好,我是郭震

阅读文章
deepseek-study2025-05-212513

33 这样做,DeepSeek终于不再胡说了!

让模型少胡说,不能只靠一句“不要编造”。更有效的是给它可靠资料、要求引用来源、找不到时允许拒答,并把高风险答案交给人复核。幻觉问题是系统设计问题,不只是提示词问题。

阅读文章
deepseek-study2025-04-272396

32 DeepSeek接入这个智能体后,能够吞下整本书了,确实可以封神了!

整本书不是把 PDF 丢进去就结束。章节结构、目录层级、引用页码和问题范围都会影响回答。我的做法是先让系统能按章节找依据,再做总结和跨章节比较。

阅读文章
deepseek-study2025-04-021983

29 DeepSeekMine-V6.1软件修复问题

修复说明最有价值的部分,是告诉用户这个问题在什么情况下出现、现在怎样确认已经解决。只写“优化体验”很难让人放心。能复现、能验证,才是对用户真正有帮助的更新记录。

阅读文章
deepseek-study2025-03-263550

26 DeepSeek+实在Agent,一句指令生成全自动流程

一句指令生成流程很吸引人,但我更关心它哪里会停下来让人确认。涉及文件、账号、支付、发布这些动作时,智能体不能一路自动执行到底。好的自动化应该省步骤,不应该省掉责任。

阅读文章

常见问题

模型榜单能直接决定选型吗?

不能。榜单只能缩小候选,最终还要结合任务、成本、速度、上下文、隐私和你自己的小样本测试。

中文用户应该优先看哪些维度?

中文表达、长文档、代码、工具调用、国内可访问性、价格和数据合规都要单独看。