GLM-5.2、Kimi 2.7 Code、Claude…测了什么？

看 AI消息的实际效果、使用门槛和结果表现。

GLM-5.2、Kimi 2.7 Code、Claude…适合谁看？

适合正在选工具、做本地部署或验证 AI 工作流的人。

GLM-5.2、Kimi 2.7 Code、Claude…要注意什么？

重点看配置成本、失败点、数据边界和可替代方案。

GLM-5.2、Kimi 2.7 Code、Claude Opus 4.8 对比实测：Agent 任务谁更稳

Q: GLM-5.2、Kimi 2.7 Code、Claude…测了什么？

看 AI消息 的实际效果、使用门槛和结果表现。

你好，我是郭震！

最近GLM-5.2，Kimi 2.7 Code，两个新模型发布，

与当前最强模型Claude Opus 4.8，

对比实测下，感兴趣的可以看下。

1 新模型介绍

GLM5.2，在以下两个数据集，都仅次于 Opus 4.8：

GLM-5.2 在长程软件工程基准中接近 Claude Opus 4.8

** FrontierSWE，这个数据集最有意思，**

** 它主要看模型能不能在真实代码工程里完成非常难、开放式、长时间的技术任务，**

** 很多任务需要跑** 20 小时，****

**** 所以它真实考察了模型长程任务处理能力，这也是我最喜欢的，因为开发软件就是需要这样的能力强。****

**** Kimi 2.7 Code，也在最新发布，它同样把考察长程任务作为第一优先级，就是左一柱状图：****

Kimi 2.7 Code 在长程任务基准中的能力展示

**** 看到它同样接近Opus 4.8 xhigh模式****

模型胜任长程任务、开发复杂项目，看来都是大模型迭代的方向。

接下来咱们就重点测试它们三个处理相对复杂任务能力，到底实际使用表现如何。

接下来直接开始测评

2 对比实测

测评思路：使用一个典型的中小型Agent任务，测评大家普遍关心的智能体能力。

然后选择Gemini-3.1-Pro为裁判，根据裁判的打分，给出客观的结果评估。

Agent任务，提示词如下：

开发一个单文件 HTML 网页，实现 Excel 数据分析与可视化工具。支持上传 .xlsx/.xls，使用 SheetJS 解析 Excel，读取多 Sheet，并展示可搜索、分页、横向滚动的数据表格。自动识别字段类型、统计行列数、缺失值、唯一值、最大/最小/平均/求和，并生成中文数据分析报告。使用 ECharts 自动生成柱状图、折线图、饼图、散点图等可视化，并支持用户选择 X/Y 字段和图表类型自定义生成。只输出完整可运行的单文件 HTML 代码，不要解释，不要 Markdown，不依赖后端。

先发给GLM-5.2:

向 GLM-5.2 发送 Excel 数据分析网页生成提示词

保存为html文件，并打开：

GLM-5.2 生成的单文件 Excel 分析 HTML 页面

导入一个Excel文件，自动分页展示：

GLM-5.2 输出 Excel 上传和分页表格预览

下面是数据统计预览：

GLM-5.2 生成字段统计和缺失值分析

生成的部分图表：

GLM-5.2 生成的 Excel 可视化图表示例

GLM-5.2 数据分析页面中的图表结果

同样任务发给 Opus 4.8，打开html文件：

Claude Opus 4.8 生成的 Excel 分析 HTML 页面

数据预览：

Claude Opus 4.8 输出 Excel 数据预览表格

Claude Opus 4.8 输出字段统计区域

图表：

Claude Opus 4.8 生成的图表视图

Claude Opus 4.8 可视化结果中的功能缺失表现

Claude Opus 4.8 图表配置和展示区域

同样任务发给：Kimi 2.7 Code

但是Kimi官方，无最新这个模型：

Kimi 2.7 Code 暂未出现在官方网页模型列表

我选择通过API调用它：

from openai import OpenAI
import os
import re

client = OpenAI(
    api_key=os.environ["MOONSHOT_API_KEY"],
    base_url="https://api.moonshot.ai/v1",
)

prompt = """
开发一个单文件 HTML 网页，实现 Excel 数据分析与可视化工具。

支持上传 .xlsx/.xls，使用 SheetJS 解析 Excel，读取多 Sheet，并展示可搜索、分页、横向滚动的数据表格。

自动识别字段类型、统计行列数、缺失值、唯一值、最大/最小/平均/求和，并生成中文数据分析报告。

使用 ECharts 自动生成柱状图、折线图、饼图、散点图等可视化，并支持用户选择 X/Y 字段和图表类型自定义生成。

只输出完整可运行的单文件 HTML 代码，不要解释，不要 Markdown，不依赖后端。
"""

completion = client.chat.completions.create(
    model="kimi-k2.7-code",
    temperature=1,
    max_tokens=30000,
    messages=[
        {
            "role": "system",
            "content": "你是资深前端工程师。严格遵守用户要求：只输出完整 HTML 源码，不输出解释、Markdown 或代码围栏。",
        },
        {
            "role": "user",
            "content": prompt,
        },
    ],
)

html = completion.choices[0].message.content.strip()

html = re.sub(r"^```html\s*", "", html)
html = re.sub(r"^```\s*", "", html)
html = re.sub(r"\s*```$", "", html)
html = html.strip()

with open("kimi-excel-analysis-visualizer.html", "w", encoding="utf-8") as f:
    f.write(html)

print("已保存到 kimi-excel-analysis-visualizer.html")

双击打开html，显示如下：

Kimi 2.7 Code 生成的 Excel 分析 HTML 页面