最近更新:
AI 教程网络
专题导读
阅读路径
每个系列都可以先抓主线,再挑重点文章复现,最后回到问题边界和检查表。
图文优先
这套新系列讲 Harness Engineering。这里说的 Harness,不是某个 CI/CD 品牌,而是 Agent Harness Engineering:把大模型放进一个外部编排系统里,让系统负责目标、状态、计划、工具、检查点和记忆,模型每次只专注当前一步推理。
Agent 最容易跑偏的地方,往往不是模型不会推理,而是目标没有被牢牢保存。用户一开始说“帮我调研一个工具并写成文章”,中间搜索到很多新资料,Agent 就可能变成“继续搜索更多资料”,最后忘了交付文章。
Goal 解决“要去哪里”,State 解决“现在走到哪里”。如果没有 State,Agent 每一步都要从历史里猜进度;如果 State 太乱,Agent 会把噪音当成事实。
Goal 和 State 解决了主线与进度,接下来要解决执行。一个长任务不能只靠模型自由发挥,最好拆成 Planner 和 Executor 两个角色。Planner 负责把目标拆成步骤,Executor 负责完成当前一步。
如果一个 Agent 要执行几十步,光有 Goal、State 和 Planner 还不够。上下文会越来越长,工具观察会越来越多,中间决策也会越来越散。这时就需要 Checkpoint 和 Memory。