4 Planner 与 Executor:把长任务拆成可控执行循环
系列进度
Harness Engineering 从零教程 · 第 4 / 5 篇
Goal 和 State 解决了主线与进度,接下来要解决执行。一个长任务不能只靠模型自由发挥,最好拆成 Planner 和 Executor 两个角色。Planner 负责把目标拆成步骤,Executor 负责完成当前一步。
这不是为了让系统变复杂,而是为了降低漂移概率。Planner 如果也去执行,很容易边想边跑;Executor 如果也去重新定义目标,很容易越做越偏。职责分开以后,每一步更容易检查。
优秀 Agent 的基本循环通常是:Goal → Planner → Task → Executor → Tool → Observation → State Update → Re-plan。看起来像多了一圈,实际是在给长任务加护栏。
1. Planner 只负责拆路
Planner 的输出应该是可执行步骤,不是宏大口号。比如“调研资料”太大,可以拆成“打开官方文档并提取产品定位”“搜索三条社区评价”“整理争议点”。
每个步骤最好包含输入、动作、产出和验收标准。没有验收标准的步骤,执行器做完也很难判断是否真的完成。
2. Executor 只负责当前一步
Executor 的约束越清楚越好:只处理 current_task,调用必要工具,返回观察结果和产物,不擅自扩大范围,不偷偷修改 Goal。
比如当前任务是“提取官方文档里的功能点”,Executor 就不应该顺手写完整文章;它应该返回功能点、来源、未确认问题,然后让 State 和 Planner 决定下一步。
3. 工具调用要进入观察结果
Agent 不是只靠想,它会搜索网页、读文件、跑命令、打开浏览器。每次工具调用之后,都应该形成 Observation,再由 Harness 更新 State。
不要让工具输出直接淹没下一轮提示。工具输出可能很长,应该先提取关键事实、错误、文件路径、截图结论和下一步建议。
4. 什么时候需要 Re-plan
计划不是写完就永远不动。遇到阻塞、发现前提错误、用户改变要求、工具失败、产物不符合验收标准时,都要重新规划。
但 Re-plan 也不能太频繁。每执行一步就完全推翻计划,Agent 会陷入反复思考。更好的节奏是:小步骤执行,关键检查点重排。
5. 本节练习
给“写一篇工具测评文章”设计一个 6 步 Planner 输出:收集资料、确认角度、列大纲、写正文、插图、复核。然后给每一步加一个验收标准。
下一节我们讲 Checkpoint、Memory 和 Re-plan。它们负责在任务变长之后,把上下文重新整理,让 Agent 每隔几步找回一次主线。
相关教程
相关入口
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
相关内容



