4 Planner 与 Executor：把长任务拆成可控执行循环

发布日期: 2026-06-08

分类: Harness Engineering

预计阅读: 3 分钟

Goal 和 State 解决了主线与进度，接下来要解决执行。一个长任务不能只靠模型自由发挥，最好拆成 Planner 和 Executor 两个角色。Planner 负责把目标拆成步骤，Executor 负责完成当前一步。

这不是为了让系统变复杂，而是为了降低漂移概率。Planner 如果也去执行，很容易边想边跑；Executor 如果也去重新定义目标，很容易越做越偏。职责分开以后，每一步更容易检查。

优秀 Agent 的基本循环通常是：Goal → Planner → Task → Executor → Tool → Observation → State Update → Re-plan。看起来像多了一圈，实际是在给长任务加护栏。

1. Planner 只负责拆路

Planner 的输出应该是可执行步骤，不是宏大口号。比如“调研资料”太大，可以拆成“打开官方文档并提取产品定位”“搜索三条社区评价”“整理争议点”。

每个步骤最好包含输入、动作、产出和验收标准。没有验收标准的步骤，执行器做完也很难判断是否真的完成。

Executor 的约束越清楚越好：只处理 current_task，调用必要工具，返回观察结果和产物，不擅自扩大范围，不偷偷修改 Goal。

比如当前任务是“提取官方文档里的功能点”，Executor 就不应该顺手写完整文章；它应该返回功能点、来源、未确认问题，然后让 State 和 Planner 决定下一步。

Agent 不是只靠想，它会搜索网页、读文件、跑命令、打开浏览器。每次工具调用之后，都应该形成 Observation，再由 Harness 更新 State。

不要让工具输出直接淹没下一轮提示。工具输出可能很长，应该先提取关键事实、错误、文件路径、截图结论和下一步建议。

计划不是写完就永远不动。遇到阻塞、发现前提错误、用户改变要求、工具失败、产物不符合验收标准时，都要重新规划。

但 Re-plan 也不能太频繁。每执行一步就完全推翻计划，Agent 会陷入反复思考。更好的节奏是：小步骤执行，关键检查点重排。

给“写一篇工具测评文章”设计一个 6 步 Planner 输出：收集资料、确认角度、列大纲、写正文、插图、复核。然后给每一步加一个验收标准。

下一节我们讲 Checkpoint、Memory 和 Re-plan。它们负责在任务变长之后，把上下文重新整理，让 Agent 每隔几步找回一次主线。