郭震 AI公众号:郭震AI

4 Planner 与 Executor:把长任务拆成可控执行循环

发布日期:

分类: Harness Engineering

预计阅读: 3 分钟

阅读次数: 0

预计阅读3 分钟
结构重点5 个
图文要点6 张
正文规模1.1k 字
Planner Executor 工具循环图查看大图
Planner Executor 工具循环图

Goal 和 State 解决了主线与进度,接下来要解决执行。一个长任务不能只靠模型自由发挥,最好拆成 Planner 和 Executor 两个角色。Planner 负责把目标拆成步骤,Executor 负责完成当前一步。

这不是为了让系统变复杂,而是为了降低漂移概率。Planner 如果也去执行,很容易边想边跑;Executor 如果也去重新定义目标,很容易越做越偏。职责分开以后,每一步更容易检查。

优秀 Agent 的基本循环通常是:Goal → Planner → Task → Executor → Tool → Observation → State Update → Re-plan。看起来像多了一圈,实际是在给长任务加护栏。

1. Planner 只负责拆路

Planner 任务契约拆解图查看大图
Planner 任务契约拆解图

Planner 的输出应该是可执行步骤,不是宏大口号。比如“调研资料”太大,可以拆成“打开官方文档并提取产品定位”“搜索三条社区评价”“整理争议点”。

每个步骤最好包含输入、动作、产出和验收标准。没有验收标准的步骤,执行器做完也很难判断是否真的完成。

2. Executor 只负责当前一步

Executor 当前一步边界卡查看大图
Executor 当前一步边界卡

Executor 的约束越清楚越好:只处理 current_task,调用必要工具,返回观察结果和产物,不擅自扩大范围,不偷偷修改 Goal。

比如当前任务是“提取官方文档里的功能点”,Executor 就不应该顺手写完整文章;它应该返回功能点、来源、未确认问题,然后让 State 和 Planner 决定下一步。

3. 工具调用要进入观察结果

Agent 不是只靠想,它会搜索网页、读文件、跑命令、打开浏览器。每次工具调用之后,都应该形成 Observation,再由 Harness 更新 State。

不要让工具输出直接淹没下一轮提示。工具输出可能很长,应该先提取关键事实、错误、文件路径、截图结论和下一步建议。

4. 什么时候需要 Re-plan

Planner Executor 阅读地图卡查看大图
Planner Executor 阅读地图卡

计划不是写完就永远不动。遇到阻塞、发现前提错误、用户改变要求、工具失败、产物不符合验收标准时,都要重新规划。

但 Re-plan 也不能太频繁。每执行一步就完全推翻计划,Agent 会陷入反复思考。更好的节奏是:小步骤执行,关键检查点重排。

5. 本节练习

Planner Executor 应用检查卡查看大图
Planner Executor 应用检查卡

给“写一篇工具测评文章”设计一个 6 步 Planner 输出:收集资料、确认角度、列大纲、写正文、插图、复核。然后给每一步加一个验收标准。

下一节我们讲 Checkpoint、Memory 和 Re-plan。它们负责在任务变长之后,把上下文重新整理,让 Agent 每隔几步找回一次主线。

Planner Executor 应用复盘卡查看大图
Planner Executor 应用复盘卡

相关教程

相关入口

AI 教程总索引

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

相关内容

相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...