什么是“幻觉执行”，为什么比回答幻觉更危险？

回答幻觉通常停留在文本层面，而执行幻觉会触发真实副作用，例如误发邮件、误改日程、误删数据。它直接影响业务系统和用户资产，所以需要在架构层面做分层与防护。

Planner-Executor 分层能解决所有错误执行吗？

不能。分层能显著降低“计划混乱导致的错误动作”，但仍需要权限边界、幂等、审计日志和人工审批配合，才能形成完整防线。

什么时候应该引入监督器（Supervisor）？

当任务跨多个工具、包含高风险副作用、或错误成本高于一次额外模型调用时，就应该引入监督器做一致性检查与策略拦截。

小团队怎么最低成本落地？

先做三件事：定义任务契约、把执行动作结构化、在高风险工具前加确认门。先解决“可控性”，再追求复杂智能。

AgentPlanner Executor架构设计可靠性工具调用

Planner-Executor 分层实战：如何系统性降低 Agent 幻觉执行

Agent 真正危险的不是“答错”，而是“做错”。本文从 Planner-Executor 分层架构出发，讲清执行幻觉的来源、任务契约设计、二次确认与监督回路，并给出可直接落地的接口与评测方案，帮助团队把“能跑 demo”升级为“可控生产执行”。

2026年3月5日

Synthly 团队

预计阅读 18 分钟

📷 Photo by cottonbro studio via Pexels

一、为什么 Agent 会“幻觉执行”

大多数团队把幻觉理解为“模型说错话”，但在工具化 Agent 里，真正高风险的问题是：

模型把不确定当成确定
把“建议”当“指令”
在上下文缺失时硬执行工具

这类问题的共同根因是：规划与执行耦合在一个生成回合里。当同一模型同时负责“想清楚”和“动手做”，就很容易出现逻辑跳步：计划还没稳定，动作已经提交。

因此，第一原则不是“让模型更聪明”，而是“让系统更可控”。

二、Planner-Executor 的最小分层模型

一个可落地的分层，不需要复杂到多 Agent 编排，先做三层就够：

Planner（规划层）
- 只产出任务图，不直接调用外部工具
- 输出内容必须结构化：目标、约束、步骤、依赖、成功条件
Executor（执行层）
- 只接受结构化任务，不自由发挥
- 对每个步骤执行前检查输入完整性、权限和前置条件
Supervisor（监督层，可选但强烈建议）
- 对 Planner 输出做静态检查
- 对 Executor 动作做动态拦截与风险分级

关键点在于：每层都有限定职责，减少“跨层自由推断”。

三、任务契约（Task Contract）：降低幻觉的核心接口

很多团队失败在“接口太自由”。如果 Planner 输出只是自然语言，Executor 只能猜。

建议统一任务契约：

{
  "goal": "整理并回复并发邮件",
  "constraints": ["仅处理本周邮件", "不得发送外部域名"],
  "steps": [
    {
      "id": "s1",
      "action": "list_emails",
      "inputs": { "folder": "inbox", "since": "2026-03-01" },
      "risk": "low",
      "dependsOn": []
    },
    {
      "id": "s2",
      "action": "draft_reply",
      "inputs": { "tone": "professional" },
      "risk": "medium",
      "dependsOn": ["s1"]
    },
    {
      "id": "s3",
      "action": "send_email",
      "inputs": { "requireApproval": true },
      "risk": "high",
      "dependsOn": ["s2"]
    }
  ],
  "successCriteria": ["草稿覆盖所有高优先邮件", "高风险发送需人工确认"]
}