返回文章列表
PAPERReflexion自我修正AgentFeedback Loop

论文解读:Reflexion 与自我修正闭环设计,如何用于 Agent 迭代

Reflexion 的核心不是“让模型反思更久”,而是把错误反馈转成下一轮行为改进信号。本文结合工程实践拆解 Reflexion 的闭环结构:错误检测、反思记忆、策略更新与稳定性控制,并给出在线系统可落地的反馈回路设计,帮助 Agent 在失败中变得更可靠。

2026年3月6日
Synthly 团队
预计阅读 15 分钟
Reflexion 闭环示意:错误检测、反思记忆写入与下一轮策略调整

📷 Photo by Ron Lach via Pexels

一、Reflexion 的真正价值:把失败变成可积累资产

传统 Agent 常见模式是:

  • 失败 → 重试 → 仍失败

Reflexion 的不同在于引入“失败后学习”步骤:

  • 失败 → 归因 → 反思记忆 → 下一轮策略调整

这让系统从“短期纠错”走向“跨轮次改进”。


二、闭环拆解:检测、反思、更新

1)错误检测(Detect)

要先定义什么叫失败:

  • 工具返回错误
  • 结果不满足约束
  • 用户反馈否定

2)反思生成(Reflect)

把失败转成结构化反思,而不是长段文字吐槽。

推荐结构:

  • 错误类型
  • 触发条件
  • 不该做什么
  • 下轮建议策略

3)策略更新(Update)

将反思注入下一轮执行(提示词、规则或路由策略),并设置有效期与作用域。

没有作用域控制,反思很容易“误伤”不相关任务。


三、工程重点:反思记忆必须可治理

Reflexion 最大工程风险是记忆污染,常见形式:

  • 过度泛化:一次失败被写成普遍规律
  • 上下文错配:A 场景结论应用到 B 场景
  • 过期记忆:旧规则压制新版本能力

建议治理策略:

  • 记忆分层(短期/长期)
  • 作用域标签(任务类型、工具、租户)
  • TTL 与衰减
  • 审核与回滚机制

四、与现有可靠性体系联动

Reflexion 不应独立存在,建议和以下机制联动:

  • 事件日志:提供失败证据
  • 任务状态机:决定何时反思、何时终止
  • 限流与预算:防止“反思过度调用”

这样可以避免为了学习而牺牲整体稳定性。


五、评估方法:看“跨轮次收益”,不是单次偶然成功

建议新增四个指标:

  • repeat_failure_rate
  • post_reflection_success_rate
  • avg_steps_to_success
  • memory_pollution_incidents

如果前 3 项改善但第 4 项上升,说明系统进入“短期增益、长期污染”状态,需要收紧记忆写入策略。


六、上线策略:先在高价值窄场景灰度

推荐灰度顺序:

  1. 单工具、单任务类型
  2. 可观测指标稳定后扩到多工具
  3. 最后再引入跨任务共享反思

Reflexion 的关键不是“覆盖越广越好”,而是“每次学习都可验证、可撤销”。


七、结论:Reflexion 让 Agent 有机会“越做越稳”,前提是记忆可控

Reflexion 值得做,但它是系统工程,不是提示词魔法。

把检测、反思、更新与治理闭环搭起来,Agent 才能在失败中持续提高,而不是反复犯同类错误。

联动阅读: