PAPERReflexion自我修正AgentFeedback Loop
论文解读:Reflexion 与自我修正闭环设计,如何用于 Agent 迭代
Reflexion 的核心不是“让模型反思更久”,而是把错误反馈转成下一轮行为改进信号。本文结合工程实践拆解 Reflexion 的闭环结构:错误检测、反思记忆、策略更新与稳定性控制,并给出在线系统可落地的反馈回路设计,帮助 Agent 在失败中变得更可靠。
2026年3月6日
Synthly 团队
预计阅读 15 分钟

📷 Photo by Ron Lach via Pexels
一、Reflexion 的真正价值:把失败变成可积累资产
传统 Agent 常见模式是:
- 失败 → 重试 → 仍失败
Reflexion 的不同在于引入“失败后学习”步骤:
- 失败 → 归因 → 反思记忆 → 下一轮策略调整
这让系统从“短期纠错”走向“跨轮次改进”。
二、闭环拆解:检测、反思、更新
1)错误检测(Detect)
要先定义什么叫失败:
- 工具返回错误
- 结果不满足约束
- 用户反馈否定
2)反思生成(Reflect)
把失败转成结构化反思,而不是长段文字吐槽。
推荐结构:
- 错误类型
- 触发条件
- 不该做什么
- 下轮建议策略
3)策略更新(Update)
将反思注入下一轮执行(提示词、规则或路由策略),并设置有效期与作用域。
没有作用域控制,反思很容易“误伤”不相关任务。
三、工程重点:反思记忆必须可治理
Reflexion 最大工程风险是记忆污染,常见形式:
- 过度泛化:一次失败被写成普遍规律
- 上下文错配:A 场景结论应用到 B 场景
- 过期记忆:旧规则压制新版本能力
建议治理策略:
- 记忆分层(短期/长期)
- 作用域标签(任务类型、工具、租户)
- TTL 与衰减
- 审核与回滚机制
四、与现有可靠性体系联动
Reflexion 不应独立存在,建议和以下机制联动:
- 事件日志:提供失败证据
- 任务状态机:决定何时反思、何时终止
- 限流与预算:防止“反思过度调用”
这样可以避免为了学习而牺牲整体稳定性。
五、评估方法:看“跨轮次收益”,不是单次偶然成功
建议新增四个指标:
repeat_failure_ratepost_reflection_success_rateavg_steps_to_successmemory_pollution_incidents
如果前 3 项改善但第 4 项上升,说明系统进入“短期增益、长期污染”状态,需要收紧记忆写入策略。
六、上线策略:先在高价值窄场景灰度
推荐灰度顺序:
- 单工具、单任务类型
- 可观测指标稳定后扩到多工具
- 最后再引入跨任务共享反思
Reflexion 的关键不是“覆盖越广越好”,而是“每次学习都可验证、可撤销”。
七、结论:Reflexion 让 Agent 有机会“越做越稳”,前提是记忆可控
Reflexion 值得做,但它是系统工程,不是提示词魔法。
把检测、反思、更新与治理闭环搭起来,Agent 才能在失败中持续提高,而不是反复犯同类错误。
联动阅读: