核心用法
Self Reflection 是一款专为 AI 代理设计的质量保障技能,通过三层触发机制实现持续改进:
Pre-Delivery(预交付检查):在发送重要成果前强制暂停 30 秒,使用 7 维度评估法(正确性、完整性、清晰度、健壮性、效率、一致性、自豪感)进行快速扫描,任一维度低于 7/10 则修复后再交付。
Post-Mistake(错误后分析):用户纠正时立即捕获数据,使用「5 Whys」分析根本原因,按标准格式记录到 ~/reflection/reflections.md。
Pattern Detection(模式检测):同类错误出现 3+ 次即升级为模式,创建预防规则并注入后续工作,实现「事前提醒」而非事后补救。
显著优点
- 防重复失误:将单次错误转化为可复用的预防规则,打破「代理健忘」循环
- 轻量高效:30 秒预检查设计,避免过度反思的性能损耗
- 主动注入:在任务开始前自动提示相关历史教训,而非被动等待用户纠正
- 可视化追踪: streak 计数器和模式生命周期管理(Emerging → Active → Monitoring → Resolved),提供清晰的改进进度反馈
潜在缺点与局限
- 依赖本地存储:所有数据保存在
~/reflection/目录,无云同步时跨设备失效 - 启动成本:首次使用需完成 setup 流程并建立个人习惯
- 判断门槛:「重要工作」的界定依赖代理自身判断,可能漏检或过度检查
- 长周期验证:模式从 Active 到 Resolved 需 30 天零复发,验证周期较长
适合人群
- 需要高频交付高质量代码/文档/策略的技术用户
- 对代理重复犯错感到困扰、希望建立系统性改进机制的用户
- 重视可追溯学习、愿意投入初期配置换取长期效率的进阶用户
常规风险
- 数据丢失风险:本地文件损坏或误删将导致完整反思历史丢失,建议配合版本控制
- 隐私暴露:反思日志可能包含敏感的工作细节,存储位置需符合用户安全策略
- 过度自信风险:7 维度自评仍属代理自我判断,无法完全替代人类审核
- 模式误判:统计阈值(3 次触发)可能因样本量小产生假阳性规则