核心功能
Self-Improvement 是一套持续学习基础设施,专为AI代理设计,用于捕获、沉淀和复用从错误中获得的 durable lessons。它区别于简单的日志系统,强调可复用性而非记录每件事。
主要用法
技能围绕三种核心记录类型构建:
- Learning:用户纠正、项目约定、知识盲区
- Error:非显而易见的工具/API失败、调试后的问题
- Feature Request:缺失能力、反复出现的摩擦点
使用Python CLI工具(learnings.py)初始化工作区、搜索历史记录、创建条目,最终将验证有效的规则提升为项目记忆文件(CLAUDE.md、AGENTS.md等)或提取为独立技能。
显著优点
1. 结构性抗重复:通过强制搜索(search-first)、稳定Pattern-Key、See Also链接,有效防止条目碎片化
2. 渐进式沉淀:capture → dedupe → promote → extract 的闭环设计,确保知识从临时记录流向持久基础设施
3. 双根模型清晰分离:技能资源(scripts/、references/)与项目工作区(.learnings/、CLAUDE.md)严格隔离,避免污染
4. 评估驱动:预留 evals/ 和 trigger/output eval 框架,支持技能自身的持续改进
局限性与风险
- 工具链依赖:需要Python 3.11+,部分hook依赖bash;纯手动使用虽可行但体验下降
- 推广门槛:"promote aggressively" 要求代理具备判断何时规则已"验证有效"的能力,实践中可能过度推广或保守
- 无内置同步:
.learnings/是本地文件,多设备/多协作者场景下无合并策略 - 静默日志风险:规则7要求"do not interrupt the user",但某些关键学习可能需要用户确认以避免错误假设
适合人群
- 长期使用Claude Code、OpenClaw等AI编程工具的专业开发者
- 维护复杂代码库、需要跨会话保持上下文的团队
- 希望将个人调试经验转化为可复用技能的"技能作者"
常规风险
| 风险 | 缓解 |
|------|------|
| 条目膨胀、低信噪比 | 严格过滤规则(排除trivial typos、straightforward retries)+ 搜索优先 |
| 推广规则未经充分验证 | 建议设置观察期,高频复发后再推广 |
| 模式键(Pattern-Key)冲突 | 使用带日期前缀的确定性ID |
| 敏感信息泄露 | 学习记录可能包含错误日志、文件路径,需注意`.learnings/`的gitignore配置 |