核心用法
Self-Improving Agent 是一套指导 Claude 进行主动自反思的文档型 Skill。它不包含任何可执行代码,而是通过结构化的 Markdown 文档定义了一套完整的记忆管理机制:
1. 三层记忆架构:HOT(memory.md,≤100行,常驻加载)、WARM(projects/、domains/,按需加载)、COLD(archive/,归档存储)
2. 触发检测:自动识别用户更正("Actually...")、偏好信号("I like when...")和重复模式(3次以上相同指令)
3. 自我反思流程:完成重要任务后暂停评估——是否达标、如何改进、是否为可复用模式
4. 晋升/降级规则:3次成功应用→晋升 HOT;30天未用→降级 WARM;90天未用→归档 COLD
显著优点
- 零攻击面:纯 Markdown 文档,无代码、无网络请求、无依赖,通过 Agent 工具操作本地文件
- 隐私优先设计:boundaries.md 明确定义禁止存储凭证、健康数据、第三方信息,完全合规 GDPR/CCPA
- 透明可控:每个记忆项标注来源文件和行号,支持"forget everything"删除、完整 ZIP 导出
- 渐进式学习:不猜测用户偏好,仅从明确更正和确认中学习,避免过度拟合
- 命名空间隔离:项目级/领域级/全局级分层,冲突时最具体、最新规则优先
潜在缺点与局限性
- 依赖用户主动反馈:不推断沉默信号,学习速度受限于用户更正频率
- 上下文窗口压力:HOT 层虽限 100 行,但高频使用场景下仍需定期压缩归档
- 无跨会话同步:记忆仅存储于本地
~/self-improving/,多设备场景需手动迁移 - Agent 执行一致性:实际效果依赖 Claude 对文档指令的解析精度,复杂规则可能执行偏差
- 缺乏版本回滚:corrections.md 和 memory.md 的修改是追加/覆盖式,无内置历史版本
适合人群
- 高频使用 Claude 进行复杂多步任务、希望减少重复说明的专业用户
- 有明确工作流偏好、愿意投入时间进行"训练式"反馈的开发者/写作者
- 对数据隐私敏感、要求本地优先存储的企业环境
- 需要可审计、可解释记忆机制而非黑盒学习的场景
常规风险
| 风险类型 | 评估 | 说明 |
|---------|------|------|
| 代码执行 | ✅ 无风险 | 纯文档,无可执行代码 |
| 数据外泄 | ✅ 无风险 | 零网络请求,仅本地文件操作 |
| 隐私侵犯 | ⚠️ 低风险 | 理论上可能误存敏感信息,但 boundaries.md 有明确禁令 |
| 提示词注入 | ✅ 无风险 | 无用户输入直接处理逻辑 |
| 供应链攻击 | ✅ 无风险 | 零依赖 |
使用建议:首次使用前阅读 boundaries.md 确认安全边界;定期运行"memory stats"监控存储增长;重要项目记忆可手动备份 ZIP。