核心用法
Self-Improving Agent 是一套让 AI 助手具备自我反思、自我批评、自我学习、自我组织记忆能力的技能框架。当用户纠正错误、拒绝输出、或助手发现自身知识过时时,自动触发学习流程。
触发场景:
1. 命令/工具/API 调用失败
2. 用户明确纠正或拒绝
3. 发现知识过时或错误
4. 发现更优方法
5. 用户显式引用该技能
记忆架构采用三级分层:
- HOT (
memory.md, ≤100行):始终加载的核心偏好 - WARM (
projects/,domains/, ≤200行/文件):按需加载的项目/领域模式 - COLD (
archive/):90天未用的归档模式
自动流转规则:3次成功应用→晋升HOT;30天未用→降级WARM;90天未用→归档COLD。
---
显著优点
| 维度 | 优势 |
|------|------|
| **知识复利** | 避免重复犯错,用户偏好随时间自动沉淀,无需手动维护 |
| **透明可控** | 每次记忆调用都标注来源文件和行号,用户可审计、导出、删除 |
| **轻量安全** | 纯 Markdown 文档实现,无可执行代码,零网络请求 |
| **精准匹配** | 三级命名空间隔离(global→domain→project),冲突时最近最优先 |
| **隐私优先** | 明确边界:不存凭证、健康数据、第三方信息,支持一键删除 |
---
潜在局限
1. 冷启动依赖:新用户需积累3次相同纠正才能形成稳定规则
2. 上下文敏感:单次指令、假设性问题不会被记录,可能遗漏临时但重要的偏好
3. 自我反思主观性:助手自主判断"何时反思"可能存在延迟或遗漏
4. 跨项目迁移:项目级模式(projects/)默认隔离,需手动确认才能全局化
5. 存储膨胀风险:虽有多级归档,长期高频使用下 COLD 层可能累积冗余
---
适合人群
- 高频深度用户:与AI有持续协作关系,希望减少重复沟通成本
- 质量敏感场景:代码审查、内容创作、数据分析等需持续精进的领域
- 团队知识沉淀:项目级记忆可作为团队规范载体(需配合导出功能)
- 隐私意识强者:本地文件存储,完全用户可控,符合GDPR合规要求
---
常规风险
| 风险 | 等级 | 说明 |
|------|------|------|
| 记忆固化偏差 | 中 | 早期错误模式若被多次强化,需手动干预删除 |
| 过度拟合用户 | 低 | 可能过于依赖历史偏好,忽略场景变化信号 |
| 配置误操作 | 低 | 建议修改 AGENTS.md/SOUL.md 时需用户确认,但文档未强制要求交互式确认 |
| 来源可信度 | 低 | clawic.com 为T2可信来源,但维护者信息公开度有限 |
缓解建议:定期执行"memory stats"审查记忆状态;对关键规则主动要求用户确认;版本升级后重新评估存量记忆相关性。