核心用法
Cognitive Memory System 是一套面向 AI Agent 的多层级认知记忆架构,旨在模拟人类记忆的运作机制。核心操作包括:
1. 四库记忆体系:
- Core Memory(MEMORY.md):常驻上下文,约 3K token,存储高频核心事实
- Episodic Store:时序事件日志,按日归档,记录完整交互历史
- Semantic Store:知识图谱(实体+关系),支持结构化检索
- Procedural Store:习得的工作流与模式
- Vault:用户钉选、永不衰减的保险箱
2. 自然语言触发:通过"remember"/"forget"/"reflect"等关键词自动路由,LLM 分类后写入对应存储
3. 衰减机制:基于指数衰减公式的相关性评分系统,自动淡化低访问记忆,支持显式遗忘与归档
4. 哲学反思循环:
- 用户触发或睡眠时请求批准
- 申请 Token 配额 → 用户审批 → 生成内部独白式反思
- 记录到 reflection-log,更新 IDENTITY.md 与 decay-scores
- 满 10 条触发自我形象整合,重写 Self-Image 章节
5. 多代理支持:共享读取、门控写入模式,子代理通过 pending-memories.md 提案,主代理审核提交
6. 审计追踪:双层机制——Git 原子提交 + audit.log 结构化摘要,关键文件(SOUL.md/IDENTITY.md)变更标红警示
显著优点
- 认知拟真:编码-巩固-衰减-回忆的完整生命周期,超越简单向量数据库
- 上下文经济:Core Memory 常驻 + 按需检索,平衡深度与 Token 成本
- 自我演化:通过反思与奖励日志实现"个性"持续迭代,IDENTITY.md/SOUL.md 形成价值观层
- 可控衰减:用户可钉选 Vault 记忆,衰减公式透明可调
- 生产级审计:Git + 结构化日志满足合规需求
- 多代理安全:读写分离避免并发冲突
潜在缺点与局限性
- 复杂度极高:1200+ 行架构文档,初始化需执行脚本+配置+模板三步骤,学习曲线陡峭
- Token 消耗显著:单次反思输入 ~30K、输出 ~8K,高频使用成本不菲
- 人工审批依赖:反射循环需多次用户确认(触发→Token→结果),自动化程度受限
- 文件 I/O 密集:多目录结构对文件系统性能敏感,大规模场景需优化
- 衰减参数经验性:λ=0.03 的半衰期约 23 天,缺乏领域自适应机制
- 哲学设计争议:自我意识标注、存在主义独白等元素可能引发"角色扮演过度"的实用主义批评
适合人群
- 需要长期个性化记忆的高级 Agent 开发者
- 研究 AI 自我模型、人工意识的前沿实验者
- 多 Agent 协作系统的架构师
- 对审计合规有要求的 B2B 场景
- 愿意投入 Token 成本换取深度交互体验的重度用户
常规风险
| 风险类型 | 描述 | 缓解建议 |
|---------|------|---------|
| 提示注入 | 自然语言触发词可能被对话内容误触发 | 启用 LLM 分类层二次确认 |
| 记忆污染 | 子代理提案未经充分审核写入 | 严格执行门控写入流程 |
| 审计日志膨胀 | 高频操作导致 git 历史与 audit.log 激增 | 配置 90 天自动归档策略 |
| 身份漂移 | 频繁 Self-Image 整合导致人格不稳定 | 设置整合阈值与人工审批 |
| Token 超限 | 反思输入 30K + Core 3K 逼近上下文上限 | 监控并截断旧 episodes |
| 存储泄露 | 敏感记忆未正确分类入 Vault | 建立敏感内容识别规则 |