核心用法
Hippocampus 是一套为 AI agent 设计的后台记忆器官系统,独立于主 agent 运行,模拟生物海马体的记忆机制。核心流程包括:
1. 记忆捕获:通过触发词识别或显式指令,将交互内容结构化存储到四类领域(user/self/relationship/world)
2. 重要性评分:0-1 分初始评分,依据内容性质(显式记忆指令 0.9、情感内容 0.85、偏好声明 0.8 等)
3. 自动衰减:每日按 0.99^days 公式降低未访问记忆的重要性,模拟遗忘曲线
4. 主动强化:记忆被调用时,按 (1-old)×0.15 公式提升权重,常用记忆趋于固化
5. 分层检索:0.7+ 为核心记忆、0.4-0.7 为活跃记忆、<0.2 进入归档候选
通过 shell 脚本实现(decay.sh / recall.sh / reinforce.sh / load-core.sh),支持 OpenClaw 框架集成,可自动生成 HIPPOCAMPUS_CORE.md 供 RAG 系统读取。
显著优点
- 学术背书:直接基于 Stanford Generative Agents 论文(Park et al., 2023)实现,机制经过同行评审验证
- 自动化运行:Cron 定时任务实现无人值守的记忆维护,无需手动干预
- 结构化存储:JSON 索引 + 领域分类,便于程序化检索和版本控制
- 与 LLM 解耦:记忆系统独立于推理引擎,可跨模型、跨会话保持连续性
- 可解释性强:重要性分数、衰减历史、强化次数全部透明可审计
潜在缺点与局限性
- 实现依赖外部工具:需要
python3、jq及 shell 环境,Windows 原生支持有限 - 评分规则静态:初始重要性依赖预设规则表,无法根据个体用户动态调整阈值
- 无语义检索:基于关键词和加权分数,缺乏向量相似度或嵌入检索能力
- 存储本地化:默认文件系统存储,无原生云端同步或多设备一致性方案
- 冷启动问题:新 agent 需累积足够交互才能形成有效记忆层
适合人群
- 使用 OpenClaw 或其他支持 shell 调用的 AI agent 框架的技术用户
- 需要长期连续性对话、跨会话身份一致性的个人知识管理场景
- 希望理解/复现 Stanford Generative Agents 架构的研究者或开发者
- 偏好本地优先、可审计、可版本控制记忆数据的隐私敏感用户
常规风险
- 数据持久化风险:本地 JSON 文件损坏或误删将导致记忆永久丢失,需配合 Git 等版本控制
- 隐私泄露风险:
user/目录可能累积敏感个人信息,明文存储需确保文件权限控制 - 衰减参数僵化:固定的 0.99 衰减系数可能不适合所有记忆类型,关键信息可能意外淡化
- 脚本注入风险:
recall.sh等接受用户输入查询,若未严格转义可能存在命令注入漏洞(需审计实现)