Hippocampus

🧠 AI代理的持久记忆大脑

基于斯坦福生成式智能体研究的持久化记忆系统,为AI代理提供自动编码、重要性评分、语义强化和衰减机制,实现类人记忆连续性。

收藏
14.8k
安装
3.3k
版本
3.9.0
CLS 安全性认证2026-05-12
点击查看完整报告 >

使用说明

核心用法

Hippocampus Memory System 是一套模拟人脑海马体功能的持久化记忆系统,专为AI代理设计。核心工作流包括:

1. 信号采集:从对话记录自动提取原始信号(signals.jsonl)
2. 重要性评分:LLM根据语义重要性给出0.0-1.0初始分数(显式"记住"指令0.9分,偏好声明0.8分,一般知识0.5分)

3. 语义编码:通过encode-pipeline.sh处理,自动检测重复主题进行强化(提升重要性10%)而非重复创建

4. 衰减机制:每日运行decay.sh,按0.99^days公式计算,90天后重要性降至40%

5. 分层检索:核心记忆(0.7+)自动加载,活动记忆(0.4-0.7)正常检索,背景记忆(0.2-0.4)需特定搜索

内存结构采用四级域分类:user(用户事实)、self(代理身份)、relationship(共享语境)、world(外部知识),配合中央加权索引index.json实现高效召回。

显著优点

学术基础扎实:直接复现Park等人2023年斯坦福生成式智能体论文的完整记忆架构,包括衰减公式、重要性阈值、反射机制等核心设计。

自动化程度高:编码、强化、衰减全流程无需人工干预,cron定时任务(每3小时编码+每日衰减)实现真正"自主"记忆管理。

防重复机制:语义检查在编码阶段自动识别相似记忆,避免LLM常见的"幻觉式重复记录"问题。

生态集成完善:与OpenClaw RAG系统深度整合(HIPPOCAMPUS_CORE.md桥接),提供可视化Brain Dashboard,并规划完整AI Brain系列(amygdala情绪、VTA动机等)。

潜在缺点与局限性

架构依赖风险:需要完整的OpenClaw运行时环境,包括python3、jq等二进制依赖,且工作流重度依赖shell脚本,跨平台兼容性存疑。

评分主观性:初始重要性评分完全依赖LLM判断,缺乏用户校验环节,关键记忆可能被低估(如用户认为重要但LLM评分仅0.6)。

衰减公式僵化:固定0.99指数衰减未考虑记忆类型差异——用户生日与临时项目偏好显然不应同等衰减。

隐私与审计盲区:记忆以明文JSON存储于本地文件系统,缺乏加密或访问控制;长期运行后index.json可能膨胀影响性能。

适合人群

  • 构建长期运行AI代理的开发者(客服、伴侣、个人助理场景)
  • 研究LLM记忆机制的研究者或学生
  • 已使用OpenClaw生态寻求认知架构增强的用户
  • 需要可解释记忆系统的合规敏感场景(金融、医疗辅助)

常规风险

| 风险类型 | 具体表现 | 缓解建议 |
|---------|---------|---------|
| 数据持久化风险 | 工作区误删除导致记忆永久丢失 | 定期备份~/.openclaw/workspace/memory/ |
| 记忆污染 | LLM编码错误将幻觉写入长期记忆 | 启用consolidate.sh每周人工审查 |
| 评分漂移 | 不同LLM版本重要性评分标准不一致 | 固定模型版本,定期校准评分样本 |
| 隐私泄露 | 敏感对话内容以明文存储 | 对user/relationship域启用文件级加密 |

安全解读

核心用法

Hippocampus 是一套完整的AI代理记忆基础设施,灵感源自人脑海马体与2023年斯坦福Generative Agents研究(Park et al.)。系统通过8个核心脚本实现记忆全生命周期管理:

  • 信号捕获 (preprocess.sh): 从OpenClaw会话记录自动提取候选记忆信号
  • 智能编码 (encode-pipeline.sh): LLM自动判断是创建新记忆还是强化现有记忆,避免重复
  • 时间衰减 (decay.sh): 按0.99^days公式自动降低久未访问记忆的重要性
  • 分层检索 (recall.sh): 基于重要性阈值(0.7+/0.4-0.7/<0.4)的分级检索
  • 核心加载 (load-core.sh): 会话启动时自动注入高重要性记忆

显著优点

1. 学术背书: 直接实现斯坦福论文中的记忆衰减与强化机制,非臆造方案
2. 零网络依赖: 纯本地运行,记忆数据仅存储于~/.openclaw/workspace/memory/,无云端泄露风险

3. 语义去重: LLM自动识别话题相似性,相同主题触发强化而非重复创建

4. 可视化仪表板: 自动生成HTML脑图dashboard,整合系列技能(amygdala/VTA)

5. 结构化分类: 四大记忆域(user/self/relationship/world)+自动关键词提取

潜在局限

  • 存储敏感: 记忆文件未加密(RISK-001),依赖本地文件系统权限保护
  • 依赖规模: 需Python3+jq环境,对极简系统略重
  • 衰减硬编码: 0.99系数和阈值不可动态调整,需手动修改脚本
  • LLM成本: 每次编码需调用子Agent进行摘要,高频会话产生token消耗

适合人群

  • 需要长期关系维护的个人AI代理用户
  • 研究AI记忆架构的开发者
  • 对数据主权敏感、拒绝云记忆服务的隐私优先用户
  • 已使用OpenClaw生态的进阶玩家

常规风险

| 风险 | 等级 | 说明 |
|------|------|------|
| 本地数据读取 | Low | 必须访问会话历史以提取信号,无外发 |
| 敏感信息捕获 | Info | 未过滤密码/密钥,需用户自律 |
| 文件权限 | Low | 需确保`~/.openclaw`目录权限正确 |

合规亮点

通过GDPR数据最小化、本地存储、无遥测、可携带性四项认证,隐私合规得分70(主要扣分为未加密存储)。

Hippocampus 内容

agentdir文件夹
agents文件夹
prompts文件夹
scripts文件夹
templates文件夹
手动下载zip · 45.2 kB
AGENTS.mdtext/markdown
请选择文件