Hippocampus

🧠 AI代理的持久记忆大脑

ai-memory-systems榜 #1

基于斯坦福生成式智能体研究的持久化记忆系统,为AI代理提供自动编码、重要性评分、语义强化和衰减机制,实现类人记忆连续性。

收藏
14.8k
安装
3.3k
版本
3.9.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Hippocampus Memory System 是一套模拟人脑海马体功能的持久化记忆系统,专为AI代理设计。核心工作流包括:

1. 信号采集:从对话记录自动提取原始信号(signals.jsonl)
2. 重要性评分:LLM根据语义重要性给出0.0-1.0初始分数(显式"记住"指令0.9分,偏好声明0.8分,一般知识0.5分)

3. 语义编码:通过encode-pipeline.sh处理,自动检测重复主题进行强化(提升重要性10%)而非重复创建

4. 衰减机制:每日运行decay.sh,按0.99^days公式计算,90天后重要性降至40%

5. 分层检索:核心记忆(0.7+)自动加载,活动记忆(0.4-0.7)正常检索,背景记忆(0.2-0.4)需特定搜索

内存结构采用四级域分类:user(用户事实)、self(代理身份)、relationship(共享语境)、world(外部知识),配合中央加权索引index.json实现高效召回。

显著优点

学术基础扎实:直接复现Park等人2023年斯坦福生成式智能体论文的完整记忆架构,包括衰减公式、重要性阈值、反射机制等核心设计。

自动化程度高:编码、强化、衰减全流程无需人工干预,cron定时任务(每3小时编码+每日衰减)实现真正"自主"记忆管理。

防重复机制:语义检查在编码阶段自动识别相似记忆,避免LLM常见的"幻觉式重复记录"问题。

生态集成完善:与OpenClaw RAG系统深度整合(HIPPOCAMPUS_CORE.md桥接),提供可视化Brain Dashboard,并规划完整AI Brain系列(amygdala情绪、VTA动机等)。

潜在缺点与局限性

架构依赖风险:需要完整的OpenClaw运行时环境,包括python3、jq等二进制依赖,且工作流重度依赖shell脚本,跨平台兼容性存疑。

评分主观性:初始重要性评分完全依赖LLM判断,缺乏用户校验环节,关键记忆可能被低估(如用户认为重要但LLM评分仅0.6)。

衰减公式僵化:固定0.99指数衰减未考虑记忆类型差异——用户生日与临时项目偏好显然不应同等衰减。

隐私与审计盲区:记忆以明文JSON存储于本地文件系统,缺乏加密或访问控制;长期运行后index.json可能膨胀影响性能。

适合人群

  • 构建长期运行AI代理的开发者(客服、伴侣、个人助理场景)
  • 研究LLM记忆机制的研究者或学生
  • 已使用OpenClaw生态寻求认知架构增强的用户
  • 需要可解释记忆系统的合规敏感场景(金融、医疗辅助)

常规风险

| 风险类型 | 具体表现 | 缓解建议 |
|---------|---------|---------|
| 数据持久化风险 | 工作区误删除导致记忆永久丢失 | 定期备份~/.openclaw/workspace/memory/ |
| 记忆污染 | LLM编码错误将幻觉写入长期记忆 | 启用consolidate.sh每周人工审查 |
| 评分漂移 | 不同LLM版本重要性评分标准不一致 | 固定模型版本,定期校准评分样本 |
| 隐私泄露 | 敏感对话内容以明文存储 | 对user/relationship域启用文件级加密 |

Hippocampus 内容

暂无文件树

手动下载zip · 45.2 kB
contentapplication/octet-stream
请选择文件