Jasper Recall

🧠 为 AI Agent 赋予持久记忆的本地 RAG 系统

本地 RAG 记忆系统,基于 ChromaDB 实现会话历史的语义检索,支持 agent 跨会话记忆上下文

收藏
5.9k
安装
2.7k
版本
0.1.0
CLS 安全性认证2026-06-23
点击查看完整报告 >

使用说明

核心用法

Jasper Recall 是一套面向 AI agent 的本地记忆增强系统,通过 Retrieval-Augmented Generation 架构实现会话历史的持久化存储与语义检索。

三大核心命令:

1. `digest-sessions` — 从会话日志提取关键信息(主题、工具使用记录),生成结构化摘要
2. `index-digests` — 将 Markdown 文件分块、嵌入并索引到本地 ChromaDB 数据库

3. `recall "query"` — 执行语义搜索,基于 sentence-transformers 的 384 维向量检索相关记忆

技术栈特点:

  • 使用 all-MiniLM-L6-v2 模型(~80MB),完全本地运行,零 API 依赖
  • 默认索引路径:~/.openclaw/workspace/memory/ 下的笔记、会话摘要、项目文档等
  • 支持内容哈希检测,跳过未变更文件,避免重复处理

Agent 集成方案:

  • 查询前置:回答问题前自动检索相关历史上下文
  • 定时维护:通过 HEARTBEAT.md 或 cron 任务实现自动索引更新
  • JSON 输出模式便于程序化解析

显著优点

  • 隐私优先:纯本地运行,敏感会话数据不出境
  • 低门槛部署:单条命令 npx jasper-recall setup 完成环境配置
  • 语义理解:基于向量相似度而非关键词匹配,支持模糊查询
  • 模块化设计:三个独立 CLI 工具可灵活组合
  • 增量索引:智能检测文件变更,高效处理大规模记忆库

潜在缺点与局限性

  • 模型能力边界:MiniLM 对复杂语义和跨语言支持有限
  • 无分布式能力:单节点 ChromaDB,不适合多机协作场景
  • 分块策略固定:500 字符硬分块可能破坏语义连贯性
  • 冷启动成本:首次需下载 embedding 模型
  • 维护负担:需手动/定时触发索引更新,非实时同步

适合人群

  • 注重数据隐私的独立开发者与小型团队
  • 需要 agent 具备长期记忆能力的 AI 应用构建者
  • 频繁进行多轮复杂会话、需上下文连续性的场景
  • 希望零成本(无 API 费用)实现 RAG 记忆的开发环境

常规风险

| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 数据丢失 | 本地 ChromaDB 无内置备份机制 | 定期备份 `~/.openclaw/chroma-db` 目录 |
| 索引漂移 | 长期未更新导致记忆库与实际文件脱节 | 配置 cron 每 6 小时自动执行 `index-digests` |
| 模型偏见 | embedding 模型可能编码训练数据中的偏见 | 关键决策仍需人工复核原始会话 |
| 存储膨胀 | 高频会话生成大量向量数据 | 定期清理过期 `session-digests` |

安全解读

核心用法

Jasper Recall 是一款专为 AI agent 设计的本地 RAG(检索增强生成)记忆系统,通过三条核心命令构建完整的记忆工作流:

  • `digest-sessions`:从会话日志中提取关键信息(主题、工具使用记录),生成结构化摘要
  • `index-digests`:将 Markdown 记忆文件分块、向量化并索引到本地 ChromaDB 数据库
  • `recall`:基于语义相似度搜索历史记忆,支持 JSON 输出和相似度评分

安装后自动配置 Python 虚拟环境(~/.openclaw/rag-env)和 ChromaDB 持久化存储(~/.openclaw/chroma-db),首次运行下载约 80MB 的 sentence-transformers/all-MiniLM-L6-v2 嵌入模型,后续完全离线运行。

显著优点

1. 纯本地架构:零网络请求、零 API 密钥,数据完全驻留本地,隐私风险极低
2. 无缝 Agent 集成:可通过 HEARTBEAT.md 或 Cron 任务实现自动化索引,支持程序化调用

3. 语义级搜索:384 维向量嵌入实现概念匹配,超越关键词检索的局限

4. 模块化设计:三条命令可独立使用,灵活适配不同工作流

潜在局限

  • 模型体积限制:MiniLM-L6 在复杂语义理解上弱于 GPT 类大模型,极端专业场景召回精度有限
  • 单用户架构:无多用户隔离机制,共享环境存在数据交叉风险
  • 运维复杂度:需定期手动或定时执行索引维护,否则记忆滞后
  • 生态早期:Star 数仅 3,社区验证尚浅,生产环境稳定性待观察

适合人群

  • 注重隐私、拒绝云端记忆方案的开发者
  • 需要 AI agent 具备跨会话上下文延续能力的进阶用户
  • 已使用 OpenClaw 生态、熟悉 CLI 工具链的技术人群

常规风险

  • 文件系统权限依赖 ~/.openclaw/ 目录,需确保写入权限
  • execSync 执行本地脚本虽安全但存在理论注入面(当前实现已控制脚本来源)
  • 依赖 Python 环境,跨平台兼容性需验证

Jasper Recall 内容

cli文件夹
scripts文件夹
src文件夹
手动下载zip · 12.8 kB
jasper-recall.jstext/javascript
请选择文件