jasper-recall

🧠 本地 RAG 智能记忆中枢

基于 ChromaDB 和 sentence-transformers 的本地 RAG 记忆系统,支持多 Agent 隔离共享,让 AI 具备持久化上下文记忆能力。

收藏
1.4k
安装
499
版本
0.0.0
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

jasper-recall 是一套完整的本地 RAG(检索增强生成)记忆基础设施,通过三个核心命令实现 Agent 记忆的闭环管理::digest-sessions 从会话日志提取关键信息生成摘要,,index-digests 将 Markdown 文档分块嵌入到 ChromaDB 向量数据库,,recall 执行语义搜索召回相关记忆。系统采用 Python 虚拟环境隔离运行,依赖 ChromaDB 和 sentence-transformers 实现完全离线的嵌入生成与向量检索,无需调用任何外部 API。

多 Agent 场景下,系统通过集合隔离机制实现精细的权限控制:private_memories 仅供主 Agent 访问,shared_memories 存放标记为 [public] 的内容供沙盒 Agent 查询,agent_learnings 则实现双向知识共享。HTTP 服务器模式(serve 命令)为 Docker 隔离环境提供 API 接入,默认强制启用 public_only 限制。

显著优点

隐私优先的本地架构:所有数据存储于用户目录(~/.openclaw),嵌入模型本地运行,从根本上杜绝数据外泄风险。多集合隔离设计配合显式标签机制([public]/[private]/[learning]),让敏感信息管控变得直观可操作。

零配置快速部署:单条命令 npx jasper-recall setup 完成 Python 环境、数据库、CLI 工具链的全自动安装,200MB 依赖一次性下载后永久离线可用。

完善的辅助工具链:内置 privacy-check 敏感数据扫描(支持 API Key、邮箱、内网 IP 等模式识别)、sync-shared 安全同步预览、、moltbook-setup 沙盒环境一键配置,大幅降低多 Agent 部署的出错概率。

OpenClaw 生态深度集成:通过插件配置可实现 autoRecall 自动注入,支持 minScore 相关性过滤和智能跳过规则(心跳轮询、自动化报告等场景不触发记忆召回)。

潜在缺点与局限性

技术栈异构成本:核心功能依赖 Python 生态,虽通过 venv 隔离避免冲突,但维护团队需同时理解 Node.js 调用层与 Python 实现层,故障排查路径相对复杂。

命令注入残留风险:server.js 中查询参数通过 shell 字符串拼接执行,虽有转义处理但仍属非最佳实践;极端输入场景下正则表达式可能存在性能瓶颈。

规模扩展天花板:ChromaDB 作为嵌入式向量数据库,在百万级文档场景下可能面临性能衰减;当前架构未提供分布式或云端扩展路径。

用户认知负担:多集合查询参数(--public-only/--learnings/--all/--collection)需要使用者清晰理解隐私模型,误用可能导致敏感信息意外暴露。

适合的目标群体

  • 多 Agent 系统开发者:需要为主 Agent 与沙盒 Agent 建立安全可控的记忆共享机制
  • 本地优先的 AI 应用构建者:拒绝云端 API 依赖,追求数据完全自主可控
  • 长期上下文场景用户:客服、编程助手、研究助理等需要跨会话保持记忆的应用
  • OpenClaw 框架使用者:希望获得开箱即用的记忆增强能力

使用风险

配置误用风险:RECALL_ALLOW_PRIVATE=true 环境变量或 --host 0.0.0.0 参数的不当使用会直接暴露私有记忆,生产环境务必保持默认约束。

数据残留风险:删除操作仅移除索引条目,原始 Markdown 文件仍保留于文件系统,彻底清理需手动处理 workspace 目录。

模型首次下载依赖:sentence-transformers 模型约 80MB,离线环境需提前完成初始化,否则首次调用将失败。

版本兼容性:v0.2.2+ 引入的多集合架构与早期单集合版本存在数据格式差异,升级时需重建索引。

安全解读

Jasper Recall 综合评估

核心用法

Jasper Recall 是一款面向 AI Agent 的本地 RAG(检索增强生成)记忆系统,基于 ChromaDB 向量数据库和 sentence-transformers 嵌入模型构建。其核心功能包括:

  • 语义检索 (recall): 通过自然语言查询历史会话与笔记,支持多集合搜索(private/shared/learnings)
  • 自动索引 (index-digests): 将 Markdown 记忆文件分块嵌入至向量数据库
  • 会话摘要 (digest-sessions): 从会话日志提取关键信息生成结构化摘要
  • 多代理网格 (recall-mesh): v0.3.0+ 支持 N 个代理共享记忆,实现双向学习

显著优点

1. 完全本地化: 所有数据处理在本地完成,无需外部 API 密钥,符合隐私优先原则
2. 多级隐私隔离: 独创的 [public]/[private]/[learning] 标签机制,配合 ChromaDB 多集合架构,实现主代理与沙箱代理的精细权限控制

3. 零配置快速启动: npx jasper-recall setup 一键完成 Python 虚拟环境、数据库和 CLI 工具链部署

4. 企业级安全设计: 通过 CLS-Certify T2 认证(Score 78/Grade A),内置 privacy-check 敏感数据扫描工具

5. OpenClaw 生态集成: 提供 autoRecall 插件,支持自动记忆注入与 Heartbeat 定时索引

潜在局限

1. Python 依赖负担: 需下载 ~200MB 的 Python 虚拟环境及 ~80MB 的 HuggingFace 嵌入模型,首次初始化耗时
2. 离线模型限制: 固定使用 all-MiniLM-L6-v2(384维),无法灵活切换更强大的嵌入模型

3. 无分布式支持: 记忆存储于本地 SQLite/ChromaDB,多机部署需自行解决同步

4. HTTP 服务局限: serve 命令仅提供基础 REST 接口,无内置认证层,依赖网络边界安全

适合人群

  • 多 Agent 架构开发者: 需要主代理与沙箱代理间安全共享记忆的场景
  • 隐私敏感型企业: 金融、医疗、法律等禁止数据外泄的行业
  • 长期会话型应用: 需要跨重启保持上下文的个人助理、研究助手
  • 本地优先技术栈: 倾向于完全离线运行、避免云 API 依赖的团队

常规风险

  • 配置漂移风险: RECALL_ALLOW_PRIVATE=true 环境变量若误设于共享主机,将暴露私有记忆
  • 模型供应链风险: 首次运行从 HuggingFace 下载模型,需确保网络环境可信
  • 权限配置复杂性: 多集合权限模型对初学者有学习成本,建议配合 moltbook-setup 使用
  • 存储增长未控: 长期运行的 ChromaDB 可能膨胀,需定期维护(当前无自动清理机制)

jasper-recall 内容

cli文件夹
docs文件夹
extensions文件夹
jasper-recall文件夹
moltbook-setup文件夹
openclaw-plugin文件夹
scripts文件夹
src文件夹
手动下载zip · 63.5 kB
config.jstext/javascript
请选择文件