Chromadb Memory Pub

🧠 本地语义记忆,自动召回上下文

memory榜 #4

基于 ChromaDB 与本地 Ollama 的语义记忆系统,支持自动召回历史上下文,无需云端 API 即可实现完全自托管的长期记忆。

收藏
16.3k
安装
4.7k
版本
1.2.0
CLS 安全性认证2026-05-14
点击查看完整报告 >

使用说明

核心功能

ChromaDB Memory 是一款为 OpenClaw 框架设计的长期记忆插件,通过 ChromaDB 向量数据库与 Ollama 本地嵌入模型实现语义记忆的存储与检索。其核心机制包括:

自动召回(Auto-recall):每次用户交互前,插件自动将当前消息通过 Ollama 的 nomic-embed-text 模型(768 维)向量化,查询 ChromaDB 中最相似的记录,并将相关性高于 minScore 阈值的结果自动注入代理上下文的 <chromadb-memories> 标签内。全程零人工干预,代理获得"过目不忘"的能力。

手动检索工具:提供 chromadb_search 工具,支持按需执行语义搜索,适用于精确控制记忆调用的场景。

技术架构优势

  • 完全本地化:ChromaDB + Ollama 组合彻底摆脱 OpenAI、Google 等云端依赖,数据不出本地,满足隐私敏感场景
  • 低 token 开销:单次自动召回约 275 token(3 条结果),在 200K+ 上下文窗口中几乎无感知
  • 灵活配置:支持调整相似度阈值(minScore)、召回数量(autoRecallResults)、切换手动/自动模式

局限性与风险

部署门槛:需独立维护 ChromaDB 服务(Docker 推荐)和 Ollama 实例,对非技术用户有一定复杂度;嵌入模型需预先 ollama pull,首次配置流程较长。

数据管理责任:文档索引需通过外部工具预先灌入 ChromaDB,插件本身不提供数据录入功能,形成"只读记忆"的依赖链条。

质量调优成本minScore 默认 0.5 可能引入噪声(0.6-0.7 更干净)或漏召回(0.4 更宽松),需针对具体数据集反复调试。

无内置加密:ChromaDB 默认 HTTP 通信,生产环境需自行配置 TLS 和访问控制。

适用人群

  • 高度重视数据隐私、需完全离线运行的个人开发者与企业
  • 已具备 Docker/Ollama 运维经验的技术团队
  • 需要为 AI 代理构建可累积、可检索知识库的长期项目

风险提示

该技能依赖外部服务的可用性(ChromaDB 端口 8100、Ollama 端口 11434),服务中断将导致记忆功能失效;配置中的 collectionId 若泄露,在缺乏鉴权的环境中可能被恶意查询。

安全解读

核心用法

chromadb-memory 是一款面向 OpenClaw 框架的长期记忆插件,通过 ChromaDB 向量数据库与 Ollama 本地嵌入模型实现语义记忆存储与召回。核心工作流程为:用户每条消息自动经 Ollama nomic-embed-text 模型生成 768 维向量 → 查询本地 ChromaDB 获取相似度最高的记忆片段 → 将结果注入代理上下文作为 <chromadb-memories>

插件提供两种使用模式:Auto-recall(自动召回) 为默认模式,每轮对话自动执行;`chromadb_search` 工具 支持手动触发语义搜索。配置通过 ~/.openclaw/openclaw.json 完成,关键参数包括 chromaUrlollamaUrlcollectionId/collectionNameminScore(相似度阈值,默认 0.5)、autoRecallResults(召回数量,默认 3)。

显著优点

  • 完全本地自治:零依赖云 API,数据不出本地硬件,符合 GDPR/CCPA 本地处理原则
  • 供应链安全:无第三方 npm 依赖,仅使用原生 fetch API,攻击面极窄
  • 透明可审计:MIT 开源协议,代码结构清晰,无混淆或动态代码加载
  • 智能降级:ChromaDB/Ollama 服务不可用时自动降级至本地 memory_search,连续失败 3 次后告警
  • Token 效率:单次召回约 275 tokens(3 条结果),对 200K+ 上下文窗口影响可忽略

潜在缺点与局限性

  • 部署复杂度:需独立维护 ChromaDB(Docker 推荐)和 Ollama 两个服务,前置配置门槛高于云端方案
  • 召回质量依赖嵌入模型nomic-embed-text 对特定领域(如中文、代码)的语义理解可能弱于商业嵌入 API
  • 无内置索引工具:需用户自行使用 ChromaDB 兼容工具导入文档,插件仅提供查询层
  • HTTP 明文风险:默认本地 HTTP 通信,若用户配置远程地址且未启用 HTTPS,存在中间人攻击可能

适合人群

  • 隐私敏感型用户(医疗、法律、企业内网场景)
  • 需要离线/断网环境运行的开发者
  • 已具备 Docker 和本地 AI 基础设施的技术团队
  • 追求长期记忆成本可控的个人用户

常规风险

1. 服务可用性依赖:ChromaDB 或 Ollama 进程崩溃将导致自动召回失效,需监控服务健康状态
2. 配置误用风险minScore 设置过高(>0.7)可能导致关键上下文遗漏,过低(<0.4)则引入噪声

3. 版本兼容性:ChromaDB API v2 与早期版本存在差异,升级时需验证集合 ID 获取方式

4. 存储边界:未设置记忆过期或分层机制,长期运行可能导致向量库膨胀影响查询性能

安全认证显示静态分析 90 分、动态行为 95 分、依赖审计 100 分,综合评级 S 级,为当前评测体系中最高安全档位。

Chromadb Memory Pub 内容

scripts文件夹
手动下载zip · 8.9 kB
index.tstext/plain
请选择文件