Chromadb Memory Pub

🧠 本地语义记忆,零云托管

memory榜 #4

基于 ChromaDB 的本地长期语义记忆,通过 Ollama 嵌入实现零云依赖的自动上下文召回。

收藏
20.7k
安装
4.7k
版本
1.0.0
CLS 安全性认证2026-05-20
点击查看完整报告 >

使用说明

核心用法

ChromaDB Memory 为 OpenClaw 智能体提供本地长期记忆能力。插件在每个用户消息前自动执行:消息嵌入(Ollama nomic-embed-text)→ ChromaDB 向量检索 → 相似度过滤 → 上下文注入。用户也可通过 chromadb_search 工具手动查询记忆库。

显著优点

  • 完全离线:零云端 API 依赖,数据不出本地
  • 架构简洁:Ollama + ChromaDB 双组件,Docker 一键部署
  • 无缝集成:自动召回机制对用户透明,无需手动管理上下文
  • 成本可控:每轮约 275 tokens 额外开销,大上下文窗口下可忽略

潜在局限

  • 运维复杂度:需自行维护 ChromaDB 和 Ollama 服务健康
  • 冷启动问题:空库或无匹配结果时无记忆可用
  • 嵌入质量依赖:nomic-embed-text 性能虽优,但逊于云端嵌入模型
  • 无跨会话同步:纯本地架构,多设备场景需自行解决数据同步

适合人群

隐私敏感型企业用户、需要处理敏感数据的合规场景、希望完全掌控 AI 基础设施的技术团队,以及已具备本地 LLM 运维经验的开发者。

常规风险

  • 数据持久化:ChromaDB 默认配置下需关注存储卷备份策略
  • 性能瓶颈:大规模记忆库(百万级文档)需评估 ChromaDB 索引优化
  • 相似度阈值误配:minScore 设置不当导致信息噪声或遗漏关键上下文

安全解读

核心用法

ChromaDB Memory 是一款为AI对话系统设计的长期语义记忆插件,通过向量数据库实现跨会话的上下文延续。核心工作流程包含自动召回(Auto-recall)与手动搜索两种模式:每次用户发消息时,插件自动调用Ollama的nomic-embed-text模型将查询编码为768维向量,在本地ChromaDB中执行最近邻搜索,将相似度超过阈值(默认0.5)的历史记录注入当前对话上下文;用户也可通过chromadb_search工具主动检索记忆库。

部署需三步:启动ChromaDB容器(端口8100)、配置Ollama并拉取嵌入模型、在OpenClaw配置文件中启用插件并指定collection ID。支持精细调参,包括召回数量(1-5条)、相似度阈值(0-1)、开关自动召回等。

显著优点

| 维度 | 优势 |
|------|------|
| **隐私安全** | 100%本地运行,数据永不离开硬件,零云端API调用 |
| **零依赖** | 无npm/pip外部包,纯原生fetch实现,消除供应链攻击面 |
| **低延迟** | 局域网localhost通信,无网络往返延迟 |
| **成本可控** | 无API调用费用,一次性硬件投入 |
| **上下文质量** | 语义搜索优于关键词匹配,跨主题联想能力强 |

潜在缺点与局限性

1. 运维复杂度:需自行维护ChromaDB和Ollama服务,对非技术用户门槛较高
2. 冷启动问题:空记忆库时无自动召回效果,需预先索引文档

3. 幻觉风险:召回的"相关"上下文可能与当前意图存在语义偏差,导致模型被误导

4. 存储成本:长期积累大量向量数据可能占用显著磁盘空间

5. 模型绑定:依赖特定嵌入模型(nomic-embed-text),切换模型需重新索引

适合人群

  • 隐私敏感用户:医疗、法律、金融等数据合规要求严格的场景
  • 本地AI爱好者:已部署Ollama本地大模型的技术用户
  • 长期对话应用:个人知识管理、客服机器人、数字伴侣等需要记忆延续的场景
  • 离线环境:无稳定互联网连接的企业内网部署

常规风险

| 风险类型 | 说明 | 缓解措施 |
|----------|------|----------|
| 服务可用性 | ChromaDB/Ollama进程崩溃导致记忆功能失效 | 配置systemd守护进程自动重启 |
| 召回噪声 | 低阈值设置引入无关历史,干扰当前对话 | 提高minScore至0.6-0.7 |
| 上下文膨胀 | 高频使用导致token消耗累积 | 监控token使用,调整autoRecallResults |
| 未授权访问 | 本地端口暴露至公网被恶意利用 | 防火墙限制8100/11434仅localhost访问 |

Token开销方面,每次自动召回约增加275 tokens(3条结果×约300字符+包装),在200K+上下文窗口中可忽略不计。

Chromadb Memory Pub 内容

scripts文件夹
手动下载zip · 5.5 kB
index.tstext/plain
请选择文件