使用说明

核心用法

ChromaDB Memory 为 OpenClaw 智能体提供本地长期记忆能力。插件在每个用户消息前自动执行：消息嵌入（Ollama nomic-embed-text）→ ChromaDB 向量检索 → 相似度过滤 → 上下文注入。用户也可通过 chromadb_search 工具手动查询记忆库。

显著优点

完全离线：零云端 API 依赖，数据不出本地
架构简洁：Ollama + ChromaDB 双组件，Docker 一键部署
无缝集成：自动召回机制对用户透明，无需手动管理上下文
成本可控：每轮约 275 tokens 额外开销，大上下文窗口下可忽略

潜在局限

运维复杂度：需自行维护 ChromaDB 和 Ollama 服务健康
冷启动问题：空库或无匹配结果时无记忆可用
嵌入质量依赖：nomic-embed-text 性能虽优，但逊于云端嵌入模型
无跨会话同步：纯本地架构，多设备场景需自行解决数据同步

适合人群

隐私敏感型企业用户、需要处理敏感数据的合规场景、希望完全掌控 AI 基础设施的技术团队，以及已具备本地 LLM 运维经验的开发者。

常规风险

数据持久化：ChromaDB 默认配置下需关注存储卷备份策略
性能瓶颈：大规模记忆库（百万级文档）需评估 ChromaDB 索引优化
相似度阈值误配：minScore 设置不当导致信息噪声或遗漏关键上下文

安全解读

核心用法

ChromaDB Memory 是一款为AI对话系统设计的长期语义记忆插件，通过向量数据库实现跨会话的上下文延续。核心工作流程包含自动召回（Auto-recall）与手动搜索两种模式：每次用户发消息时，插件自动调用Ollama的nomic-embed-text模型将查询编码为768维向量，在本地ChromaDB中执行最近邻搜索，将相似度超过阈值（默认0.5）的历史记录注入当前对话上下文；用户也可通过chromadb_search工具主动检索记忆库。

部署需三步：启动ChromaDB容器（端口8100）、配置Ollama并拉取嵌入模型、在OpenClaw配置文件中启用插件并指定collection ID。支持精细调参，包括召回数量（1-5条）、相似度阈值（0-1）、开关自动召回等。

显著优点

| 维度 | 优势 |

|------|------|

| **隐私安全** | 100%本地运行，数据永不离开硬件，零云端API调用 |

| **零依赖** | 无npm/pip外部包，纯原生fetch实现，消除供应链攻击面 |

| **低延迟** | 局域网localhost通信，无网络往返延迟 |

| **成本可控** | 无API调用费用，一次性硬件投入 |

| **上下文质量** | 语义搜索优于关键词匹配，跨主题联想能力强 |

潜在缺点与局限性

1. 运维复杂度：需自行维护ChromaDB和Ollama服务，对非技术用户门槛较高
2. 冷启动问题：空记忆库时无自动召回效果，需预先索引文档
3. 幻觉风险：召回的"相关"上下文可能与当前意图存在语义偏差，导致模型被误导
4. 存储成本：长期积累大量向量数据可能占用显著磁盘空间
5. 模型绑定：依赖特定嵌入模型（nomic-embed-text），切换模型需重新索引

适合人群

隐私敏感用户：医疗、法律、金融等数据合规要求严格的场景
本地AI爱好者：已部署Ollama本地大模型的技术用户
长期对话应用：个人知识管理、客服机器人、数字伴侣等需要记忆延续的场景
离线环境：无稳定互联网连接的企业内网部署

常规风险

| 风险类型 | 说明 | 缓解措施 |

|----------|------|----------|

| 服务可用性 | ChromaDB/Ollama进程崩溃导致记忆功能失效 | 配置systemd守护进程自动重启 |

| 召回噪声 | 低阈值设置引入无关历史，干扰当前对话 | 提高minScore至0.6-0.7 |

| 上下文膨胀 | 高频使用导致token消耗累积 | 监控token使用，调整autoRecallResults |

| 未授权访问 | 本地端口暴露至公网被恶意利用 | 防火墙限制8100/11434仅localhost访问 |

Token开销方面，每次自动召回约增加275 tokens（3条结果×约300字符+包装），在200K+上下文窗口中可忽略不计。

memory chromadb ollama vector-search local self-hosted auto-recall privacy-first

Chromadb Memory Pub 内容

scripts文件夹

手动下载zip · 5.5 kB

index.tstext/plain

请选择文件