核心用法
ChromaDB Memory 是一款为AI对话系统设计的长期语义记忆插件,通过向量数据库实现跨会话的上下文延续。核心工作流程包含自动召回(Auto-recall)与手动搜索两种模式:每次用户发消息时,插件自动调用Ollama的nomic-embed-text模型将查询编码为768维向量,在本地ChromaDB中执行最近邻搜索,将相似度超过阈值(默认0.5)的历史记录注入当前对话上下文;用户也可通过chromadb_search工具主动检索记忆库。
部署需三步:启动ChromaDB容器(端口8100)、配置Ollama并拉取嵌入模型、在OpenClaw配置文件中启用插件并指定collection ID。支持精细调参,包括召回数量(1-5条)、相似度阈值(0-1)、开关自动召回等。
显著优点
| 维度 | 优势 |
|------|------|
| **隐私安全** | 100%本地运行,数据永不离开硬件,零云端API调用 |
| **零依赖** | 无npm/pip外部包,纯原生fetch实现,消除供应链攻击面 |
| **低延迟** | 局域网localhost通信,无网络往返延迟 |
| **成本可控** | 无API调用费用,一次性硬件投入 |
| **上下文质量** | 语义搜索优于关键词匹配,跨主题联想能力强 |
潜在缺点与局限性
1. 运维复杂度:需自行维护ChromaDB和Ollama服务,对非技术用户门槛较高
2. 冷启动问题:空记忆库时无自动召回效果,需预先索引文档
3. 幻觉风险:召回的"相关"上下文可能与当前意图存在语义偏差,导致模型被误导
4. 存储成本:长期积累大量向量数据可能占用显著磁盘空间
5. 模型绑定:依赖特定嵌入模型(nomic-embed-text),切换模型需重新索引
适合人群
- 隐私敏感用户:医疗、法律、金融等数据合规要求严格的场景
- 本地AI爱好者:已部署Ollama本地大模型的技术用户
- 长期对话应用:个人知识管理、客服机器人、数字伴侣等需要记忆延续的场景
- 离线环境:无稳定互联网连接的企业内网部署
常规风险
| 风险类型 | 说明 | 缓解措施 |
|----------|------|----------|
| 服务可用性 | ChromaDB/Ollama进程崩溃导致记忆功能失效 | 配置systemd守护进程自动重启 |
| 召回噪声 | 低阈值设置引入无关历史,干扰当前对话 | 提高minScore至0.6-0.7 |
| 上下文膨胀 | 高频使用导致token消耗累积 | 监控token使用,调整autoRecallResults |
| 未授权访问 | 本地端口暴露至公网被恶意利用 | 防火墙限制8100/11434仅localhost访问 |
Token开销方面,每次自动召回约增加275 tokens(3条结果×约300字符+包装),在200K+上下文窗口中可忽略不计。