memory-lancedb-hybrid

🧠 本地混合搜索长期记忆插件

AI 增强榜 #22

OpenClaw 本地混合搜索记忆插件,基于 LanceDB 融合语义与 BM25 检索,在保障数据隐私的同时显著提升长期记忆准确性。

收藏
16.2k
安装
3.6k
版本
v1.2.0
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

该技能是一个 OpenClaw 平台的本地插件扩展,通过覆盖内置的 memory-lancedb 插件,为 AI Agent 提供增强型的长期记忆能力。安装后,用户需在 openclaw.json 中配置插件路径并启用混合搜索模式。插件支持两种重排序算法:RRF(Reciprocal Rank Fusion,推荐)和线性加权组合。一旦启用,memory_recall 等工具将自动使用向量语义搜索与 BM25 全文搜索的混合模式,无需修改现有代码。插件会自动尝试创建 FTS(全文搜索)索引,若失败则优雅降级为纯向量搜索。

最大的优势是结合了语义理解的向量搜索和精确匹配的 BM25 关键词搜索,显著提升了记忆检索的准确性和召回率。RRF 算法无需调参即可有效融合两种搜索结果,而线性模式则允许用户根据场景调整权重。所有数据存储在本地 LanceDB 数据库,确保隐私安全。插件设计为"即插即用",通过覆盖内置插件 ID 实现无缝升级,保留原有数据路径。完善的配置验证(JSON Schema)和类型安全(TypeScript)确保了稳定性,FTS 索引创建失败时的自动降级机制保证了服务连续性。

首先,该技能强依赖 OpenAI API 进行文本嵌入,无法在完全离线环境使用,且会产生 API 调用成本。其次,作为 T3 来源的个人开发者项目,长期维护和支持的持续性存在一定不确定性。安装过程需要手动执行 npm install 安装依赖,对非技术用户不够友好。此外,该插件专为 OpenClaw 平台设计,无法在其他 AI 框架或独立环境中使用。混合搜索虽然提升了准确性,但相比纯向量搜索会增加一定的计算和响应延迟。

主要面向使用 OpenClaw 框架构建 AI Agent 的开发者,特别是那些需要高精度记忆检索的场景,如客服助手、知识管理、长期对话伴侣等。适合注重数据隐私、倾向本地存储而非云端记忆服务的用户。对于需要同时处理语义相似性查询和精确关键词匹配(如特定术语、人名、代码片段)的应用场景尤为适用。技术团队应具备基本的 Node.js 环境和配置文件管理能力。

性能方面,混合搜索涉及两次查询和重排序计算,高并发场景下可能成为瓶颈。依赖风险包括 OpenAI API 的可用性和潜在的成本累积。数据安全方面,虽然记忆数据本地存储,但嵌入过程需将文本发送至 OpenAI,对极度敏感数据需谨慎。建议定期备份 ~/.openclaw/memory/lancedb 目录以防数据丢失。由于插件覆盖内置功能,升级 OpenClaw 主程序时需注意兼容性问题。

安全解读

核心功能

memory-lancedb-hybrid 是 OpenClaw 生态的官方增强型记忆插件,在标准 LanceDB 向量存储基础上引入 BM25 + 向量混合搜索 能力,通过 Reciprocal Rank Fusion (RRF) 或线性加权重排序,显著改善语义搜索对精确关键词匹配不足的痛点。

技术架构

  • 双重检索通道:语义向量搜索(OpenAI text-embedding-3-small)+ 全文 BM25 倒排索引
  • 智能重排序:默认 RRF 算法融合双路结果,可选线性加权模式灵活调整 vector/text 权重(默认 0.7/0.3)
  • 零侵入部署:通过 plugins.load.paths 机制运行时覆盖内置 memory-lancedb,无需修改 OpenClaw 安装

显著优点

1. 召回率跃升:BM25 补足向量搜索对专有名词、代码片段、数字等精确匹配的短板
2. 生产级容错:FTS 索引构建失败自动降级至纯向量搜索,保障服务连续性

3. 配置即热插拔:JSON Schema 严格校验,UI 提示友好,支持 autoCapture/autoRecall 无缝衔接现有工作流

4. 数据零迁移:复用原有 dbPath,历史记忆数据可直接启用混合搜索

局限性与风险

  • 云 API 依赖:必需 OpenAI API Key,离线环境无法工作;API 限流或故障时功能降级
  • 隐私权衡:文本需传输至 OpenAI 生成 embedding,敏感场景需评估数据出境合规
  • 存储开销:FTS 索引额外占用磁盘空间,高频写入场景需监控存储增长
  • 环境配置复杂度:相较内置插件增加 hybrid 配置块,新手需仔细阅读文档

适合人群

  • 需要 高精度记忆召回 的开发者(RAG 聊天助手、代码知识库、长对话 Agent)
  • 已有 OpenClaw + LanceDB 部署,希望 无缝升级搜索质量 的现有用户
  • 愿意接受 OpenAI 依赖以换取 开箱即用 SOTA 嵌入质量 的场景

安全评估

CLS-Certify v2.1.0 全量扫描评定 Grade A / Score 78,代码 620 行无危险函数(eval/exec/system),依赖均为可信开源库(@lancedb/lancedbopenai)。网络行为仅限于 api.openai.com TLS 加密通信,本地数据隔离存储于 ~/.openclaw/memory/lancedb。主要风险为 API Key 环境变量管理(RISK-003),建议采用 ${ENV_VAR} 语法避免硬编码泄露。

memory-lancedb-hybrid 内容

plugin文件夹
手动下载zip · 18.0 kB
config.tstext/plain
请选择文件