openclaw-universal-memory

🧠 异构数据统一记忆存储方案

🥥47总安装量 14评分人数 17
100% 的用户推荐

基于 PostgreSQL 与 pgvector 的开源记忆层,支持多源数据标准化摄入、增量同步与向量检索,为 RAG 应用提供企业级数据基础。

A

基本安全,请在特定环境下使用

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 无危险代码执行:未检出 `eval()`、`exec()` 等动态代码执行函数,无动态代码下载
  • ✅ 凭证管理安全:无硬编码密码或 API Key,强制通过环境变量或配置文件注入数据库 DSN
  • ✅ 依赖可信:核心依赖 `psycopg[binary]>=3.2` 版本已锁定,无远程脚本执行风险
  • ⚠️ 子进程执行风险:使用 `subprocess.run()` 调用本地 Python 模块,需防范 PYTHONPATH 环境注入攻击
  • ⚠️ 数据库安全依赖:需用户自行确保 PostgreSQL 数据库的网络隔离、访问控制及最小权限配置

使用说明

核心用法

OpenClaw Universal Memory 提供了一个与连接器无关的通用记忆层,专为异构数据标准化存储而设计。用户首先通过环境变量或交互式配置安全存储 PostgreSQL 连接凭证(DSN),随后初始化标准化的实体/块 schema。系统支持两种主要数据摄入方式:直接导入 JSON/NDJSON 文件,或通过内置连接器(如 Gmail、Google 等)进行增量同步。每个连接器维护独立的 cursor 历史,确保断点续传能力。数据存储后,用户可利用 pgvector 进行语义搜索,也可查询近期摄入事件历史。

显著优点

该技能的最大优势在于其连接器无关的架构设计,通过标准化实体 schema(external_id、entity_type、title、body_text 等字段)统一不同来源的数据格式,消除数据孤岛。支持增量同步与游标管理,大幅降低重复数据抓取的开销。基于 PostgreSQL 与 pgvector 的存储方案提供了企业级数据可靠性,同时满足 RAG(检索增强生成)应用对向量检索的需求。安全设计方面,明确倡导最小权限原则(least-privilege),建议仅授予 um_* 表的操作权限,并通过环境变量注入敏感凭证,避免命令行暴露密码。

潜在缺点与局限性

首先,该技能强依赖 PostgreSQL 环境,用户需自行部署并配置 vector 扩展,对无数据库管理经验的技术人员存在一定门槛。其次,尽管项目提供了连接器模板,但自定义连接器开发仍需 Python 编程能力,且目前内置连接器数量有限。特别需要注意的是,该实现为AI 生成代码(虽有经验丰富的工程师监督),官方明确建议在生产环境部署前进行代码审计与验证。此外,脚本通过 subprocess.run() 执行本地 Python 模块,存在潜在的 PYTHONPATH 注入风险,需谨慎处理环境变量。

适合的目标群体

本技能主要面向以下群体:构建 RAG 应用的 AI 开发者,需要将多源非结构化数据转化为可检索的向量记忆;数据工程师与架构师,负责整合分散在 Gmail、Slack、Asana 等系统的企业数据;具备 PostgreSQL 运维能力的后端开发团队,希望建立统一的异构数据仓库。对于需要严格数据隐私控制的场景(如医疗、金融领域),由于数据完全存储在用户自主控制的数据库中,而非第三方 SaaS,具有显著的合规优势。

使用风险与注意事项

数据库安全风险:用户需自行确保 PostgreSQL 实例的网络隔离、访问控制和加密配置,使用最小权限账号(仅 SELECT/INSERT/UPDATE/DELETE on um_*)避免数据泄露。环境配置风险:DSN 配置虽支持环境变量,但不当的文件权限设置可能导致敏感信息泄露。连接器认证风险:第三方连接器(如 Google API)需要 OAuth 认证配置,用户需妥善保管刷新令牌。性能风险:大规模数据摄入可能影响数据库性能,建议参考文档中的调度策略(15分钟默认间隔)进行限流。合规责任:用户需确保对摄入数据拥有合法授权,并自行承担隐私保护、数据保留和监管合规责任。

openclaw-universal-memory 内容

文件夹图标scripts文件夹
手动下载zip · 4.1 kB
run_memory.pytext/plain
请选择文件