synapse

🧠 AI 驱动的 P2P 语义知识网络

HiveBrain Project 开源的 P2P 语义文件共享工具,基于 BitTorrent 与向量嵌入实现 Agent 间安全知识发现与传输。

收藏
1.9k
安装
906
版本
v0.2.0
CLS 安全性认证2026-05-01
点击查看完整报告 >

使用说明

核心用法

Synapse 是一款面向 Agent 生态的 P2P 文件共享协议,核心功能围绕「语义搜索驱动的内容发现」展开。用户通过 CLI 工具完成全流程操作:启动 seeder 守护进程后,使用 share 命令将本地文件注册到网络,系统自动生成 768 维向量嵌入并创建磁力链接;其他节点可通过 search 以自然语言查询语义相似内容,获取带相似度评分的排名结果,再用 download 拉取文件。全程基于 BitTorrent DHT 网络传输,无需中心化存储。

显著优点

1. 语义级内容发现:突破传统文件名搜索限制,基于 Nomic 嵌入模型实现「用意思找文件」,特别适合知识库、文档库场景。
2. 后量子安全架构:采用 ML-DSA-87 数字签名,为长期数据完整性提供抗量子计算攻击的保障。

3. 多层威胁防护:内置 assimilation 安全扫描引擎,可检测提示注入、数据外泄、恶意代码执行等 5 类高危模式。

4. 零配置体验:基于 uv 包管理器实现依赖自动安装,用户无需手动处理 Python 虚拟环境或模型下载。

5. 去中心化设计:无单点故障,支持自定义 tracker,适合构建抗审查的分布式知识网络。

潜在缺点与局限性

  • 网络依赖性强:依赖公共 tracker(hivebraintracker.com)和 DHT 网络,若 tracker 不可用或网络分区,搜索功能将失效。
  • 嵌入模型开销:首次运行需从 HuggingFace 下载 sentence-transformers 模型,对带宽和磁盘有一定要求;大文件向量化也可能产生计算延迟。
  • P2P 内容风险:尽管有签名验证,但网络中仍可能存在恶意用户分享的污染内容,严格模式(strict_mode)需手动开启。
  • 生态成熟度:作为 0.2.0 版本的社区项目,API 稳定性、长期维护及企业级支持尚未经过大规模验证。

适合的目标群体

  • AI Agent 开发者:需要让多个 Agent 实例安全共享知识片段、记忆库或微调数据集。
  • 分布式团队:希望在无中心化服务器的情况下,建立内部文档的语义化共享网络。
  • 研究者与开源社区:关注后量子密码学应用、去中心化信息检索技术的早期采用者。
  • 隐私敏感用户:不愿将文件上传至公有云,偏好 P2P 直连传输的场景。

使用风险

  • 文件系统风险:需读写 ~/.openclaw// 目录及用户指定路径,若配置不当可能存在路径遍历隐患(当前实现使用标准 Path 库,风险可控)。
  • 网络暴露面:默认开放 6881 端口用于 BitTorrent 通信,需确保防火墙策略符合组织安全规范。
  • 依赖项供应链:核心依赖 libtorrent(C++)、liboqs-python(后量子加密)及 HuggingFace 模型下载,需信任上游源完整性。
  • 资源消耗:后台守护进程持续运行,大量种子文件可能占用内存;大文件分块哈希计算对 CPU 有一定压力。

安全解读

核心功能与架构

Synapse 是由 HiveBrain Project 开发的 Agent-to-Agent P2P 文件共享协议,创新性地将 BitTorrent 分布式传输与向量嵌入语义搜索相结合。其核心架构包含:

  • BitTorrent 引擎:基于 libtorrent 实现 DHT、UPnP、NAT-PMP 穿透,支持标准磁力链分发
  • 语义嵌入层:集成 sentence-transformers/Nomic 模型,将文件内容编码为 768 维向量
  • 混合搜索:结合关键词过滤与余弦相似度排序,实现"用概念找文件"的内容发现
  • 后量子身份:采用 ML-DSA-87 数字签名(FIPS 203 标准),可降级至 Ed25519

显著优势

1. 去中心化知识网络:无需中央索引,Agent 直接共享结构化知识数据
2. 内容感知检索:突破传统文件名搜索,支持"Kubernetes 部署指南"语义匹配

3. uv 零配置部署:依赖自动管理,无需手动虚拟环境

4. ML-DSA 前瞻安全:提前部署后量子密码学,抵御未来量子计算威胁

潜在局限与风险

| 维度 | 问题 | 影响 |
|------|------|------|
| **传输安全** | Tracker 通信使用 HTTP 明文(RISK-001) | 元数据与嵌入向量可被中间人窃听 |
| **代码执行** | `trust_remote_code=True` 加载 HuggingFace 模型(RISK-003) | 供应链攻击可导致远程代码执行 |
| **子进程风险** | openssl 命令通过 subprocess 调用(RISK-002) | 参数注入潜在攻击面 |
| **权限过大** | Unix socket 使用 0o666 权限(RISK-004) | 多用户环境信息泄露 |
| **网络暴露** | 默认监听 0.0.0.0,启用 DHT/UPnP(RISK-006) | 企业环境可能违反安全策略 |

适合人群

  • AI Agent 开发者:需要跨实例共享知识库、向量数据的分布式系统
  • 科研协作团队:开源论文、数据集的去中心化分发与语义检索
  • 隐私敏感用户:不愿将文件上传至中心化云存储的内容创作者
  • 技术尝鲜者:关注后量子密码学与 P2P 协议融合的前沿实践

常规风险

  • 合规风险:BitTorrent 协议在某些企业网络被禁用,可能触发安全告警
  • 数据完整性:HTTP Tracker 无 TLS,需依赖应用层签名验证数据真实性
  • 模型供应链:HuggingFace 账户若被攻破,可植入恶意嵌入模型
  • 长期维护:社区项目(T2 来源)持续更新承诺弱于顶级基金会项目

使用建议

生产环境部署前,务必:1) 强制配置 HTTPS Tracker 或启用签名验证;2) 预下载并哈希校验模型文件,禁用 trust_remote_code;3) 通过防火墙限制 DHT 端口范围,禁用 UPnP;4) 定期运行 pip-audit 扫描依赖 CVE。

synapse 内容

src文件夹
synapse文件夹
手动下载zip · 53.5 kB
__init__.pytext/plain
请选择文件