使用说明

核心用法

Synapse 是一款面向 Agent 生态的 P2P 文件共享协议，核心功能围绕「语义搜索驱动的内容发现」展开。用户通过 CLI 工具完成全流程操作：启动 seeder 守护进程后，使用 share 命令将本地文件注册到网络，系统自动生成 768 维向量嵌入并创建磁力链接；其他节点可通过 search 以自然语言查询语义相似内容，获取带相似度评分的排名结果，再用 download 拉取文件。全程基于 BitTorrent DHT 网络传输，无需中心化存储。

显著优点

1. 语义级内容发现：突破传统文件名搜索限制，基于 Nomic 嵌入模型实现「用意思找文件」，特别适合知识库、文档库场景。
2. 后量子安全架构：采用 ML-DSA-87 数字签名，为长期数据完整性提供抗量子计算攻击的保障。
3. 多层威胁防护：内置 assimilation 安全扫描引擎，可检测提示注入、数据外泄、恶意代码执行等 5 类高危模式。
4. 零配置体验：基于 uv 包管理器实现依赖自动安装，用户无需手动处理 Python 虚拟环境或模型下载。
5. 去中心化设计：无单点故障，支持自定义 tracker，适合构建抗审查的分布式知识网络。

潜在缺点与局限性

网络依赖性强：依赖公共 tracker（hivebraintracker.com）和 DHT 网络，若 tracker 不可用或网络分区，搜索功能将失效。
嵌入模型开销：首次运行需从 HuggingFace 下载 sentence-transformers 模型，对带宽和磁盘有一定要求；大文件向量化也可能产生计算延迟。
P2P 内容风险：尽管有签名验证，但网络中仍可能存在恶意用户分享的污染内容，严格模式（strict_mode）需手动开启。
生态成熟度：作为 0.2.0 版本的社区项目，API 稳定性、长期维护及企业级支持尚未经过大规模验证。

适合的目标群体

AI Agent 开发者：需要让多个 Agent 实例安全共享知识片段、记忆库或微调数据集。
分布式团队：希望在无中心化服务器的情况下，建立内部文档的语义化共享网络。
研究者与开源社区：关注后量子密码学应用、去中心化信息检索技术的早期采用者。
隐私敏感用户：不愿将文件上传至公有云，偏好 P2P 直连传输的场景。

使用风险

文件系统风险：需读写 ~/.openclaw// 目录及用户指定路径，若配置不当可能存在路径遍历隐患（当前实现使用标准 Path 库，风险可控）。
网络暴露面：默认开放 6881 端口用于 BitTorrent 通信，需确保防火墙策略符合组织安全规范。
依赖项供应链：核心依赖 libtorrent（C++）、liboqs-python（后量子加密）及 HuggingFace 模型下载，需信任上游源完整性。
资源消耗：后台守护进程持续运行，大量种子文件可能占用内存；大文件分块哈希计算对 CPU 有一定压力。

安全解读

核心功能与架构

Synapse 是由 HiveBrain Project 开发的 Agent-to-Agent P2P 文件共享协议，创新性地将 BitTorrent 分布式传输与向量嵌入语义搜索相结合。其核心架构包含：

BitTorrent 引擎：基于 libtorrent 实现 DHT、UPnP、NAT-PMP 穿透，支持标准磁力链分发
语义嵌入层：集成 sentence-transformers/Nomic 模型，将文件内容编码为 768 维向量
混合搜索：结合关键词过滤与余弦相似度排序，实现"用概念找文件"的内容发现
后量子身份：采用 ML-DSA-87 数字签名（FIPS 203 标准），可降级至 Ed25519

显著优势

1. 去中心化知识网络：无需中央索引，Agent 直接共享结构化知识数据
2. 内容感知检索：突破传统文件名搜索，支持"Kubernetes 部署指南"语义匹配
3. uv 零配置部署：依赖自动管理，无需手动虚拟环境
4. ML-DSA 前瞻安全：提前部署后量子密码学，抵御未来量子计算威胁

潜在局限与风险

| 维度 | 问题 | 影响 |

|------|------|------|

| **传输安全** | Tracker 通信使用 HTTP 明文（RISK-001） | 元数据与嵌入向量可被中间人窃听 |

| **代码执行** | `trust_remote_code=True` 加载 HuggingFace 模型（RISK-003） | 供应链攻击可导致远程代码执行 |

| **子进程风险** | openssl 命令通过 subprocess 调用（RISK-002） | 参数注入潜在攻击面 |

| **权限过大** | Unix socket 使用 0o666 权限（RISK-004） | 多用户环境信息泄露 |

| **网络暴露** | 默认监听 0.0.0.0，启用 DHT/UPnP（RISK-006） | 企业环境可能违反安全策略 |

适合人群

AI Agent 开发者：需要跨实例共享知识库、向量数据的分布式系统
科研协作团队：开源论文、数据集的去中心化分发与语义检索
隐私敏感用户：不愿将文件上传至中心化云存储的内容创作者
技术尝鲜者：关注后量子密码学与 P2P 协议融合的前沿实践

常规风险

合规风险：BitTorrent 协议在某些企业网络被禁用，可能触发安全告警
数据完整性：HTTP Tracker 无 TLS，需依赖应用层签名验证数据真实性
模型供应链：HuggingFace 账户若被攻破，可植入恶意嵌入模型
长期维护：社区项目（T2 来源）持续更新承诺弱于顶级基金会项目

使用建议

生产环境部署前，务必：1) 强制配置 HTTPS Tracker 或启用签名验证；2) 预下载并哈希校验模型文件，禁用 trust_remote_code；3) 通过防火墙限制 DHT 端口范围，禁用 UPnP；4) 定期运行 pip-audit 扫描依赖 CVE。

p2p semantic-search knowledge-sharing distributed data-analytics security content-media api

synapse 内容

src文件夹

synapse文件夹

手动下载zip · 53.5 kB

__init__.pytext/plain

请选择文件