swarm - 200倍降本的并行AI计算引擎

使用说明

Swarm 是一个面向 AI Agent 的并行任务执行引擎，核心机制是将原本顺序执行的 LLM 调用分发到多个廉价的 Gemini Flash Worker 节点上并行处理。用户通过本地 Daemon（localhost:9999）协调任务，支持单节点和多节点分布式部署两种模式。

基础工作流为：启动 Daemon → 提交并行任务列表 → 自动分发到各 Worker → 聚合返回结果。命令行接口简洁，支持 swarm parallel 直接运行多提示任务，，swarm bench 进行吞吐量测试。配置通过 YAML 文件管理，可设置节点上限、并发数、每日预算等参数。

极致成本效益：官方数据显示 600 任务场景下，相比 Claude Opus 顺序执行，成本从约 $9.00 降至 $0.045，实现 200 倍成本降低；时间从约 10 分钟压缩至 3.8 秒，速度提升 157 倍。

线性扩展能力：单节点可达 30-35 任务/秒，6 节点分布式部署实测达 181 任务/秒，每新增节点约增加 30 任务/秒吞吐量，适合大规模批处理场景。

多提供商兼容：除推荐的 Gemini Flash 外，支持 OpenAI、Anthropic、Groq 等主流 LLM API，用户可按需切换。

内置安全机制：包含提示注入检测（识别 "ignore all previous instructions" 等攻击模式）、输出脱敏（自动隐藏 API 密钥格式）、安全策略包装（预置系统提示防止凭证泄露）三层防护。

网络依赖性强：所有 Worker 需稳定连接 LLM 提供商 API，离线环境无法使用；DuckDuckGo 搜索和网页抓取功能依赖外部服务可用性。

任务独立性要求：仅适合可并行化的独立任务，存在状态依赖或需顺序执行的工作流无法直接套用。

本地服务暴露：Daemon 默认监听 localhost:9999，虽 CORS 限制为本地，但多节点部署时需自行保障网络隔离。

成本监控依赖配置：虽有 max_daily_spend 参数，但实际额度消耗取决于 API 提供商计费，超支风险需用户主动监控。

API 配额与计费风险：并行高并发可能快速消耗 API 额度，建议配置 max_daily_spend 并监控用量。

网络与依赖稳定性：DuckDuckGo 搜索、网页抓取、LLM API 任一服务故障将影响任务完成率。

多节点部署复杂度：分布式场景需自行管理节点发现、网络连通性和负载均衡，增加运维负担。

提示注入残余风险：虽有检测机制，但新型攻击模式可能绕过规则，处理不可信来源内容时仍需警惕。

bin文件夹

docker文件夹

coordinator文件夹

worker文件夹

docs文件夹

examples文件夹

lib文件夹

providers文件夹

scripts文件夹

skill文件夹

test文件夹

手动下载zip · 99.5 kB

diagnose.jstext/javascript

请选择文件