使用说明

核心用法

Swarm 是一个专为 AI 代理设计的并行任务执行框架，采用 Node.js 构建，核心机制是将大规模 LLM 任务分发到廉价的 Gemini Flash 工作节点，而非在单一昂贵模型（如 Claude Opus）上串行执行。

关键操作：

swarm start 启动守护进程
swarm parallel "prompt1" "prompt2" ... 并行执行多个提示
swarm bench --tasks N 基准测试吞吐量
支持多节点分布式部署，线性扩展处理能力

显著优点

1. 极致成本效益：600 次任务对比测试中，Swarm 成本约 $0.045，而 Opus 串行执行约 $9.00，成本降低 200 倍
2. 超高吞吐量：单节点可达 35 tasks/sec，6 节点分布式集群可达 181 tasks/sec，速度提升 157 倍
3. API 配额保护：将消耗型任务转移到廉价模型，保留昂贵模型的配额用于关键任务
4. 线性可扩展：每新增一个节点约增加 30 tasks/sec，支持最多 20 节点配置
5. 轻量部署：基于 Node.js，npm 一键安装，支持本地文件协调或可选的 Supabase 后端

潜在缺点与局限性

1. 模型能力降级：Gemini Flash 在复杂推理、长上下文理解、创意写作等任务上可能不及 Claude Opus 等旗舰模型
2. 任务耦合限制：仅适合可并行化的独立任务，存在依赖关系的任务链无法直接受益
3. 运维复杂度：多节点部署需要额外机器管理，网络延迟和节点故障可能影响整体吞吐量
4. 冷启动开销：守护进程启动和任务分发存在固定开销，极小批量任务（<3 个）可能得不偿失
5. 配置门槛：需要自行管理 API 密钥、成本上限（max_daily_spend）和节点配额

适合人群

需要批量处理独立研究查询的知识工作者
执行多文档分析、多 URL 抓取摘要的内容团队
希望优化 AI 成本结构、保护昂贵 API 配额的开发者
具备基础 Node.js/运维能力的技术用户

常规风险

API 密钥泄露：需自行保管 GEMINI_API_KEY，框架本身无凭证硬编码
成本失控：虽单价低廉，但高并发场景下仍需配置 max_daily_spend 限制
输出质量波动：廉价模型可能产生不一致结果，关键任务建议抽样验证
网络依赖：分布式模式依赖节点间通信，网络不稳定可能导致任务丢失或重复执行

ai-orchestration parallel-computing cost-optimization gemini-api nodejs distributed-systems llm-inference developer-tools

Swarm 内容

暂无文件树

手动下载zip · 100.9 kB

contentapplication/octet-stream

请选择文件