核心用法
Swarm 是一款基于 Node.js 的并行任务执行工具,专为 Claude 用户设计,通过调用 Gemini Flash 模型实现低成本、高效率的批量任务处理。核心功能包括:
- 并行提示执行:使用
swarm parallel同时运行多个独立提示,支持 20 个并发 worker - 多主题研究:
swarm research提供搜索→获取→分析的多阶段工作流 - 守护进程管理:常驻后台的 daemon 保持 worker 预热,降低延迟
- JavaScript API:程序化调用
parallel()和research()函数
显著优点
1. 极致成本优势:Gemini Flash 定价约 $0.075/百万 tokens,较 Opus ($15/百万) 降低 200 倍
2. 速度提升:30 个任务从 Opus 顺序执行的 ~30 秒降至 ~1 秒
3. 配额保护:将高消耗的批量工作转移至廉价 API,保留 Opus 额度用于关键任务
4. 吞吐量可扩展:批量越大效率越高,50 任务可达 35 tasks/sec
潜在局限
- 模型能力降级:Gemini Flash 在复杂推理、长文本理解、创意写作方面弱于 Opus
- 额外运维层:需管理 Node.js 守护进程,增加系统复杂度
- 供应商锁定:目前仅支持 Gemini,切换成本高
- 冷启动问题:daemon 未运行时首请求延迟较高
适合人群
- 高频使用 Claude Opus 且预算敏感的个人/团队开发者
- 需批量处理研究、摘要、比较类任务的自动化工作流用户
- 已具备 Node.js 环境的技术用户
常规风险
| 风险类型 | 说明 |
|---------|------|
| API 密钥泄露 | 需配置 `GEMINI_API_KEY`,建议配合密钥管理工具 |
| 速率限制 | 并发过高可能触发 Google API 限流,需调低 `max_concurrent_api` |
| 结果质量波动 | Flash 模型输出稳定性不及 Opus,关键任务需人工校验 |
| 依赖维护 | 开源项目(GitHub: Chair4ce/node-scaling)持续维护存在不确定性 |