核心用法
Swarm 是基于 Gemini Flash 的并行任务执行引擎,专为需要同时处理多个独立任务的场景设计。用户通过本地守护进程(daemon)管理任务分发,支持四种主要执行模式:
1. Parallel(并行):同时执行 N 个独立提示,适用于批量问答、多主题对比
2. Research(研究):多阶段流水线(搜索→抓取→分析),自动调用 Google Search grounding
3. Chain(链式):构建多阶段分析管道,支持并行、单例、扇出、归约四种阶段模式,内置 10+ 专业视角(提取器、分析师、批判者等)
4. Benchmark(基准测试):用 LLM-as-judge 对比单线程/并行/链式执行质量
关键特性:
- LRU 缓存:命中时 212-514 倍加速,持久化存储
- 智能重试:仅失败任务重试,非整阶段重启
- 成本追踪:实时显示会话/日/月节省金额
显著优点
- 极致成本效益:Gemini Flash 价格约为 Opus 的 1/200,30 个任务从 ~$0.50 降至 ~$0.003
- 速度优异:并行模式下任务平均耗时 120-140ms,10 个任务约 1.2 秒完成
- 架构灵活:Chain 模式支持自动构建(auto-chain)或手动定义复杂流水线,深度预设从 quick(2 阶段)到 exhaustive(8 阶段)
- 零额外搜索成本:Gemini 的 Google Search grounding 不产生额外费用
- 开发者友好:提供 JavaScript API、REST 端点、CLI 三重接口
潜在缺点与局限性
- 模型质量边界:Gemini Flash 在复杂推理、长文本连贯性、创意写作方面弱于 Opus/Claude 3.5 Sonnet,不适合对质量极度敏感的单任务
- 网络依赖:Research 模式依赖 Google Search,国内或特殊网络环境可能不稳定
- Node.js 依赖:要求本地安装 Node 运行时,非技术用户门槛较高
- 缓存陷阱:缓存键仅基于指令+输入+视角哈希,业务逻辑变化可能导致脏读,需手动清除
- 并发限制:默认最多 16 并发,超量需队列等待;Gemini 本身存在速率限制
适合人群
- 高频 API 使用者:日均消耗数万 token 的开发者、分析师、自动化工作流搭建者
- 批量处理场景:需要同时分析多个竞品、多份文档、多个数据源的运营/产品/研究人员
- 成本敏感型团队:初创公司、个人开发者、学生项目,需在有限预算内最大化调用次数
- 工程化思维用户:熟悉 CLI、愿意配置 YAML、理解并发与缓存概念的技术人员
常规风险
- 质量误判风险:过度依赖成本优势可能在关键任务上牺牲质量,建议对核心输出抽样复核
- 配置泄露:YAML 配置和 API key 存储于本地明文文件,共享机器需注意权限
- 缓存过时:TTL 1 小时的默认设置对时效性数据可能过长,需根据场景调整
- 单点故障:守护进程崩溃会导致任务中断,生产环境建议监控进程健康
- 供应商锁定:深度依赖 Gemini 生态,切换模型需重构配置和部分逻辑