使用说明

核心用法

Swarm 是基于 Gemini Flash 的并行任务执行引擎，专为需要同时处理多个独立任务的场景设计。用户通过本地守护进程（daemon）管理任务分发，支持四种主要执行模式：

1. Parallel（并行）：同时执行 N 个独立提示，适用于批量问答、多主题对比
2. Research（研究）：多阶段流水线（搜索→抓取→分析），自动调用 Google Search grounding
3. Chain（链式）：构建多阶段分析管道，支持并行、单例、扇出、归约四种阶段模式，内置 10+ 专业视角（提取器、分析师、批判者等）
4. Benchmark（基准测试）：用 LLM-as-judge 对比单线程/并行/链式执行质量

关键特性：

LRU 缓存：命中时 212-514 倍加速，持久化存储
智能重试：仅失败任务重试，非整阶段重启
成本追踪：实时显示会话/日/月节省金额

显著优点

极致成本效益：Gemini Flash 价格约为 Opus 的 1/200，30 个任务从 ~$0.50 降至 ~$0.003
速度优异：并行模式下任务平均耗时 120-140ms，10 个任务约 1.2 秒完成
架构灵活：Chain 模式支持自动构建（auto-chain）或手动定义复杂流水线，深度预设从 quick（2 阶段）到 exhaustive（8 阶段）
零额外搜索成本：Gemini 的 Google Search grounding 不产生额外费用
开发者友好：提供 JavaScript API、REST 端点、CLI 三重接口

潜在缺点与局限性

模型质量边界：Gemini Flash 在复杂推理、长文本连贯性、创意写作方面弱于 Opus/Claude 3.5 Sonnet，不适合对质量极度敏感的单任务
网络依赖：Research 模式依赖 Google Search，国内或特殊网络环境可能不稳定
Node.js 依赖：要求本地安装 Node 运行时，非技术用户门槛较高
缓存陷阱：缓存键仅基于指令+输入+视角哈希，业务逻辑变化可能导致脏读，需手动清除
并发限制：默认最多 16 并发，超量需队列等待；Gemini 本身存在速率限制

适合人群

高频 API 使用者：日均消耗数万 token 的开发者、分析师、自动化工作流搭建者
批量处理场景：需要同时分析多个竞品、多份文档、多个数据源的运营/产品/研究人员
成本敏感型团队：初创公司、个人开发者、学生项目，需在有限预算内最大化调用次数
工程化思维用户：熟悉 CLI、愿意配置 YAML、理解并发与缓存概念的技术人员

常规风险

质量误判风险：过度依赖成本优势可能在关键任务上牺牲质量，建议对核心输出抽样复核
配置泄露：YAML 配置和 API key 存储于本地明文文件，共享机器需注意权限
缓存过时：TTL 1 小时的默认设置对时效性数据可能过长，需根据场景调整
单点故障：守护进程崩溃会导致任务中断，生产环境建议监控进程健康
供应商锁定：深度依赖 Gemini 生态，切换模型需重构配置和部分逻辑

parallel-computing cost-optimization gemini batch-processing cli api-orchestration caching workflow-automation

Swarm 内容

暂无文件树

手动下载zip · 112.9 kB

contentapplication/octet-stream

请选择文件