Swarm

🐝 200倍成本节省的并行 AI 引擎

Gemini Flash 并行任务执行工具,成本仅为 Opus 的 1/200,支持多任务并行、链式分析与缓存加速,大幅节省 API 配额。

收藏
9.7k
安装
3.6k
版本
1.3.2
CLS 安全性认证2026-05-18
点击查看完整报告 >

使用说明

核心用法

Swarm 是基于 Gemini Flash 的并行任务执行引擎,专为需要同时处理多个独立任务的场景设计。用户通过本地守护进程(daemon)管理任务分发,支持四种主要执行模式:

1. Parallel(并行):同时执行 N 个独立提示,适用于批量问答、多主题对比
2. Research(研究):多阶段流水线(搜索→抓取→分析),自动调用 Google Search grounding

3. Chain(链式):构建多阶段分析管道,支持并行、单例、扇出、归约四种阶段模式,内置 10+ 专业视角(提取器、分析师、批判者等)

4. Benchmark(基准测试):用 LLM-as-judge 对比单线程/并行/链式执行质量

关键特性

  • LRU 缓存:命中时 212-514 倍加速,持久化存储
  • 智能重试:仅失败任务重试,非整阶段重启
  • 成本追踪:实时显示会话/日/月节省金额

显著优点

  • 极致成本效益:Gemini Flash 价格约为 Opus 的 1/200,30 个任务从 ~$0.50 降至 ~$0.003
  • 速度优异:并行模式下任务平均耗时 120-140ms,10 个任务约 1.2 秒完成
  • 架构灵活:Chain 模式支持自动构建(auto-chain)或手动定义复杂流水线,深度预设从 quick(2 阶段)到 exhaustive(8 阶段)
  • 零额外搜索成本:Gemini 的 Google Search grounding 不产生额外费用
  • 开发者友好:提供 JavaScript API、REST 端点、CLI 三重接口

潜在缺点与局限性

  • 模型质量边界:Gemini Flash 在复杂推理、长文本连贯性、创意写作方面弱于 Opus/Claude 3.5 Sonnet,不适合对质量极度敏感的单任务
  • 网络依赖:Research 模式依赖 Google Search,国内或特殊网络环境可能不稳定
  • Node.js 依赖:要求本地安装 Node 运行时,非技术用户门槛较高
  • 缓存陷阱:缓存键仅基于指令+输入+视角哈希,业务逻辑变化可能导致脏读,需手动清除
  • 并发限制:默认最多 16 并发,超量需队列等待;Gemini 本身存在速率限制

适合人群

  • 高频 API 使用者:日均消耗数万 token 的开发者、分析师、自动化工作流搭建者
  • 批量处理场景:需要同时分析多个竞品、多份文档、多个数据源的运营/产品/研究人员
  • 成本敏感型团队:初创公司、个人开发者、学生项目,需在有限预算内最大化调用次数
  • 工程化思维用户:熟悉 CLI、愿意配置 YAML、理解并发与缓存概念的技术人员

常规风险

  • 质量误判风险:过度依赖成本优势可能在关键任务上牺牲质量,建议对核心输出抽样复核
  • 配置泄露:YAML 配置和 API key 存储于本地明文文件,共享机器需注意权限
  • 缓存过时:TTL 1 小时的默认设置对时效性数据可能过长,需根据场景调整
  • 单点故障:守护进程崩溃会导致任务中断,生产环境建议监控进程健康
  • 供应商锁定:深度依赖 Gemini 生态,切换模型需重构配置和部分逻辑

安全解读

核心用法

Swarm 是一款面向 Claude 生态的并行任务编排 Skill,通过本地 Node.js Daemon 将多个独立 LLM 调用分发至 Google Gemini Flash 执行,实现成本降低 200 倍(对比 Claude Opus)。

三种执行模式

  • parallel: 独立任务并行执行,适用于批量摘要、多实体研究等场景
  • research: 多阶段工作流(搜索→获取→分析),自动启用 Google Search 实时 grounding
  • chain: 复杂分析流水线,支持 fan-out(单输入多视角发散)、single(合并处理)、reduce(多输入合成)等阶段模式,深度可配置为 quick/standard/deep/exhaustive

关键特性

  • 智能缓存(v1.3.2): LRU 缓存带来 212-514 倍加速,缓存命中时响应降至 3-5ms
  • 成本追踪: 实时展示 session/daily 花费,内置月度节省报告
  • 阶段重试: Chain 模式下仅重试失败子任务,非整阶段回滚
  • API 与 CLI 双接口: 支持 Bash 命令与 JavaScript SDK 调用

显著优点

  • 经济性突出: $0.075/百万 tokens 对比 Opus $15/百万,批量任务边际成本趋近于零
  • 架构清晰: 本地 Daemon + HTTP API 设计,状态隔离、易于调试
  • 缓存策略智能: 自动跳过需实时数据的 web search 任务,持久化至磁盘
  • 安全设计: 无硬编码凭证,API key 通过环境变量或 0o600 权限文件管理,输出内容主动脱敏

局限与风险

  • 模型能力天花板: Gemini Flash 在复杂推理、长上下文一致性上弱于 Opus/Claude 3.5 Sonnet,需权衡成本与质量
  • 本地依赖: 要求 Node.js 环境与常驻 Daemon,对无持久化环境的 CI/CD 场景不友好
  • 端口占用: 固定使用 localhost:9999,可能与用户现有服务冲突
  • 网络单点: 虽为 localhost 服务,但若配置不当开放至公网存在未授权调用风险

适合人群

  • 高频批量研究者: 竞品分析、舆情监控、大规模实体信息抽取
  • 成本敏感团队: 初创公司、个人开发者需将 LLM 预算压缩 2 个数量级
  • Claude 重度用户: 已习惯 Claude 生态,愿用 Gemini Flash 处理"可并行化"子任务以保留 Opus 额度给核心推理

常规风险提示

  • 质量漂移: 建议在 Chain 模式中使用内置的 benchmark 端点,以 LLM-as-judge 评估单条 vs 并行 vs 链式输出的 FLASK 得分
  • 缓存失效: 涉及价格、政策等时效性数据时,显式设置 task.cache = false
  • Daemon 稳定性: 长期运行需关注日志轮转,避免 ~/.config/clawdbot/logs/ 磁盘占满

Swarm 内容

bin文件夹
docker文件夹
coordinator文件夹
worker文件夹
docs文件夹
examples文件夹
lib文件夹
providers文件夹
scripts文件夹
skill文件夹
test文件夹
手动下载zip · 112.9 kB
diagnose.jstext/javascript
请选择文件