zeroapi

⚡ 零成本AI模型智能路由中枢

基于OpenClaw框架的订阅制模型路由方案,通过9步决策算法智能分配任务至Claude、GPT、Gemini等最佳模型,实现零API调用成本的高效AI协作。

收藏
7k
安装
1.6k
版本
v3.1.0
CLS 安全性认证2026-05-17
点击查看完整报告 >

使用说明

核心用法

ZeroAPI 是一个面向 OpenClaw 框架的智能模型路由技能,其核心机制是通过9步决策算法将用户任务自动分配至最适合的AI模型。该技能定义了六个模型层级:SIMPLE(Gemini Flash-Lite,用于心跳检测和简单任务)、FAST(Gemini 3 Flash,擅长指令遵循)、RESEARCH(Gemini 3 Pro,1M上下文窗口)、CODE(GPT-5.3 Codex,数学和编程)、DEEP(Claude Opus 4.6,推理和规划)以及 ORCHESTRATE(Kimi K2.5,多代理协调)。

使用时,系统按顺序检查任务特征:上下文长度超过100k、数学计算、代码生成、代码审查、速度要求、科研性质、多步骤工具链、结构化输出等,首个匹配条件决定路由目标。通过 /agent <agent-id> <instruction> 语法,主代理可将任务委托给子代理执行,实现流水线、并行合并、对抗性审查等协作模式。

显著优点

零API调用成本是最大亮点,用户只需支付固定月费订阅($20-200/月),无需按token计费,适合高频AI使用场景。智能基准驱动的路由策略基于 Artificial Analysis API v4 的最新评测数据(2026年2月),包括GPQA科学推理、SWE-bench编程、AIME数学、TAU-2代理工具使用等指标,确保任务与最擅长该领域的模型匹配。

自动故障转移机制提供了可靠性保障:当主模型超时、认证失效或触发速率限制时,系统会按预设链条(Gemini > Codex > Kimi)自动降级,并最多重试3次。工作区隔离设计确保了子代理无法访问主代理文件,防止意外修改,适合处理敏感代码审查等场景。

潜在缺点与局限性

配置复杂度极高是该技能的主要门槛。用户需手动编辑 openclaw.json 和多个 models.json 文件,处理不同类型的认证(Anthropic API Token、Google OAuth、OpenAI OAuth、Kimi API Key),特别是Google Gemini的OAuth配置存在特殊限制(必须放在 per-agent models.json 而非主配置)。

订阅成本不菲,完整四提供商方案月费可达$250-430,且部分模型(如Codex)依赖ChatGPT Pro订阅。来源可信度为T3级(个人开发者账号),虽代码透明但缺乏企业级背书。此外,该技能强依赖OpenClaw框架,非该框架用户无法使用,且存在OAuth令牌易失效(特别是Codex在多设备登录时)等运维风险。

适合的目标群体

该技能最适合已使用OpenClaw框架的进阶用户,特别是持有多个AI订阅(Claude Max + Gemini Advanced + ChatGPT Plus/Pro)的开发者、研究人员和AI重度使用者。对于需要频繁切换模型以平衡成本与性能的场景(如同时需要Gemini的长上下文和Claude的推理能力),或需要构建多代理工作流的团队具有显著价值。

不适合单一模型用户、不愿处理复杂配置的普通消费者,以及依赖标准API计费模式的企业集成场景。

使用风险

认证失效风险较高,特别是OpenAI Codex的OAuth令牌容易因多设备登录而失效,需定期重新授权。配置错误可能导致模型无法识别(如Gemini 2.5模型ID必须包含-preview后缀)或网关崩溃(缺少api字段)。性能风险方面,部分模型TTFT(首token时间)较长(Gemini Pro 29.59秒,Codex 20秒),不适合交互式快速对话。

此外,用户需自行承担订阅服务条款合规责任,确保通过OpenClaw框架的调用符合各AI提供商的使用政策,避免账号封禁风险。

安全解读

核心功能

ZeroAPI 是一款面向 OpenClaw Agent 的纯文档型路由策略 Skill,核心作用是教导 Agent 如何将用户任务智能分配至最适合的 AI 模型。它本身不执行任何代码或 API 调用,而是通过一套严谨的 9 步决策算法,帮助用户充分利用已有的付费订阅(Claude Max、ChatGPT Plus/Pro、Gemini Advanced、Kimi),实现「零 per-token 成本」的多模型协作。

9 步决策路由算法

任务按优先级依次匹配:
1. 超长上下文(>100k tokens)→ Gemini Pro(1M 上下文)

2. 数学/证明/数值推理 → GPT-5.3 Codex(Math: 99.0)

3. 代码生成 → Codex(SWE-bench: 49.3)

4. 代码审查/架构/安全 → Claude Opus(保留在主 Agent)

5. 速度关键/琐碎任务 → Gemini Flash-Lite(645 tok/s, 0.18s TTFT)

6. 研究/科学/事实核查 → Gemini Pro(GPQA: 0.908)

7. 多步骤工具编排 → Kimi K2.5(TAU-2: 0.959)

8. 严格指令遵循/结构化输出 → Gemini Flash(IFBench: 0.780)

9. 默认兜底 → Claude Opus(通用智能最高: 53.0)

显著优点

  • 零额外成本:利用现有订阅,无 API 调用费用
  • Benchmark 驱动:基于 Artificial Analysis 2026年2月数据,非主观偏好
  • 自动故障转移:定义了完整的 fallback 链条,单模型失效时自动切换
  • 安全敏感任务保护:明确禁止将凭证、私钥等敏感数据发往子 Agent
  • 多协作模式:支持 Pipeline、Parallel + Merge、Adversarial Review、Orchestrated 等协作范式

潜在局限

  • 依赖 OpenClaw 生态:非独立工具,必须与 OpenClaw Agent 配合使用
  • 配置复杂度较高:多提供商 OAuth/API Key 设置繁琐,尤其是 Gemini 的 google-gemini-cli 类型需特殊处理
  • Codex 认证脆弱:ChatGPT OAuth 易因多设备登录失效,需频繁重新授权
  • T3 来源可信度:个人开发者项目(dorukardahan),虽 MIT 开源但社区验证有限
  • 未来兼容性风险:引用的模型版本(如 "GPT-5.3 Codex")为前瞻性命名,实际可用性待验证

适合人群

  • 已持有 2-4 个 AI 订阅 的高频用户,希望优化各模型特长
  • 需要处理 多样化任务类型(代码、研究、数学、长文档)的开发者
  • 延迟敏感成本敏感,希望避免按 token 计费的用户
  • 使用 OpenClaw 作为 Agent 框架的技术用户

常规风险

  • 配置错误导致路由失效openclaw.json 语法错误或模型 ID 不匹配会导致代理无法启动
  • 敏感数据误路由:未遵循 "安全敏感任务不委托子 Agent" 的指导可能造成数据泄露
  • OAuth 令牌失效:尤其 Codex 和 Gemini 的 OAuth 需定期维护
  • 模型可用性变化:Skill 中的 benchmark 数据基于 2026年2月,实际模型迭代可能导致路由策略次优

安全认证结论

CLS-Certify v2.1.0 扫描结果:A 级(95分)。纯 Markdown 文档,无可执行代码、无网络调用、无依赖、无数据收集。所有 6 项 "威胁" 均为扫描误报(如 "Artificial Analysis API" 中的 "AI" 被误识别)。符合 GDPR/CCPA,MIT 许可证开源可审计。

> 建议:配置完成后务必运行 openclaw models status 验证模型可用性;处理敏感任务时强制禁用子 Agent 路由。

zeroapi 内容

手动下载zip · 10.7 kB
README.mdtext/markdown
请选择文件