RelayPlane

🚀 AI API 成本自动优化代理

ai-tools榜 #5

本地代理自动路由简单LLM任务到廉价模型,为OpenClaw用户节省40-70%成本,835+开发者已安装

收藏
8k
安装
2.8k
版本
3.1.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

RelayPlane 是一个本地代理服务,通过拦截并重路由 LLM API 请求来降低使用成本。安装后无需修改代码,只需将环境变量指向本地代理端口(默认3001),即可自动实现智能路由:复杂推理任务继续使用 Opus 等高端模型,而文件读取、状态检查、简单编辑等低复杂度任务自动降级至 Haiku 等廉价模型。

显著优点

  • 即装即用:npm 全局安装,两条环境变量配置,零代码改动
  • 自动回退:路由失败时无缝回退到原模型,保障可靠性
  • 成本效益明确:官方声称 $100/月 开销可节省 $47,Pro 版在 $60/月 以上即回本
  • 隐私优先:提示词完全本地处理,不上传至 RelayPlane 服务器
  • 多供应商支持:除 Anthropic 外,支持 OpenAI、Google Gemini、xAI
  • 离线可用--offline 模式彻底断网(除必要 LLM API 调用)

局限性与风险

  • MIT 开源但生态早期:GitHub 星数、社区维护活跃度未披露,长期维护存疑
  • 路由策略黑盒:"简单任务"的判定标准由代理内部决定,用户无法细粒度控制
  • 延迟增加:本地代理多一跳网络,对延迟敏感场景可能有影响
  • Token 统计不透明:声称匿名遥测仅传 token 计数,但用户难以独立验证
  • 供应商锁定风险:深度依赖单一代理层的路由逻辑,迁移需调整架构

适合人群

  • 月 LLM API 开销 $60-300 的中高频开发者
  • 使用 OpenClaw 等客户端工具且希望降低成本的团队
  • 对隐私敏感、不愿将提示词上传第三方服务的用户
  • 愿意接受轻度延迟换取成本节省的场景

常规风险

  • 代理层单点故障可能导致请求失败(虽有回退机制)
  • 模型降级可能意外影响输出质量,需持续监控
  • npm 供应链攻击风险(建议锁定版本并审计)
  • 遥测数据虽匿名,但 token 使用模式本身可能泄露业务特征

RelayPlane 内容

手动下载zip · 3.7 kB
CHANGELOG.mdtext/markdown
请选择文件