Name: 智能路由，AI 成本直降 60%
Author: relayplane

使用说明

核心用法

RelayPlane 是一款智能 LLM 路由代理，通过拦截并重新分发 API 请求，在保证质量的同时大幅降低 AI 使用成本。用户启动本地代理后，将 ANTHROPIC_BASE_URL 或 OPENAI_BASE_URL 指向 http://localhost:3001，即可在 API 调用中使用路由别名如 rp:auto、rp:cost、rp:best 等，让系统根据任务复杂度自动选择最优模型。

主要功能模块：

/relayplane proxy start/stop：启停本地代理服务
/relayplane stats：查看用量统计与节省金额
/relayplane doctor：诊断配置与连接问题
/relayplane telemetry：管理匿名遥测数据
/relayplane dashboard：获取云仪表盘链接

路由策略： rp:auto 智能分流（简单任务→GPT-4o-mini/Claude Haiku，复杂推理→Claude Sonnet 4）、rp:cost 始终最便宜、rp:fast 最低延迟、rp:best 最佳质量。

显著优点

1. 成本节省显著：官方宣称节省 40-60%，简单任务自动降级至低价模型
2. 零侵入集成：仅需修改环境变量中的 BASE_URL，无需改动现有代码
3. 隐私优先设计：API 密钥完全本地处理，绝不传输至 RelayPlane 服务器；支持离线模式 (RELAYPLANE_OFFLINE=1)
4. 遥测透明可控：默认收集匿名元数据（模型、token 数、延迟），但绝不收集 prompts/responses；可随时关闭
5. 免费可用：本地模式完全免费，无需注册账号

潜在缺点与局限性

网络依赖增加：引入本地代理 hop，可能增加数十毫秒延迟
路由误判风险：自动分类可能将复杂任务路由至低价模型，导致输出质量下降
Node 环境要求：需要本地安装 Node.js 和 npm/npx
Pro 功能付费：云仪表盘、团队功能、预算控制等需 $29+/月订阅
生态局限：目前主要支持 Anthropic、OpenAI、Google 三家主流 API

适合人群

高用量 AI 开发者：每月 AI API 支出超过 $100 的工程师或团队
多模型策略用户：需要灵活切换 Claude/OpenAI 以优化性价比的场景
成本敏感型企业：希望在不影响核心体验前提下控制 AI 预算的初创公司
隐私合规团队：对数据出境敏感，需要本地处理 API 密钥的组织

常规风险

真实成本仍产生：代理本身不免费，所有请求最终仍向原供应商付费；需主动监控 /relayplane stats 避免预算超支
代理故障风险：本地服务崩溃将导致 API 调用失败，生产环境需考虑 fallback 机制
密钥管理：虽声称密钥不上传，但用户仍需审计 relayplane.js 源码以验证此承诺
供应商锁定：深度依赖后，切换成本可能增加

cost-optimization llm-proxy model-routing api-management anthropic openai

RelayPlane 内容

tests文件夹

手动下载zip · 9.8 kB

test-skill.shtext/x-shellscript

请选择文件