核心用法
RelayPlane 是一款智能 LLM 路由代理,通过拦截并重新分发 API 请求,在保证质量的同时大幅降低 AI 使用成本。用户启动本地代理后,将 ANTHROPIC_BASE_URL 或 OPENAI_BASE_URL 指向 http://localhost:3001,即可在 API 调用中使用路由别名如 rp:auto、rp:cost、rp:best 等,让系统根据任务复杂度自动选择最优模型。
主要功能模块:
/relayplane proxy start/stop:启停本地代理服务/relayplane stats:查看用量统计与节省金额/relayplane doctor:诊断配置与连接问题/relayplane telemetry:管理匿名遥测数据/relayplane dashboard:获取云仪表盘链接
路由策略: rp:auto 智能分流(简单任务→GPT-4o-mini/Claude Haiku,复杂推理→Claude Sonnet 4)、rp:cost 始终最便宜、rp:fast 最低延迟、rp:best 最佳质量。
显著优点
1. 成本节省显著:官方宣称节省 40-60%,简单任务自动降级至低价模型
2. 零侵入集成:仅需修改环境变量中的 BASE_URL,无需改动现有代码
3. 隐私优先设计:API 密钥完全本地处理,绝不传输至 RelayPlane 服务器;支持离线模式 (RELAYPLANE_OFFLINE=1)
4. 遥测透明可控:默认收集匿名元数据(模型、token 数、延迟),但绝不收集 prompts/responses;可随时关闭
5. 免费可用:本地模式完全免费,无需注册账号
潜在缺点与局限性
- 网络依赖增加:引入本地代理 hop,可能增加数十毫秒延迟
- 路由误判风险:自动分类可能将复杂任务路由至低价模型,导致输出质量下降
- Node 环境要求:需要本地安装 Node.js 和 npm/npx
- Pro 功能付费:云仪表盘、团队功能、预算控制等需 $29+/月订阅
- 生态局限:目前主要支持 Anthropic、OpenAI、Google 三家主流 API
适合人群
- 高用量 AI 开发者:每月 AI API 支出超过 $100 的工程师或团队
- 多模型策略用户:需要灵活切换 Claude/OpenAI 以优化性价比的场景
- 成本敏感型企业:希望在不影响核心体验前提下控制 AI 预算的初创公司
- 隐私合规团队:对数据出境敏感,需要本地处理 API 密钥的组织
常规风险
- 真实成本仍产生:代理本身不免费,所有请求最终仍向原供应商付费;需主动监控
/relayplane stats避免预算超支 - 代理故障风险:本地服务崩溃将导致 API 调用失败,生产环境需考虑 fallback 机制
- 密钥管理:虽声称密钥不上传,但用户仍需审计
relayplane.js源码以验证此承诺 - 供应商锁定:深度依赖后,切换成本可能增加