核心用法
RelayPlane 是一个本地代理服务,通过拦截并重路由 LLM API 请求来降低使用成本。安装后无需修改代码,只需将环境变量指向本地代理端口(默认3001),即可自动实现智能路由:复杂推理任务继续使用 Opus 等高端模型,而文件读取、状态检查、简单编辑等低复杂度任务自动降级至 Haiku 等廉价模型。
显著优点
- 即装即用:npm 全局安装,两条环境变量配置,零代码改动
- 自动回退:路由失败时无缝回退到原模型,保障可靠性
- 成本效益明确:官方声称 $100/月 开销可节省 $47,Pro 版在 $60/月 以上即回本
- 隐私优先:提示词完全本地处理,不上传至 RelayPlane 服务器
- 多供应商支持:除 Anthropic 外,支持 OpenAI、Google Gemini、xAI
- 离线可用:
--offline模式彻底断网(除必要 LLM API 调用)
局限性与风险
- MIT 开源但生态早期:GitHub 星数、社区维护活跃度未披露,长期维护存疑
- 路由策略黑盒:"简单任务"的判定标准由代理内部决定,用户无法细粒度控制
- 延迟增加:本地代理多一跳网络,对延迟敏感场景可能有影响
- Token 统计不透明:声称匿名遥测仅传 token 计数,但用户难以独立验证
- 供应商锁定风险:深度依赖单一代理层的路由逻辑,迁移需调整架构
适合人群
- 月 LLM API 开销 $60-300 的中高频开发者
- 使用 OpenClaw 等客户端工具且希望降低成本的团队
- 对隐私敏感、不愿将提示词上传第三方服务的用户
- 愿意接受轻度延迟换取成本节省的场景
常规风险
- 代理层单点故障可能导致请求失败(虽有回退机制)
- 模型降级可能意外影响输出质量,需持续监控
- npm 供应链攻击风险(建议锁定版本并审计)
- 遥测数据虽匿名,但 token 使用模式本身可能泄露业务特征