核心用法
RelayPlane 是一个本地代理服务,通过在用户与 LLM API 之间插入智能路由层,自动将请求分发至最优模型。其工作原理基于任务复杂度判断:简单查询(如翻译、摘要)路由至 Claude Haiku 等廉价模型,复杂推理任务则保留给 Claude Opus 或 GPT-4 等旗舰模型。
部署极为轻量:通过 npm 全局安装后启动本地代理(默认端口3001),仅需修改环境变量 ANTHROPIC_BASE_URL 和 OPENAI_BASE_URL 指向 localhost:3001,即可让任何兼容 OpenAI/Anthropic SDK 的应用无缝接入。CLI 提供成本统计、遥测开关、离线模式等管理功能。
显著优点
1. 成本优化直接可量化:官方宣称节省40-60%,对高频调用场景(如AI编码助手、自动化流水线)ROI极高
2. 零侵入集成:无需修改应用代码,仅通过环境变量重定向,与 OpenClaw、Cursor、 Continue 等工具链兼容
3. 隐私优先架构:提示词完全本地处理,仅上传脱敏的 token 计数与延迟指标;支持 --offline 彻底断网
4. 多厂商支持:原生覆盖 Anthropic、OpenAI,可选接入 Google Gemini、xAI Grok
潜在局限
- 路由策略黑盒:未公开复杂度判定逻辑,用户无法自定义规则或校准阈值
- 单点故障风险:本地代理崩溃或端口冲突将导致所有 LLM 请求中断
- 延迟增加:额外路由层可能引入 10-50ms 本地处理开销
- 生态锁定:主要面向 Node.js/npm 环境,对 Python/Rust 原生工具链用户不够友好
适合人群
- 月消耗 $50+ API 费用的重度用户(开发者、小团队、AI产品原型)
- 需同时调用多厂商模型但希望统一接口的技术团队
- 对数据合规敏感、要求提示词不出境的企业场景
常规风险
- MIT 许可免责声明:生产环境无商业支持保障
- 模型降级误判:关键任务若被错误路由至弱模型,可能输出质量劣化且不易察觉
- npm 供应链安全:全局安装模式暴露于依赖投毒风险,建议锁定版本审计 lockfile