Name: AI API 成本自动优化代理
Author: relayplane

使用说明

核心用法

RelayPlane 是一个本地代理服务，通过拦截并重路由 LLM API 请求来降低使用成本。安装后无需修改代码，只需将环境变量指向本地代理端口（默认3001），即可自动实现智能路由：复杂推理任务继续使用 Opus 等高端模型，而文件读取、状态检查、简单编辑等低复杂度任务自动降级至 Haiku 等廉价模型。

显著优点

即装即用：npm 全局安装，两条环境变量配置，零代码改动
自动回退：路由失败时无缝回退到原模型，保障可靠性
成本效益明确：官方声称 $100/月开销可节省 $47，Pro 版在 $60/月以上即回本
隐私优先：提示词完全本地处理，不上传至 RelayPlane 服务器
多供应商支持：除 Anthropic 外，支持 OpenAI、Google Gemini、xAI
离线可用：--offline 模式彻底断网（除必要 LLM API 调用）

局限性与风险

MIT 开源但生态早期：GitHub 星数、社区维护活跃度未披露，长期维护存疑
路由策略黑盒："简单任务"的判定标准由代理内部决定，用户无法细粒度控制
延迟增加：本地代理多一跳网络，对延迟敏感场景可能有影响
Token 统计不透明：声称匿名遥测仅传 token 计数，但用户难以独立验证
供应商锁定风险：深度依赖单一代理层的路由逻辑，迁移需调整架构

适合人群

月 LLM API 开销 $60-300 的中高频开发者
使用 OpenClaw 等客户端工具且希望降低成本的团队
对隐私敏感、不愿将提示词上传第三方服务的用户
愿意接受轻度延迟换取成本节省的场景

常规风险

代理层单点故障可能导致请求失败（虽有回退机制）
模型降级可能意外影响输出质量，需持续监控
npm 供应链攻击风险（建议锁定版本并审计）
遥测数据虽匿名，但 token 使用模式本身可能泄露业务特征

llm-proxy cost-optimization anthropic openai local-proxy npm open-source

RelayPlane 内容

手动下载zip · 3.7 kB

CHANGELOG.mdtext/markdown

请选择文件