Llmrouter

🔀 智能路由省成本,按需调用最优模型

智能LLM代理路由器,根据任务复杂度自动选择模型,使用本地Qwen分类器节省API成本,目前仅测试Anthropic

收藏
10.6k
安装
2.6k
版本
0.1.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

LLM Router 综合评估

核心用法

LLM Router 是一个开源的智能代理服务器,位于用户与大模型API之间,自动分析输入请求的复杂度并将其路由到成本最优的模型。系统采用本地运行的Ollama小型模型(默认Qwen2.5:3B)作为分类器,将任务分为5个复杂度等级(super_easy/easy/medium/hard/super_hard),对应Anthropic不同价位的Claude模型。

工作流程:用户请求 → 本地分类器判定复杂度 → 路由至Haiku/Sonnet/Opus → 返回结果。支持OpenAI兼容API格式,可无缝接入现有工具链。

显著优点

  • 成本优化:简单问候使用Haiku( cheapest),复杂架构设计才调用Opus,典型场景可节省50-80%成本
  • 透明可控:基于本地运行的开源模型做分类决策,无需额外API调用
  • 灵活配置:YAML配置+Markdown路由规则表,支持自定义复杂度定义和模型映射
  • OpenClaw集成:专为该生态设计,扩展性强

局限性与风险

  • 成熟度不足:核心功能仅Anthropic经测试,OpenAI/Google/Ollama均为"未测试"状态
  • 分类准确性依赖:3B参数模型的判断力有限,可能误判任务复杂度导致体验下降或成本失控
  • 单点故障:本地Ollama宕机则整个路由系统失效
  • 延迟增加:增加一次本地推理的额外延迟(通常<100ms但不可忽视)
  • 维护负担:需同时管理Ollama服务、分类器模型、代理服务器三层组件

适合人群

  • 高频使用Claude API且请求类型差异大的开发者
  • 希望精细控制AI预算的技术团队
  • 已部署OpenClaw生态的用户
  • 愿意承担运维复杂度换取成本优化的高级用户

常规风险

  • API密钥暴露:需配置Anthropic密钥于环境变量,存在泄露风险
  • 配置错误成本:路由规则误配可能导致意外调用高价模型
  • 本地服务安全:默认监听127.0.0.1,但生产环境暴露需谨慎
  • 供应商锁定:深度集成Anthropic,迁移至其他平台需重构配置

Llmrouter 内容

手动下载zip · 2.1 kB
SKILL.mdtext/markdown
请选择文件