使用说明

LLM Router 综合评估

核心用法

LLM Router 是一个开源的智能代理服务器，位于用户与大模型API之间，自动分析输入请求的复杂度并将其路由到成本最优的模型。系统采用本地运行的Ollama小型模型（默认Qwen2.5:3B）作为分类器，将任务分为5个复杂度等级（super_easy/easy/medium/hard/super_hard），对应Anthropic不同价位的Claude模型。

工作流程：用户请求 → 本地分类器判定复杂度 → 路由至Haiku/Sonnet/Opus → 返回结果。支持OpenAI兼容API格式，可无缝接入现有工具链。

显著优点

成本优化：简单问候使用Haiku（ cheapest），复杂架构设计才调用Opus，典型场景可节省50-80%成本
透明可控：基于本地运行的开源模型做分类决策，无需额外API调用
灵活配置：YAML配置+Markdown路由规则表，支持自定义复杂度定义和模型映射
OpenClaw集成：专为该生态设计，扩展性强

局限性与风险

成熟度不足：核心功能仅Anthropic经测试，OpenAI/Google/Ollama均为"未测试"状态
分类准确性依赖：3B参数模型的判断力有限，可能误判任务复杂度导致体验下降或成本失控
单点故障：本地Ollama宕机则整个路由系统失效
延迟增加：增加一次本地推理的额外延迟（通常<100ms但不可忽视）
维护负担：需同时管理Ollama服务、分类器模型、代理服务器三层组件

适合人群

高频使用Claude API且请求类型差异大的开发者
希望精细控制AI预算的技术团队
已部署OpenClaw生态的用户
愿意承担运维复杂度换取成本优化的高级用户

常规风险

API密钥暴露：需配置Anthropic密钥于环境变量，存在泄露风险
配置错误成本：路由规则误配可能导致意外调用高价模型
本地服务安全：默认监听127.0.0.1，但生产环境暴露需谨慎
供应商锁定：深度集成Anthropic，迁移至其他平台需重构配置

llm-proxy cost-optimization anthropic ollama open-source api-gateway routing claude

Llmrouter 内容

手动下载zip · 2.1 kB

SKILL.mdtext/markdown

请选择文件