核心用法
LLM Supervisor 是一个基础设施类 Skill,专为解决云端 LLM 服务不稳定场景设计。它通过监听 Anthropic/OpenAI 的 rate-limit 和 overload 错误,自动将 OpenClaw 的工作模式从云端模型切换至本地 Ollama 实例(默认 qwen2.5:7b),实现"降级运行"而非"完全中断"。
用户可通过三类命令主动干预:
/llm status — 查看当前工作模式及连接状态/llm switch cloud / /llm switch local — 手动强制切换模式
关键安全设计:代码确认机制
当系统处于本地模式时,所有涉及代码生成的任务(如代码补全、脚本生成)会被拦截。用户必须在终端输入指定确认短语 CONFIRM LOCAL CODE 后方可继续。这一设计有效防止了本地小模型在代码任务上可能产生的低质量输出被误用。
显著优点
1. 高可用兜底:将 rate limit 从"阻断性故障"转化为"可降级的服务质量调整"
2. 零依赖架构:package.json 无任何依赖,彻底规避供应链攻击
3. 网络隔离:仅连接 127.0.0.1:11434 本地回环,数据零外传
4. 类型安全:TypeScript 全代码库,静态分析得分 95/100
5. 隐私合规:通过 GDPR/CCPA 检测,无敏感数据收集
潜在缺点与局限性
| 局限类型 | 具体说明 |
|---------|---------|
| 来源可信度 | T3 级别(个人开发者/社区项目),非企业级背书 |
| 本地模型能力 | qwen2.5:7b 在复杂推理任务上显著弱于 Claude/GPT-4 |
| 硬件依赖 | 需本地运行 Ollama,无 GPU 环境时响应极慢 |
| 确认摩擦 | 代码任务需人工确认,批量自动化场景体验下降 |
| 单点配置 | Ollama 地址硬编码为 127.0.0.1:11434,无法自定义 |
适合人群
- 高频 API 调用者:日均调用量易触限的开发者
- 隐私敏感用户:希望将核心代码处理保留在本地
- 企业内网环境:无外网出口或需离线工作的团队
- LLM 可靠性研究者:需要测试多模型降级策略的技术人员
常规风险
- 本地模型幻觉风险:7B 参数模型产生错误代码概率更高,确认机制仅提供人工兜底而非质量保障
- 状态同步延迟:自动切换依赖错误检测,极端情况下可能漏检或延迟切换
- 配置固化风险:冷却期、确认短语等关键参数未暴露配置接口,需修改源码调整
- T3 维护不确定性:个人项目存在维护者精力波动导致的更新延迟风险