LLM Supervisor

🛡️ 智能故障转移,守护代码质量

自动检测云端LLM限流并切换至本地模型,确保会话不中断,同时防止代码质量静默降级,需用户确认后才允许本地模型执行代码生成任务。

收藏
6.9k
安装
3k
版本
1.0.0
CLS 安全性认证2026-05-17
点击查看完整报告 >

使用说明

核心用法

LLM Supervisor 是一款面向 OpenClaw 的智能 LLM 路由管理技能,主要解决云端大模型在重度使用场景下的可靠性问题。当系统检测到 Anthropic 等云服务商的速率限制错误时,会自动将主 Agent 切换至本地 Ollama 模型,确保会话连续性。用户可通过 /llm status 查看当前模式,使用 /llm switch local|cloud 进行手动切换。

显著优点

1. 高可用性保障:消除因云 API 限流导致的"死机"状态,特别适合长时间运行的自动化任务
2. 质量管控机制:本地模型执行代码生成前必须获得用户显式确认,防止静默降级

3. 配置灵活性:支持自定义冷却时间、本地模型选型(默认 qwen2.5:7b)、确认话术等参数

4. 上下文继承:新创建的 Agent 自动继承当前活跃的 LLM 模式,保持行为一致性

5. 成本透明:明确承诺不会未经用户意图消耗云端额度

潜在缺点与局限性

  • 本地模型性能瓶颈:qwen2.5:7b 等本地模型在复杂代码推理任务上显著弱于 Claude 等云端模型
  • 确认流程摩擦:频繁触发的代码生成确认可能打断开发心流
  • 单点故障风险:依赖 Ollama 本地服务的可用性,若本地服务异常则无法完成自动切换
  • 网络依赖残留:初始检测仍需云端 API 交互,完全离线场景下无法触发切换逻辑
  • 配置复杂度:自动化决策与用户确认之间的平衡需要精细调参

适合人群

  • 运行长会话或 Agent 密集型工作流的进阶用户
  • 混合使用云地双栈、对服务连续性有硬性要求的开发者
  • 企业环境中需规避"机器人掉线"影响的自动化场景

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| 模型能力错配 | 本地模型生成低质量代码 | 强制确认机制 + 人工审查 |
| 自动切换误触发 | 非限流错误被误判 | 可配置冷却期 + 手动覆盖 |
| 本地资源耗尽 | OOM 或 GPU 满载导致本地服务崩溃 | 监控本地服务健康状态 |
| 确认疲劳 | 频繁弹窗降低效率 | 调整 `requireConfirmationForLocalCode` 阈值 |

安全解读

核心用法

LLM Supervisor 是 OpenClaw 生态的 LLM 管理中间件,核心功能围绕故障转移质量保障双主线展开。其设计目标明确:当云模型(如 Anthropic Claude)遭遇速率限制时,自动降级至本地 Ollama 实例,同时通过强制确认机制防止本地弱模型擅自执行生产级代码生成。

典型工作流
1. 默认以云模式启动,享受最强模型能力

2. 监测到 429 rate limit 类错误时触发自动切换

3. 新创建 Agent 继承当前 LLM 模式,保持会话一致性

4. 本地模式下,任何代码生成任务需用户显式输入确认短语(默认 CONFIRM LOCAL CODE

5. 冷却期(cooldownMinutes)结束后可手动或自动恢复云模式

关键命令/llm status 实时查看模式状态;/llm switch {local|cloud} 强制切换运行模式。

显著优点

  • 零中断保障:彻底解决「API 限流 = 工作停滞」的痛点,长会话/自动化场景尤为受益
  • 质量防火墙:本地模型仅能执行聊天、规划等低风险任务,代码生成必须人工放行,避免「静默降级」导致的劣质代码污染仓库
  • 零依赖架构:纯 TypeScript 实现,零运行时依赖,供应链攻击面归零
  • 透明可审计:所有模式切换、确认交互均有日志留痕,符合合规要求
  • 配置灵活:支持自定义本地模型(默认 Qwen2.5:7B)、冷却时长、确认短语等

潜在缺点与局限性

  • T3 来源风险:作者 Duncan Hardie 为个人开发者 GitHub 账号,历史公开仓库仅 6 个,需对后续更新保持警惕
  • 本地模型能力瓶颈:即便有确认机制,用户误操作仍可能让弱模型进入代码流程,需配合团队 code review
  • Ollama 依赖:本地回退能力绑定 Ollama 生态,若未预装或端口冲突则失效
  • 冷却期盲区:自动切换后若未达冷却时长,即便云 API 恢复也无法自动回切,可能延长本地模型使用窗口

适合人群

  • 重度依赖 Claude/ GPT API 的自动化开发者(CI Agent、长时任务脚本)
  • 混合云-本地架构的团队,追求「API 降级不失控」
  • 对供应链安全敏感、偏好零依赖实现的技术洁癖用户
  • 需要审计追踪的合规敏感场景(金融、医疗代码辅助)

常规风险

| 风险类别 | 说明 | 缓释措施 |
|---------|------|---------|
| 供应链风险 | 零依赖已规避,但 T3 来源需关注后续更新 | 订阅 Release 通知,升级前重跑 CLS 认证 |
| 误操作风险 | 用户误确认导致本地模型生成代码 | 强制确认短语 + 团队 code review 双保险 |
| 配置漂移 | 多 Agent 场景下 LLM 模式不一致 | 利用「新 Agent 继承」机制 + 定期 `/llm status` 检查 |
| 本地服务单点 | Ollama 崩溃则失去回退能力 | 监控 127.0.0.1:11434 健康状态,配置备用本地模型 |

整体而言,LLM Supervisor 是 OpenClaw 生态中可靠性工程的典范实践,以最小权限原则和显式确认机制,在「可用性」与「代码质量」之间取得了负责任的平衡。

LLM Supervisor 内容

commands文件夹
dist文件夹
commands文件夹
hooks文件夹
hooks文件夹
types文件夹
@openclaw文件夹
手动下载zip · 11.0 kB
llm.tstext/plain
请选择文件