使用说明

核心用法

Claude Code Supervisor 是一套针对 Claude Code 长期运行会话的自动化监控解决方案。它通过植入 Claude Code 生命周期钩子（Stop/Error/Notify），结合 Bash 预过滤层与轻量 LLM 分流判断，实现对后台编码 agent 的智能监督。

典型使用流程：
1. 运行 install-hooks.sh 向目标项目植入钩子脚本与配置
2. 编辑 .claude-code-supervisor.yml 配置分流模型（如 Claude Haiku 或本地 Ollama）和通知命令（OpenClaw/webhook/ntfy 等）
3. 在 tmux 会话中启动 Claude Code 任务，钩子自动捕获事件
4. Bash 预过滤处理明显情况（如 API 429 直接记录、auth 事件跳过），模糊情况交由 LLM 分流为 FINE/NEEDS_NUDGE/STUCK/DONE/ESCALATE 五类
5. 通知后端接收 cc-supervisor: 前缀消息，由 agent harness 决定是发送 "continue" 按键、更换策略，还是升维人工介入
6. 独立 watchdog 脚本周期性检测 tmux 会话与进程存活，防止 Claude Code 崩溃或 OOM 导致的监控盲区

显著优点

分层架构高效：Bash 处理 80% 的常规情况，LLM 仅处理需要判断的 20%，成本与延迟可控
Harness 无关：通知层可对接 OpenClaw、webhook、ntfy 或任意脚本，不绑定特定平台
防御性设计：独立 watchdog 用纯 Bash 实现，即使 API 熔断、账户超限、模型宕机仍能检测死会话
细粒度状态追踪：通过 supervisor-state.json 维护会话元数据（目标、成功标准、最大 nudge 次数、升维时限）
会话恢复友好：支持在上下文限制重置后继续工作，适合数小时级别的长任务

潜在缺点与局限性

依赖 tmux：必须预先配置 tmux socket，Windows 原生环境需 WSL
Claude CLI 独占：目前仅支持 Anthropic 官方 claude CLI，不兼容其他 Claude API 调用方式
分流质量波动：Haiku 级模型对复杂终端输出模式的判断可能出现误分类（如将正常编译输出误判为 STUCK）
通知延迟：若选择远程 LLM 分流，网络波动会拉长 "错误发生→收到通知" 的窗口期
配置门槛：需要同时理解 tmux 会话管理、YAML 配置、JSON 状态文件格式，对非运维背景用户不友好

适合人群

需要让 Claude Code 在后台运行 30 分钟以上任务的开发者
已搭建 OpenClaw 或类似 agent harness 框架的高级用户
团队中有多个长期运行编码任务需要统一监控与自动恢复的场景
希望减少 "盯着终端等结果" 时间的工程师

常规风险

误触发 nudge：自动发送 "continue" 可能在 agent 实际等待用户输入（如 permission_prompt）时造成干扰
状态文件竞争：多进程同时读写 supervisor-state.json 若未加锁可能导致状态不一致
敏感信息泄露：钩子脚本可能将终端输出片段发送至 LLM 或通知后端，需确保工作目录无硬编码密钥
无限循环风险：若任务本身存在逻辑 bug 导致反复失败，maxNudges 机制可防止无限重试，但需合理设置阈值

安全解读

核心用法

claude-code-supervisor 是一个 Claude Code 会话监控工具，通过集成 tmux 和生命周期 Hook 实现后台 Agent 的自动化监管。核心工作流程包括：

1. Hook 安装：运行 install-hooks.sh 在目标项目注入 Stop、PostToolUseFailure、Notification 三种生命周期 Hook
2. 会话注册：在 supervisor-state.json 中配置受监控的 tmux 会话、目标、成功标准和超时参数
3. 智能分流：Bash 预过滤器快速处理明显情况（如 API 429 直接跳过），仅将模糊案例提交给轻量 LLM（Haiku/本地模型）分类
4. 状态判定：LLM 返回 FINE | NEEDS_NUDGE | STUCK | DONE | ESCALATE 五种状态，驱动后续动作
5. 通知与干预：通过用户配置的命令（webhook、ntfy、openclaw 等）发送通知，必要时通过 tmux send-keys 自动唤醒 Agent
6. Watchdog 兜底：纯 Bash 定时检查进程存活，捕获 Hook 无法覆盖的硬崩溃、OOM 或账户限制场景

显著优点

架构分层清晰：Bash 预过滤 + 快速 LLM 分类 + 可配置通知后端，兼顾效率与灵活性
Harness 无关：支持 OpenClaw、ntfy、自定义 webhook、任意脚本作为通知后端
低成本运行：大量常见场景（正常停止、瞬时错误）无需 LLM 调用，仅模糊情况触发分类
故障兜底：Watchdog 独立于 Claude Code 运行，即使 API 完全不可用仍能检测死会话
配置驱动：triage 模型、通知命令、升级规则均可自定义，支持本地模型（Ollama）实现离线运行

潜在局限

依赖 tmux：必须使用 tmux 会话管理，不直接支持 screen 或其他终端复用器
初始配置复杂：需分别配置 Hook 安装、状态文件、通知后端、定时任务（Watchdog），学习曲线较陡
分类质量依赖模型：Haiku 或本地小模型可能误判复杂场景，需人工调校 prompt 或升级模型
通知延迟：Bash 预过滤虽减少 LLM 调用，但模糊场景仍需等待分类结果，非实时响应
无内置 Web 界面：状态查看依赖日志文件或外部 Harness，原生缺乏可视化监控面板

适合人群

需要长时间运行 Claude Code 处理大型任务（代码重构、批量测试）的开发者
运行多个并行 Agent 会话，需要集中监控和自动恢复的基础设施维护者
已使用 OpenClaw、ntfy 等通知系统的自动化工作流用户
希望减少 API 错误导致的 Agent 闲置时间，优化 token 效率的成本敏感团队

常规风险

Hook 配置修改风险：安装脚本修改 .claude/settings.json，虽需用户显式执行，但仍需审查脚本内容
tmux 会话干扰：send-keys 可能向错误会话发送输入，需严格配置 supervisor-state.json 限制监控范围
外部命令执行风险：triage.command 和 notify.command 完全由用户配置，配置恶意脚本将导致安全问题
隐私暴露：tmux capture-pane 读取终端输出，虽与屏幕可见内容一致，但仍需注意敏感信息（如临时 token）的回显
无限重试风险：maxNudges 和 escalateAfterMin 配置不当可能导致 Agent 在错误循环中持续消耗 token

claude-code tmux agent-supervision automation monitoring llm-triage background-tasks devops hooks

Claude Code Supervisor 内容

assets文件夹

references文件夹

scripts文件夹

hooks文件夹

手动下载zip · 18.7 kB

supervisor-state.template.jsonapplication/json

请选择文件