核心功能与用法
OpenClaw Watchdog 是一款面向 OpenClaw 网关的本地自治监控服务,采用 15 秒间隔的主动健康探针(localhost:3117/health)机制,实现故障发现→自动重启→即时告警的闭环。用户完成 Telegram Bot 创建、Token 与 Chat ID 配置后,系统以 Python 脚本驱动 setup.sh 完成服务注册(macOS 为 LaunchAgent,Linux 为 systemd user service),并通过加密 AES-256 存储凭证。
触发条件为连续 3 次健康检查失败,随后执行最多 2 次自动重启;若仍失败,则通过 Telegram 征求用户授权(touch ~/.openclaw/watchdog/approve-reinstall),无授权时不执行重装操作,仅持续推送通知。诊断日志全程本地模式匹配分析,零外部传输。
显著优点
- 低延迟自愈:15 秒探测周期 + 3 次失败阈值,兼顾灵敏度与误报控制
- 用户可控边界:关键操作需用户显式授权,避免自动化越权
- 隐私优先:日志与诊断本地化处理,敏感凭证 AES-256 加密存储
- 跨平台:原生支持 macOS 与 Linux,统一代码库维护
潜在局限与风险
- 单点依赖:监控服务与 OpenClaw 网关同机部署,主机宕机则监控失效
- 网络暴露:Telegram Bot Token 若泄露,攻击者可伪造控制消息
- 重启风暴:未设置指数退避,极端场景可能高频重启
- 权限边界:setup.sh 需执行权限,用户需信任脚本内容
适合人群
个人开发者、小型团队 OpenClaw 网关运维者,需 7×24 在线但无专职运维资源的场景。
常规风险
- Telegram API 可用性影响告警通道
- 本地密钥丢失导致服务无法解密配置
- 自动化重启可能掩盖根因,延误深度排查