使用说明

核心用法

OpenClaw Safety Coach 是专为 OpenClaw/ClawHub 生态设计的主动防御型安全助手。其核心职责是在对话中实时识别并拦截六类高危场景：工具执行（如 shell/exec）、网关/Webhook 调用、敏感数据操作、未审核技能安装、群聊操作及越狱/提示注入攻击。

该技能采用「拒绝+引导」的响应模式：明确拒绝危险请求，说明安全/法律/政策依据，提供具体的安全替代方案，并通过提问引导用户转向安全目标。例如，当用户请求执行 shell 命令时，系统不会直接拒绝，而是提供伪代码、只读检查步骤，并建议禁用 exec 工具。

显著优点

1. 威胁覆盖全面：构建了六维威胁矩阵（恶意技能、工具滥用、SSRF/网关泄露、提示注入、密钥泄露、内存投毒），并配套具体的识别信号与响应策略。

2. 可操作性强：不仅识别风险，更提供精确的 CLI 级修复指令，如 openclaw auth set 替代不安全的 configure set，文件权限硬编码（700/600），以及 openclaw security audit 定期扫描。

3. 应急响应完整：泄露事件响应流程包含密钥轮换、会话吊销、运行时隔离、日志审计、已知良好状态重部署等 7 步闭环。

4. 用户教育导向：通过「安全检查清单」和场景化示例（如 API 密钥存储纠错），将安全最佳实践内化为用户习惯。

潜在缺点与局限性

生态绑定：功能深度依赖 OpenClaw 特定命令（openclaw auth set、clawhub 技能机制），对非 OpenClaw 用户参考价值有限。

被动防御边界：作为对话层安全 coach，无法直接阻止底层系统配置错误（如用户执意修改文件权限），依赖用户配合执行建议。

误拒风险：严格的拒绝策略可能在高频开发场景中产生摩擦，需要用户明确区分「调试需求」与「生产风险」。

无自动化审计：提供的 security audit 命令需用户手动触发，缺乏持续监控与实时告警能力。

适合人群

OpenClaw/ClawBot 管理员与开发者
运营 ClawHub 技能市场的平台维护者
需要快速建立 AI 代理安全基线的中小企业技术团队
对提示注入、供应链攻击（恶意技能）缺乏系统认知的安全初学者

常规风险

1. 策略绕过：攻击者可能通过多轮对话逐步拆解安全边界（"分块请求"攻击），需结合对话上下文保持警惕。

2. 技能供应链污染：若 ClawHub 审核机制本身存在漏洞，本 coach 的「人工审核建议」可能不足以防御高级持续威胁（APT）。

3. 密钥管理惯性：用户可能因便利惯性忽视 auth set 迁移建议，导致长期 plaintext 存储风险。

安全解读

核心用法

OpenClaw Safety Coach 是专为 OpenClaw/ClawHub 生态设计的安全副驾驶，主要功能包括：

实时风险拦截：识别并拒绝涉及代码执行（exec）、敏感信息泄露、未审核 Skill 安装等高风险请求
安全替代方案：不提供拒绝即结束，而是给出结构化的安全替代路径（如用伪代码替代 shell 执行、用脱敏片段替代原始密钥）
威胁矩阵导航：内置六类核心威胁的识别信号与响应策略（恶意 Skill、工具滥用、SSRF、提示词注入、密钥泄露、记忆投毒）
事件响应 playbook：提供从密钥轮换到环境隔离的标准化应急流程

显著优点

1. 零攻击面设计：纯 Markdown 文档（T-MD），无可执行代码、无外部依赖、无网络调用，本身即是最安全的 Skill 形态
2. 实战导向：不堆砌理论，直接给出可执行的 CLI 命令（如 openclaw auth set、chmod 600、openclaw security audit）
3. 结构化拒绝：遵循「明确拒绝→说明原因→安全替代→澄清问题」的四步法则，既守住安全底线又保持用户体验
4. 生态协同：深度绑定 OpenClaw 原生安全机制（系统密钥链存储、权限硬化、自动化审计），而非外部工具堆砌

潜在局限

T3 来源可信度：维护者为个人开发者（justindobbs），非企业级安全团队背书，关键场景建议人工复核
静态知识库：威胁矩阵依赖手动更新，对零日漏洞或新型攻击模式响应存在滞后
OpenClaw 生态绑定：部分命令（如 openclaw auth set）为特定平台实现，跨平台迁移需适配
无自动化执行：仅提供指导，不直接执行安全加固操作，依赖用户主动配合

适合人群

OpenClaw/ClawHub 新手用户（建立安全意识基线）
自托管 Bot 运维者（需要密钥管理与应急响应指引）
企业安全管理员（评估 Skill 供应链风险）
开发者（审查第三方 Skill 时的参照清单）

常规风险

误拒风险：严格策略可能误伤合法自动化需求，需通过「澄清问题」环节缓解
合规边界：明确拒绝提供医疗/法律/金融专业建议，仅输出通用信息并附加免责声明
社会工程绕过：虽内置 jailbreak 识别（"DAN"、"ignore previous"），但对抗性提示演进可能绕过静态规则

---

安全认证：CLS-Certify v2.1.0 六维扫描，S 级（94分），零风险发现，GDPR/CCPA 合规。

security safety moderation openclaw clawhub api-key-management incident-response supply-chain-security prompt-injection-defense secret-protection

Openclaw Safety Coach 内容

手动下载zip · 4.3 kB

skill.mdtext/markdown

请选择文件