使用说明

核心用法

OpenClaw Safety Coach 是一款针对 OpenClaw 2026 时代安全态势的纯文档型教练技能。它并非一个可执行的工具，而是一套完整的、嵌入 Agent 提示词中的安全策略与行为规范。其核心任务在于拒绝执行有害、非法或不安全的请求，并向用户提供实用的操作指引，以降低生态系统风险（如恶意技能安装、工具滥用、密钥泄露和提示注入）。

使用时，该技能会自动介入涉及以下范畴的对话：工具或系统访问 (exec, shell, 文件写入)、密钥或敏感配置、未审核的 ClawHub 技能安装、存在身份冒充或提示注入风险的群聊操作，以及任何试图越狱、覆盖系统指令或提取系统提示词的尝试。它遵循“先拒绝、再解释、后建议”的响应契约，不仅说“不”，还会提供安全合规的替代方案。

显著优点

零执行风险：该 Skill 为纯 Markdown 文档（210 行，3 个文件），无任何可执行代码、外部 API 调用或第三方依赖，自身不会引入运行时安全漏洞。
全面的安全知识库：内容覆盖 OpenClaw 2026.x 的安全配置要点，包括外部密钥管理、多用户安全策略、DM/群组访问控制、命令授权、沙箱范围、浏览器 SSRF 防护、容器隔离、网关认证与 TLS、钩子安全等数十个检查列表，是一部可对话的安全手册。
主动防御与教练结合：不仅能自动拒绝越狱、提示注入、密钥提取等高风险行为，还针对恶意技能、命令滥用、容器逃逸等 10 余类威胁场景提供了具体的检测线索和安全响应方案。
内置应急响应：提供 7 步事件响应剧本，从密钥轮转到安全审计、会话吊销、钩子检查、日志审查直至重新部署，可指导用户在安全事件发生后快速止损。
100 分无瑕疵扫描结果：经 CLS-Certify v2.1.0 扫描，静态分析、动态行为、依赖审计、网络流量、隐私合规各项均为绿色通过，未发现任何危险函数、硬编码敏感信息、数据外泄或过度权限申请。

潜在缺点或局限性

来源可信度受限（T3）：该 Skill 由个人开发者 justindobbs 维护，托管于个人 GitHub 仓库，无法通过自动扫描验证其社区 Star、Fork 等量化信誉指标。尽管托管于 ClawHub 且有 1.0.6 的版本维护历史，评级仍被限制为 A。
纯内容依赖 Agent 执行：由于它是纯提示词/Markdown 类型，其安全约束力完全取决于底层 Agent 是否遵从这些指令。若 Agent 本身配置不当（如未设置 sandbox.mode 或未禁用 exec），该 Skill 的防护可能被绕过。
无实战验证数据：作为教练角色，它提供的是最佳实践指南而非主动防御系统，缺乏对实际攻防场景的动态检测能力。

适合的目标群体

OpenClaw 平台的使用者和管理员，尤其是希望在 2026 时代构建安全 Agent 对话环境的用户。
需要安全入门指引的个人开发者或小团队，可将该 Skill 作为“安全助手”集成，获得实时的安全操作建议。
任何需要在 Agent 中嵌入安全护栏，以防止用户误操作或恶意攻击的场景。
T3 来源的高信任度探索者，愿意在隔离环境中尝试个人开发者维护的安全工具。

使用风险提示

依赖项风险：该 Skill 本身无依赖项，不引入连锁漏洞风险。
性能影响：纯文档不会消耗额外的计算或内存资源，对 Agent 性能的影响可忽略不计。
安全配置漂移：该 Skill 的安全建议基于 OpenClaw 2026.x，若平台版本更新但 Skill 未同步，可能出现配置建议过时的情况。
信任边界：T3 来源意味着需用户自行承担信任决策。建议在网络可用环境中手动审查 GitHub 仓库活跃度，并在每次 Skill 更新后重新进行人工内容审查，确保未被加入恶意指令。
替代方案缺失：在拒绝高风险请求后，若用户缺乏足够的技术背景，可能难以独立执行 Skill 建议的替代安全操作（如手动审核代码或配置 groupPolicy 白名单），需要额外的外部技术支持。

安全解读

OpenClaw Safety Coach 综合评估

核心用途

OpenClaw Safety Coach 是专为 OpenClaw 生态设计的安全指导型 Skill，定位为"安全教练"而非被动防火墙。它在检测到高风险操作时主动介入，覆盖五大场景：工具/系统访问（exec、shell、文件写入）、敏感信息处理（密钥、配置）、未审核 Skill 安装、群聊场景的仿冒/注入攻击，以及任何试图覆盖指令、越狱或提取系统提示的行为。

显著优点

1. 预防性安全架构：不同于事后审计，该 Skill 采用"拒绝+解释+替代方案+澄清问题"的四步响应契约，将用户引导至安全路径。
2. 版本化安全基线：紧密跟随 OpenClaw 2026.x 的安全演进，涵盖外部密钥管理（openclaw secrets）、多用户信任模型、sandbox.mode、DM/群聊配对策略、容器隔离等 15+ 项具体配置指令。
3. 威胁场景全覆盖：从恶意 Skill、exec 滥用、SSRF、容器逃逸到名称匹配绕过、提示注入、密钥泄露等 12 类攻击向量，均提供识别特征与标准化响应话术。
4. 零执行风险：纯 Markdown 文档型 Skill，无代码执行能力、无外部依赖、无网络调用，安全认证评分 100/S+。
5. 可操作的检查清单：每次会话前的 10 项速查清单，以及事件响应的 7 步 playbook，降低安全运营的认知负担。

潜在局限

1. 版本锁定风险：安全建议高度绑定 OpenClaw 2026.x 特性，若用户运行旧版本或未来版本发生配置变更，部分指令可能失效或产生误导。
2. 被动依赖用户配合：Skill 本身无法强制修改系统配置，最终安全姿态仍取决于用户是否采纳建议并正确执行命令。
3. 无自动化 enforcement：缺乏与 OpenClaw 核心引擎的深度集成，无法像内核级安全模块那样强制拦截危险操作（仅能通过对话层拒绝）。
4. 英文语境优化：配置指令和命令示例以英文为主，对中文用户的本地化支持有限。

适合人群

OpenClaw 系统管理员与 DevSecOps 工程师
在多用户/多租户环境中部署 OpenClaw 的团队
需要处理敏感数据（密钥、凭证）的自动化工作流设计者
从个人使用向生产级部署迁移的 OpenClaw 用户

常规风险

误用风险：用户可能将 Skill 的建议视为"绝对安全"而忽视环境特异性评估，例如盲目关闭 allow_exec 可能导致正常自动化任务中断。
滞后性：安全指导文档更新可能滞后于 OpenClaw 新版本发布，存在配置建议过时的窗口期。
社会工程绕过：尽管 Skill 会拒绝越狱尝试，但持续的社会工程攻击仍可能诱导用户手动绕过安全建议。

security devops productivity education-research

Openclaw Safety Coach 内容

手动下载zip · 6.2 kB

README.mdtext/markdown

请选择文件