openclaw-profanity

🛡️ 全场景智能内容审核专家

GLINCKER 官方内容审核方案,支持 Leetspeak/Unicode 检测,为 OpenClaw 机器人提供实时脏话过滤与多平台适配。

收藏
1.8k
安装
825
版本
v1.0.0
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

OpenClaw Profanity Plugin 是专为 OpenClaw 和 Moltbot AI 代理设计的内容审核解决方案,旨在为现代聊天机器人提供企业级的脏话过滤与内容安全防护。该插件通过 npm 包形式分发,可无缝集成到 Discord、Slack、Telegram 等主流即时通讯平台,帮助开发者快速构建健康、安全的交互环境。

核心用法围绕简单的配置驱动模式展开。开发者通过 npm 安装后,只需在 OpenClaw 初始化时引入并配置 profanityPlugin 即可启用。插件提供四种核心处置策略:warn(警告提示)、censor(星号屏蔽)、block(消息拦截)和 log(仅记录),并支持通过 onViolation 回调实现自定义违规处理逻辑,如追踪重复违规者或自动封禁。配置方面,可灵活指定 languages 支持多语言检测,通过 customWordsignoreWords 自定义黑白名单,还能开启 detectLeetspeaknormalizeUnicode 应对变形文字。

显著优点体现在其强大的检测能力与平台适配性。插件不仅能识别标准脏话,还能捕捉 Leetspeak(如 f4cksh1t)、Unicode 视觉欺骗(如西里尔字母替代拉丁字母)、空格分隔及混合变形等高级规避手段。多平台示例代码覆盖主流场景,大大降低了跨平台部署的门槛。此外,插件的架构设计允许精细化的策略配置,既能满足严格的社区管理需求,也支持宽松的日志记录模式。

然而,该技能也存在一定局限性。首先,基于模式匹配的检测机制可能存在误判风险,将正常词汇错误标记。其次,复杂的 Unicode 规范化与多语言检测可能带来性能开销,在高并发场景下需要评估延迟影响。再者,当前语言支持虽覆盖主要语种,但对新兴网络用语更新可能滞后。最后,插件依赖外部 npm 包的核心检测逻辑,若上游词典更新不及时,可能出现漏检。

适合的目标群体主要包括:构建社区 Discord 机器人或 Telegram 群组管理机器人的开发者;需要在 Slack 工作区实现自动内容合规的企业运维团队;使用 OpenClaw 框架开发客服 AI 代理且需确保输出安全的产品团队;以及任何希望快速集成内容审核能力而无需自建复杂过滤系统的独立开发者。

使用该技能可能存在的常规风险包括:性能方面,实时内容检查会增加消息处理延迟,极端情况下可能影响用户体验;依赖项方面,实际执行依赖 openclaw-profanity npm 包,需关注其供应链安全与版本兼容性;配置方面,过于严格的过滤规则可能导致过度审查,影响正常交流,而过于宽松则可能失去防护意义,需要反复调优;此外,自定义违规处理器若实现不当,可能引发未捕获的异常或竞态条件。

安全解读

核心用法

openclaw-profanity 是一款面向 OpenClaw 和 Moltbot AI 代理的内容审核插件,主要用于聊天机器人的脏话过滤场景。该 Skill 为纯文档型插件,提供完整的安装配置指南与多平台集成示例。

主要功能模式

  • warn:检测到违规时发送警告并继续处理
  • censor:用占位符(如 ***)替换敏感词后继续
  • block:直接拦截整条消息
  • log:记录违规日志但正常处理
  • custom:通过 onViolation 回调实现自定义逻辑(如累犯追踪、自动封禁)

检测能力:支持标准脏话、leetspeak(f4cksh1t)、Unicode 视觉欺骗(西里尔字母替代)、空格分隔字符(f u c k)及混合混淆(fü©k)等规避手法的识别。

多平台适配:提供 Discord、Telegram、Slack 等主流聊天平台的完整配置示例,开发者可直接复制使用。

显著优点

1. 安全性极高:S级安全认证,零威胁检出,纯 Markdown 文档无可执行代码
2. 检测维度全面:覆盖字符级、语义级、视觉欺骗级多重过滤策略

3. 多语言支持:内置英语、西班牙语等语言包,可扩展自定义词库

4. 灵活可配置:白名单、自定义敏感词、精细化动作策略满足不同场景

5. 来源可信:GLINCKER GitHub 组织维护,npm 官方仓库发布,T2级信任背书

潜在局限

  • 无运行时实现:该 Skill 仅为使用文档,实际功能需依赖 openclaw-profanity npm 包
  • 误判风险:基于词表匹配可能误伤正常词汇(如上下文敏感的医学术语)
  • 对抗性局限:高度创造性的规避手段(如隐喻、谐音)可能漏检
  • 中文支持未明确:文档示例以英文为主,中文分词及语义理解能力待验证

适合人群

  • 使用 OpenClaw/Moltbot 框架构建 Discord/Telegram/Slack 机器人的开发者
  • 需要快速集成内容审核功能但缺乏安全审计能力的中小团队
  • 对合规要求严格的社区运营者(教育平台、游戏公会等)

常规风险

| 风险类型 | 评估 | 说明 |
|---------|------|------|
| 代码执行风险 | 极低 | 无可执行代码,纯文档型 |
| 数据泄露风险 | 极低 | 不处理用户数据,无 API 调用 |
| 供应链风险 | 低 | 依赖外部 npm 包,建议锁定版本 |
| 合规风险 | 低 | 建议补充明确的开源许可证声明 |

生产建议:该 Skill 文档本身可安全使用,但实际运行需安装同名 npm 包,建议对 npm 依赖进行独立审计并启用 Dependabot 监控。

openclaw-profanity 内容

手动下载zip · 1.9 kB
SKILL.mdtext/markdown
请选择文件