glin-profanity-mcp

🛡️ 多语言内容安全审核专家

基于MCP协议的AI内容审核工具,支持24种语言敏感词检测与上下文分析,助力构建安全合规的内容生态。

收藏
21.5k
安装
4.5k
版本
v1.0.0
CLS 安全性认证2026-05-02
点击查看完整报告 >

使用说明

Glin Profanity MCP Server 是一款专为 AI 助手设计的内容安全审核工具,通过 Model Context Protocol (MCP) 协议为 Claude Desktop、Cursor 和 Windsurf 等应用提供强大的敏感词检测与文本净化能力。

在核心用法方面,该 Skill 提供四大类工具:核心检测(包括文本亵渎检查、智能脱敏、批量审查和安全评分)、深度分析(支持上下文感知分析如医疗/游戏场景、混淆字符检测如 leetspeak 和 Unicode 技巧、匹配原因解释和多级严格度对比)、实用工具(清洁替代词建议、大规模语料库统计、正则表达式生成和 24 种语言支持)以及用户追踪(消息历史记录、违规用户画像和高风险用户识别)。用户可通过自然语言指令如"检查这50条评论"或"生成审核报告"快速调用这些功能。

显著优点体现在多维度能力上:多语言支持覆盖全球主要语种;上下文感知能区分医疗术语与真正的不当内容;混淆检测可识别变体如"f4ck";批量处理支持单次分析多达500条文本;用户追踪功能有助于识别重复违规者。此外,作为 MCP 服务器,它能无缝集成到现有 AI 工作流,实现人机协作的内容审核模式。

潜在局限性包括:性能方面,由于依赖本地 MCP Server 处理,响应时间超过1毫秒,不适合超高频实时过滤场景;自动化程度方面,设计初衷是人机协作而非完全无人值守,复杂语境仍需人工复核;数据处理方面,虽然文本仅在本地处理,但涉及敏感信息时仍需先进行脱敏处理。

该工具特别适合内容平台运营团队、社区管理员、在线出版编辑、AI 应用开发者以及需要内容合规审查的企业。对于处理用户生成内容(UGC)的平台,它能有效减轻人工审核负担;对于教育机构,可过滤不当内容保护未成年人;对于出版行业,能在发布前自动检测敏感词。

使用风险主要包括:技术依赖风险,需要维护 npm 包更新和本地 MCP Server 运行环境;误判风险,任何自动化审核都可能产生假阳性(如误判医学术语),建议设置人工复核环节;隐私合规风险,尽管数据本地处理,但在处理含 PII(个人身份信息)的内容时,仍需遵守 GDPR 等法规要求;边界情况风险,对于新兴网络用语或文化特定表达,检测库可能存在滞后性。

安全解读

核心用法

Glin Profanity MCP 是一款专为 AI 助手设计的内容安全审查工具,通过 MCP 协议集成到 Claude Desktop、Cursor、Windsurf 等 AI 工作流中。提供四大类工具:

1. 检测类check_profanity 单条检测、batch_check 批量检测(最多100条)、validate_content 安全评分(0-100)、detect_obfuscation 识别变形文本(如 leetspeak、Unicode 伪装)
2. 处理类censor_text 智能脱敏、suggest_alternatives 提供文明替代词

3. 分析类analyze_context 领域自适应(医疗/游戏等场景)、compare_strictness 多严格度对比、explain_match 可解释性分析

4. 风控类track_user_message 用户行为追踪、get_user_profile 违规画像、get_high_risk_users 高风险用户识别

显著优点

  • AI 原生设计:专为 AI 工作流优化,支持自然语言指令如"检查这50条评论并告诉我哪些需要处理"
  • 多语言支持:覆盖 24 种语言的脏话检测,满足全球化内容平台需求
  • 领域自适应:医疗、游戏等专业场景可切换上下文,减少误杀
  • 可解释性:不仅能检测,还能解释"为什么 f4ck 被判定为违规"
  • 用户风控闭环:从单条检测到用户级违规画像,支持 repeat offender 识别

潜在缺点与局限性

  • 延迟敏感场景不适用:官方明确建议实时过滤(<1ms)场景应直接使用底层库而非 MCP 服务
  • AI 依赖成本:每次检测需调用 AI 推理,高频场景成本显著高于纯本地库
  • 误判风险:上下文分析虽能缓解,但医疗术语、亚文化黑话仍可能触发误报
  • MCP 生态锁定:仅支持 MCP 兼容客户端,通用性受限

适合人群

  • 内容平台运营者:需要批量审核 UGC、生成 moderation report
  • AI 工作流构建者:在发布前对 AI 生成内容进行安全校验
  • 社区管理员:人机协作审查场景,AI 预筛+人工复核
  • 多语言产品团队:需统一管控全球化内容的合规风险

常规风险

  • 过度审查风险:高严格度设置可能导致正常表达受限,建议配合 compare_strictness 调优
  • 隐私合规:用户追踪功能涉及行为数据积累,需确保符合 GDPR/CCPA 等法规
  • 供应链安全:运行时依赖 npm 包 glin-profanity,需关注其更新与漏洞

glin-profanity-mcp 内容

手动下载zip · 1.9 kB
SKILL.mdtext/markdown
请选择文件