expanso-pii-detect

🔒 智能隐私信息检测与合规助手

Expanso 官方出品的 PII 检测技能,基于 GPT-4o-mini 智能识别文本中的个人身份信息,助力企业数据合规与隐私保护。

收藏
5.2k
安装
1.6k
版本
v1.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

pii-detect 是一款专注于个人身份信息(PII)检测的 Agent Skill,由 Expanso 团队开发。该技能提供三种部署模式:CLI 管道模式适合命令行快速检测,MCP 模式可作为服务长期运行,Expanso Cloud 模式支持云端规模化部署。用户通过环境变量配置 OPENAI_API_KEY 和可选的 PII_TYPES 检测类型,即可对输入文本进行智能分析,输出结构化的 PII 检测结果。

显著优点

1. 智能识别能力:采用 GPT-4o-mini 模型,相比传统正则表达式能识别更复杂的 PII 变体和上下文关联信息
2. 灵活部署:支持本地 CLI、MCP 服务和云端三种模式,适应不同架构需求

3. 审计友好:自动生成 trace_id 和 input_hash,便于合规审计和结果追踪

4. 隐私保护设计:输入内容仅发送哈希值用于追踪,原始数据通过 HTTPS 传输至 OpenAI API

5. 降级能力:支持纯 regex 模式运行,无需 API Key 即可进行基础检测

潜在缺点与局限性

1. 外部依赖强:核心功能依赖 OpenAI API,离线环境无法使用完整功能
2. 延迟问题:LLM 调用带来额外网络延迟,不适合实时性要求极高的场景

3. 成本考量:持续调用 GPT-4o-mini 会产生 API 费用,高频使用需评估成本

4. 准确率边界:AI 检测存在误报/漏报可能,关键场景建议人工复核

5. 输入限制:默认 1MB 缓冲区限制,超大文本需分批处理

适合的目标群体

  • 数据工程师:构建数据脱敏和 DLP 管道
  • 合规团队:执行 GDPR、CCPA 等隐私法规检查
  • 安全运维:日志审计前的敏感信息筛查
  • 开发者:集成隐私感知的数据处理工作流

使用风险

1. 数据出境风险:检测数据需发送至 OpenAI 服务器,跨国企业需评估合规性
2. API 密钥管理:OPENAI_API_KEY 需安全存储,避免泄露导致费用损失

3. 模型版本锁定:当前锁定 gpt-4o-mini,未来模型升级可能需要手动更新配置

4. 沙箱依赖:功能依赖 Expanso Edge 运行时环境,需确保正确安装和版本兼容

expanso-pii-detect 内容

test文件夹
fixtures文件夹
手动下载zip · 6.4 kB
input.txttext/plain
请选择文件