expanso-log-sanitize

🛡️ 零泄露风险的本地日志脱敏专家

基于 Expanso Edge 框架的本地日志脱敏工具,通过正则匹配自动清除密码、Token 等敏感信息,零外部调用保障数据隐私安全。

收藏
4.1k
安装
1.9k
版本
0.0.0
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

log-sanitize 是一款专注于日志敏感信息脱敏的轻量级工具,基于 Expanso Edge 管道框架构建。它提供三种运行模式:CLI 管道模式通过标准输入输出处理文本,适合脚本集成和命令行快速处理;MCP 模式启动 HTTP 服务器,可作为服务被其他系统调用;Expanso Cloud 部署模式支持云端托管运行。用户只需将日志内容通过管道传入,工具即可自动识别并替换密码、API Token、密钥等敏感模式,输出脱敏后的安全日志。

显著优点

该工具的核心优势在于纯本地处理架构——无需 LLM、无外部 API 调用、无数据上传,从根本上杜绝了数据泄露风险。采用声明式 YAML 管道配置,无需编写复杂代码即可实现专业级脱敏功能。内置 10MB 输入缓冲区限制和 60 秒超时机制,有效防止资源耗尽攻击。输出附带 SHA256 哈希便于追踪审计,同时保留日志结构完整性。与 Expanso 生态深度集成,可无缝接入现有数据管道工作流。

潜在缺点与局限性

作为基于正则表达式的脱敏方案,其匹配规则可能存在覆盖不全的风险,新型敏感模式或变体格式可能遗漏脱敏。MCP 模式默认绑定 0.0.0.0,若部署不当存在网络暴露隐患。依赖 Expanso Edge 运行时环境,增加了额外的安装和维护成本。处理大体积日志时,10MB 缓冲区限制可能需要分批处理。此外,正则替换可能对日志格式造成意外破坏,建议关键场景下人工复核。

适合的目标群体

该工具特别适合运维工程师安全合规团队用于日志预处理与分享前的脱敏;开发者在调试时快速清理日志中的敏感凭证;技术支持人员向外部提交日志时保护客户隐私;以及需要满足GDPR、等保等合规要求的企业数据治理场景。对于使用 Expanso 数据管道平台的用户,可实现开箱即用的集成体验。

使用风险

主要风险集中在 MCP 模式的网络暴露配置,建议始终配合防火墙或绑定 127.0.0.1 使用。正则脱敏的非完备性意味着不应将其作为唯一安全防线,高敏感场景需叠加人工审核。Expanso Edge 作为新兴框架,长期维护稳定性有待观察。此外,输入大小限制可能导致超大日志截断,需预先规划分块策略。

安全解读

核心用法

log-sanitize 是一款专为日志安全设计的脱敏 Skill,基于 Expanso Edge 运行时构建。它通过声明式 YAML 配置(pipeline-cli.yaml / pipeline-mcp.yaml)实现纯本地文本处理,支持两种运行模式:

CLI Pipeline:标准 Unix 管道用法,适合脚本集成和批量处理

echo 'user=admin password=secret123' | expanso-edge run pipeline-cli.yaml

MCP Pipeline:作为 MCP Server 启动,便于 IDE 和 AI 工具集成

expanso-edge run pipeline-mcp.yaml

核心脱敏能力:内置正则表达式识别 password、token、api_key、secret、private_key 等 15+ 类敏感字段,支持通过 patterns 参数自定义扩展。

---

显著优点

| 维度 | 表现 |
|------|------|
| **安全架构** | 纯本地处理,零网络调用,数据永不离开设备 |
| **依赖管理** | 零第三方依赖,仅依赖 expanso-edge 运行时,无供应链风险 |
| **隐私合规** | 完全符合 GDPR 数据最小化原则,无持久化存储 |
| **部署灵活** | 支持本地 CLI、MCP Server、Expanso Cloud 三种部署形态 |
| **模式可扩展** | 支持通过 `patterns` 参数注入自定义正则,适配企业合规要求 |

安全认证评分 S+ (98分),六维雷达全满分:静态分析 98、动态行为 100、依赖审计 100、网络分析 100、隐私合规 95、威胁情报 95。

---

潜在缺点与局限性

1. 运行时绑定:必须安装 expanso-edge 二进制文件,Windows 用户需手动配置 PATH
2. 正则覆盖盲区:内置模式可能遗漏新型凭证格式(如 GitHub Fine-grained PAT github_pat_*),需手动更新

3. 缓冲区限制:默认 10MB 输入上限,超大日志需分块处理

4. 无智能语义分析:仅基于正则模式匹配,无法识别上下文敏感的间接泄露(如 pwd=xxx 的变量命名变体)

5. 无日志分类:不支持按日志级别(ERROR/WARN)差异化脱敏策略

---

适合人群

  • DevOps/SRE:需快速脱敏应用日志用于故障排查共享
  • 安全合规团队:满足日志外发审计的数据脱敏要求
  • 开源贡献者:提交 issue/PR 前自动脱敏附件日志
  • AI 工具用户:通过 MCP 协议让 AI 助手安全分析本地日志

---

常规风险

| 风险类型 | 评估 | 说明 |
|----------|------|------|
| 数据外泄 | **极低** | 纯本地架构,认证报告确认零网络调用 |
| 供应链攻击 | **极低** | 零依赖设计,无第三方库引入风险 |
| 误脱敏/漏脱敏 | **中低** | 依赖正则准确性,建议生产环境配合人工抽检 |
| ReDoS 攻击 | **极低** | 认证报告确认正则模式设计合理,无灾难性回溯风险 |
| 持久化风险 | **无** | 无本地缓存或临时文件写入 |

使用建议:处理含高度敏感数据(如金融核心系统日志)时,建议先运行 diff 对比脱敏前后差异,确保关键上下文未被过度清除。

expanso-log-sanitize 内容

test文件夹
fixtures文件夹
手动下载zip · 5.0 kB
input.txttext/plain
请选择文件