Tinman - AI Failure Mode Research, Prompt Injection & Tool Exfil Detection

🛡️ AI 安全扫描与威胁发现专家

security榜 #38

专业级 AI 安全扫描器,提供 270+ 攻击探针与实时监控,覆盖提示注入、工具泄露、上下文渗透、加密货币盗窃等 11 大类威胁向量

收藏
11.2k
安装
3.3k
版本
0.5.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用途

Tinman 是一款面向 AI 系统的主动安全研究代理,通过系统化实验发现并分类 AI 失败模式。核心功能包括:

  • 会话扫描:分析近期会话,检测提示注入、工具滥用、上下文泄露
  • 实时监控:通过 WebSocket 网关或轮询模式持续监控安全事件
  • 主动渗透:运行 270+ 合成攻击探针,覆盖 11 大类攻击向量
  • 威胁分级:按 S0-S4 五级严重性分类,自动生成可操作的缓解建议

显著优点

1. 覆盖面极广:270+ 攻击探针涵盖提示注入、工具泄露、上下文渗透、权限提升、加密货币盗窃、MCP 滥用、间接注入、逃避绕过、内存投毒等全谱系威胁
2. 实时响应:支持 WebSocket 实时监听与可配置轮询双模式

3. 本地化执行:所有分析在本地运行,会话数据不外传

4. 深度集成:与 OpenClaw 生态深度整合,直接映射到 SOUL.md 防护策略、沙箱策略、工具黑白名单

5. 平台适配:包含 Windows、macOS、Linux 及云环境的特定攻击向量

局限与注意事项

  • 权限依赖:需要 sessions_listsessions_historyreadwrite 等工具权限
  • 配置复杂度:初次使用需初始化工作区并理解 OpenClaw 控制体系
  • 误报可能:合成探针可能产生噪音,需人工复核 S2 以下告警
  • Python 版本限制:要求 Python ≥3.10

适合人群

  • AI 系统安全工程师与红队研究员
  • 企业 AI 平台运维团队
  • 对 AI 代理安全有合规要求的组织
  • OpenClaw/Gateway 生态的深度用户

常规风险

  • 数据暴露风险:扫描过程需读取会话历史,敏感场景需确保隔离环境
  • 资源占用:270+ 探针的全量扫描可能消耗显著计算资源
  • 依赖维护:依赖 AgentTinmantinman-openclaw-eval 两个外部包,需关注供应链安全

Tinman - AI Failure Mode Research, Prompt Injection & Tool Exfil Detection 内容

手动下载zip · 13.5 kB
requirements.txttext/plain
请选择文件