使用说明

核心用法

cls-certify是一款专为企业级安全需求设计的Agent Skill认证工具，通过六维深度检测框架对目标Skill进行全方位安全分析。用户可通过本地路径、Skill名称或GitHub链接指定待检对象，工具将自动执行版本检查、来源分级、硬编码快检、六维深度检测、综合评级及报告生成等完整流程。支持策略感知分类（T-MD/T-LITE/T-REF/T-HEAVY），针对不同代码规模自动调整检查强度，大幅提升检测效率。输出包含结构化Markdown/JSON报告及可选的HTML/PDF可视化文档，便于CI/CD集成和人工审计。

显著优点

1. 多维度检测体系：覆盖静态代码分析、动态行为模拟、依赖审计、网络流量分析、隐私合规检查、威胁情报六大维度，检测项涵盖140+威胁模式，包括隐蔽的提示词投毒、权限升级诱导、Agent上下文注入等高级攻击向量。
2. 智能策略适配：基于代码规模自动选择最优检查策略（MD-ONLY/TARGETED/FULL等），对纯Markdown文档跳过冗余检测，对大型代码库采用精准定位模式，兼顾深度与效率。
3. AI辅助验证：引入Agent意图验证机制，通过LLM能力对硬编码候选命中进行最终判定，有效区分真实威胁与文档描述/代码注释，显著降低误报率。
4. 分级评级标准：采用S+/S/A/B/C/D六级评级体系，结合强制降级规则（如L2+嵌套拉取直接判D级），结果清晰可执行。
5. 完整报告生态：支持Markdown、HTML、PDF、JSON多格式输出，HTML报告包含六边形雷达图可视化，便于向非技术 stakeholders 汇报。

潜在缺点或局限性

1. T3来源可信度：作为个人开发者社区项目，未达到T1/T2级别的来源可信度，无法享受官方动态代码加载等放宽政策。
2. 动态分析依赖模拟：当前版本通过子Agent进行模拟运行分析，非真实沙箱执行，置信度低于70%的发现需标记为"needs_sandbox_verification"。
3. 威胁情报局限：运行于Claude Code环境中，无法调用商业威胁情报API，依赖本地轻量级恶意模式库，覆盖度有限。
4. 纯Bash实现局限：核心工具链采用Bash脚本实现，跨平台兼容性受限（主要为Unix-like环境），复杂数据处理场景下性能与可维护性不及原生编程语言。
5. 人工验证瓶颈：S+评级需通过人工验证，但当前流程未明确人工介入的具体机制与时效保障。

适合的目标群体

Skill开发者：在发布前对自身Skill进行安全自检，修复潜在漏洞，争取更高评级
平台运营方：建立Skill入驻安全门槛，批量审核第三方提交的技能
企业安全团队：评估内部使用的Agent Skills风险等级，制定分级使用策略
安全研究人员：分析Skill生态中的新型攻击模式，积累威胁情报
终端用户：在安装来源不明的Skill前进行快速安全评估

使用风险

1. 依赖工具可用性：部分检测脚本依赖jq等外部工具，虽提供grep/sed降级方案，但在极端精简环境中可能影响功能完整性。
2. 网络请求依赖：版本检查功能需访问GitHub Raw URL，在内网/隔离环境中可能超时或失败。
3. 模拟分析不确定性：动态行为分析基于代码推理而非实际执行，存在漏检复杂条件触发逻辑的风险。
4. 评分规则迭代风险：安全评级标准随版本更新可能变化，历史报告分数不宜直接横向对比。
5. 报告渲染依赖Chrome：PDF生成功能依赖本地Chrome Headless环境，未安装Chrome时该功能不可用。

安全解读

cls-certify 综合评估

cls-certify 是由个人开发者 tanshow 开发的一款专业级 Agent Skill 安全检测认证工具，采用纯 Bash 脚本实现，当前版本 2.1.0，获得 A 级安全认证（评分 85/100）。该工具针对 Agent Skills 提供六维深度安全分析能力，涵盖静态代码分析、动态行为监控、依赖审计、网络流量分析、隐私合规检查和威胁情报六大维度，输出标准化的安全等级评估（S+/S/A/B/C/D）和结构化的 HTML/PDF/Markdown 可视化报告。

核心用法

用户可通过本地路径、已安装 skill 名称或 GitHub 链接指定待检测目标。工具自动执行版本检查、来源分级（T1/T2/T3）、智能分类（T-MD/T-LITE/T-REF/T-HEAVY）、硬编码快检、Agent 意图验证、六维深度检测和综合评级判定七大阶段。支持 auto/full/quick 三种扫描模式，T-HEAVY 大型代码库采用 Targeted 策略避免过度检测。报告严格遵循 report-data-protocol.md 数据协议，包含雷达图评分、外部 API 清单、风险发现详情和改进建议。

显著优点

1. 检测体系完备：140+ 威胁模式覆盖提示词注入、数据外泄、权限升级、MCP 滥用、Agent 上下文注入等新兴攻击向量；独创 L0-L3 动态代码嵌套拉取检测，≥2 层即强制 D 级降级。
2. 策略智能适配：基于代码量、文件结构和风险特征自动选择检测强度，纯 Markdown skill 跳过可执行代码检测，大型代码库聚焦命中点上下文分析，兼顾效率与深度。
3. AI 辅助验证：硬编码检测仅产出候选疑似点，通过 Agent LLM 推理进行最终意图判定，有效区分真实威胁与文档引用、测试代码，大幅降低误报率。
4. 供应链安全：集成 CVE 漏洞扫描、恶意包检测（typosquatting）、依赖树分析，GitHub 仓库信誉评估涵盖账号年龄、星标数、提交活跃度等多维指标。
5. 合规覆盖全面：GDPR/CCPA 数据最小化原则检查、隐私合规审查、敏感环境变量分级（批量遍历 process.env 最高 C 级限制）。

潜在缺点与局限性

1. 依赖模拟分析：动态行为分析当前通过子 Agent dry-run 模拟推理，非真实沙箱执行，置信度低于 70% 的发现需标记待验证，运行时行为可能与模拟结果存在偏差。
2. 威胁情报受限：运行于 Claude Code 环境，无法调用商业威胁情报 API，恶意模式库依赖本地维护，新型攻击特征可能存在滞后。
3. T3 来源信任成本：作为个人开发者项目，虽开源透明但缺乏企业背书，关键环境需额外审慎评估。
4. 渲染依赖 Chrome：PDF 生成需本地 Chrome Headless，环境缺失时降级为仅 HTML/Markdown。

适合人群

Agent Skill 开发者：代码安全自检与合规验证
企业安全团队：第三方 Skill 准入审查与供应链安全管控
开源社区维护者：CI/CD 集成自动化安全检测
安全意识强的终端用户：安装前风险速查

常规风险

无显著使用风险。工具仅读取目标文件进行分析，不修改、不上传、不持久化敏感数据。唯一网络行为为版本检查（GitHub Raw），可离线使用。需注意：检测结果基于静态分析，不代表运行时绝对安全；T3 来源 skill 建议隔离环境先行验证。

security automation devops testing backend development-engineering data-analytics

cls-certify 内容

cls-certify-main文件夹

references文件夹

templates文件夹

tools文件夹

手动下载zip · 141.9 kB

api-classification.mdtext/markdown

请选择文件