cls-certify

🛡️ 企业级Skill安全认证专家

编辑精选

企业级Agent Skill安全认证工具,采用六维深度检测技术(静态分析、动态行为、依赖审计、网络流量、隐私合规、威胁情报),为个人开发者社区项目,可输出S+/S/A/B/C/D安全等级评估及可视化报告。

收藏
268
安装
78
版本
latest
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

核心用法

cls-certify是一款专为企业级安全需求设计的Agent Skill认证工具,通过六维深度检测框架对目标Skill进行全方位安全分析。用户可通过本地路径、Skill名称或GitHub链接指定待检对象,工具将自动执行版本检查、来源分级、硬编码快检、六维深度检测、综合评级及报告生成等完整流程。支持策略感知分类(T-MD/T-LITE/T-REF/T-HEAVY),针对不同代码规模自动调整检查强度,大幅提升检测效率。输出包含结构化Markdown/JSON报告及可选的HTML/PDF可视化文档,便于CI/CD集成和人工审计。

显著优点

1. 多维度检测体系:覆盖静态代码分析、动态行为模拟、依赖审计、网络流量分析、隐私合规检查、威胁情报六大维度,检测项涵盖140+威胁模式,包括隐蔽的提示词投毒、权限升级诱导、Agent上下文注入等高级攻击向量。
2. 智能策略适配:基于代码规模自动选择最优检查策略(MD-ONLY/TARGETED/FULL等),对纯Markdown文档跳过冗余检测,对大型代码库采用精准定位模式,兼顾深度与效率。

3. AI辅助验证:引入Agent意图验证机制,通过LLM能力对硬编码候选命中进行最终判定,有效区分真实威胁与文档描述/代码注释,显著降低误报率。

4. 分级评级标准:采用S+/S/A/B/C/D六级评级体系,结合强制降级规则(如L2+嵌套拉取直接判D级),结果清晰可执行。

5. 完整报告生态:支持Markdown、HTML、PDF、JSON多格式输出,HTML报告包含六边形雷达图可视化,便于向非技术 stakeholders 汇报。

潜在缺点或局限性

1. T3来源可信度:作为个人开发者社区项目,未达到T1/T2级别的来源可信度,无法享受官方动态代码加载等放宽政策。
2. 动态分析依赖模拟:当前版本通过子Agent进行模拟运行分析,非真实沙箱执行,置信度低于70%的发现需标记为"needs_sandbox_verification"。

3. 威胁情报局限:运行于Claude Code环境中,无法调用商业威胁情报API,依赖本地轻量级恶意模式库,覆盖度有限。

4. 纯Bash实现局限:核心工具链采用Bash脚本实现,跨平台兼容性受限(主要为Unix-like环境),复杂数据处理场景下性能与可维护性不及原生编程语言。

5. 人工验证瓶颈:S+评级需通过人工验证,但当前流程未明确人工介入的具体机制与时效保障。

适合的目标群体

  • Skill开发者:在发布前对自身Skill进行安全自检,修复潜在漏洞,争取更高评级
  • 平台运营方:建立Skill入驻安全门槛,批量审核第三方提交的技能
  • 企业安全团队:评估内部使用的Agent Skills风险等级,制定分级使用策略
  • 安全研究人员:分析Skill生态中的新型攻击模式,积累威胁情报
  • 终端用户:在安装来源不明的Skill前进行快速安全评估

使用风险

1. 依赖工具可用性:部分检测脚本依赖jq等外部工具,虽提供grep/sed降级方案,但在极端精简环境中可能影响功能完整性。
2. 网络请求依赖:版本检查功能需访问GitHub Raw URL,在内网/隔离环境中可能超时或失败。

3. 模拟分析不确定性:动态行为分析基于代码推理而非实际执行,存在漏检复杂条件触发逻辑的风险。

4. 评分规则迭代风险:安全评级标准随版本更新可能变化,历史报告分数不宜直接横向对比。

5. 报告渲染依赖Chrome:PDF生成功能依赖本地Chrome Headless环境,未安装Chrome时该功能不可用。

安全解读

cls-certify 综合评估

cls-certify 是由个人开发者 tanshow 开发的一款专业级 Agent Skill 安全检测认证工具,采用纯 Bash 脚本实现,当前版本 2.1.0,获得 A 级安全认证(评分 85/100)。该工具针对 Agent Skills 提供六维深度安全分析能力,涵盖静态代码分析、动态行为监控、依赖审计、网络流量分析、隐私合规检查和威胁情报六大维度,输出标准化的安全等级评估(S+/S/A/B/C/D)和结构化的 HTML/PDF/Markdown 可视化报告。

核心用法

用户可通过本地路径、已安装 skill 名称或 GitHub 链接指定待检测目标。工具自动执行版本检查、来源分级(T1/T2/T3)、智能分类(T-MD/T-LITE/T-REF/T-HEAVY)、硬编码快检、Agent 意图验证、六维深度检测和综合评级判定七大阶段。支持 auto/full/quick 三种扫描模式,T-HEAVY 大型代码库采用 Targeted 策略避免过度检测。报告严格遵循 report-data-protocol.md 数据协议,包含雷达图评分、外部 API 清单、风险发现详情和改进建议。

显著优点

1. 检测体系完备:140+ 威胁模式覆盖提示词注入、数据外泄、权限升级、MCP 滥用、Agent 上下文注入等新兴攻击向量;独创 L0-L3 动态代码嵌套拉取检测,≥2 层即强制 D 级降级。
2. 策略智能适配:基于代码量、文件结构和风险特征自动选择检测强度,纯 Markdown skill 跳过可执行代码检测,大型代码库聚焦命中点上下文分析,兼顾效率与深度。

3. AI 辅助验证:硬编码检测仅产出候选疑似点,通过 Agent LLM 推理进行最终意图判定,有效区分真实威胁与文档引用、测试代码,大幅降低误报率。

4. 供应链安全:集成 CVE 漏洞扫描、恶意包检测(typosquatting)、依赖树分析,GitHub 仓库信誉评估涵盖账号年龄、星标数、提交活跃度等多维指标。

5. 合规覆盖全面:GDPR/CCPA 数据最小化原则检查、隐私合规审查、敏感环境变量分级(批量遍历 process.env 最高 C 级限制)。

潜在缺点与局限性

1. 依赖模拟分析:动态行为分析当前通过子 Agent dry-run 模拟推理,非真实沙箱执行,置信度低于 70% 的发现需标记待验证,运行时行为可能与模拟结果存在偏差。
2. 威胁情报受限:运行于 Claude Code 环境,无法调用商业威胁情报 API,恶意模式库依赖本地维护,新型攻击特征可能存在滞后。

3. T3 来源信任成本:作为个人开发者项目,虽开源透明但缺乏企业背书,关键环境需额外审慎评估。

4. 渲染依赖 Chrome:PDF 生成需本地 Chrome Headless,环境缺失时降级为仅 HTML/Markdown。

适合人群

  • Agent Skill 开发者:代码安全自检与合规验证
  • 企业安全团队:第三方 Skill 准入审查与供应链安全管控
  • 开源社区维护者:CI/CD 集成自动化安全检测
  • 安全意识强的终端用户:安装前风险速查

常规风险

无显著使用风险。工具仅读取目标文件进行分析,不修改、不上传、不持久化敏感数据。唯一网络行为为版本检查(GitHub Raw),可离线使用。需注意:检测结果基于静态分析,不代表运行时绝对安全;T3 来源 skill 建议隔离环境先行验证。

cls-certify 内容

cls-certify-main文件夹
references文件夹
templates文件夹
tools文件夹
手动下载zip · 141.9 kB
api-classification.mdtext/markdown
请选择文件