核心用法
Screenshot 是一个纯文档型指导 Skill,专注于提供跨平台、跨场景的截图最佳实践。它不执行任何代码,而是作为决策参考工具,帮助用户选择正确的截图工具、等待策略、视口配置和输出格式。
覆盖场景:
- 桌面捕获:macOS (
screencapture)、Linux Wayland (grim+slurp)、Windows (nircmd/Pillow) - 浏览器捕获:Playwright 用于网页、元素、全页、遮罩和回归测试截图
- 模拟器捕获:iOS Simulator (
xcrun simctl) - CI/自动化:无头环境下的稳定、可复现截图
八项核心规则:
1. 按目标选工具(桌面用原生、网页用浏览器、模拟器用 simctl)
2. 捕获前稳定目标(等待网络空闲、字体渲染完成)
3. 固定视口/缩放/主题确保可复现性
4. 捕获最小有用范围(元素 > 区域 > 全屏)
5. 去除噪声(光标、通知、时间戳、敏感信息)
6. 选对格式(PNG 默认,JPEG 仅用于照片)
7. CI 捕获可调试(失败即截图、稳定命名)
8. 验证截图实用性(细节可见、无敏感泄露)
显著优点
- 零攻击面:无代码执行、无网络请求、无文件系统操作、零依赖
- 专业深度:覆盖 Retina/HiDPI、动画控制、遮罩、视觉回归等高级场景
- 隐私意识:明确提醒遮蔽 secrets、tokens、个人数据
- 工具链整合:与 Playwright、image、documentation 等 Skill 形成工作流
- 平台全面:macOS、Linux(X11/Wayland)、Windows、iOS 模拟器均有针对性方案
潜在局限
- 非自动化工具:仅提供指导,不直接执行截图(需用户手动运行命令或代码)
- 无错误处理:不包含重试逻辑、异常捕获或失败回退机制
- 版本依赖:部分命令(如
grim、slurp)需用户自行安装 - T3 来源:个人开发者维护,非知名组织背书
适合人群
- QA 工程师:构建稳定的视觉回归测试流程
- 开发者:调试 UI、生成文档素材、准备发布说明
- 技术写作者:制作清晰、一致的文档截图
- DevOps:配置 CI 中的失败调试截图机制
常规风险
- 用户误操作风险:虽然 Skill 提醒遮蔽敏感信息,但最终截图内容由用户控制
- 工具权限:
screencapture等系统工具可能请求录屏权限 - CI 凭证泄露:自动化截图若配置不当,可能捕获环境变量或测试账号信息(Skill 已明确警示)