核心用法
Clawbrowser 是一款基于 Microsoft Playwright CLI 的浏览器控制技能,专为 Agent 提供轻量级、脚本化的浏览器自动化能力。其核心工作流遵循「打开页面 → 生成快照 → 执行交互 → 捕获证据」的循环模式:
1. 启动与会话管理:使用 playwright-cli open <url> 加载页面,配合 --session=<name> 实现 Cookie、存储和标签页的隔离持久化。支持通过环境变量 PLAYWRIGHT_CLI_SESSION 简化多命令场景。
2. 元素定位与交互:snapshot 命令生成元素引用(如 e1, e2),后续所有点击、填充、选择等操作均基于这些引用。DOM 变更后需重新执行 snapshot 以避免引用失效。
3. 丰富的交互能力:涵盖点击、双击、悬停、拖拽、表单填充、文件上传、键盘鼠标控制、标签页管理、前进后退等完整浏览操作,以及 eval 执行 JavaScript 的扩展能力。
4. 调试与取证:内置截图、PDF 导出、控制台日志抓取、网络请求监控、追踪录制(tracing)和视频录制功能,便于问题排查与流程复现。
显著优点
- 轻量高效:相比完整 MCP 浏览器,CLI 模式资源占用更低,启动更快,适合批量化脚本任务。
- 会话隔离机制完善:显式 session 管理支持多工作流并行,避免状态污染,同时提供
--isolated纯临时模式。 - 配置驱动:
playwright-cli.json集中管理浏览器类型、视口、超时、输出目录等参数,降低命令行复杂度。 - 自文档化:
--help实时反映最新命令集,降低记忆负担。
潜在局限
- 引用脆弱性:依赖 snapshot 生成的元素引用,动态页面或频繁 DOM 变更场景下需反复刷新引用,增加脚本复杂度。
- 无原生视觉感知:CLI 模式无法直接"看见"页面,需通过 screenshot/snapshot 间接确认状态,调试成本高于 headed 模式。
- 学习曲线:需掌握特定 CLI 语法和引用机制,对熟悉传统 Playwright 代码 API 的用户存在迁移成本。
适合人群
- 需要批量网页数据采集、表单自动提交的自动化工程师
- 需在受限环境中(如无 GUI 服务器)执行浏览器任务的 DevOps 人员
- 追求低开销、高可控性浏览器自动化的 Agent 开发者
常规风险
- 会话数据残留:未及时清理的 session 可能泄露敏感 Cookie 或存储信息,建议任务完成后执行
session-delete。 - 元素引用过期:未重新 snapshot 导致的点击失败可能引发意外行为,关键流程应添加状态校验。
- 配置漂移:修改配置后未执行
session-restart会导致设置不生效,易引发环境不一致问题。
---
注:文档包含 ClawAudit AI 安全徽章,但未提供具体扫描细节。