核心用法
Screen Monitor 提供两种互补的屏幕交互模式:
🟢 快速分享模式(WebRTC)
- 生成本地WebRTC门户URL,无需安装浏览器扩展
- 适合快速视觉检查、受限浏览器环境或非技术场景
- 通过
screen_share_link获取链接,screen_analyze捕获当前帧并调用视觉模型分析
🔵 完全控制模式(Browser Relay)
- 需安装Clawdbot浏览器扩展并附加到Chrome标签页
- 支持精确截图(
browser action:snapshot)、点击/输入等UI自动化操作 - 适合深度调试、复杂网页交互场景
显著优点
- 模型无关性:兼容Gemini、Claude、Qwen3-VL等主流视觉模型
- 双模式灵活:轻量快速分享 vs 深度控制,覆盖不同使用场景
- 本地优先:WebRTC后端运行在本地端口18795,减少数据外泄风险
潜在局限
- Browser Relay模式依赖Chrome扩展,配置步骤较多
- WebRTC模式在复杂网络环境(如企业防火墙)下可能连接受限
- 未明确提及录屏存储加密、访问鉴权机制
适合人群
前端开发者、UI/UX设计师、远程协作团队、需要AI辅助屏幕分析的技术用户
常规风险
- 屏幕内容可能包含敏感信息,分享时需确认可见范围
- WebRTC信令服务若配置不当,存在端口暴露风险
- 浏览器扩展需从非商店渠道加载(unpacked),存在供应链信任问题