核心用法
WeChat Sender 是一套基于视觉理解的微信自动化发送方案,通过组合 peekaboo 窗口操作工具与 Agent-Eye 屏幕捕获服务,实现对微信客户端的 GUI 自动化控制。
关键能力组合:
- 窗口操控:聚焦微信窗口并调整至 1200×900 分辨率,绕过防录屏限制
- 视觉感知:Agent-Eye 提供实时截图(100px 网格+鼠标准星),结合内置
image工具进行界面理解 - 联系人查找:双模式策略——推荐 Cmd+F 搜索(高效),备选 Shift+方向键列表滑动
- 消息发送:剪贴板粘贴文本 + Cmd+Return 快捷键触发发送
典型执行流:聚焦窗口 → 调整大小 → 搜索/定位联系人 → 截图确认 → 粘贴消息 → 发送 → 二次截图验证气泡出现。
显著优点
1. 非侵入式架构:不依赖微信 API 或协议破解,纯 GUI 层模拟,降低账号风控概率
2. 视觉反馈闭环:每次关键操作后截图确认,避免盲目执行导致的误发
3. 灵活策略选择:搜索模式适合已知姓名场景,列表滑动适合顺序固定的批量场景
4. 网格坐标辅助:100px 网格叠加降低定位误差,便于精确点击
潜在缺点与局限性
- 外部依赖重:必须同时启动
eye-server+ Python Agent 两个服务,部署门槛较高 - 延迟敏感:截图-分析-决策链条长,单次发送耗时数秒至数十秒,不适合高并发
- UI 脆弱性:微信版本更新可能导致界面元素位置偏移,需维护坐标映射
- 平台锁定:当前方案基于 macOS(
screencapture、cmd键),跨平台需适配
适合人群
- 需要低频、个性化微信触达的自动化场景(如定时问候、状态通知)
- 具备本地服务部署能力的技术用户
- 无法接受 API 方案封号风险,愿牺牲效率换取稳定性的场景
常规风险
- 隐私泄露:屏幕捕获服务截取完整桌面内容,需确保运行环境隔离敏感信息
- 误发风险:视觉理解错误可能导致消息发送至错误联系人,建议关键操作前人工复核
- 服务可用性:Agent-Eye 服务崩溃将导致整个链路中断,缺乏降级机制
- 微信风控:频繁自动化操作仍可能触发客户端行为检测,建议控制发送频率