核心用法
TuriX-Mac 是一款基于计算机视觉的 macOS 桌面自动化工具,采用多模型架构实现类人化操作。用户通过自然语言描述任务目标,系统自动分解执行步骤并控制鼠标键盘完成操作。
基本运行模式:
skills/local/turix-mac/scripts/run_turix.sh "打开 Chrome 访问 github.com"
支持任务中断恢复(--resume)、复杂任务规划(use_plan: true)和领域技能手册(Skills)系统。
显著优点
1. 零 API 依赖:直接操作原生 UI,覆盖无 CLI/接口的应用场景
2. 多模态架构:Brain(规划)、Actor(执行)、Memory(上下文)、Planner(任务分解)协同工作
3. 可扩展技能系统:Markdown 格式的领域手册,支持自定义任务模板
4. 安全热键:Cmd+Shift+2 强制终止,防止失控操作
5. 完整审计日志:详细记录 LLM 推理与执行步骤
潜在局限
- 权限门槛高:需屏幕录制、辅助功能、键盘监听等多层系统授权
- 视觉依赖性强:分辨率/主题变更可能导致识别失败
- 性能开销:多模型推理带来延迟,不适合高频实时任务
- 单用户会话:暂不支持多用户并发或远程会话隔离
适合人群
- 自动化测试工程师(无 API 的 legacy 应用)
- 效率极客(重复性跨应用工作流)
- 无障碍辅助需求用户
- macOS 独占场景开发者
常规风险
| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 隐私泄露 | 屏幕录制捕获敏感信息 | 在受控环境使用,定期清理日志 |
| 误操作 | AI 误判 UI 元素导致意外点击 | 避免生产环境敏感账户,设置 `max_steps` 上限 |
| 权限滥用 | 辅助功能权限被恶意利用 | 仅从可信来源安装,监控异常进程 |
| 任务中断 | 网络/权限问题导致执行失败 | 使用 `agent_id` 启用恢复机制 |