核心用法
Desktop Control 是一套基于 PowerShell 的 Windows 桌面自动化技能,通过 5 个核心脚本模块实现全栈式系统控制:
1. 窗口管理(app-control.ps1)
- 启动、关闭、聚焦、移动、调整大小、分屏停靠任意应用程序窗口
- 支持按窗口标题模糊匹配或 PID 精确操作
- 提供完整的窗口状态枚举(Normal/Minimized/Maximized)
2. 输入模拟(input-sim.ps1)
- 文本输入、键盘快捷键(Ctrl+S、Alt+Tab 等)、特殊按键(F1-F12、方向键)
- 鼠标移动、点击(左/右键/双击)、滚轮控制
- 关键前提:必须先聚焦目标窗口,否则输入可能发送到错误应用
3. VSCode 深度集成(vscode-control.ps1)
- 通过
codeCLI 打开文件/文件夹、跳转指定行、Diff 视图 - 扩展管理(列出、安装、卸载)
- 内置终端与命令面板快捷操作
4. 进程管理(process-manager.ps1)
- 进程列表筛选、详细信息查看、按内存/CPU 排序
- 进程启动与终止(带强制确认机制)
- 资源使用实时监控
5. 屏幕与系统信息(screen-info.ps1)
- 多显示器枚举、活动窗口信息、指定窗口截图
- 剪贴板读写(含覆盖警告机制)
- 系统运行状态(uptime、分辨率、OS 版本)
显著优点
- 原生系统集成:直接调用 Windows API 与 PowerShell,无需额外运行时
- 细粒度控制:从窗口像素级定位到 VSCode 内部命令,覆盖完整交互链
- 安全内置:脚本明确强制要求关闭窗口前确认未保存内容、终止进程前用户授权、剪贴板覆盖前警告
- 开发者友好:VSCode 专属模块支持行号跳转、Diff、扩展管理,契合开发工作流
潜在局限
- Windows 独占:依赖 PowerShell 与 Win32 API,无跨平台能力
- UI 脆弱性:窗口标题匹配易受本地化/动态标题影响;坐标硬编码在不同分辨率/DPI 下可能失效
- 权限边界:部分系统级操作(如终止受保护进程)需要管理员权限,脚本未自动提权
- 输入可靠性:模拟输入依赖窗口焦点状态,后台/最小化窗口接收可能失败
适合人群
- 需要自动化重复桌面操作的效率用户
- 希望通过 AI 助手直接操控开发环境的程序员
- 企业 IT 运维人员进行批量窗口/进程管理
常规风险
| 风险类型 | 说明 | 缓解机制 |
|---------|------|---------|
| 数据丢失 | 强制关闭含未保存内容的窗口 | 脚本强制要求用户确认 |
| 误杀进程 | 终止错误进程导致系统不稳定 | PID/名称双重确认 + 用户授权 |
| 剪贴板污染 | 覆盖用户剪贴板历史 | 显式警告机制 |
| 输入误发 | 模拟键鼠发送到错误窗口 | 强制先执行 focus 操作 |
该技能属于高权限系统级工具,建议在受控环境或明确用户意图监督下使用。