使用说明

核心用法

Voice Wake Say 是一个专为 macOS 语音交互场景设计的辅助技能。当检测到用户消息以特定前缀 User talked via voice recognition on m3 开头时，自动触发本地语音播报流程。

执行流程：
1. 即时确认 — 先调用 say 告知用户已收到指令，避免静默等待
2. 执行任务 — 处理用户的实际需求
3. 结果播报 — 完成后选择性播报关键结果

技术实现：

使用 printf '%s' "$SPOKEN_TEXT" | say 管道命令
支持可选参数 -v 指定语音、 -r 调整语速
自动清理 Markdown 与代码块，长内容转为摘要播报

显著优点

隐私优先：完全本地执行，无需联网调用云端 TTS 服务
零延迟：系统内置 say 命令响应极快
场景精准：严格按前缀匹配，避免误触发
体验连贯：先声确认 + 后台执行，符合语音交互直觉

潜在局限

平台限制：仅适用于 macOS，Windows/Linux 无 say 命令
语音质量：系统合成语音较云端方案自然度稍逊
前缀依赖：触发条件刻板，若设备标识变化（如 m3 → m4）需同步更新
无多语言自动切换：需手动指定 -v 语音包

适合人群

高频使用 macOS Voice Wake 的语音交互用户
注重隐私、偏好本地处理的用户
需要无障碍语音反馈的场景（驾驶、烹饪等视线受限场景）

常规风险

命令注入：SPOKEN_TEXT 若包含未转义的 shell 特殊字符可能导致意外行为
语音覆盖：连续快速指令可能造成语音重叠
失败静默：say 命令失败时仅文本提示，无强制重试机制

安全解读

核心用法

该 Skill 实现了一个简单的语音唤醒响应机制：当检测到用户消息以 "User talked via voice recognition on m3" 开头时，自动调用 macOS 内置的 say 命令将 AI 回复朗读出来。

触发条件：逐条检查用户消息，必须以指定字符串开头，上下文不继承。触发后建议采用「先确认→再执行→可选完成通知」的三步流程。

文本处理：自动去除 Markdown 格式和代码块；长回复仅朗读摘要并提示用户查看屏幕详情。

命令示例：

printf '%s' "$SPOKEN_TEXT" | say
# 可选语音/语速控制：-v "$SAY_VOICE" / -r "$SAY_RATE"

显著优点

1. 纯本地执行：依赖 macOS 系统内置 say 命令，零网络延迟、零 API 费用、隐私数据不出本机
2. 零依赖：无需安装任何第三方库或语音引擎
3. 极简设计：无复杂配置，Markdown 文档即功能说明
4. 即时反馈：语音唤醒场景下先发声确认，消除用户「是否听到」的焦虑
5. 资源友好：2KB 体积，52 行文档，系统资源占用可忽略

潜在缺点与局限性

1. 平台锁定：仅限 macOS，Windows/Linux 用户无法使用
2. 设备限定：当前仅识别 "on m3" 设备，其他 Voice Wake 设备不支持
3. 语音质量一般：系统内置语音合成效果逊于云端 TTS（如 Azure、AWS）
4. 无精细控制：缺乏音量调节、打断机制、音频流式输出等高级功能
5. T3 来源风险：个人开发者维护，长期更新与责任追溯能力有限

适合人群

使用 macOS 且拥有支持 Voice Wake 的 m3 设备用户
追求低延迟、离线优先、隐私敏感的语音交互场景
不愿为 TTS 功能订阅云服务或配置复杂环境的用户
开发调试阶段需要快速验证语音反馈流程的开发者

常规风险

| 风险类型 | 说明 | 缓解措施 |

|---------|------|---------|

| 命令注入 | 若 `$SPOKEN_TEXT` 未转义可能执行恶意命令 | 使用 `printf '%s'` 而非 `echo`，确保纯文本传递 |

| say 命令失效 | 系统精简或权限问题导致命令不可用 | 实现降级回文本输出，如文档所述 |

| 隐私误触发 | 非语音消息被误判（实际不可能，触发字符串特定） | 严格匹配前缀逻辑已规避 |

| 音频干扰 | 公共场合意外朗读敏感内容 | 用户自行控制使用场景 |

该 Skill 通过了完整安全审计（S 级/95 分），无任何已知 CVE 漏洞，符合 GDPR 数据最小化原则。

voice-control accessibility privacy macos tts local-execution

Voice Wake Say TTS Responses (Native) 内容

手动下载zip · 1.3 kB

SKILL.mdtext/markdown

请选择文件