Voice Wake Say TTS Responses (Native)

🔊 本地语音播报 · 隐私零泄露

为 macOS Voice Wake 语音唤醒场景提供本地语音播报,使用系统内置 say 命令而非云端 TTS,确保隐私与即时响应。

收藏
7.6k
安装
2.6k
版本
0.1.0
CLS 安全性认证2026-05-14
点击查看完整报告 >

使用说明

核心用法

Voice Wake Say 是一个专为 macOS 语音交互场景设计的辅助技能。当检测到用户消息以特定前缀 User talked via voice recognition on m3 开头时,自动触发本地语音播报流程。

执行流程:
1. 即时确认 — 先调用 say 告知用户已收到指令,避免静默等待

2. 执行任务 — 处理用户的实际需求

3. 结果播报 — 完成后选择性播报关键结果

技术实现:

  • 使用 printf '%s' "$SPOKEN_TEXT" | say 管道命令
  • 支持可选参数 -v 指定语音、 -r 调整语速
  • 自动清理 Markdown 与代码块,长内容转为摘要播报

显著优点

  • 隐私优先:完全本地执行,无需联网调用云端 TTS 服务
  • 零延迟:系统内置 say 命令响应极快
  • 场景精准:严格按前缀匹配,避免误触发
  • 体验连贯:先声确认 + 后台执行,符合语音交互直觉

潜在局限

  • 平台限制:仅适用于 macOS,Windows/Linux 无 say 命令
  • 语音质量:系统合成语音较云端方案自然度稍逊
  • 前缀依赖:触发条件刻板,若设备标识变化(如 m3 → m4)需同步更新
  • 无多语言自动切换:需手动指定 -v 语音包

适合人群

  • 高频使用 macOS Voice Wake 的语音交互用户
  • 注重隐私、偏好本地处理的用户
  • 需要无障碍语音反馈的场景(驾驶、烹饪等视线受限场景)

常规风险

  • 命令注入SPOKEN_TEXT 若包含未转义的 shell 特殊字符可能导致意外行为
  • 语音覆盖:连续快速指令可能造成语音重叠
  • 失败静默say 命令失败时仅文本提示,无强制重试机制

安全解读

核心用法

该 Skill 实现了一个简单的语音唤醒响应机制:当检测到用户消息以 "User talked via voice recognition on m3" 开头时,自动调用 macOS 内置的 say 命令将 AI 回复朗读出来。

触发条件:逐条检查用户消息,必须以指定字符串开头,上下文不继承。触发后建议采用「先确认→再执行→可选完成通知」的三步流程。

文本处理:自动去除 Markdown 格式和代码块;长回复仅朗读摘要并提示用户查看屏幕详情。

命令示例

printf '%s' "$SPOKEN_TEXT" | say
# 可选语音/语速控制:-v "$SAY_VOICE" / -r "$SAY_RATE"

显著优点

1. 纯本地执行:依赖 macOS 系统内置 say 命令,零网络延迟、零 API 费用、隐私数据不出本机
2. 零依赖:无需安装任何第三方库或语音引擎

3. 极简设计:无复杂配置,Markdown 文档即功能说明

4. 即时反馈:语音唤醒场景下先发声确认,消除用户「是否听到」的焦虑

5. 资源友好:2KB 体积,52 行文档,系统资源占用可忽略

潜在缺点与局限性

1. 平台锁定:仅限 macOS,Windows/Linux 用户无法使用
2. 设备限定:当前仅识别 "on m3" 设备,其他 Voice Wake 设备不支持

3. 语音质量一般:系统内置语音合成效果逊于云端 TTS(如 Azure、AWS)

4. 无精细控制:缺乏音量调节、打断机制、音频流式输出等高级功能

5. T3 来源风险:个人开发者维护,长期更新与责任追溯能力有限

适合人群

  • 使用 macOS 且拥有支持 Voice Wake 的 m3 设备用户
  • 追求低延迟、离线优先、隐私敏感的语音交互场景
  • 不愿为 TTS 功能订阅云服务或配置复杂环境的用户
  • 开发调试阶段需要快速验证语音反馈流程的开发者

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| 命令注入 | 若 `$SPOKEN_TEXT` 未转义可能执行恶意命令 | 使用 `printf '%s'` 而非 `echo`,确保纯文本传递 |
| say 命令失效 | 系统精简或权限问题导致命令不可用 | 实现降级回文本输出,如文档所述 |
| 隐私误触发 | 非语音消息被误判(实际不可能,触发字符串特定) | 严格匹配前缀逻辑已规避 |
| 音频干扰 | 公共场合意外朗读敏感内容 | 用户自行控制使用场景 |

该 Skill 通过了完整安全审计(S 级/95 分),无任何已知 CVE 漏洞,符合 GDPR 数据最小化原则。

Voice Wake Say TTS Responses (Native) 内容

手动下载zip · 1.3 kB
SKILL.mdtext/markdown
请选择文件