使用说明

核心用法

该 Skill 基于 macOS 原生 say 命令，提供系统级文本转语音（TTS）能力的完整使用指南。核心用法包括：通过 defaults write 命令切换系统 TTS 语言以调用 Siri 自然语音（推荐方式），或使用 -v 参数指定传统语音；利用 -o 参数将语音输出为 AIFF 格式文件，配合 ffmpeg 转换为 WAV/MP3 等通用格式；通过 -r 参数调节语速（词/分钟），实现个性化的朗读效果。特别值得注意的是，Siri 语音无法通过 -v 直接选择，必须通过修改系统语言偏好设置来切换，这是使用该 Skill 的关键技巧。

显著优点

首要优势在于完全本地化。所有处理均在设备端完成，无需网络连接，不存在 API 调用限制或密钥管理问题，特别适合处理敏感文本内容。其次，音质卓越，通过配置可使用 Apple 最新的 Siri 自然语音，相比传统机械式 TTS 引擎，在语调、停顿和自然度上接近真人发声。第三，成本为零，作为 macOS 系统内置功能，无需订阅第三方服务。此外，该方案隐私安全性极高，文本数据不会上传至任何云端服务器，从根本上杜绝了数据泄露风险。

潜在缺点与局限性

最大的局限是平台独占性，该 Skill 仅适用于 macOS（Darwin）系统，Windows 和 Linux 用户无法使用。其次，配置门槛相对较高，使用 Siri 语音需要先进入系统设置下载语音包，并通过命令行修改系统偏好，对非技术用户不够友好。第三，输出格式限制，原生输出为 AIFF 格式，若需其他格式必须依赖外部工具 ffmpeg 进行转换，增加了使用复杂度。最后，功能相对基础，缺少高级的 SSML 语音标记支持，无法进行细粒度的语音控制（如调整特定词汇的发音或情绪）。

适合的目标群体

该 Skill 最适合macOS 生态深度用户，特别是需要批量生成语音内容的视频创作者、播客制作人；隐私敏感型用户，如处理机密文档的律师、医生、研究人员；开发者与自动化爱好者，可将 TTS 功能集成到脚本和工作流中；以及辅助功能需求者，需要为视障人士或阅读障碍者提供语音支持的群体。对于追求高音质离线 TTS 且不愿支付订阅费用的个人用户，这也是极具性价比的选择。

使用风险与注意事项

首先，defaults write 命令会修改系统级偏好设置，虽然风险较低，但建议在修改前记录原始配置以便恢复。其次，依赖项管理，Skill 要求预先安装 ffmpeg 用于音频格式转换，且需确保已在系统设置中下载目标语言的 Siri 语音包，否则会出现语音缺失或回退到机械音的情况。第三，批处理性能，频繁切换语言设置会产生大量 defaults write 调用，建议按语言分组批量生成以提升效率。最后，作为 T3 来源的个人开发者作品，虽经安全审查无恶意代码，但用户仍应理解每个命令的含义后再执行，避免盲目复制粘贴导致的配置错误。

安全解读

核心用法

say skill 是 macOS 内置文本转语音（TTS）命令的纯文档型使用指南，无实际可执行代码。核心功能围绕调用系统 say 命令展开：

Siri自然语音（推荐方案）：

通过 defaults write 修改系统语音语言偏好，无需 -v 参数即可使用
支持德语、中文（普通话）等多语言即时切换，无需重启进程
需预先在「系统设置 > 辅助功能 > 朗读内容」中下载并激活对应 Siri 语音

基础语音生成：

say "Hello world"                    # 直接朗读
say -o output.aiff "Hello world"     # 输出AIFF文件
say -r 150 -o file.aiff "text"       # 自定义语速(WPM)

音频格式转换：
AIFF 为原生输出格式，需配合 ffmpeg 转换为 WAV/MP3 等通用格式。

显著优点

1. 零代码安全风险：纯 Markdown 文档，无脚本、无网络请求、无数据收集
2. 原生系统集成：直接调用 macOS 底层 TTS 引擎，延迟极低、无需联网
3. Siri语音质量：自然度显著优于传统 -v 参数可选的 legacy 语音
4. 多语言即时切换：通过 defaults write 动态改语言，适合批量生成多语种语音
5. 批量工作流优化：先统一设置语言再批量生成，最小化系统配置调用

潜在缺点与局限性

1. 平台锁死：仅支持 macOS（darwin），Linux/Windows 不可用
2. Siri语音不可枚举：-v '?' 不列出 Siri 语音，需手动在系统设置中管理
3. 输出格式受限：原生仅 AIFF，需外部 ffmpeg 转换
4. 依赖预装语音包：若未提前下载对应语言 Siri 语音，会 fallback 到低质量语音
5. 无实时参数调优：语速 -r 为全局 WPM 控制，无细粒度韵律调节

适合人群

macOS 开发者需批量生成语音素材
无障碍辅助工具集成者
本地化测试团队（多语言 TTS 验证）
隐私敏感用户（拒绝云端 TTS API）

常规风险

误用风险：用户可能误以为 skill 自带 ffmpeg，实际需系统预装
语言切换副作用：defaults write 修改全局系统偏好，可能影响其他应用语音行为
AIFF 文件残留：批量生成后若未清理临时文件，可能占用磁盘空间

content-media productivity automation

say 内容

手动下载zip · 1.4 kB

SKILL.mdtext/markdown

请选择文件