say

🔊 macOS 原生语音合成助手

🥥21总安装量 10评分人数 11
100% 的用户推荐

基于 macOS 原生 say 命令的本地 TTS 方案,利用 Siri 自然语音实现离线文本朗读,零网络依赖且完全免费。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无可执行代码,无隐藏风险
  • ✅ 无网络通信、无数据收集行为,完全本地离线
  • ⚠️ T3 来源(个人开发者),建议审查内容后再使用
  • ⚠️ 代码示例涉及系统命令(defaults/say),执行前需理解含义
  • ✅ 无危险函数调用(eval/exec/system 等),无破坏性操作

使用说明

核心用法

该 Skill 基于 macOS 原生 say 命令,提供系统级文本转语音(TTS)能力的完整使用指南。核心用法包括:通过 defaults write 命令切换系统 TTS 语言以调用 Siri 自然语音(推荐方式),或使用 -v 参数指定传统语音;利用 -o 参数将语音输出为 AIFF 格式文件,配合 ffmpeg 转换为 WAV/MP3 等通用格式;通过 -r 参数调节语速(词/分钟),实现个性化的朗读效果。特别值得注意的是,Siri 语音无法通过 -v 直接选择,必须通过修改系统语言偏好设置来切换,这是使用该 Skill 的关键技巧。

显著优点

首要优势在于完全本地化。所有处理均在设备端完成,无需网络连接,不存在 API 调用限制或密钥管理问题,特别适合处理敏感文本内容。其次,音质卓越,通过配置可使用 Apple 最新的 Siri 自然语音,相比传统机械式 TTS 引擎,在语调、停顿和自然度上接近真人发声。第三,成本为零,作为 macOS 系统内置功能,无需订阅第三方服务。此外,该方案隐私安全性极高,文本数据不会上传至任何云端服务器,从根本上杜绝了数据泄露风险。

潜在缺点与局限性

最大的局限是平台独占性,该 Skill 仅适用于 macOS(Darwin)系统,Windows 和 Linux 用户无法使用。其次,配置门槛相对较高,使用 Siri 语音需要先进入系统设置下载语音包,并通过命令行修改系统偏好,对非技术用户不够友好。第三,输出格式限制,原生输出为 AIFF 格式,若需其他格式必须依赖外部工具 ffmpeg 进行转换,增加了使用复杂度。最后,功能相对基础,缺少高级的 SSML 语音标记支持,无法进行细粒度的语音控制(如调整特定词汇的发音或情绪)。

适合的目标群体

该 Skill 最适合macOS 生态深度用户,特别是需要批量生成语音内容的视频创作者、播客制作人;隐私敏感型用户,如处理机密文档的律师、医生、研究人员;开发者与自动化爱好者,可将 TTS 功能集成到脚本和工作流中;以及辅助功能需求者,需要为视障人士或阅读障碍者提供语音支持的群体。对于追求高音质离线 TTS 且不愿支付订阅费用的个人用户,这也是极具性价比的选择。

使用风险与注意事项

首先,defaults write 命令会修改系统级偏好设置,虽然风险较低,但建议在修改前记录原始配置以便恢复。其次,依赖项管理,Skill 要求预先安装 ffmpeg 用于音频格式转换,且需确保已在系统设置中下载目标语言的 Siri 语音包,否则会出现语音缺失或回退到机械音的情况。第三,批处理性能,频繁切换语言设置会产生大量 defaults write 调用,建议按语言分组批量生成以提升效率。最后,作为 T3 来源的个人开发者作品,虽经安全审查无恶意代码,但用户仍应理解每个命令的含义后再执行,避免盲目复制粘贴导致的配置错误。

say 内容

手动下载zip · 1.4 kB
SKILL.mdtext/markdown
请选择文件