核心用法
sapi-tts 是一款基于 Windows SAPI5 的轻量级文本转语音脚本,利用 PowerShell 调用系统内置语音合成引擎。无需安装第三方 AI 模型或依赖 GPU,即可实现即时语音生成。支持自动识别最优语音(优先 Neural 语音)、多语言切换、语速调节、WAV 输出及即时播放。
显著优点
1. 零硬件门槛:纯 CPU 运行,无需 NVDIA/AMD 显卡,老旧设备亦可流畅使用
2. 毫秒级响应:本地系统 API 调用,生成延迟 < 1 秒
3. 智能语音选择:自动匹配语言对应的 Neural 语音,支持部分名称模糊匹配
4. 开箱即用:Windows 10/11 原生支持,无需复杂环境配置
5. 格式友好:输出标准 WAV 格式,兼容性强
潜在缺点与局限性
- 平台锁定:仅支持 Windows,macOS/Linux 无法使用
- 语音质量上限:即便 Neural 语音,仍逊于云端 AI TTS(如 ElevenLabs、Azure TTS)
- 语言覆盖有限:依赖 Windows 系统安装的语言包,小语种支持可能缺失
- 无 SSML 高级控制:不支持复杂的情感标记、停顿控制等专业功能
- 音频格式单一:仅输出 WAV,无 MP3/OGG 等压缩选项
适合人群
- 需要快速生成提示音、通知语音的开发者
- 硬件资源受限场景(低配服务器、VM 环境)
- 隐私敏感用户(本地处理,不上传云端)
- 法语/英语/德语/西班牙语/意大利语内容创作者
常规风险
- 路径遍历风险:
-Output参数未做严格校验,恶意输入可能覆盖系统文件(建议限定输出目录) - 语音包依赖:未安装对应语言语音时降级为任意可用语音,可能导致输出与预期不符
- 无输入过滤:未对
$Text内容做过滤,特殊字符可能引发解析异常