🗣️ Edge-TTS Skill using uvx

🗣️ 免费神经语音,即说即得

基于 Microsoft Edge 神经 TTS 服务的免费开源语音合成工具,支持多语言、多音色与语速/音调调节,无需 API 密钥即可生成高质量语音。

收藏
12.7k
安装
2.6k
版本
1.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Edge-TTS 是一款调用 Microsoft Edge 浏览器内置神经语音合成服务的命令行工具,通过 uvx edge-tts 即可快速将文本转换为自然语音。

基础生成:指定 --text 内容与输出路径,默认生成 MP3 音频文件。支持 --write-subtitles 同步生成字幕文件,便于视频制作或听力对照。

语音参数调节

  • --rate:语速调整(如 +50% 加速、-20% 减速)
  • --volume:音量增益
  • --pitch:音调偏移(如 -50Hz 降低音调)
  • --voice:切换发言人,涵盖 20+ 种中英文及方言音色

音色选择:内置 Microsoft 神经语音库,包括新闻播报风格(Aria、Christopher)、对话风格(Andrew、Ava)、卡通风格(Ana)及中文方言(辽宁小北、陕西小妮)等,可通过 --list-voices 查看完整列表。

显著优点

1. 零成本零配置:无需 Azure 订阅或 API 密钥,直接调用 Edge 浏览器公共服务,对个人用户完全免费
2. 神经级音质:基于 Microsoft 深度学习的神经网络 TTS,音质接近真人,显著优于传统拼接式语音

3. 多语言原生支持:覆盖英、中、法、粤、台中等语种,中文支持标准普通话及辽宁、陕西方言

4. UVX 即装即用:通过 uvx 运行时安装,无需手动处理 Node.js 依赖,隔离环境干净

潜在局限

  • 服务依赖:底层调用 Microsoft Edge 在线服务,需网络连接,存在服务变更或限流风险
  • 商用合规性:微软服务条款对自动化调用存在限制,大规模商业使用存在法律灰色地带
  • 无离线能力:必须联网,无法本地部署或私有化
  • 长文本处理:超长文本需自行分段,单次调用存在隐性长度限制

适合人群

  • 个人内容创作者(短视频配音、播客制作)
  • 语言学习者(听力材料生成、发音对比)
  • 视障用户及无障碍需求场景
  • 多任务场景用户(驾车、烹饪时收听长文)
  • 快速原型验证开发者(无需申请 Azure Speech 服务)

常规风险

  • 网络依赖导致可用性波动
  • 微软服务策略变化可能导致功能失效
  • 生成内容版权归属需自行确认
  • 不建议用于高并发生产环境

🗣️ Edge-TTS Skill using uvx 内容

手动下载zip · 1.5 kB
SKILL.mdtext/markdown
请选择文件