edge-tts

🔊 免费高质量的神经语音合成

🥥73总安装量 15评分人数 8
100% 的用户推荐

基于 Microsoft Edge 神经 TTS 服务的免费语音合成工具,支持多语言、语速音调调节及字幕生成,无需 API 密钥即可生成高质量音频。

B

存在边界风险,建议在隔离环境中验证

  • 来自可信来源(Github / Microsoft / 官方仓库)
  • ✅ 无动态代码执行(eval/new Function),无恶意代码注入风险
  • ✅ 输入验证完善:文本长度限制、prosody 格式校验、超时机制齐全
  • ⚠️ 临时文件不自动清理,需用户或调用方定期清理磁盘
  • ⚠️ 依赖外部在线服务,存在网络可用性和隐私传输风险
  • ⚠️ 输出路径未严格验证路径遍历,建议避免使用系统关键目录

使用说明

核心用法

Edge-TTS Skill 提供文本到语音转换功能,支持两种使用模式:对于简单需求,直接调用内置 tts()() 工具即可快速生成音频;对于高级需求,可通过 tts-converter.js 脚本实现精细控制,包括语音选择(如 en-US-MichelleNeural)、语速调节(-20% 至 +50%)、音调控制、音量调整及输出格式定制。配置管理器支持持久化保存用户偏好,避免重复设置。

显著优点

该 Skill 最大优势在于零成本使用微软 Edge 神经 TTS 服务,无需 API 密钥或付费订阅,即可获得接近真人发音质量的音频输出。支持 100+ 种语言和方言,覆盖全球主要语种。功能层面提供丰富的 prosody 控制(rate/pitch/volume),并支持字幕生成(JSON 格式带词级时间戳),满足内容创作、无障碍辅助等多场景需求。代码结构清晰,模块化设计良好,配置管理便捷。

潜在缺点与局限性

网络依赖性强:必须连接互联网调用微软在线服务,无法离线使用,存在服务可用性风险。临时文件管理缺陷:音频文件默认保存至系统临时目录且不自动清理,长期运行可能导致磁盘空间占用。隐私顾虑:文本内容需发送至外部服务器处理,敏感信息存在泄露风险。此外,输出路径未严格验证路径遍历,虽风险较低仍需注意。

适合的目标群体

  • 内容创作者:播客、视频配音、多媒体制作
  • 开发者:需要语音合成集成的应用开发
  • 无障碍需求用户:视障辅助、阅读障碍支持
  • 多语言学习者:外语发音练习、听力材料生成
  • 自动化场景:语音播报、通知提醒系统

使用风险

1. 服务稳定性风险:依赖微软 Edge TTS 在线服务,网络波动或服务变更可能影响可用性
2. 隐私合规风险:文本数据出境处理,企业敏感信息需谨慎评估

3. 磁盘空间风险:临时文件累积需建立定期清理机制

4. 代理配置风险:如使用代理服务器,需确保来源可信防止中间人攻击

5. 性能瓶颈:超长文本(接近 10000 字符限制)可能增加处理延迟

edge-tts 内容

文件夹图标references文件夹
文件夹图标scripts文件夹
手动下载zip · 16.2 kB
node_edge_tts_guide.mdtext/markdown
请选择文件