tts

🔊 双引擎智能语音合成助手

基于 Hume AI 和 OpenAI 官方 API 的文本转语音工具,支持生成高质量 MP3 音频,适合需要语音回复和音频内容创作的用户。

收藏
5.2k
安装
1.3k
版本
v1.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

该 TTS Skill 提供文本转语音功能,支持双 API 提供商方案。首选 Hume AI(推荐语音 ID: 9e1f9e4f-691a-4bb0-b87c-e306a4c838ef),备选 OpenAI(推荐语音: nova)。用户通过 Node.js 脚本调用,需配置对应的环境变量(HUME_API_KEY//HUME_SECRET_KEYOPENAI_API_KEY),指定 --text--output 参数即可生成 MP3 文件。脚本执行后会输出 MEDIA:: 行标识文件路径,配合 message` 工具可将音频发送给用户。

显著优点

1. 双供应商冗余设计:Hume AI 优先、OpenAI 兜底,确保服务可用性
2. 安全规范:API 密钥严格走环境变量,无硬编码风险;使用官方 SDK 和原生 fetch,无危险函数

3. 参数验证完善:采用 commander 的 requiredOption 强制校验必要参数

4. 输出标准化MEDIA:: 前缀路径便于自动化工具解析

5. 轻量无依赖:核心逻辑简洁,依赖均为成熟官方库

潜在缺点与局限性

  • 网络依赖:必须连接外部 API,无法离线使用
  • 成本敏感:按调用量计费,高频使用需关注账单
  • T3 来源:个人开发者维护,非官方组织背书
  • 版本浮动:依赖使用 ^ 前缀,存在非预期升级风险
  • 路径未严格过滤--output 参数理论上存在路径遍历可能(需用户自行确保)

适合的目标群体

  • 需要为 Claude 对话添加语音回复能力的开发者
  • 内容创作者(播客、有声书、视频配音等批量生成场景)
  • 构建自动化工作流的技术用户
  • 对语音质量有一定要求、愿意接入第三方 API 的个人项目

使用风险

1. 数据隐私:文本内容会发送至 Hume AI 或 OpenAI 服务器,敏感信息需谨慎
2. API 可用性:依赖外部服务商稳定性,存在单点故障风险

3. 费用控制:无内置用量限制,异常调用可能导致超额计费

4. 环境配置:需正确设置环境变量,配置错误会导致调用失败

tts 内容

scripts文件夹
手动下载zip · 7.4 kB
generate_hume_speech.jstext/javascript
请选择文件