ListenHub

🎙️ AI 播客与视频一键生成

content-creation榜 #18

一键将文本、链接或想法转为播客、解说视频、语音朗读及AI图像,支持中英双语与多音色选择。

收藏
16.5k
安装
3.8k
版本
0.6.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

ListenHub 是一套基于 Shell 脚本的 AI 音视频生成工具集,通过封装 ListenHub 专有 API,提供五种核心能力:

| 模式 | 功能 | 典型场景 |
|------|------|---------|
| Podcast | 1-2人对话式播客生成 | 热点讨论、知识解读 |
| Explainer | 解说视频(旁白+AI画面) | 教程、产品介绍 |
| TTS | 纯文本朗读 | 文章听读、有声书 |
| Speech | 多角色脚本配音 | 有声剧、广播剧 |
| Image | AI图像生成 | 配图、封面设计 |

执行流程:根据用户输入自动识别模式 → 调用 get-speakers.sh 获取可用音色 → 执行对应脚本提交任务 → 后台轮询状态 → 返回结果链接。任务耗时:TTS 1-2分钟,播客 2-3分钟,解说视频 3-5分钟。

特色机制:播客支持「单阶段快速生成」与「双阶段先审后录」两种模式,后者允许用户审阅修改脚本后再合成音频。

显著优点

  • 零代码操作:纯 Shell 脚本封装,无需直接调用 REST API
  • 多源输入:支持纯文本、YouTube 链接、文章 URL、图片提示词
  • 音色丰富:内置多语言多角色语音库,自动匹配语言首选项
  • 灵活审校:播客双阶段模式满足内容安全与质量把控需求
  • 格式友好:视频默认 2K/16:9,图像支持多种比例与参考图融合

局限与风险

  • 封闭生态:API 端点与参数黑箱化,无法自定义模型或微调
  • 依赖外部服务:所有生成任务受 ListenHub 平台稳定性与政策约束
  • 版权模糊:AI 合成语音与图像的商用授权需用户自行确认服务条款
  • 无离线能力:必须联网且持有有效 API Key
  • 长文本限制:TTS 单次上限 10,000 字符,超长内容需切分或转 URL

适合人群

  • 内容创作者快速制作播客/短视频素材
  • 教育工作者生成讲解音频与可视化课件
  • 无障碍需求用户将文章转为语音
  • 需要多语言多音色配音的本地化团队

常规风险

| 风险项 | 等级 | 说明 |
|--------|------|------|
| API Key 泄露 | 中 | 需妥善保管 `lh_sk_...` 密钥,避免硬编码提交版本控制 |
| 生成内容合规 | 中 | AI 合成内容可能涉及肖像权、版权问题,商用前建议二次审核 |
| 服务可用性 | 低 | 依赖 ListenHub 平台,存在服务中断或计费策略变更风险 |
| 输出质量波动 | 低 | 播客对话逻辑、图像细节可能需多次迭代优化 |

ListenHub 内容

暂无文件树

手动下载zip · 21.6 kB
contentapplication/octet-stream
请选择文件