TubeScribe

🎬 视频一键转文档与播客

将YouTube视频转为结构化文档与音频摘要的本地工具,支持说话人识别、时间戳链接和评论分析,完全免费且隐私安全

收藏
13k
安装
4.5k
版本
1.1.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

TubeScribe 是一个完全本地运行的 YouTube 视频处理工具,用户只需粘贴视频链接,即可在数秒内获得完整的结构化文档和音频摘要。工具通过子代理(sub-agent)异步执行完整流程,包括:提取视频元数据与字幕、识别说话人、生成带时间戳的可点击引用、分析观众评论情感、输出精美格式的文档(DOCX/HTML/Markdown)以及高质量的 AI 语音摘要(MP3/WAV)。

显著优点

隐私与成本优势突出:100% 免费,无需订阅或 API 密钥,所有处理在本地完成,数据绝不离开设备,且无使用次数限制。支持智能说话人检测,特别适合访谈、播客等多说话人场景;时间戳可直接跳转 YouTube 对应时刻;内置队列系统可批量处理多个视频。

输出质量与灵活性:文档支持专业级排版,包含参与者表格、关键引用、观众情感分析等模块;音频摘要采用 Kokoro TTS 高质量语音合成,支持自定义音色混合;可配置输出格式、自动打开文件夹等细节。

潜在缺点与局限性

  • 依赖外部工具:需要安装 summarize CLI、pandoc、ffmpeg、yt-dlp 等多个依赖,首次配置较复杂
  • 仅支持带字幕的视频:无字幕视频无法处理,且对自动字幕质量有依赖
  • 说话人识别局限:在背景音乐嘈杂、多人同时说话或音质较差的视频中,识别准确率会下降
  • 不支持直播流:实时直播无法处理,需等待结束
  • 评论获取受限:部分视频因隐私设置或区域限制无法获取评论
  • 平台单一:目前仅支持 YouTube,不支持其他视频平台

适合人群

  • 研究人员、记者、学生:需要快速整理访谈、讲座、纪录片内容
  • 播客听众:希望将长音频转为可搜索、可分享的文档
  • 内容创作者:分析观众反馈,提取热门评论与情感倾向
  • 多语言学习者:通过结构化文本和音频摘要辅助理解外语视频

常规风险

  • 版权与合规:转录受版权保护的内容可能违反 YouTube 服务条款,用户需自行承担法律风险
  • 字幕准确性:自动生成的字幕可能存在错误,关键信息建议人工核对
  • 工具维护依赖:yt-dlp 等工具需定期更新以应对 YouTube 反爬机制变化
  • 存储空间:长视频生成的音频摘要和文档可能占用较大磁盘空间

TubeScribe 内容

暂无文件树

手动下载zip · 30.9 kB
contentapplication/octet-stream
请选择文件