TubeScribe

🎬 YouTube 智能转录与音频摘要生成器

本地运行的YouTube视频智能摘要工具,自动生成带时间戳、发言者标识的格式化文档与音频摘要,100%免费且数据不出本地。

收藏
16k
安装
4.5k
版本
1.1.4
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

TubeScribe 是一款专为 YouTube 视频内容设计的本地化处理工具,用户只需提供视频链接,即可自动完成从提取、转录到生成多格式文档和音频摘要的全流程。系统采用非阻塞式架构——主对话在子代理后台处理视频时可持续交互,完成后通过通知推送结果。

完整工作流包含七个步骤:视频元数据与字幕提取 → 读取结构化信息 → 生成带格式的 Markdown 文档(含参与者表格、3-5 段摘要、5 条带时间戳的关键引述、观众情感分析与精选评论、完整转录稿) → 通过 Pandoc 转换为 DOCX → 可选生成音频摘要(支持 macOS 内置语音或 Kokoro TTS)→ 清理临时文件 → 自动打开输出文件夹。

显著优点

  • 零成本零门槛:无需订阅、无需 API 密钥、开箱即用
  • 隐私优先:所有处理在本地完成,视频内容不会上传至第三方
  • 智能格式化:自动识别多发言者场景(访谈/播客)与单发言者内容(讲座/教程),生成带可点击时间戳的专业文档
  • 灵活输出:支持 DOCX、HTML、Markdown 三种文档格式,MP3/WAV 两种音频格式
  • 批量与队列:支持多链接顺序处理,避免并行资源冲突
  • 深度整合:可选提取 YouTube 评论区进行情感分析与优质评论筛选

潜在缺点与局限性

  • 平台受限:仅支持 YouTube,无法处理其他视频平台
  • 依赖字幕质量:转录准确性完全取决于 YouTube 自动字幕或上传者字幕的质量,无内置语音识别纠错
  • 格式依赖:DOCX 输出依赖 Pandoc,MP3 生成依赖 ffmpeg,高品质语音需额外配置 Kokoro TTS
  • macOS 偏向:内置 TTS 使用 say 命令,Windows/Linux 用户需额外配置
  • 长视频超时风险:超过 30 分钟的视频需手动调增子代理超时时间(默认 600 秒)
  • 实时流不支持:无法处理正在直播的内容

适合人群

  • 内容创作者与编辑:快速提取访谈金句、生成节目笔记
  • 学生与研究者:将学术讲座、纪录片转为可搜索的文档与随身听音频
  • 市场分析师:批量处理行业访谈、提取观众评论洞察
  • 播客听众:生成带时间戳的 shownotes,便于二次引用

常规风险

  • 版权合规:生成的文档与音频仅限个人学习使用,商用传播需获得原视频版权方授权
  • 字幕缺失风险:无字幕视频完全无法处理,需用户提前确认
  • 年龄/地区限制:部分视频因平台策略无法访问
  • 依赖维护:yt-dlp、Kokoro 等外部工具更新可能导致兼容性问题

TubeScribe 内容

暂无文件树

手动下载zip · 32.2 kB
contentapplication/octet-stream
请选择文件