使用说明

TubeScribe 是一款专为 YouTube 内容设计的本地转录与摘要工具。用户只需粘贴视频链接，即可获得结构化文档（DOCX/HTML/Markdown）和 MP3 语音摘要。核心流程包括：提取字幕与元数据 → 智能识别说话人 → 生成带时间戳的摘要文档 → 本地 TTS 合成音频。

完全本地化：所有处理（转录、说话人分离、语音合成）均在本地完成，无需订阅或 API 密钥，隐私零风险。支持 Apple Silicon 的 MLX 加速，TTS 速度极快。

智能格式化：自动识别访谈/播客的多说话人场景，生成带角色标签的表格；单说话人内容（教程、讲座）自动简化。时间戳可点击跳转，引用格式规范。

批量与队列支持：支持多链接顺序处理，后台非阻塞运行，对话可继续进行。

灵活配置：通过 JSON 配置文件控制输出格式、语音引擎（mlx/kokoro/builtin）、语速、声线混合等细节。

依赖外部工具：需要预先安装 summarize CLI、pandoc、ffmpeg 等，首次配置门槛较高。

字幕依赖性：无字幕视频无法处理；自动生成的 YouTube 字幕质量参差不齐，可能影响摘要准确性。

Apple Silicon 优化：MLX 加速仅限 M 系列芯片，Intel Mac 或 Linux 用户需使用较慢的 PyTorch 后端。

直播与限制内容：不支持实时直播、年龄限制、区域封锁或私有视频。

工具链维护：依赖的 yt-dlp 等工具需随 YouTube 反爬机制更新而维护，可能偶发失效。

版权注意：生成内容的再分发需遵守原视频版权，工具本身仅提供格式转换便利。

存储管理：长视频可能产生较大临时文件，需注意磁盘空间。

TubeScribe 内容

scripts文件夹

手动下载zip · 42.4 kB

config.pytext/plain

请选择文件