Transcribee 🐝

🎙️ AI 音视频转录与说话人分离

基于 ElevenLabs API 的音视频转录工具,支持 YouTube 链接与本地文件,自动区分说话人并输出结构化文本,便于 LLM 二次分析。

收藏
7.1k
安装
3.2k
版本
1.2.0
CLS 安全性认证2026-06-03
点击查看完整报告 >

使用说明

核心用法

Transcribee 是一款命令行转录工具,通过调用 ElevenLabs API 实现音频/视频内容的语音转文字,并具备说话人分离(Speaker Diarization)能力。用户只需提供 YouTube URL 或本地文件路径,即可自动生成带说话人标签的完整转录文本。

显著优点

  • 多源兼容:同时支持 YouTube 在线视频与本地音视频文件(mp3/mp4/wav 等十余种格式)
  • 智能标注:自动识别不同说话人并添加标签(Speaker A/B/C...),免去人工区分麻烦
  • 输出丰富:提供带标签文本、纯文本、词级时间戳 JSON、元数据四种格式,满足下游 LLM 分析、字幕制作、内容归档等多场景需求
  • 结构化存储:按类别+标题+日期自动归档,便于长期管理

潜在局限与风险

  • 依赖外部 API:核心能力完全依赖 ElevenLabs 云服务,存在网络延迟、配额限制、服务中断风险
  • 隐私隐患:本地文件需上传至第三方云端处理,敏感内容存在数据外泄可能
  • 成本因素:ElevenLabs API 按时长计费,高频/长视频使用成本累积较快
  • 环境配置:需手动安装 yt-dlp、ffmpeg 及配置 API 密钥,对非技术用户门槛较高
  • 中文支持存疑:ElevenLabs 官方文档主要强调英语场景,中文转录准确性需实际验证

适合人群

  • 播客/会议纪要的整理者,需要将长音频快速转为可编辑文本
  • 内容创作者,需从 YouTube 视频中提取结构化文稿用于二次创作
  • AI 研究者/开发者,需获取带时间戳的语料进行 LLM 微调或分析

常规风险

  • API 密钥泄露风险:.env 文件需妥善保管
  • 版权合规:下载/转录 YouTube 内容需遵守平台 ToS 及当地版权法规
  • 转录误差:口音、专业术语、多人重叠说话场景识别准确率可能下降

安全解读

核心用法

Transcribee 是一款命令行音视频转录工具,核心功能是将 YouTube 视频或本地媒体文件转换为带说话人标记的文本。使用时只需传入 URL 或文件路径即可触发转录流程,输出文件自动保存至 ~/Documents/transcripts/ 目录。

主要能力

  • YouTube 视频:通过 yt-dlp 下载音频流,无需完整下载视频文件
  • 本地媒体:支持 mp3、m4a、wav、mp4、mkv 等常见格式
  • 说话人分离:利用 ElevenLabs 的 diarization 功能区分不同说话人
  • 智能分类:调用 Anthropic API 自动为内容打标签分类

输出交付物

  • transcription.txt —— 带说话人标签的完整转录稿
  • transcription-raw.txt —— 纯文本版本
  • transcription-raw.json —— 词级时间戳数据
  • metadata.json —— 视频信息、语言、分类标签

显著优点

1. 集成体验流畅:单命令完成下载→转录→分类全流程,适合追求效率的用户
2. 输出格式丰富:同时提供人工可读版本和机器可处理的 JSON 数据,方便二次开发

3. 说话人分离准确:ElevenLabs 的 diarization 在业界口碑较好,能减少后期人工校对成本

4. 开源透明:代码公开,依赖清晰可见,便于安全审计

局限性与风险

| 方面 | 说明 |
|------|------|
| **成本依赖** | 依赖 ElevenLabs API,按音频时长计费,高频使用成本不可忽视 |
| **网络要求** | 核心功能完全依赖云服务,离线无法使用 |
| **隐私边界** | 音频数据需上传至 ElevenLabs 服务器,敏感内容需谨慎 |
| **平台限制** | 目前仅支持 YouTube,其他平台(B站、Spotify 等)需自行下载 |
| **环境配置** | 需提前安装 `yt-dlp`、`ffmpeg` 并配置 API 密钥,对非技术用户门槛较高 |

适合人群

  • 播客制作者、内容运营者需要批量生成文字稿
  • 研究人员需要整理访谈、会议录音
  • 开发者希望获取结构化音视频数据做 NLP 分析
  • 对 ElevenLabs 生态已有投入的用户

常规风险提醒

  • API 密钥泄露:虽然代码无硬编码,但 .env 文件权限管理不当仍可能导致密钥泄露
  • 版权合规:下载 YouTube 内容需遵守平台 ToS,商业用途需确认版权状态
  • 依赖维护yt-dlp 需定期更新以应对 YouTube 的反爬机制变化

Transcribee 🐝 内容

手动下载zip · 23.1 kB
CLAUDE.mdtext/markdown
请选择文件