使用说明

核心用法

Transcribee 是一款命令行转录工具，通过调用 ElevenLabs API 实现音频/视频内容的语音转文字，并具备说话人分离（Speaker Diarization）能力。用户只需提供 YouTube URL 或本地文件路径，即可自动生成带说话人标签的完整转录文本。

显著优点

多源兼容：同时支持 YouTube 在线视频与本地音视频文件（mp3/mp4/wav 等十余种格式）
智能标注：自动识别不同说话人并添加标签（Speaker A/B/C...），免去人工区分麻烦
输出丰富：提供带标签文本、纯文本、词级时间戳 JSON、元数据四种格式，满足下游 LLM 分析、字幕制作、内容归档等多场景需求
结构化存储：按类别+标题+日期自动归档，便于长期管理

潜在局限与风险

依赖外部 API：核心能力完全依赖 ElevenLabs 云服务，存在网络延迟、配额限制、服务中断风险
隐私隐患：本地文件需上传至第三方云端处理，敏感内容存在数据外泄可能
成本因素：ElevenLabs API 按时长计费，高频/长视频使用成本累积较快
环境配置：需手动安装 yt-dlp、ffmpeg 及配置 API 密钥，对非技术用户门槛较高
中文支持存疑：ElevenLabs 官方文档主要强调英语场景，中文转录准确性需实际验证

适合人群

播客/会议纪要的整理者，需要将长音频快速转为可编辑文本
内容创作者，需从 YouTube 视频中提取结构化文稿用于二次创作
AI 研究者/开发者，需获取带时间戳的语料进行 LLM 微调或分析

常规风险

API 密钥泄露风险：.env 文件需妥善保管
版权合规：下载/转录 YouTube 内容需遵守平台 ToS 及当地版权法规
转录误差：口音、专业术语、多人重叠说话场景识别准确率可能下降

安全解读

核心用法

Transcribee 是一款命令行音视频转录工具，核心功能是将 YouTube 视频或本地媒体文件转换为带说话人标记的文本。使用时只需传入 URL 或文件路径即可触发转录流程，输出文件自动保存至 ~/Documents/transcripts/ 目录。

主要能力：

YouTube 视频：通过 yt-dlp 下载音频流，无需完整下载视频文件
本地媒体：支持 mp3、m4a、wav、mp4、mkv 等常见格式
说话人分离：利用 ElevenLabs 的 diarization 功能区分不同说话人
智能分类：调用 Anthropic API 自动为内容打标签分类

输出交付物：

transcription.txt —— 带说话人标签的完整转录稿
transcription-raw.txt —— 纯文本版本
transcription-raw.json —— 词级时间戳数据
metadata.json —— 视频信息、语言、分类标签

显著优点

1. 集成体验流畅：单命令完成下载→转录→分类全流程，适合追求效率的用户
2. 输出格式丰富：同时提供人工可读版本和机器可处理的 JSON 数据，方便二次开发
3. 说话人分离准确：ElevenLabs 的 diarization 在业界口碑较好，能减少后期人工校对成本
4. 开源透明：代码公开，依赖清晰可见，便于安全审计

局限性与风险

| 方面 | 说明 |

|------|------|

| **成本依赖** | 依赖 ElevenLabs API，按音频时长计费，高频使用成本不可忽视 |

| **网络要求** | 核心功能完全依赖云服务，离线无法使用 |

| **隐私边界** | 音频数据需上传至 ElevenLabs 服务器，敏感内容需谨慎 |

| **平台限制** | 目前仅支持 YouTube，其他平台（B站、Spotify 等）需自行下载 |

| **环境配置** | 需提前安装 `yt-dlp`、`ffmpeg` 并配置 API 密钥，对非技术用户门槛较高 |

适合人群

播客制作者、内容运营者需要批量生成文字稿
研究人员需要整理访谈、会议录音
开发者希望获取结构化音视频数据做 NLP 分析
对 ElevenLabs 生态已有投入的用户

常规风险提醒

API 密钥泄露：虽然代码无硬编码，但 .env 文件权限管理不当仍可能导致密钥泄露
版权合规：下载 YouTube 内容需遵守平台 ToS，商业用途需确认版权状态
依赖维护：yt-dlp 需定期更新以应对 YouTube 的反爬机制变化

transcription audio-processing video-processing youtube elevenlabs cli-tool speaker-diarization podcast

Transcribee 🐝 内容

手动下载zip · 23.1 kB

CLAUDE.mdtext/markdown

请选择文件