Video Subtitles

🎬 AI音视频转录翻译一键成片

专业的音视频字幕生成工具,支持希伯来语/英语自动识别转录、多语言翻译及硬编码字幕烧录,适合社交媒体内容制作

收藏
17.9k
安装
8.1k
版本
1.0.0
CLS 安全性认证2026-05-13
点击查看完整报告 >

使用说明

核心功能

Video Subtitles 是一款面向内容创作者的字幕生成工具,专注于将音视频内容转化为专业级字幕文件。该工具整合了两条顶尖的语音识别流水线:针对希伯来语采用 ivrit.ai 微调模型(业界希伯来语识别最佳方案),英语则使用 OpenAI Whisper large-v3 模型,并支持自动语言检测以选择最优模型。

显著优点

1. 双顶级模型支持:ivrit.ai 在希伯来语转录领域具有权威性,Whisper large-v3 为英语识别标杆,覆盖两大语言场景
2. 全链路字幕工作流:从转录 → SRT生成 → 翻译 → 硬编码烧录一站式完成,无需切换工具

3. 影院级字幕美学:智能断句(42字符/行上限)、1-7秒自然时长控制、白字黑边经典配色,直接输出社交媒体可用素材

4. 硬编码优先设计--burn 选项确保字幕在 WhatsApp 等不支持软字幕的平台始终可见

潜在局限

  • 仅深度优化希伯来语和英语,其他语言依赖 Whisper 通用能力,效果未经专项调优
  • 模型文件体积庞大(单模型约3GB),首次使用需等待下载
  • 依赖 ffmpeg-full 完整版,对系统环境有一定要求
  • 字幕样式参数固定(字号12、底部对齐),缺乏自定义主题能力

适合人群

  • 以色列/犹太社区内容创作者(希伯来语刚需)
  • 需要快速产出带字幕短视频的社交媒体运营者
  • 多语言视频本地化团队(希伯来语→英语翻译场景)
  • 追求"开箱即用"字幕方案的非专业用户

常规风险

转录准确性受音频质量显著影响;翻译功能为机器直译,建议人工校对关键内容;硬编码烧录为不可逆操作,建议保留原始文件备份。

安全解读

核心功能

video-subtitles 是一款本地化视频字幕生成工具,整合 ivrit.ai(希伯来语专用)与 OpenAI Whisper large-v3(英语)双模型,实现高质量语音转文字。支持三大输出模式:纯文本转录、SRT 字幕文件、硬编码字幕视频(burn-in),后者可直接在 WhatsApp 等不支持软字幕的平台显示。

显著优点

  • 语言针对性强:ivrit.ai 专为希伯来语优化,转录准确率显著优于通用模型
  • 全流程覆盖:从转录、翻译(he→en)到字幕烧录一站式完成
  • 影院级字幕样式:自动断句(42字符/行)、白字黑边、底部对齐,专业美观
  • 零配置启动uv 自动管理依赖,模型按需下载,首次使用友好
  • 隐私优先:本地处理,音视频数据不上传云端

潜在局限

  • 硬件要求:3GB+ 模型文件需首次下载,推理依赖本地 GPU/CPU 性能
  • 语言覆盖有限:仅优化希伯来语和英语,其他语言依赖 Whisper 通用能力
  • 硬编码不可逆:burn 模式生成的新视频文件体积增大,原画质略有损失
  • 输入验证待加强:当前版本存在路径注入风险(见安全报告 RISK-001)

适合人群

  • 以色列/希伯来语内容创作者、播客、教育工作者
  • 需为短视频、访谈、课程快速生成字幕的自媒体运营者
  • 需要在 WhatsApp 等封闭平台分享带字幕视频的用户

常规风险提示

  • 首次运行需从 HuggingFace 和 ivrit.ai 下载约 3GB 模型,建议确保网络环境可信
  • 处理敏感视频时,注意临时文件(/tmp/subtitles_temp.srt)在多用户环境的残留风险
  • 依赖 ffmpeg-full 完整版,精简版可能缺失字幕滤镜支持

Video Subtitles 内容

scripts文件夹
手动下载zip · 4.9 kB
generate_srt.pytext/plain
请选择文件