youtube-editor

🎬 AI 驱动的 YouTube 全自动视频编辑

基于 OpenAI Whisper/GPT-4 的 YouTube 自动化工作流,一键完成字幕生成、SEO 优化与 AI 缩略图制作,大幅提升视频创作效率。

收藏
9.2k
安装
2.4k
版本
v1.0.14
CLS 安全性认证2026-05-01
点击查看完整报告 >

使用说明

核心用法

该 Skill 构建了一套端到端的 YouTube 视频自动化处理流水线。用户只需提供 YouTube URL 或本地视频文件路径,系统便会自动执行四大核心环节:首先通过 yt-dlp 下载目标视频;接着利用 OpenAI Whisper API 生成高精度的 .srt 格式字幕文件;然后调用 GPT-4 对视频内容进行深度分析,自动生成经过 SEO 优化的韩语标题、描述和标签;最后可选启用 Nano Banana Pro 集成功能,基于用户上传的头像或默认角色(海盗龙虾)生成保持角色一致性的专业级视频缩略图,支持背景移除和黑金配色布局设计。

显著优点

全流程自动化将视频后期制作时间从数小时压缩至几分钟,显著提升内容创作者的生产力。针对韩语市场的专项优化使其在多语言内容处理上具备独特优势。AI 缩略图生成的角色一致性保持能力(Image-to-Image)确保了品牌视觉的统一性。安全架构方面表现突出:实现了 YouTube URL 白名单验证(阻断私有 IP 和 localhost)、HTML 转义防止 XSS 攻击、子进程 900 秒超时保护以及固定路径脚本调用,杜绝了任意代码执行风险。代码完全开源可审计,依赖版本通过 PEP 723 格式严格锁定,敏感信息均通过环境变量读取,符合企业级安全规范。

潜在缺点或局限性

核心功能强依赖 OpenAI API(Whisper 转录和 GPT-4 分析),无法在离线环境使用且产生持续的 API 调用成本。高级缩略图功能需要额外的 Nano Banana API 密钥和 Playwright、Rembg 等 Python 包支持,增加了配置复杂度。使用 yt-dlp 下载 YouTube 内容可能违反 YouTube 服务条款,存在账号风险。作为 T3 来源的社区项目(OpenClaw 组织),其长期维护稳定性和商业支持能力不及官方或大厂背书的项目。处理大型视频文件时可能受限于 API 文件大小限制和网络带宽。

适合的目标群体

主要面向 YouTube 内容创作者(特别是面向韩语市场的频道)、社交媒体运营人员、需要批量生成视频字幕的后期剪辑师、追求高效内容生产的自媒体从业者,以及需要进行视频内容本地化的教育机构和跨国企业营销团队。适合那些熟悉命令行操作、拥有稳定 OpenAI API 访问权限且对自动化工作流有需求的技术型创作者。

使用风险

首要风险为数据隐私:视频内容需上传至 OpenAI 服务器进行转录,敏感或机密视频不宜使用。API 密钥管理不当可能导致凭证泄露(尽管 Skill 本身使用环境变量,但用户终端环境仍可能被入侵)。依赖项如 FFmpeg 的安装和版本兼容性可能引发运行时错误。外部服务(OpenAI、Nano Banana、YouTube)的 API 变更或可用性问题会直接影响功能稳定性。本地磁盘空间可能因视频下载和缩略图生成而快速消耗,需定期清理临时文件。

安全解读

核心用法

YouTube AI Editor 是一条端到端的自动化视频生产流水线,用户只需提供YouTube链接或本地视频文件,即可在数分钟内获得完整的上传就绪素材包:

1. 视频获取:通过 yt-dlp 下载YouTube内容或直接处理本地文件,内置URL白名单验证(拦截localhost/私有IP)
2. 智能转录:调用 OpenAI Whisper API 生成高精度 .srt 字幕文件

3. 内容分析:使用 GPT-4 自动生成韩语优化的视频标题、描述和标签(SEO导向)

4. AI缩略图生成(Pro功能):

  • 角色一致性:基于用户头像或默认"海盗龙虾"形象,通过 Image-to-Image 技术生成不同姿势
  • 专业排版:黑金配色方案,集成 Paperlogy ExtraBold 字体
  • 自动抠图:使用 rembg 移除生成角色背景

显著优点

  • 全流程自动化:将原本需要数小时的人工剪辑、字幕校对、文案撰写、设计工作压缩至分钟级
  • 韩语原生支持:GPT-4输出针对韩语YouTube生态优化,非简单翻译
  • 品牌一致性:自定义头像功能确保频道视觉风格的长期统一
  • 安全设计完善:相比同类工具,具备URL验证、HTML转义、超时保护(900s)、固定路径解析等多重防护

潜在缺点与局限性

  • 依赖外部服务稳定性:核心功能绑定OpenAI API(Whisper+GPT-4),一旦限额或故障则流程中断
  • 跨Skill执行风险:调用 nano-banana-pro Skill 进行图像生成,需用户单独审查该组件安全性
  • 子进程依赖:ffmpeg、Playwright等系统级工具增加部署复杂度,Windows环境配置尤其繁琐
  • 成本累积:视频下载+音频转录+GPT-4分析+图像生成,长视频可能产生较高API费用
  • 缩略图风格固定:黑金模板虽专业但缺乏多样化风格选择

适合人群

  • 韩语内容创作者:需要批量生产、快速迭代的YouTuber
  • MCN机构:管理多频道、追求内容产出效率的运营团队
  • 剪辑外包需求者:将技术执行层完全自动化的个人创作者

常规风险

  • API密钥泄露风险(需严格保管 OPENAI_API_KEYNANO_BANANA_KEY
  • YouTube下载可能违反平台ToS(工具本身不承担责任)
  • 生成内容版权归属需用户自行确认
  • 浏览器自动化组件Playwright存在被恶意HTML利用的理论可能

youtube-editor 内容

scripts文件夹
手动下载zip · 7.2 kB
process_video.pytext/plain
请选择文件