remotion-excalidraw-tts

🎬 手绘图表一键生成配音解说视频

基于 Remotion 框架与 Excalidraw 渲染引擎,可将手绘图表与文本脚本自动合成为带平移缩放特效的专业解说视频,支持离线 TTS 与多种云端语音引擎。

收藏
5.2k
安装
1.8k
版本
v1.1.0
CLS 安全性认证2026-05-07
点击查看完整报告 >

使用说明

该 Skill 提供了一套完整的自动化视频生成工作流,核心在于将 Excalidraw 手绘图表与文本转语音技术相结合,通过 Remotion 框架渲染出带有专业镜头运动(平移/缩放)和焦点高亮效果的 MP4 视频。用户只需提供 .excalidraw 文件和语音脚本文本,即可一键生成配有解说音轨的教学或演示视频,极大降低了技术内容可视化的门槛。

核心用法方面,用户通过命令行调用 Python 脚本,输入图表文件路径和语音文本路径,脚本会自动完成以下流程:复制 Remotion 模板项目、生成语音音频(支持 macOS 离线 say 命令或 OpenAI/ElevenLabs 云端 TTS)、根据音频时长调整视频长度,并最终渲染输出。高级用户可通过 TypeScript 代码或 JSON 故事板文件自定义每个场景的相机运动轨迹(cameraFrom/cameraTo)、焦点高亮区域(focus)及字幕内容,实现精确的视觉叙事控制。

显著优点体现在其灵活的技术架构上。首先,默认支持 macOS 原生 say 命令实现完全离线的文本转语音,保障数据隐私;同时提供 OpenAI 和 ElevenLabs 等云端高品质语音选项,满足不同场景需求。其次,基于 React 的 Remotion 渲染引擎确保了视频输出的专业质量,支持 30fps 标准帧率。再者,通过 storyboard 机制,用户可以精确控制镜头语言,制作具有电影感的平移、缩放和焦点转移效果,远超简单的录屏质量。

潜在缺点与局限性不容忽视。该 Skill 对系统环境有严格要求:必须运行 macOS 才能使用本地 TTS(尽管云端 TTS 可跨平台),且依赖 ffmpeg、Node.js、npm 等外部工具链,配置门槛较高。作为 T3 来源的社区项目,其长期维护稳定性与顶级开源项目相比存在不确定性。此外,视频渲染过程需要消耗大量计算资源,复杂项目可能需要较长的渲染时间。

适合的目标群体主要包括技术内容创作者、在线教育讲师、产品经理及开发者 advocate。特别适合需要频繁制作架构图解说、流程演示、概念讲解视频的用户,以及希望将静态 Excalidraw 草图转化为动态演示素材的设计人员。对于注重数据隐私且使用 macOS 的个人创作者而言,离线 TTS 功能极具吸引力。

使用该技能可能存在的风险包括:使用第三方 TTS 服务时需妥善管理 API 密钥,避免硬编码泄露;依赖外部工具版本兼容性可能引发构建失败;临时工作目录的磁盘空间占用(视频渲染中间文件较大);以及云端 TTS 服务可能产生的费用和数据传输隐私考量。建议用户在执行前确保系统环境完整,并优先使用本地 TTS 以最大化数据安全性。

安全解读

Remotion + Excalidraw + TTS 技能综合评估

1. 核心用法

该技能旨在将一张 Excalidraw 手绘风格图表 和一段 配音脚本文本 自动合成为一个带有动态运镜(平移/缩放/高亮)的 MP4 视频。用户只需提供图表文件(.excalidraw)和配音文本(.txt),通过一行命令即可完成视频制作。默认情况下,它利用 macOS 本地语音合成引擎(say)生成旁白,结合 Remotion 的动态渲染能力,适用于快速生成技术讲解、产品演示或教学视频。

2. 显著优点

  • 完全离线可用:默认 TTS 后端为 macOS say,全程无需联网,无 API 费用且保障隐私,中文配音同样支持。
  • 可定制性强:支持通过 JSON 分镜脚本(storyboard)精细控制镜头运镜、聚焦区域和字幕,满足专业视频制作需求。
  • 自动化高效:将图表渲染、语音合成、音视频同步、视频导出整合为单一命令,极大简化了从设计图到视频的工作流。
  • 多 TTS 选项:除离线引擎外,还支持 OpenAI 和 ElevenLabs 的高质量云 TTS,满足对语音品质有更高要求的场景。

3. 潜在缺点或局限性

  • 平台限制:默认的离线 TTS 引擎(say)为 macOS 独有功能,限制了其在 Windows 或 Linux 系统上的直接使用。
  • 语音自然度:macOS 内置的合成语音在自然度和表现力上可能不及商业级云 TTS 服务(如 OpenAI 或 ElevenLabs)。
  • 依赖项较多:运行视频生成需要本地预先安装 ffmpegNode.jsnpm,对新手用户存在一定的环境配置门槛。
  • 来源透明度不足:该技能来源于个人/社区开发者,其关联的代码仓库不可公开访问,用户难以通过历史提交记录或社区活跃度评估其长期维护能力。

4. 适合的目标群体

  • 技术内容创作者:需要快速将架构图、流程图转化为带解说的短视频用于社交媒体或技术博客的开发者。
  • 产品经理与教育者:希望利用手绘风格图表制作生动、易懂的产品原型演示或课程讲解视频。
  • 追求极客工具流的用户:偏好使用 Excalidraw 绘制图表,且不希望在视频制作初期依赖外部云服务,重视本地化、低成本创作链路的用户。

5. 使用风险与注意事项

  • 常规依赖风险:技能在运行时会自动执行 npm install,虽依赖均为知名官方包,但用户应留意网络环境及依赖安装的完整性,以防构建失败。
  • 云 API 密钥安全:当用户显式选择 OpenAI 或 ElevenLabs 的云 TTS 后端时,技能会从环境变量读取对应 API 密钥并调用官方接口,用户需确保密钥安全且已设置用量上限,避免意外账单。
  • 路径遍历潜在风险:尽管当前代码安全,但技能接受用户输入的绝对路径文件,应确保输入的源文件路径不包含非法遍历(如 ..),以防在非隔离环境中被恶意利用,读取非预期文件。
  • 后续维护不确定性:作为 T3 信任等级的个人项目,其后续版本更新、漏洞修复或对 Remotion 新版本适配的及时性无法得到组织级保证。

remotion-excalidraw-tts 内容

assets文件夹
template文件夹
remotion-project文件夹
public文件夹
tts文件夹
src文件夹
video文件夹
components文件夹
storyboard文件夹
references文件夹
scripts文件夹
手动下载zip · 86.9 kB
list.txttext/plain
请选择文件