核心用法
该 skill 作为 RunComfy 平台的图生视频智能路由器,通过解析用户意图自动选择最优模型:
- HappyHorse 1.0 I2V(默认):适用于肖像/产品动画,保持身份一致性,支持原生音频生成,Arena 排名第一(Elo 1392)
- Wan 2.7 + audio_url:当用户提供自定义语音轨道时,驱动口型同步的 talking-head 视频
- Seedance 2.0 Pro:多模态场景,支持图像+参考视频+参考音频的组合创作
调用方式为本地 CLI runcomfy run <vendor>/<model>,需预先安装 @runcomfy/cli 并完成登录认证。
显著优点
1. 意图感知路由:避免用户手动试错,自动匹配 3 种专业级模型的最佳适用场景
2. 内置提示词模板:针对不同模型提供结构化的 prompting 指南(运动动词前置、身份保持声明等)
3. 端到端工作流:单命令完成提交-轮询-下载,支持 Ctrl-C 取消远程任务
4. 多语言 dub 友好:Wan 2.7 路线支持同一画面替换 audio_url 批量生成多语言版本
5. 安全设计:Token 文件权限 0600,HTTPS 传输,无 shell 注入风险,下载 2GiB 上限防磁盘填满
潜在局限
- 模型互斥性:单次调用仅支持单一模型,无法直接融合 HappyHorse 动画 + Wan 口型(需外部拼接)
- 分辨率天花板:Seedance Pro 路线最高 720p,HappyHorse/Wan 支持 1080p
- 音频时长限制:Wan 3-30s,Seedance 2-15s,长内容需分段处理
- 输出宽高比绑定输入:HappyHorse 不支持独立重构图,输入决定输出比例
- 依赖外部服务:完全依赖 RunComfy 模型 API 可用性,本地无 fallback
适合人群
- 内容创作者:需要快速将静态肖像/产品图转为动态视频
- 营销团队:批量生成多语言口型同步的 spokesperson 视频
- 品牌方:需保持视觉一致性(角色+场景+音色)的多模态叙事
- 开发者:已在 CI/CD 管道中使用 RunComfy CLI 的自动化工作流
常规风险
| 风险类别 | 说明 |
|---------|------|
| API 依赖 | RunComfy 服务中断或模型下线将导致 skill 不可用 |
| 成本累积 | 视频生成按秒计费,批量任务需预算控制 |
| 版权与合规 | 上传的参考音视频、生成内容的商用授权需自行确认 |
| 提示词泄露 | 提示内容传输至第三方模型服务器,敏感信息避免写入 |
| 生成质量波动 | AI 视频存在面部扭曲、手指异常等常见问题,需 seed 锁定比对 |