使用说明

核心用法

该 skill 作为 RunComfy 平台的图生视频智能路由器，通过解析用户意图自动选择最优模型：

HappyHorse 1.0 I2V（默认）：适用于肖像/产品动画，保持身份一致性，支持原生音频生成，Arena 排名第一（Elo 1392）
Wan 2.7 + audio_url：当用户提供自定义语音轨道时，驱动口型同步的 talking-head 视频
Seedance 2.0 Pro：多模态场景，支持图像+参考视频+参考音频的组合创作

调用方式为本地 CLI runcomfy run <vendor>/<model>，需预先安装 @runcomfy/cli 并完成登录认证。

显著优点

1. 意图感知路由：避免用户手动试错，自动匹配 3 种专业级模型的最佳适用场景
2. 内置提示词模板：针对不同模型提供结构化的 prompting 指南（运动动词前置、身份保持声明等）
3. 端到端工作流：单命令完成提交-轮询-下载，支持 Ctrl-C 取消远程任务
4. 多语言 dub 友好：Wan 2.7 路线支持同一画面替换 audio_url 批量生成多语言版本
5. 安全设计：Token 文件权限 0600，HTTPS 传输，无 shell 注入风险，下载 2GiB 上限防磁盘填满

潜在局限

模型互斥性：单次调用仅支持单一模型，无法直接融合 HappyHorse 动画 + Wan 口型（需外部拼接）
分辨率天花板：Seedance Pro 路线最高 720p，HappyHorse/Wan 支持 1080p
音频时长限制：Wan 3-30s，Seedance 2-15s，长内容需分段处理
输出宽高比绑定输入：HappyHorse 不支持独立重构图，输入决定输出比例
依赖外部服务：完全依赖 RunComfy 模型 API 可用性，本地无 fallback

适合人群

内容创作者：需要快速将静态肖像/产品图转为动态视频
营销团队：批量生成多语言口型同步的 spokesperson 视频
品牌方：需保持视觉一致性（角色+场景+音色）的多模态叙事
开发者：已在 CI/CD 管道中使用 RunComfy CLI 的自动化工作流

常规风险

| 风险类别 | 说明 |

|---------|------|

| API 依赖 | RunComfy 服务中断或模型下线将导致 skill 不可用 |

| 成本累积 | 视频生成按秒计费，批量任务需预算控制 |

| 版权与合规 | 上传的参考音视频、生成内容的商用授权需自行确认 |

| 提示词泄露 | 提示内容传输至第三方模型服务器，敏感信息避免写入 |

| 生成质量波动 | AI 视频存在面部扭曲、手指异常等常见问题，需 seed 锁定比对 |

安全解读

核心用法

该 Skill 作为智能路由层，根据用户意图自动选择 RunComfy 平台内三款顶尖图生视频（I2V）模型，无需手动比对模型特性：

| 场景 | 自动路由模型 | 关键特性 |

|------|-----------|---------|

| 肖像/产品动画，保持身份稳定 | **HappyHorse 1.0 I2V** | Artificial Analysis Arena #1（Elo 1392），原生同步音频，15秒上限 |

| 自定义语音旁白口型同步 | **Wan 2.7 + `audio_url`** | 接收 3-30 秒 MP3/WAV，驱动精准唇形匹配，支持多语言换轨 |

| 图片+参考视频+参考音频混合创作 | **Seedance 2.0 Pro** | 最多 9 图 + 3 视频 + 3 音频参考，品牌叙事一致性 |

调用方式统一为 runcomfy run <vendor>/<model>，Skill 内部完成参数映射与 JSON 构造。用户仅需提供图片 URL 与意图描述（如"让肖像眨眼并配这段旁白"），系统自动触发对应工作流。

显著优点

1. 意图驱动，零模型选型成本：内置决策表消除用户面对多模型的选择困难，降低迭代试错成本
2. Arena 榜首质量兜底：默认路由 HappyHorse 1.0 I2V 为当前公开评测最高排名模型，画质与身份保持领先
3. 原生音频闭环：HappyHorse 与 Seedance 支持生成内嵌同步音频，避免后期手动对齐
4. 多语言口型工作流：Wan 2.7 路线支持同视觉种子换音频轨道，批量生成本地化版本
5. 企业级安全架构：Token 文件 0600 权限、HTTPS-only 传输、2GiB 下载上限、无遥测回传

潜在缺点与局限性

分辨率天花板：Seedance 2.0 Pro 此模板仅限 720p，HappyHorse/Wan 上限 1080p，无 4K 选项
时长硬限制：全模型 15 秒封顶，长叙事需分段生成后外部拼接
单模型单调用：无法在一次请求中融合 HappyHorse 动画 + Wan 唇形（需两阶段合成）
输入 aspect 锁定：HappyHorse 输出比例强制等于输入，无独立裁切控制
CLI 依赖前置：必须全局安装 @runcomfy/cli 并完成登录流程，纯浏览器用户无法直接调用

适合人群

内容创作者：快速将静态肖像/产品图转为动态展示视频
本地化团队：需批量生成多语言口型同步视频的出海品牌
广告制片方：利用 Seedance 多模态参考保持角色、场景、音色跨镜头一致
开发者/自动化工程师：通过 RUNCOMFY_TOKEN 实现 CI/CD 流水线集成

常规风险

Token 泄露：环境变量或 ~/.config/runcomfy/token.json 若权限配置不当存在读取风险
URL 投毒：传入的图片/音频 URL 若来自不可信源，可能触发模型层的提示注入或恶意内容渲染
成本失控：视频生成按秒/分辨率计费，高频自动化调用需配合预算告警
版权合规：参考音频/视频涉及第三方素材时需自行确认授权链

image-to-video ai-video lip-sync runcomfy happyhorse wan-2-7 seedance multi-modal cli-tool content-creation

🫧 Image-to-Video — Pro Pack on RunComfy 内容

手动下载zip · 5.0 kB

SKILL.mdtext/markdown

请选择文件