核心用法
HappyHorse 1.0 是一款通过 RunComfy CLI 调用的文本生成视频模型,核心命令为 runcomfy run happyhorse/happyhorse-1-0/text-to-video。用户需先安装 CLI (npm i -g @runcomfy/cli) 并完成登录认证。支持 6 种语言提示词(中/英/日/韩/德/法),最长 2500 字符,输出分辨率可选 720P/1080P,时长 3-15 秒,宽高比限定为 16:9、9:16、1:1、4:3、3:4 五种。
关键特性是同 pass 同步生成音频——包括环境音、音效甚至对白,无需后期配音。CLI 采用轮询机制(每 2 秒查询状态)直至任务完成,自动下载结果到指定目录,支持 Ctrl+C 取消任务避免计费。
显著优点
- 质量领先:Artificial Analysis Video Arena 盲测排名第一(Elo 1333 t2v / 1392 i2v)
- 原生 1080p:无需上采样,直接输出广播级画质
- 音视频同步生成:独家的 in-pass 音频合成,适合需要音画同步的品牌故事
- 多镜头角色一致性:跨镜头保持人物外貌、服装稳定,减少后期剪辑成本
- 多语言原生支持:6 种语言提示词质量不打折扣,适合全球化内容生产
- 安全下载限制:仅自动获取
*.runcomfy.net/com域名内容,防止恶意模型拉取外部资源
潜在缺点与局限性
- 时长封顶 15 秒:长叙事需分段生成后手动拼接
- 宽高比受限:不支持 2.39:1 等电影宽银幕比例,超宽画面会被裁切或报错
- 无法外接音频驱动:不支持上传音频文件引导唇形同步,此场景需改用 Wan 2.7 或 Seedance 2.0 Pro
- 无免费 i2v 入口:此 skill 仅封装 t2v 端点,图生视频需调用独立 pipeline
- 依赖 RunComfy 账户:非自托管方案,需持续付费使用
- 2 GiB 单文件上限:超大视频可能触发下载中断
适合人群
- 需要快速产出高质量品牌短片的市场营销团队
- 追求角色一致性、减少后期成本的多镜头叙事创作者
- 需要原生多语言支持、同步音频的全球化内容生产者
- 已有 RunComfy 账户、熟悉 CLI 工作流的技术型用户
常规风险
- 账户与计费风险:API 调用按 GPU 时长计费,取消机制虽存在但网络中断可能导致意外扣费
- 提示词注入风险:2500 字符限制虽存在,但复杂提示仍可能产生不可控输出,需人工审核
- 供应链依赖:完全依赖 RunComfy 服务可用性,单点故障风险
- 版权与合规:生成内容的版权归属需参考 RunComfy 服务条款,商用前建议确认授权范围
- 存储安全:token 存储于
~/.config/runcomfy/token.json(权限 0600),但在共享环境或 CI 中使用RUNCOMFY_TOKEN时需防范泄露