🫧 HappyHorse 1.0 — Pro Pack on RunComfy

🫧 AI 视频生成冠军,声画同步原生 1080p

RunComfy 托管的 HappyHorse 1.0 视频生成 CLI 工具,支持原生 1080p、同步音频与多镜头角色一致性,当前 Artificial Analysis Video Arena 排名第一。

收藏
8.2k
安装
2.7k
版本
0.1.5
CLS 安全性认证2026-05-16
点击查看完整报告 >

使用说明

核心用法

HappyHorse 1.0 是一款通过 RunComfy CLI 调用的文本转视频模型,命令格式为 runcomfy run happyhorse/happyhorse-1-0/text-to-video。用户需提供 RunComfy 账户令牌(RUNCOMFY_TOKEN 或通过 runcomfy login 获取),并配置 JSON 输入参数包括提示词、宽高比、分辨率、时长、随机种子和水印开关。

显著优点

  • 原生 1080p 输出:无需上采样,直接生成广播级画质,同时支持 720p 低成本测试
  • 同步音频生成:在单次生成中产出对话、环境音和拟音效果,并与口型、动作自动对齐
  • 多镜头角色一致性:跨镜头保持人物面容、服装、道具的统一,解决传统视频模型的漂移问题
  • 多语言原生支持:英文、简繁中文、日文、韩文、德文、法文六种语言提示词质量无衰减
  • 权威排名验证:当前 Artificial Analysis Video Arena 文本转视频/图像转视频双榜第一(Elo 1333/1392)

潜在缺点与局限性

  • 时长限制:单次生成仅 3–15 秒,长叙事需分段生成后拼接
  • 固定宽高比:仅支持 16:9、9:16、1:1、4:3、3:4 五种比例,超宽电影画幅不可用
  • 无外部音频输入:无法基于现有音频文件驱动口型同步,音频必须由模型根据提示词生成
  • 仅限文本转视频:图像转视频需调用独立模板,本 skill 不覆盖
  • 商业依赖:完整功能(如无水印输出)需付费 RunComfy 订阅计划

适合人群

  • 需要多镜头品牌故事或产品展示、且要求角色一致性的创意团队
  • 制作带同步旁白/环境音的口播视频、多语言短视频广告的内容创作者
  • 追求 2026 年最高盲评视频质量、愿为云端 GPU 计算付费的专业用户
  • 具备基础 CLI 操作能力、能在 CI/容器环境中配置令牌的技术人员

常规风险

  • API 令牌泄露~/.config/runcomfy/token.json 需严格限制 0600 权限,CI 环境建议使用 RUNCOMFY_TOKEN 环境变量而非文件存储
  • 账单风险:GPU 计算按量计费,长时长、高分辨率、无水印生成成本更高;Ctrl-C 可取消正在进行的请求避免额外扣费
  • 内容合规:生成内容需遵守 RunComfy 平台政策及当地法律法规,提示词注入风险虽因纯文本输入而较低,但仍需审慎描述敏感场景
  • 依赖可用性:服务完全依赖 RunComfy 云端基础设施,本地无回退方案,网络中断或平台维护将直接影响使用

安全解读

核心用法

HappyHorse 1.0 是一款通过 RunComfy CLI 调用的文本生成视频(Text-to-Video)模型,当前在 Artificial Analysis Video Arena 排行榜位居第一。用户安装 @runcomfy/cli 后,通过 runcomfy run happyhorse/happyhorse-1-0/text-to-video 命令即可生成视频,无需本地 GPU 或模型部署。

关键参数配置:

  • prompt: 最多 2500 字符,支持中英日韩德法六种语言
  • aspect_ratio: 固定比例(16:9、9:16、1:1、4:3、3:4)
  • resolution: 原生 720P 或 1080P 输出,无需后处理放大
  • duration: 3-15 秒单次生成
  • seed: 固定种子可复现结果
  • watermark: 付费用户可关闭水印

提示词技巧: 描述动作时序而非静态画面,前置镜头语言(如"Wide shot""Tracking shot"),多镜头场景需重复锚定角色特征(服装、道具),音频需求直接写入提示词(如"warm friendly tone, English voiceover")。

显著优点

1. 原生 1080p 输出:直接生成广播级画质,避免 720p 中间画质的放大损失
2. 同步音频生成:独家的 in-pass 音频合成,对话、环境音、拟音与画面同步生成,自动对口型

3. 多镜头角色一致性:同一提示词内的多个镜头可保持人物面容、服装、道具的一致性

4. 多语言原生支持:六种语言提示词无质量折损,适合全球化短视频内容

5. 榜单验证质量:Artificial Analysis Video Arena Elo 评分 1333(t2v)/ 1392(i2v),盲测第一

潜在缺点与局限性

  • 时长限制:单次生成上限 15 秒,长叙事需分段生成后剪辑拼接
  • 固定画幅比例:仅支持 5 种标准比例,超宽电影画幅不可用
  • 音频不可导入:无法以外部音频驱动口型同步,仅能从文本生成音频
  • 纯文本输入:本 Skill 仅覆盖 t2v 端点,i2v 图生视频需调用独立模板
  • 依赖外部服务:需 RunComfy 账户与有效 Token,离线环境不可用
  • 成本考量:1080p 生成及去水印功能需付费订阅

适合人群

  • 品牌内容创作者:需统一角色形象的多镜头产品故事短片
  • 多语言运营团队:中、日、韩、德、法市场的本地化短视频生产
  • 播客/知识类博主:需要同步生成口播语音与画面的讲解视频
  • 影视预演团队:快速生成高保真动态分镜验证创意
  • 广告代理公司:追求盲测顶级画质的高端商业交付

常规风险

账户安全:API Token 存储于 ~/.config/runcomfy/token.json,需确保 0600 权限;CI 环境建议使用 RUNCOMFY_TOKEN 环境变量替代文件存储。

输入合规:提示词内容受 RunComfy 平台政策约束,生成内容需符合当地法律法规。

服务可用性:依赖 RunComfy 云端 GPU 资源,高峰期可能存在排队或 429 限流。

成本控制:1080p 生成、长时长(15s)、无水印输出消耗更多积分/额度,建议先用 720p/3s 快速迭代。

版权归属:生成内容的商用授权需查阅 RunComfy 最新服务条款,平台水印策略可能影响品牌露出。

🫧 HappyHorse 1.0 — Pro Pack on RunComfy 内容

手动下载zip · 5.8 kB
SKILL.mdtext/markdown
请选择文件