Yollomi AI Image & Video Generator

🎨 20+顶尖模型,一个端点调用

Yollomi统一AI图像与视频生成API,集成Flux、Sora、Veo等20+主流模型,单端点调用降低开发成本。

收藏
11.8k
安装
2.5k
版本
1.0.5
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Yollomi AI API Skill 是一个多模型统一接入层,开发者通过单一 /api/v1/generate 端点即可调用 Flux、Stable Diffusion 3.5、Imagen 4、Sora 2、Veo 3、Kling 等 20+ 图像/视频生成模型。支持文本生成图像(文生图)、图像编辑(背景移除、人脸替换、老照片修复、虚拟试衣)、视频生成(文生视频、图生视频)三大场景。

关键调用模式:

  • 统一认证Authorization: BearerX-API-Key 头部
  • 统一参数结构type(image/video)+ modelId + 模型专属参数
  • 模型发现GET /api/v1/models 动态获取可用模型列表

显著优点

1. 开发效率极高:单端点设计消除多供应商 SDK 集成成本,切换模型仅需改 modelId
2. 模型覆盖全面:图像侧覆盖开源(Flux、SD3.5)与商业模型(Imagen 4、Ideogram);视频侧集成 Sora 2、Veo 3、Kling、Runway Gen4 等一线引擎

3. 成本透明按量计费:图像 1-15 credits/张,视频 7-50+ credits/条,支持背景移除(0 credits)等零成本工具

4. 编辑功能闭环:内置背景移除、物体擦除、人脸替换、图像超分、老照片修复、AI 背景生成等实用工具链

潜在缺点与局限性

1. 供应商锁定风险:所有流量路由至 Yollomi 平台,若服务中断或定价调整,迁移成本较高
2. 功能阉割声明:当前版本视频生成功能被显式禁用("temporarily disabled"),实际可用性存疑

3. 参数差异化隐藏:统一端点虽简化调用,但各模型的进阶参数(如 ControlNet、LoRA、负向提示)是否透传未明确说明

4. Credits 定价不透明:部分模型标注 "varies"(如 runway-gen4-turbo),难以预估成本

5. 合规与版权:未提及生成内容的版权归属、NSFW 过滤策略、以及是否通过模型原厂的合规审查(如 OpenAI Sora 的商用条款)

适合人群

  • 初创产品团队:需快速验证 AI 生图/视频功能,无精力对接多供应商
  • 低代码/自动化平台:寻求标准化 API 封装以降低用户配置复杂度
  • 电商与营销从业者:虚拟试衣、AI 背景生成、商品图编辑等场景的直接使用者

常规风险

  • 密钥泄露YOLLOMI_API_KEY 若硬编码或日志泄露,可能导致 credits 被盗刷
  • 成本失控:视频生成(尤其 Sora 2 的 "~50+" credits)在批量测试时易产生意外账单
  • 内容审核:未明确平台的自动审核机制,用户可能生成违规内容导致账号封禁
  • 模型可用性:Yollomi 作为聚合层,底层模型(如 Sora)的访问权限可能受原厂政策变动影响

Yollomi AI Image & Video Generator 内容

暂无文件树

手动下载zip · 5.4 kB
contentapplication/octet-stream
请选择文件