核心用法
Yollomi AI API Skill 是一个多模型统一接入层,开发者通过单一 /api/v1/generate 端点即可调用 Flux、Stable Diffusion 3.5、Imagen 4、Sora 2、Veo 3、Kling 等 20+ 图像/视频生成模型。支持文本生成图像(文生图)、图像编辑(背景移除、人脸替换、老照片修复、虚拟试衣)、视频生成(文生视频、图生视频)三大场景。
关键调用模式:
- 统一认证:
Authorization: Bearer或X-API-Key头部 - 统一参数结构:
type(image/video)+modelId+ 模型专属参数 - 模型发现:
GET /api/v1/models动态获取可用模型列表
显著优点
1. 开发效率极高:单端点设计消除多供应商 SDK 集成成本,切换模型仅需改 modelId
2. 模型覆盖全面:图像侧覆盖开源(Flux、SD3.5)与商业模型(Imagen 4、Ideogram);视频侧集成 Sora 2、Veo 3、Kling、Runway Gen4 等一线引擎
3. 成本透明按量计费:图像 1-15 credits/张,视频 7-50+ credits/条,支持背景移除(0 credits)等零成本工具
4. 编辑功能闭环:内置背景移除、物体擦除、人脸替换、图像超分、老照片修复、AI 背景生成等实用工具链
潜在缺点与局限性
1. 供应商锁定风险:所有流量路由至 Yollomi 平台,若服务中断或定价调整,迁移成本较高
2. 功能阉割声明:当前版本视频生成功能被显式禁用("temporarily disabled"),实际可用性存疑
3. 参数差异化隐藏:统一端点虽简化调用,但各模型的进阶参数(如 ControlNet、LoRA、负向提示)是否透传未明确说明
4. Credits 定价不透明:部分模型标注 "varies"(如 runway-gen4-turbo),难以预估成本
5. 合规与版权:未提及生成内容的版权归属、NSFW 过滤策略、以及是否通过模型原厂的合规审查(如 OpenAI Sora 的商用条款)
适合人群
- 初创产品团队:需快速验证 AI 生图/视频功能,无精力对接多供应商
- 低代码/自动化平台:寻求标准化 API 封装以降低用户配置复杂度
- 电商与营销从业者:虚拟试衣、AI 背景生成、商品图编辑等场景的直接使用者
常规风险
- 密钥泄露:
YOLLOMI_API_KEY若硬编码或日志泄露,可能导致 credits 被盗刷 - 成本失控:视频生成(尤其 Sora 2 的 "~50+" credits)在批量测试时易产生意外账单
- 内容审核:未明确平台的自动审核机制,用户可能生成违规内容导致账号封禁
- 模型可用性:Yollomi 作为聚合层,底层模型(如 Sora)的访问权限可能受原厂政策变动影响