使用说明

核心用法

Yollomi AI API Skill 是一个多模型统一接入层，开发者通过单一 /api/v1/generate 端点即可调用 Flux、Stable Diffusion 3.5、Imagen 4、Sora 2、Veo 3、Kling 等 20+ 图像/视频生成模型。支持文本生成图像（文生图）、图像编辑（背景移除、人脸替换、老照片修复、虚拟试衣）、视频生成（文生视频、图生视频）三大场景。

关键调用模式：

统一认证：Authorization: Bearer 或 X-API-Key 头部
统一参数结构：type（image/video）+ modelId + 模型专属参数
模型发现：GET /api/v1/models 动态获取可用模型列表

显著优点

1. 开发效率极高：单端点设计消除多供应商 SDK 集成成本，切换模型仅需改 modelId
2. 模型覆盖全面：图像侧覆盖开源（Flux、SD3.5）与商业模型（Imagen 4、Ideogram）；视频侧集成 Sora 2、Veo 3、Kling、Runway Gen4 等一线引擎
3. 成本透明按量计费：图像 1-15 credits/张，视频 7-50+ credits/条，支持背景移除（0 credits）等零成本工具
4. 编辑功能闭环：内置背景移除、物体擦除、人脸替换、图像超分、老照片修复、AI 背景生成等实用工具链

潜在缺点与局限性

1. 供应商锁定风险：所有流量路由至 Yollomi 平台，若服务中断或定价调整，迁移成本较高
2. 功能阉割声明：当前版本视频生成功能被显式禁用（"temporarily disabled"），实际可用性存疑
3. 参数差异化隐藏：统一端点虽简化调用，但各模型的进阶参数（如 ControlNet、LoRA、负向提示）是否透传未明确说明
4. Credits 定价不透明：部分模型标注 "varies"（如 runway-gen4-turbo），难以预估成本
5. 合规与版权：未提及生成内容的版权归属、NSFW 过滤策略、以及是否通过模型原厂的合规审查（如 OpenAI Sora 的商用条款）

适合人群

初创产品团队：需快速验证 AI 生图/视频功能，无精力对接多供应商
低代码/自动化平台：寻求标准化 API 封装以降低用户配置复杂度
电商与营销从业者：虚拟试衣、AI 背景生成、商品图编辑等场景的直接使用者

常规风险

密钥泄露：YOLLOMI_API_KEY 若硬编码或日志泄露，可能导致 credits 被盗刷
成本失控：视频生成（尤其 Sora 2 的 "~50+" credits）在批量测试时易产生意外账单
内容审核：未明确平台的自动审核机制，用户可能生成违规内容导致账号封禁
模型可用性：Yollomi 作为聚合层，底层模型（如 Sora）的访问权限可能受原厂政策变动影响

ai-image-generation ai-video-generation flux sora veo api-gateway multi-model image-editing background-removal face-swap

Yollomi AI Image & Video Generator 内容

暂无文件树

手动下载zip · 5.4 kB

contentapplication/octet-stream

请选择文件