使用说明

核心用法

Yollomi AI API 是一个多模型聚合的生成式AI平台，通过单一REST端点 POST /api/v1/generate 提供图像与视频生成能力。开发者只需替换 modelId 参数即可切换底层模型，无需适配不同厂商的API规范。

图像生成流程：设置 YOLLOMI_API_KEY → 调用 /api/v1/models 获取可用模型 → 选择 modelId（如 flux、imagen-4-ultra）→ 提交prompt与 aspectRatio（1:1/16:9/9:16）→ 获取图片URL数组。

进阶功能覆盖：背景移除（remove-bg，0积分）、图像修复（photo-restoration）、智能扩图（image-upscaler）、虚拟试穿（virtual-try-on）、人脸替换（face-swap）、对象擦除（object-remover）及Qwen图像编辑等，形成完整视觉工作流。

视频生成：支持OpenAI Sora 2、Google Veo 3系列、Kling 2.1、Runway Gen4、MiniMax Hailuo等主流模型，计费从7-50+积分不等，当前版本视频功能已临时禁用。

显著优点

统一接口，降低集成成本：单一端点替代多家厂商SDK，切换模型仅改参数
模型覆盖全面：图像涵盖Flux全系列、Stable Diffusion 3.5、Google Imagen 4、Ideogram V3等；视频聚合Sora、Veo、Kling等一线模型
精细化计费：图像1-15积分/张，视频7-50+积分，支持按需成本控制
实用工具链：0积分背景移除、1积分超分等低价高频功能完善

潜在局限

视频功能不稳定：当前构建版本已禁用视频生成，生产环境需确认可用性
生态封闭性：相比直接使用OpenAI、Google等官方API，Yollomi作为中间层存在单点故障风险
文档深度不足：部分模型参数细节需依赖外部 models-reference.md 或运行时查询
成本不透明：Runway Gen4等模型标注"varies"，缺乏固定定价

适合人群

需快速对比多模型效果的AI应用开发者
追求单一账单管理的中小团队
需要图像后处理工具链（去背、修复、扩图）的内容创作者
积分预算敏感、希望精细控制生成成本的用户

常规风险

| 风险类型 | 说明 |

|---------|------|

| 密钥泄露 | API Key需环境变量管理，硬编码存在被盗刷积分风险 |

| 服务中断 | 聚合层故障将导致所有模型不可用，建议保留官方API兜底方案 |

| 内容安全 | 生成内容需自行合规审核，平台可能因违规内容封禁账户 |

| 积分耗尽 | 402错误需及时充值，高消耗模型（如Sora 50+积分）易触发余额不足 |

image-generation video-generation flux sora veo kling api-aggregation background-removal image-editing multi-model

Yollomi AI Image & Video Generator 内容

scripts文件夹

手动下载zip · 5.3 kB

test-api.shtext/x-shellscript

请选择文件