Name: 一站式 AI 图像视频生成平台
Author: anichikage

使用说明

核心功能与用法

Yollomi AI API 是一个统一端点的图像与视频生成服务，通过 POST /api/v1/generate 单一接口调用 20+ 图像模型和 15+ 视频模型，包括 Flux 系列、Google Veo-3、OpenAI Sora-2、Kling、Runway Gen4 等主流方案。

核心工作流：

图像生成：设置 type: "image"，选择 modelId（如 flux、imagen-4-ultra），提供 prompt 和 aspectRatio（1:1/16:9/9:16）
视频生成：设置 type: "video"，选择视频模型（如 kling-2-1、google-veo-3），提供 prompt 和可选输入帧
编辑处理：支持背景移除（remove-bg）、换脸（face-swap）、图像超分（image-upscaler）、老照片修复（photo-restoration）、虚拟试衣（virtual-try-on）等

认证方式：Authorization: Bearer 或 X-API-Key 头，需配置 YOLLOMI_API_KEY 环境变量。

显著优势

1. 统一接口设计：所有模型共用 /api/v1/generate 端点，降低集成复杂度
2. 模型覆盖全面：集成文本生成图像（Flux/SD 3.5/Imagen）、视频生成（Sora/Veo/Kling/Runway）、图像编辑三大品类
3. 按需计费透明：图像 0-15 credits/张，视频 7-50+ credits/条，支持 remainingCredits 实时余额查询
4. 实用编辑工具链：免费背景移除（0 credits）、AI 背景生成、物体擦除、照片修复等功能完善

局限性与风险

商业模型依赖：作为第三方聚合平台，底层模型（如 Sora、Veo）的实际可用性受上游供应商制约
成本波动：高端模型如 flux-2-pro（15 credits）、wan-2-6-t2v（29 credits）及 OpenAI Sora-2（50+ credits）成本较高
异步状态缺失：文档未明确说明视频生成的异步轮询机制，可能需自行处理长时任务
地区合规未知：未披露数据存储位置、GDPR/CCPA 合规状态及内容审核策略

适用人群

快速原型开发者：需一站式接入多模型对比测试
电商/营销团队：高频使用背景移除、虚拟试衣、AI 背景生成等编辑功能
内容创作者：需要 Kling、Veo、Sora 等高质量视频模型，且愿接受按需付费模式

安全建议

API Key 严格通过环境变量注入，避免硬编码
生产环境建议配置用量告警，防止 credits 意外耗尽（402 错误）
用户上传图片需预先审查，避免敏感内容触发平台合规封禁

安全解读

核心用法

Yollomi AI API Skill 是一个纯文档型 API 封装工具，通过单一统一端点 /api/v1/generate 调用 Yollomi 平台的 AI 生成服务。支持文本生成图像（Flux、Imagen、Ideogram 等）、背景移除、图像编辑（换脸、修复、扩图）、以及视频生成（Sora、Kling、Veo、Runway 等）三大类能力。

用户需提供 YOLLOMI_API_KEY 环境变量，通过 POST 请求指定 type（image/video）和 modelId 即可调用。图像生成支持 1:1、16:9、9:16 等比例；视频生成支持文生视频和图生视频模式。 credits 消耗从 0（背景移除）到 50+（Sora 2）不等，价格透明。

显著优点

1. 统一端点设计：所有模型共享同一个 /api/v1/generate 端点，大幅降低集成复杂度，无需为不同模型维护多套路由。
2. 模型生态丰富：覆盖 20+ 图像模型（Flux 系列、Stable Diffusion 3.5、Imagen-4、Seedream 等）和 15+ 视频模型（OpenAI Sora、Google Veo、Kling、Runway Gen-4 等），满足从快速原型到高端生产的分层需求。
3. 功能边界清晰：文生图、图生图、图生视频、视频生成、图像编辑五大场景全部覆盖，且参数文档完整，开发者可按表选用。
4. 成本可控：credits 定价公开（如 Flux Schnell 仅 2 credits/张，Veo-3-Fast 仅 9 credits/视频），便于预算规划。

潜在缺点与局限性

1. 外部依赖风险：核心功能完全依赖 Yollomi 第三方服务（yollomi.com），服务可用性、数据隐私政策、长期商业稳定性均由外部决定，Skill 本身无降级或本地 fallback 能力。
2. T3 来源可信度：作者为个人开发者（anichikage），无企业级背书，需用户自行承担供应链风险。
3. API Key 管理负担：用户需自行获取、安全存储和轮换 API Key，Skill 不提供密钥托管或权限细粒度控制。
4. 无代码执行能力：纯文档型 Skill，不包含实际可执行代码，需开发者自行实现 HTTP 客户端逻辑。
5. 数据传输警告：所有提示词、图片 URL 均上传至 Yollomi 服务器，存在潜在的隐私泄露和模型训练数据化风险，不适合处理敏感或机密内容。

适合人群

AI 应用开发者：需要快速集成多模型图像/视频生成能力的原型开发阶段。
内容创作者工具链：为设计、营销、社交媒体运营场景构建自动化工作流。
低代码/无代码平台：作为 API 文档参考，封装成可视化节点或插件。
接受外部 API 模式的团队：明确知晓并愿意承担第三方 SaaS 风险的中低风险场景。

常规风险

服务中断：Yollomi 服务宕机或 API 变更将直接导致 Skill 失效。
数据隐私：用户输入的提示词、图片 URL 可能被 Yollomi 记录或用于模型改进，敏感内容外泄风险。
成本失控：视频模型（尤其 Sora 2）credits 消耗较高，高频调用易产生意外账单。
密钥泄露：API Key 以环境变量形式管理，不当存储（如提交至 GitHub）将导致密钥泄露和滥用。

image-generation video-generation flux sora veo kling background-removal face-swap api-integration text-to-image text-to-video

Yollomi AI Image & Video Generator 内容

scripts文件夹

手动下载zip · 4.7 kB

test-api.shtext/x-shellscript

请选择文件