Yollomi AI Image & Video Generator

🎨 20+模型一站式图像视频生成

media-generation榜 #16

多模型AI图像生成统一API,支持Flux、Stable Diffusion、Kling等20+模型,按信用点计费,适合开发者集成图像/视频生成能力。

收藏
10.7k
安装
2.5k
版本
1.0.4
CLS 安全性认证2026-05-16
点击查看完整报告 >

使用说明

核心用法

Yollomi AI API 提供单一统一端点 /api/v1/generate,通过 type(image/video)和 modelId 参数调用不同AI模型,无需切换多个API。支持文本生图、图生视频、背景移除、人脸替换、图像修复等多样化功能。

显著优点

  • 模型丰富:覆盖20+图像模型(Flux系列、Stable Diffusion、Imagen、Ideogram等)和15+视频模型(Sora、Veo 3、Kling、Runway等)
  • 统一接口:所有模型共用同一端点和认证方式,降低集成复杂度
  • 灵活计费:按信用点(Credits)计费,图像1-15点/张,视频7-50+点/次,成本透明可控
  • 实用工具链:内置背景移除、图像超分、老照片修复、虚拟试衣、AI背景生成等辅助功能

潜在缺点/局限性

  • 视频功能暂不可用:当前版本已禁用视频生成
  • 信用点消耗差异大:高端模型(如Flux-2-Pro 15点、Sora 50+点)成本较高
  • 参数依赖模型:不同模型要求不同必填字段(prompt/imageUrl/width+height等),需查阅文档
  • 无本地部署:完全依赖云端API,存在网络延迟和可用性风险
  • 认证单一:仅支持API Key,无私钥/OAuth等多因子方案

适合人群

  • 需要快速集成多模型AI生成能力的开发者/初创团队
  • 电商/设计行业需批量图像处理(去背景、超分、虚拟试衣)
  • 内容创作者构建自动化图像/视频工作流
  • 不想维护多平台API密钥的中小型企业

常规风险

  • API密钥泄露:Bearer Token硬编码或环境变量配置不当导致未授权访问
  • 信用点耗尽误操作:高消耗模型(Sora 50+点)可能快速耗尽账户余额
  • 输出内容合规:AI生成图像/视频存在版权、肖像权、有害内容风险
  • 供应商锁定:模型和计费体系深度绑定Yollomi平台,迁移成本较高
  • 服务稳定性:依赖单一第三方服务,需考虑降级方案

安全解读

核心功能与用法

Yollomi AI API Skill 是一款多模型AI图像与视频生成工具封装,通过单一REST端点 /api/v1/generate 统一调用20+主流生成模型。核心用法为:设置 YOLLOMI_API_KEY 环境变量后,向该端点发送POST请求,指定 type("image"或"video")和 modelId 即可触发对应模型。

图像生成支持Flux系列(Schnell/Pro)、Stable Diffusion 3.5、Imagen 4、Ideogram V3、Seedream 4.5等,涵盖文生图、图生图、背景移除、人脸替换、图像修复、智能扩图、虚拟试穿等完整视觉工作流。支持1:1、16:9、9:16三种比例,单次消耗1-15积分不等。

视频生成(当前版本禁用)原生支持OpenAI Sora、Google Veo 3、Kling 2.1、Runway Gen4、MiniMax Hailuo等主流视频模型,预计消耗8-50+积分。

辅助功能包括:GET /api/v1/models 获取实时模型列表、自动积分余额返回、标准化错误码(401/402分别对应密钥/余额问题)。

显著优点

1. 统一接口降低集成成本:单一端点+模型ID切换,无需为每个模型单独适配API格式,特别适合需要快速对比多模型效果的A/B测试场景。
2. 模型覆盖全面:文生图覆盖开源(Flux、SD)与商用(Imagen、Ideogram)主流方案;视频端覆盖中美韩多家厂商,减少多平台账号管理负担。

3. 功能矩阵完整:从生成到后期处理(去背景、修图、扩图、换脸)形成闭环,无需跳转其他服务。

4. 安全架构合规:环境变量管理密钥、HTTPS加密传输、零第三方依赖,通过全维度安全扫描(总分85/S级)。

潜在局限

1. 视频功能当前禁用:文档标注为"temporarily disabled",视频生成需求需等待更新或直接使用其他工具。
2. T3来源可信度:维护者为个人开发者账号(anichikage),非企业/组织背书,存在维护持续性风险,建议关注官方渠道迁移可能。

3. 积分计费模式:多模型统一计费但单价差异大(图像1-15积分、视频8-50+积分),高频使用需精细化成本核算,无免费额度说明。

4. 参数标准化限制:部分模型原生高级参数(如ControlNet、LoRA、特定采样器)可能被统一接口抽象,深度定制需求受限。

适合人群

  • 多模型评测者:需快速对比Flux/SD/Imagen等模型效果的开发者或产品经理
  • 中小型项目团队:希望减少API对接工作量、统一账单管理的创业团队
  • 视觉工作流自动化:需要将图像生成与后期处理(去背景、修图)串联的自动化场景
  • API封装学习者:研究如何设计统一多模型接口的开发者

常规风险

  • API密钥泄露风险:虽采用环境变量管理,但密钥泄露将导致积分被盗刷,建议定期轮换并限制IP白名单(如Yollomi支持)
  • 内容合规责任:AI生成内容可能涉及版权、肖像权、有害信息,需用户自行承担合规审查责任
  • 服务可用性依赖:第三方API故障将直接影响本Skill功能,建议实现降级策略
  • 个人维护者风险:若维护者停止更新,可能面临API变更不兼容问题

技术实现亮点

安全认证报告显示代码结构清晰(287行/6文件),无危险函数调用,输入验证完善(URL协议白名单限制http/https),供应链攻击面为零(仅使用标准库fetch)。隐私合规通过GDPR数据最小化、用户知情权、传输加密、凭证安全管理等6项检测。

Yollomi AI Image & Video Generator 内容

scripts文件夹
手动下载zip · 5.3 kB
test-api.shtext/x-shellscript
请选择文件