skills/ivangdavila/AI Image Generation

AI Image Generation

🎨 多平台AI绘图，一键切换顶级引擎

创意与设计榜 #1

集成主流AI绘图平台的智能生图助手，支持Midjourney、DALL-E、Stable Diffusion、Flux等，提供专业提示词工程与风格控制，适合设计师与创意工作者高效产出。

收藏

20.5k

安装

6.9k

版本

1.0.2

CLS 安全扫描中

预计需要 3 分钟...

使用说明

核心功能

Image Generation是一款多平台AI图像生成技能，整合了Midjourney、DALL-E 3、Stable Diffusion、Flux、Leonardo、Ideogram、Replicate七大主流服务商。核心能力覆盖文生图、图像编辑、风格迁移、超分辨率放大等完整工作流。

使用机制

1. 智能记忆系统：自动读取~/image-generation/memory.md保存用户偏好供应商、风格偏好和项目上下文
2. 草稿优先策略：建议从512×512或1024×1024低分辨率验证提示词，生成4+变体后再放大优胜者
3. 任务驱动的供应商匹配：

照片级真实感 → Midjourney/Flux Pro
图像内文字生成 → Ideogram/DALL-E 3
快速迭代 → Flux Schnell/Leonardo
最大可控性 → Stable Diffusion
智能修复 → DALL-E 3/Stable Diffusion

提示词工程规范

主体前置："A red fox"优于"In the forest there is a red fox"
具体描述：用"golden hour sunlight"替代"good lighting"
宽高比适配内容：1:1人像、16:9风景

显著优势

多平台覆盖：避免单一供应商锁定，按需选择最优引擎
本地化隐私：仅提示词外发，偏好设置本地存储
系统化工作流：从草稿验证到成品放大的标准化流程
常见陷阱预案：针对手指畸形、文字乱码、面部扭曲等问题提供修复策略

局限性与风险

依赖第三方API：所有图像生成需信任OpenAI、Midjourney、Stability AI等服务商的数据处理
版权模糊地带：AI生成图像的版权归属因平台而异，商用需谨慎
质量不可控：同一提示词在不同供应商间输出差异显著
成本累积：多平台试用可能导致分散的订阅费用

适合人群

视觉设计师、营销创意人员、独立开发者、内容创作者，以及需要快速原型视觉概念的技术团队。不适合对数据主权有极高要求或完全离线环境的用户。

常规风险提示

提示词内容将被发送至所选AI供应商服务器
生成图像由供应商托管存储，非本地保存
各平台内容审核政策不同，敏感主题可能触发过滤

ai-image-generation prompt-engineering midjourney dall-e stable-diffusion flux leonardo text-to-image creative-tools

AI Image Generation 内容

手动下载zip · 12.7 kB

api-patterns.mdtext/markdown

请选择文件