使用说明

核心用法

Image Generation 是一个多平台 AI 图像生成技能，支持文本转图像、图像编辑、风格迁移和放大处理。核心工作流程为：读取本地记忆 → 草图验证 → 精选放大 → 更新记忆。

显著优点

1. 多平台智能路由：根据任务类型自动推荐最优服务商——照片级真实感选 Midjourney/Flux Pro，图像内文字选 Ideogram/DALL-E 3，快速迭代选 Flux Schnell，精细控制选 Stable Diffusion，预算有限选 Replicate/Leonardo。

2. 工程化提示词体系：提供结构化提示模板（主体优先、风格关键词、具体光线描述、画幅匹配），并内置常见问题的修复策略（手部畸形、面部扭曲、文字乱码等）。

3. 本地状态持久化：用户偏好（服务商选择、风格偏好、项目上下文）保存在 ~/image-generation/memory.md，跨版本更新不丢失。

4. 隐私设计：仅向第三方发送必要的生成提示词，偏好数据本地存储，无遥测或分析上报。

潜在缺点与局限性

依赖外部服务商：生成质量、可用性、定价完全受第三方平台制约，存在服务中断或政策变更风险
无本地模型支持：必须联网，无法离线运行
学习曲线：需掌握各平台特有的参数语法和风格关键词
生成成本不可控：高分辨率、多批次尝试可能产生显著 API 费用
版权与伦理灰色地带：训练数据版权争议、生成内容的使用权因平台而异

适合人群

设计师、营销人员需要快速视觉原型
开发者集成 AI 图像能力到工作流
内容创作者探索风格化视觉表达

常规风险

| 风险类型 | 说明 |

|---------|------|

| 数据泄露 | 提示词可能包含敏感信息，发送至第三方服务商 |

| 内容安全 | 可能生成不当内容，需遵守各平台审核政策 |

| 服务商锁定 | 特定风格的提示词难以跨平台迁移 |

| 成本超支 | 批量生成或高分辨率任务费用累积 |

安全解读

核心用法

Image Generation 是一个纯文档型 AI 图像生成知识库，整合 Midjourney、DALL-E 3、Stable Diffusion、Flux、Leonardo、Ideogram、Replicate 七大主流服务的 API 文档与最佳实践。用户通过查阅对应 provider 文件获取调用方式，结合 prompting.md 掌握提示词工程技巧，利用 memory-template.md 建立个人偏好档案实现持久化配置。

核心工作流程遵循"检查记忆→草图验证→精选放大→更新记忆"四步：首先读取 ~/image-generation/memory.md 获取用户当前选用的服务商、偏好风格及项目上下文；生成阶段建议从 512×512 或 1024×1024 草图开始，批量产出 4+ 变体后挑选最优进行高清放大；任务结束后将新确认的提供商、有效风格或新建项目同步回写记忆文件。

显著优点

全栈覆盖：7 大主流服务一站收录，从追求真实感的 Midjourney/Flux Pro、擅长文字渲染的 Ideogram/DALL-E 3，到极致控图的 Stable Diffusion、高性价比的 Replicate/Leonardo，任务-工具匹配表让用户快速决策。
工程化方法论：提示词结构强制"主体优先+具体描述+风格关键词"，避免模糊表述；草稿-终稿分离策略显著降低 token/API 成本。
零配置持久化：用户偏好自动存储于本地 ~/image-generation/ 目录，跨版本升级不丢失。
透明安全模型：明确披露数据流向（仅提示词发往第三方），本地零遥测、零依赖、零可执行代码。

潜在局限

纯指南无封装：Skill 本身不提供统一 API 封装或 SDK，用户仍需自行处理各服务商的鉴权、参数差异与错误处理。
动态维护依赖：第三方 API 文档链接可能失效，需人工定期验证更新；新模型/参数推出后指南存在滞后性。
无本地算力支持：所有图像生成均依赖云端服务，无法离线运行，受限于服务商排队与计费策略。
版权与合规盲区：未深入探讨生成图像的版权归属、商用授权及不同地区对 AI 生成内容的监管差异。

适合人群

设计师、开发者、内容创作者及 AI 爱好者。特别适合需要频繁对比多服务商效果、追求提示词工程精进、或希望建立可复用风格档案的中高级用户。不适合寻求"一键出图"极简体验、或对云端数据敏感需本地部署的用户。

常规风险

提示词隐私：所有生成请求均携带提示词发送至第三方服务器，敏感商业概念或个人信息存在泄露风险。
成本失控：高清放大、批量生成及高阶功能（如 Midjourney 的 Turbo 模式）可能快速消耗额度，缺乏内置预算管控。
风格漂移：不同服务商模型版本迭代可能导致既往提示词效果不一致，需持续调试。
生成缺陷：手部畸形、面部扭曲、文字乱码等常见问题需人工后期修复，Skill 仅提供规避建议而非自动化解决方案。

ai-image-generation text-to-image midjourney dall-e stable-diffusion flux prompt-engineering creative-tools api-integration

AI Image Generation 内容

手动下载zip · 12.5 kB

api-patterns.mdtext/markdown

请选择文件