核心用法
Image Generation 是一个多平台 AI 图像生成技能,支持文本转图像、图像编辑、风格迁移和放大处理。核心工作流程为:读取本地记忆 → 草图验证 → 精选放大 → 更新记忆。
显著优点
1. 多平台智能路由:根据任务类型自动推荐最优服务商——照片级真实感选 Midjourney/Flux Pro,图像内文字选 Ideogram/DALL-E 3,快速迭代选 Flux Schnell,精细控制选 Stable Diffusion,预算有限选 Replicate/Leonardo。
2. 工程化提示词体系:提供结构化提示模板(主体优先、风格关键词、具体光线描述、画幅匹配),并内置常见问题的修复策略(手部畸形、面部扭曲、文字乱码等)。
3. 本地状态持久化:用户偏好(服务商选择、风格偏好、项目上下文)保存在 ~/image-generation/memory.md,跨版本更新不丢失。
4. 隐私设计:仅向第三方发送必要的生成提示词,偏好数据本地存储,无遥测或分析上报。
潜在缺点与局限性
- 依赖外部服务商:生成质量、可用性、定价完全受第三方平台制约,存在服务中断或政策变更风险
- 无本地模型支持:必须联网,无法离线运行
- 学习曲线:需掌握各平台特有的参数语法和风格关键词
- 生成成本不可控:高分辨率、多批次尝试可能产生显著 API 费用
- 版权与伦理灰色地带:训练数据版权争议、生成内容的使用权因平台而异
适合人群
- 设计师、营销人员需要快速视觉原型
- 开发者集成 AI 图像能力到工作流
- 内容创作者探索风格化视觉表达
常规风险
| 风险类型 | 说明 |
|---------|------|
| 数据泄露 | 提示词可能包含敏感信息,发送至第三方服务商 |
| 内容安全 | 可能生成不当内容,需遵守各平台审核政策 |
| 服务商锁定 | 特定风格的提示词难以跨平台迁移 |
| 成本超支 | 批量生成或高分辨率任务费用累积 |