核心用法
Creative Toolkit 是一个统一的 AI 图像生成接口,支持多提供商智能路由(Nanobanana 2、Seedream 5.0、GPT Image、Midjourney V7/Niji 7 及本地 ComfyUI)。核心工作流包括:
1. 灵感搜索:通过 search_gallery 语义检索 1300+ 精选提示词,配合 get_inspiration 获取完整提示与高清参考图
2. 提示增强:enhance_prompt 将简短描述扩展为包含光照、构图、材质的专业级提示词,支持 realistic/anime/illustration 三档风格
3. 图像生成:generate_image 自动选择最优提供商,支持 aspect ratio、seed、参考图等参数;本地文件自动压缩上传(最大 2MB/2048px)
4. ComfyUI 工作流:本地用户可通过 comfyui_workflow 管理、修改模板参数,无需手动编辑 JSON
显著优点
- 零门槛入门:搜索、增强、灵感工具无需 API key 即可使用
- 智能路由:无需手动指定模型/提供商,系统自动匹配最优选项
- 多模态参考:支持 URL、本地路径、历史生成图作为风格参考,Midjourney 支持
--sref风格代码 - 工作流友好:从灵感搜索→提示增强→批量生成→衍生设计的完整创作链路
局限性与注意事项
- 视觉盲区:AI 无法查看生成结果,仅能返回工具响应的 URL/路径数据,不能描述图像内容
- Midjourney 参数锁定:stylize/chaos/weird 等高级参数固定为服务端默认值,仅
sref可通过提示词尾部代码调整 - Niji 7 内容限制:仅适用于 anime/illustration,强行用于写实内容效果不佳,需显式设置
style: 'anime'进行提示增强 - 并行限制:API 提供商最多 4 张并行,ComfyUI 本地工作流仅支持串行
适合人群
- 需要快速产出概念图、产品摄影、角色设计的视觉创作者
- 希望统一管理多 AI 提供商、避免在各平台间切换的工作室/团队
- 拥有本地 ComfyUI 环境、追求参数精细控制的技术型用户
常规风险
- 版权与合规:生成内容可能涉及训练数据版权争议,商业使用需确认各提供商条款
- API 成本:Midjourney V7/Niji 7 单次 15 积分约 60 秒,高频使用需监控额度消耗
- 本地环境依赖:ComfyUI 模式需要自行维护节点环境与模型文件,配置门槛较高