comfyui-imagegen

🎨 本地Flux2智能图像生成引擎

基于Flux2的本地ComfyUI图像生成技能,支持结构化JSON提示精准控制,异步低延迟生成,适合专业AI绘图工作流。

收藏
7.7k
安装
1.7k
版本
v1.5.0
CLS 安全性认证2026-05-08
点击查看完整报告 >

使用说明

ComfyUI ImageGen 是一款专为本地 ComfyUI 服务设计的图像生成技能,基于 Flux2 [klein] 9B 模型工作流,通过 API 方式实现高质量的 AI 图像创作。该技能的核心创新在于采用结构化 JSON 提示词系统,将自然语言请求转换为包含场景、主体、光照、构图、相机参数等维度的机器可读格式,直接作为 ComfyUI 的 positive prompt 参数传输,避免了传统文本转换过程中的信息损失与语义偏差。

该技能提供两种运行模式:异步模式(推荐)通过 sessions_spawn 启动子代理轮询任务,每 5 秒检查一次生成状态,完成后自动通过 Telegram 发送图像,相比主代理阻塞等待可节省约 10 倍 token 消耗,显著降低大模型上下文压力;同步模式则适用于快速验证和脚本化调用。支持自定义种子、采样步数(默认 5 步适合快速预览,质量模式建议 20-50 步)和输出路径,生成图像自动嵌入提示词元数据便于后续管理与追溯。

显著优势包括精确的结构化控制能力,用户可通过 JSON 精确定义画面中多个主体的位置、动作、艺术风格、色彩调色板等细节;与本地 ComfyUI 的深度集成确保数据隐私,所有生成过程在本地完成,提示词不会上传至第三方云端;轮询机制设计合理,实现低延迟(<5秒)状态感知的同时避免长时间阻塞对话上下文,支持批量任务并发处理。

局限性方面,该技能严格依赖本地运行的 ComfyUI 服务(默认 localhost:8188),未部署环境的用户完全无法使用;当前仅适配特定的 Flux2 工作流和 darkBeastFeb0826Latest_dbkBlitzV15 模型,缺乏多模型切换灵活性;结构化提示词需要一定的学习成本,对于简单快速生成场景可能显得繁琐;作为 T3 来源的个人开发者作品,长期维护更新与社区支持稳定性有待观察;此外,生成高分辨率图像(1920x1080)对本地 GPU 显存有较高要求。

适合目标群体包括:已在本地部署 ComfyUI 的 AI 绘画爱好者与专业设计师、需要批量生成图像的内容创作者与运营人员、对提示词构图精度有严格要求的技术用户,以及希望将图像生成深度集成到自动化工作流(如 Telegram Bot、定时任务)的开发者。

使用风险主要涉及本地服务可用性(ComfyUI 未启动或端口冲突会导致请求失败)、文件系统权限(需要写入权限保存生成图像至指定路径)、以及网络配置安全(--host 参数允许指向任意地址,若误配置至不可信的远程 ComfyUI 实例可能导致提示词泄露)。建议仅在可信的本地网络环境使用,定期检查输出目录磁盘空间,并避免在公共网络环境下暴露 ComfyUI 服务端口。

安全解读

核心用法

ComfyUI ImageGen 是一款面向本地AI图像生成的自动化工具,通过调用ComfyUI API实现Flux2工作流图像生成。核心流程为:用户自然语言请求 → Agent转换为结构化JSON → 本地ComfyUI生成 → 异步或同步返回结果。

结构化提示系统是该Skill的亮点。Agent将人类语言解析为标准化JSON Schema,包含subjects(主体)、scene(场景)、lighting(光照)、mood(情绪)、camera(相机参数)等字段,避免了传统关键词堆砌的低效提示方式。这种结构化方法尤其适合复杂构图需求,如多主体定位、特定镜头效果等。

双模式执行

  • 异步模式(推荐):使用sessions_spawn创建子代理轮询器,每5秒查询一次任务状态,生成完成后自动发送至Telegram。相比主代理阻塞等待,可节省约10倍token消耗,延迟控制在5秒以内。
  • 同步模式:主代理直接执行并等待结果,适合快速测试或低并发场景。

技术细节:默认连接localhost:8188,支持自定义host/seed/steps参数,输出1920x1080 16:9图像,模型采用darkBeastFeb0826Latest_dbkBlitzV15,元数据自动嵌入。

显著优点

1. token效率优化:异步子代理设计是架构亮点,将轮询开销从主代理转移至隔离环境,大幅降低运行成本
2. 提示质量提升:结构化JSON替代自由文本,遵循Flux.2最佳实践(Subject→Scene→Lighting→Mood),生成结果更可控

3. 生产级稳定:v1.5.0经过实机测试,--structured-prompt无需位置参数,边缘情况处理成熟

4. 安全隔离:纯本地通信,无外部API依赖,适合敏感内容生成场景

潜在局限

  • 环境依赖:必须预装并运行ComfyUI服务(localhost:8188),无法开箱即用
  • 硬件门槛:Flux2图像生成依赖本地GPU算力,低配置设备生成时间较长
  • 调试复杂度:异步模式下,子代理异常需通过日志追踪,问题定位略繁琐
  • 生态锁定:深度绑定ComfyUI生态,迁移至其他推理引擎(如Automatic1111)需重构

适合人群

  • 已部署本地ComfyUI/Flux2环境的Stable Diffusion进阶用户
  • 需要批量生成、定时任务等自动化工作流的效率型用户
  • 对token成本敏感、追求高并发代理架构的开发者
  • 注重隐私安全、不愿上传提示词至云端API的敏感场景使用者

常规风险

  • 本地服务暴露风险:若ComfyUI配置不当监听0.0.0.0,可能意外暴露生成接口至公网
  • 文件系统占用:未配置cleanup时,生成图像持续累积可能占满磁盘
  • 模型版权合规:所用模型及生成内容的商业使用需遵循相应许可证
  • 提示词注入:虽经JSON结构化,但若直接传递用户输入仍需防范恶意字段构造

comfyui-imagegen 内容

scripts文件夹
workflows文件夹
手动下载zip · 5.7 kB
generate.pytext/plain
请选择文件