OpenClaw ComfyUI

🎨 高效连接 ComfyUI 的智能图像生成引擎

🤖 AI/ML榜 #1

ComfyUI-OpenClaw Skill 是一款专为高效图像生成设计的专业代理技能,通过 API 连接 ComfyUI,支持文生图与图生图任务,具备自动资源处理与令牌优化策略,适合需要批量生成或自动化图像工作流的开发者与创作者。

收藏
10.7k
安装
2.6k
版本
1.0.3
CLS 安全性认证2026-05-12
点击查看完整报告 >

使用说明

核心用法

ComfyUI-OpenClaw Skill 是一款面向 ComfyUI 的 API 代理封装工具,旨在通过命令行接口实现高效的图像生成与控制。用户可通过 exec 命令调用 comfy_client.py 脚本,指定模板 ID、提示词及可选参数(输入图像路径、方向),即可完成文生图(gen_z)或图生图/编辑(qwen_edit)任务。技能采用模板映射机制,将完整的 ComfyUI JSON 工作流抽象为简短的 template_id,显著减少令牌消耗。输出图像默认保存至 outputs/comfy/ 目录,支持通过消息插件或本地工具直接交付,避免 base64 数据污染 LLM 上下文。

显著优点

1. 令牌效率优化:通过模板 ID 引用而非传输完整 JSON,极大降低 API 调用成本;结合元数据文件路径优先策略,减少不必要的视觉分析。
2. 模块化扩展性:工作流文件自包含于技能目录,新增模板仅需放置 JSON 文件并更新 WORKFLOW_MAP 字典,无需修改核心逻辑。

3. 自动化资源处理:内置图像上传与结果轮询机制,支持图像到图像任务的自动资源流转。

4. 多方向输出支持:预设 portrait(720x1280)与 landscape(1280x720)两种常用分辨率,覆盖主流应用场景。

潜在缺点与局限性

  • 网络依赖:技能依赖固定 IP 的 ComfyUI 后端(192.168.1.38:8190),局域网外或后端宕机时将完全失效。
  • 模板维护成本:新增复杂工作流需理解 ComfyUI 节点注入逻辑,非技术用户可能面临学习曲线。
  • 安全边界模糊:配置文件中的内网地址暴露潜在攻击面,若后端未配置认证,可能存在未授权访问风险。
  • 错误处理不透明:报告未详述异常处理机制,如后端超时或工作流执行失败时的降级策略。

适合人群

  • AI 艺术工作流开发者:需要将 ComfyUI 集成至自动化管道或代理系统的技术用户。
  • 内容批量生成需求者:社交媒体运营、游戏资产生成等高频图像产出场景。
  • 令牌敏感型应用:受限于 LLM 上下文长度或 API 成本,需严格控制传输数据量的项目。

常规风险

1. 服务端安全风险:内网 ComfyUI 实例若暴露于公网或未加固,可能成为命令执行或文件遍历攻击的入口。
2. 路径遍历漏洞:若 input_image_path 参数未严格校验,可能导致未授权文件读取。

3. 依赖项风险comfy_client.py 的第三方依赖(如 requests 版本)可能存在已知 CVE,需定期审计。

4. 数据残留风险:输出目录的生成图像若含敏感内容,需配置自动清理或访问控制,防止信息泄露。

安全解读

核心用法

ComfyUI-OpenClaw Skill 是一个专为 OpenClaw 代理设计的 ComfyUI API 控制工具,通过 CLI 命令调用实现图像生成工作流的自动化管理。核心脚本 comfy_client.py 封装了提示词注入、图片上传和结果轮询的完整流程,支持两种预设模板:gen_z 用于文生图(Text-to-Image),qwen_edit 用于图生图/图像编辑(Image-to-Image)。用户只需指定模板 ID、提示词及可选参数(输入图片路径、横竖屏方向),即可完成复杂的 ComfyUI 工作流调用。

显著优点

1. Token 节省架构:采用模板 ID 映射机制,避免在对话中传输完整的 Workflow JSON;优先使用文件路径而非 Vision 分析,进一步降低上下文窗口负担。
2. 零依赖轻量化:仅依赖标准库和 requests,无第三方依赖包,部署简单,安全风险可控。

3. 自动资源管理:内置图片自动上传、结果轮询和本地存储管理,输出目录隔离于 outputs/comfy/,避免污染工作空间。

4. 可扩展设计:通过修改 WORKFLOW_MAP 字典即可快速接入新的 ComfyUI 工作流,无需改动核心逻辑。

潜在缺点与局限性

1. 内网 HTTP 通信:默认使用未加密的 HTTP 协议与 ComfyUI 服务通信(192.168.1.38:8190),虽在内网环境风险可控,但生产场景建议配置 HTTPS。
2. 输入验证基础:当前对提示词长度、文件类型及路径遍历的防护较为简单,需用户自行确保输入安全。

3. 错误处理单一:网络请求失败时直接返回错误,缺乏指数退避重试机制,在不稳定网络环境下可能影响可靠性。

4. T3 来源可信度:作为个人开发者/社区项目(Maintainer: SalmonRK),用户需自行审查代码并关注后续更新。

适合人群

  • 需要在本地化环境中集成 ComfyUI 的 AI 应用开发者
  • 追求 Token 效率、希望降低 LLM 上下文负担的代理系统构建者
  • 熟悉 ComfyUI 工作流设计、具备一定 Python 调试能力的进阶用户

常规风险

  • 网络隔离风险:依赖固定内网地址,若 ComfyUI 服务迁移或端口变更需手动更新配置
  • 文件系统风险:虽限定于工作流和输出目录,但仍需注意避免通过 input_image_path 注入恶意路径
  • 隐私合规:当前实现符合 GDPR/CCPA 数据最小化原则,未主动收集敏感信息

---

安全评级:S(优秀)—— 静态分析、动态行为、依赖审计、网络流量、隐私合规、威胁情报六项指标均通过,仅发现 1 项已确认的低风险内网 HTTP 通信问题。

OpenClaw ComfyUI 内容

workflows文件夹
手动下载zip · 7.8 kB
image_z_image_turbo.jsonapplication/json
请选择文件