核心用法
ComfyUI-OpenClaw Skill 是一款面向 ComfyUI 的 API 代理封装工具,旨在通过命令行接口实现高效的图像生成与控制。用户可通过 exec 命令调用 comfy_client.py 脚本,指定模板 ID、提示词及可选参数(输入图像路径、方向),即可完成文生图(gen_z)或图生图/编辑(qwen_edit)任务。技能采用模板映射机制,将完整的 ComfyUI JSON 工作流抽象为简短的 template_id,显著减少令牌消耗。输出图像默认保存至 outputs/comfy/ 目录,支持通过消息插件或本地工具直接交付,避免 base64 数据污染 LLM 上下文。
显著优点
1. 令牌效率优化:通过模板 ID 引用而非传输完整 JSON,极大降低 API 调用成本;结合元数据文件路径优先策略,减少不必要的视觉分析。
2. 模块化扩展性:工作流文件自包含于技能目录,新增模板仅需放置 JSON 文件并更新 WORKFLOW_MAP 字典,无需修改核心逻辑。
3. 自动化资源处理:内置图像上传与结果轮询机制,支持图像到图像任务的自动资源流转。
4. 多方向输出支持:预设 portrait(720x1280)与 landscape(1280x720)两种常用分辨率,覆盖主流应用场景。
潜在缺点与局限性
- 网络依赖:技能依赖固定 IP 的 ComfyUI 后端(
192.168.1.38:8190),局域网外或后端宕机时将完全失效。 - 模板维护成本:新增复杂工作流需理解 ComfyUI 节点注入逻辑,非技术用户可能面临学习曲线。
- 安全边界模糊:配置文件中的内网地址暴露潜在攻击面,若后端未配置认证,可能存在未授权访问风险。
- 错误处理不透明:报告未详述异常处理机制,如后端超时或工作流执行失败时的降级策略。
适合人群
- AI 艺术工作流开发者:需要将 ComfyUI 集成至自动化管道或代理系统的技术用户。
- 内容批量生成需求者:社交媒体运营、游戏资产生成等高频图像产出场景。
- 令牌敏感型应用:受限于 LLM 上下文长度或 API 成本,需严格控制传输数据量的项目。
常规风险
1. 服务端安全风险:内网 ComfyUI 实例若暴露于公网或未加固,可能成为命令执行或文件遍历攻击的入口。
2. 路径遍历漏洞:若 input_image_path 参数未严格校验,可能导致未授权文件读取。
3. 依赖项风险:comfy_client.py 的第三方依赖(如 requests 版本)可能存在已知 CVE,需定期审计。
4. 数据残留风险:输出目录的生成图像若含敏感内容,需配置自动清理或访问控制,防止信息泄露。