技能概述
ComfyUI-OpenClaw Skill 是一款专为高效调用 ComfyUI API 而设计的自动化工具,核心优势在于Token 资源优化与模板化工作流管理。该技能通过预定义的 JSON 工作流模板,避免了在对话中传输冗长的节点配置数据,显著降低上下文窗口负担。
核心用法
技能采用 CLI 调用模式,通过 python3 skills/comfyui/comfy_client.py 执行,支持两种主要功能:
1. 图像生成(gen_z 模板):基于文本提示创建新图像,默认输出 720x1280 竖版
2. 图像编辑(qwen_edit 模板):支持输入图像路径进行智能编辑,具备自动上传能力
用户仅需提供 template_id、文本提示及可选参数(图像路径/方向),无需接触底层 JSON 结构。
显著优点
- Token 效率极高:通过模板 ID 替代完整工作流 JSON,减少 90% 以上的提示词冗余
- 路径级资源管理:本地相对路径引用替代 Base64 编码,避免大体积数据传输
- 直接交付机制:图像输出直达 Telegram 或本地 Mac 显示,不占用 LLM 上下文
- 可扩展架构:新增工作流仅需放置 JSON 文件并更新映射表,无需修改核心逻辑
潜在局限
- 本地部署依赖:需预先配置 ComfyUI 服务(
192.168.1.38:8190),网络可达性影响稳定性 - 模板维护成本:工作流更新需手动同步
WORKFLOW_MAP配置 - 调试透明度低:节点级错误需查看 ComfyUI 服务端日志,CLI 层错误信息有限
- 平台锁定:当前优化策略深度绑定特定目录结构(
skills/comfyui/等)
适合人群
- 需要高频、批量图像生成的内容创作者
- 受限于 LLM 上下文长度限制的复杂工作流场景
- 已具备本地 ComfyUI 环境的 Stable Diffusion 进阶用户
- 重视 API 调用成本优化的自动化工作流设计者
常规风险
- 路径穿越风险:输入图像路径未显示经过严格校验,可能存在目录遍历隐患
- 服务端暴露:硬编码内网 IP 若配置不当,存在未授权访问 ComfyUI 接口的风险
- 依赖管理:Python 环境与
comfy_client.py的第三方库版本需持续维护 - 无内置重试机制:网络抖动可能导致单次调用失败,需上层逻辑兜底