核心用法
ComfyUI-OpenClaw Skill 是一款面向 AI 图像生成工作流的专业控制客户端,通过标准化 API 接口连接本地 ComfyUI 服务,实现高效的文生图(Text-to-Image)和图生图(Image-to-Image)功能。
主要工作模式:
- 文生图模式 (
gen_z): 调用 image_z_image_turbo.json 工作流,基于文本描述生成图像 - 图生图模式 (
qwen_edit): 调用 qwen_image_edit_2511.json 工作流,支持上传本地图片进行编辑和重绘
调用方式:
python3 skills/comfyui/comfy_client.py <template_id> "<prompt>" [input_image_path] [orientation]
方向参数: 支持 portrait (720x1280) 和 landscape (1280x720) 两种输出尺寸,默认竖屏。
扩展机制: 用户可通过添加 JSON 工作流文件到 workflows/ 目录,并在 WORKFLOW_MAP 中注册新模板 ID,快速扩展功能。
---
显著优点
1. Token 效率优化:采用模板 ID 映射机制,避免在对话中传输完整的 workflow JSON,显著降低 LLM 上下文消耗。图像通过文件路径或消息插件直接交付,不占用模型上下文。
2. 自动资源管理:内置图像上传功能,图生图任务自动处理本地图片的上传和节点注入,无需手动干预。
3. 架构清晰:代码结构简洁(144 行单文件),职责分离明确——配置文件动态读取、工作流模板隔离、客户端逻辑集中。
4. 依赖极简:仅依赖 Python 标准库和 requests,无第三方包管理风险,部署轻量。
5. 本地化优先:专为本地 ComfyUI 服务设计,数据不出本地,隐私风险极低。
---
潜在缺点与局限性
1. 网络传输安全:使用 HTTP 而非 HTTPS 与本地服务通信,在不可信网络环境中存在中间人攻击风险(RISK-001)。
2. 配置验证宽松:IP 地址和端口号的正则匹配不够严格,缺乏格式校验和危险地址过滤(RISK-002)。
3. 错误处理待完善:网络请求异常未统一捕获,可能出现未处理的连接超时或拒绝服务异常(RISK-003)。
4. 超时机制缺失:requests 调用未配置超时参数,极端网络条件下可能无限挂起。
5. 功能边界:当前仅支持两个预设工作流,复杂 ComfyUI 功能(如视频生成、批量处理)需用户自行扩展。
---
适合人群
- 本地 AI 工作流用户:已部署 ComfyUI 且希望获得自动化 API 控制能力的个人开发者
- 效率导向的创作者:需要批量生成图像、追求 Token 优化和上下文清爽的专业用户
- 隐私敏感场景:要求图像数据完全本地处理、不上传云端的使用场景
- OpenClaw 生态用户:寻求与 OpenClaw 框架无缝集成的图像生成能力扩展
---
常规风险
| 风险类型 | 等级 | 说明 |
|---------|------|------|
| 网络窃听/篡改 | 低 | HTTP 通信可被局域网内攻击者拦截,建议在可信网络使用 |
| 恶意文件上传 | 低 | 已实施文件扩展名白名单(jpg/jpeg/png/webp),但路径遍历风险需关注 |
| 配置注入 | 低 | 宽松的正则匹配理论上可能引入非法配置值 |
| 服务不可用 | 低 | 依赖本地 ComfyUI 服务,服务未启动时请求失败 |
| 依赖供应链 | 极低 | 仅使用 `requests` 标准库,无第三方依赖风险 |
建议缓解措施: 配置反向代理启用 HTTPS、添加输入校验加固、为生产环境绑定 localhost 访问。