使用说明

核心用法

该skill作为GPT Image 2（ChatGPT Images 2.0）的本地代理层，让用户在Claude Code中直接调用已通过ChatGPT Plus/Pro订阅获得的图像生成能力。通过封装codex CLI命令，实现零配置复用现有登录态：文生图直接透传prompt，图生图通过--ref参数支持多参考图合成与风格迁移。

技术路径：执行codex exec --enable image_generation，利用本地session目录diff检测新生成的rollout，从中提取base64图像payload解码输出。关键约束包括必须启用image_generationfeature flag、禁止使用--ephemeral模式（否则session不持久化导致无法提取图像）。

显著优点

1. 成本结构友好：零边际成本复用ChatGPT订阅，无Fal/Replicate等第三方推理平台的按次计费
2. 本地化隐私：图像生成全程走用户自有Codex CLI会话，无额外网络出口或telemetry
3. 功能完整性：支持多参考图组合、风格迁移、图文混排等Image 2原生能力，非简化版API封装
4. 权限隔离设计：脚本仅读写本次调用产生的session文件，通过目录快照diff机制避免触碰历史Codex对话数据

潜在局限与风险

硬性依赖门槛：必须同时满足①本地安装codex CLI ②有效ChatGPT Plus/Pro登录态且账户已开通Image 2权限。任一缺失即完全不可用（exit code 3/5/7）。无订阅用户需转向RunComfy托管方案，形成体验断点。

版本耦合脆弱性：依赖特定CLI行为（0.111.0+的flag语义），OpenAI后续迭代可能破坏提取逻辑。--enable image_generation作为under-development flag存在随时变更或移除风险。

并发与性能：文件系统快照diff机制天然串行化，无并发调用支持；300秒默认超时对大尺寸多参考合成可能不足。

授权边界模糊：通过codex exec复用ChatGPT网页版权限，处于OpenAI ToS灰色地带——虽技术上可行，但官方未明确CLI调用是否等同于网页版合理使用范畴。

适合人群

已订阅ChatGPT Plus/Pro且频繁使用Image 2的重度用户
追求"订阅费已付即无限使用"成本模型、厌恶按次计费波动的价格敏感者
对数据不出本地有强需求（医疗、法律、金融视觉内容生成）的企业/个人
需要将Image 2集成进自动化工作流（配合Claude Code的agent能力）的开发者

常规风险提示

订阅失效即服务归零：ChatGPT订阅中断或Image 2功能权限调整将直接导致技能失效
输出路径污染：默认写入当前工作目录，多agent并行时需注意文件名冲突
提取失败兜底弱：exit code 6/7时仅返回错误层定位，用户需自行排查session目录状态或重新登录
无内容过滤层：直接透传用户prompt至OpenAI，敏感内容拦截依赖OpenAI后端策略，可能产生不可预期的拒绝或账户风险

安全解读

核心用法

GPT Image 2 是一个桥接型 Skill，允许用户通过 Claude Code 调用 ChatGPT Plus/Pro 订阅中的 GPT Image 2（即 ChatGPT Images 2.0）图像生成功能。它并非独立图像模型，而是通过本地 codex CLI 复用用户已登录的 ChatGPT 会话，实现零额外成本的图像生成。

触发方式：用户需显式提及 "gpt image 2"、"ChatGPT Images 2.0" 或类似指令。Skill 不会自动接管普通的 "生成图片" 请求。

两大模式：

文生图：bash scripts/gen.sh --prompt "..." --out /path/to/output.png
图生图/风格迁移：添加 --ref /path/to/reference.png 参数，可重复用于多图参考合成

技术实现上，Skill 通过快照对比 ~/.codex/sessions/ 目录，定位 codex exec 创建的会话文件，从中提取 base64 图像数据并解码输出。

显著优点

1. 成本优势：零边际成本，不消耗 OpenAI API 额度，无需 Fal/Replicate 等第三方 token
2. 功能完整：支持文本生成、图像编辑、风格迁移、多参考合成，且 Image 2 对图文混排（infographics、时间线）表现优异
3. 数据隔离：仅读取自身调用产生的会话文件，通过"快照-对比"机制确保不触碰用户历史 Codex 对话
4. 代码精简：250 行 Python/Bash，无第三方依赖，仅依赖系统标准库与 codex CLI
5. 安全设计：路径遍历防护、输出扩展名白名单（.png/.jpg/.webp）、临时文件自动清理

潜在缺点与局限性

1. 硬性前置依赖：必须同时满足（1）ChatGPT Plus/Pro 订阅含图像生成权限；（2）本地安装并登录 codex CLI。任一条件不满足即完全不可用
2. 非官方 API 通道：依赖 codex CLI 的 --enable image_generation 实验性功能，该接口可能随 OpenAI 更新而变更或失效
3. 单会话串行：并发调用被文件系统快照机制串行化，不适合高频批量生成场景
4. 无云端兜底：纯本地 workflow，无法像 RunComfy 托管方案那样脱离本地环境使用
5. 错误码需人工解读：失败时需对照 exit code（3=CLI 缺失、5=生成失败、7=无图像产出等），对用户不够友好

适合人群

已订阅 ChatGPT Plus/Pro 且希望"物尽其用"的开发者
注重隐私、希望图像数据不经过第三方中转的本地优先用户
需要快速风格迁移、多参考合成的设计师/创作者
不想管理额外 API Key 或按图计费的企业内部工具场景

常规风险

功能可用性风险：image_generation 为实验性功能，OpenAI 可能随时调整权限或移除
认证过期风险：codex login 会话可能过期，需用户手动重新登录
生成配额风险：ChatGPT 订阅层的图像生成存在隐性速率限制，大量调用可能触发限流
路径安全虽完善，但仍需信任：虽实施路径验证，但 Skill 仍需读写本地文件系统，建议在隔离环境运行
非官方 Skill 的维护风险：由 agentspace-so 社区维护，非 OpenAI 官方集成，更新响应取决于维护者

image-generation gpt-image-2 codex-cli chatgpt-subscription local-execution style-transfer multi-reference openai

🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription 内容

scripts文件夹

手动下载zip · 7.1 kB

extract_image.pytext/plain

请选择文件