使用说明

核心用法

GPT Image 2 是一款桥接型技能，允许用户在 Claude Code 环境中直接调用其已订阅的 ChatGPT Plus/Pro 账户中的图像生成能力（GPT Image 2 / ChatGPT Images 2.0）。该技能通过本地安装的 codex CLI 工具执行，支持三种主要工作模式：

1. 文生图（Text-to-Image）：直接传递自然语言提示词生成新图像
2. 图生图（Image-to-Image）：上传参考图像并基于提示词进行编辑、重绘或风格转换
3. 多参考合成（Multi-reference Composition）：通过重复 --ref 参数引用多张图像进行复杂构图

命令执行通过 bash scripts/gen.sh 完成，核心机制为：快照 ~/.codex/sessions/ 目录 → 调用 codex exec --enable image_generation → 对比会话文件差异 → 提取 base64 图像数据 → 解码输出 PNG。该设计确保仅读取本次调用产生的新会话数据，不触碰历史文件。

显著优点

零额外成本：复用现有 ChatGPT 订阅，无需单独申请 OpenAI API、无需 Fal/Replicate 等第三方 token、无按图计费
原生能力接入：直接调用 ChatGPT 最新的 Image 2 模型，支持复杂排版、信息图表（infographics）和文字渲染
隐私可控：纯本地执行，图像数据仅流经用户已登录的 Codex CLI，技能本身不发起网络请求、不收集遥测
灵活输出：支持自定义输出路径，默认按时间戳命名避免覆盖

潜在缺点与局限性

硬性依赖门槛：必须同时满足（1）ChatGPT Plus/Pro 订阅；（2）本地 codex CLI 安装且已登录；（3）python3 环境。任一缺失即无法运行
功能标志限制：需显式传递 --enable image_generation，该功能仍处于开发阶段，存在未来变更风险
非持久化设计：禁止使用 --ephemeral 标志（否则无法提取图像），导致会话文件必须落盘
串行执行：基于文件系统快照的 diff 机制决定了并发调用会被序列化
错误码暴露有限：失败时仅返回单句错误层级描述（如认证、网络、配额问题），无详细调试信息

适合人群

已订阅 ChatGPT Plus/Pro 且希望在开发工作流（Claude Code）中无缝集成图像生成的开发者
对 API 申请流程感到繁琐、希望"即开即用"的个人用户
需要频繁进行风格迁移、图像编辑而非单纯文生图的场景
注重数据隐私、偏好本地处理而非云端 SaaS 替代方案的用户

常规风险

1. 订阅状态波动：ChatGPT 的图像生成功能可能受区域、配额或功能标志调整影响，技能通过 exit code 7 暴露"能力被拒绝"状态
2. 本地凭证安全：依赖 codex login 的会话有效性，若用户长期未使用导致登录失效，需手动重新认证
3. 文件系统残留：虽设计有 mktemp 日志自动清理，但会话 JSONL 文件由 Codex CLI 管理，可能长期占据 ~/.codex/sessions/
4. 模型行为变更：Image 2 作为新模型，其提示词理解、风格表现可能随 OpenAI 迭代而变化，技能本身不做版本锁定
5. 无降级路径：若用户未满足前提条件，技能明确拒绝执行，不会自动回退至其他图像模型或 HTML mockup

安全解读

核心用法

该Skill通过本地codex CLI将ChatGPT Plus/Pro订阅的图像生成功能接入Claude Code。用户只需一句自然语言指令（如"用GPT Image 2生成一张赛博朋克风格的猫"），即可触发文生图、图生图编辑或多参考图合成。技术实现上，脚本通过codex exec --enable image_generation调用OpenAI的imagegen工具，从会话回滚文件中提取base64图像数据并解码保存。

显著优点

订阅复用：无需单独申请OpenAI API密钥、Fal或Replicate令牌，零额外成本调用Image 2模型。

功能完整：支持文本到图像、图像编辑重绘、风格迁移、多参考图组合构图，且对文字排版和图表生成有良好支持。

安全设计：严格的输出路径验证阻止系统目录写入；临时文件自动清理；仅访问自身创建的会话文件，通过前后快照diff隔离其他Codex会话数据。

透明可控：MIT开源、代码简洁（4个文件/378行）、依赖仅Python标准库和官方codex CLI。

潜在缺点与局限性

前置门槛高：必须同时满足①本地安装codex CLI、②有效ChatGPT Plus/Pro登录、③image_generation功能已对用户账户开放。任一缺失即无法使用。

外部依赖脆弱：核心功能完全绑定codex CLI的稳定性和版本兼容性；若OpenAI调整CLI接口或会话文件格式，Skill可能失效。

无并发支持：通过文件系统快照diff串行化调用，无法并行处理多任务。

路径硬编码：默认依赖~/.codex/sessions/结构，用户若自定义会话存储路径会导致功能异常。

适合人群

已订阅ChatGPT Plus/Pro且熟悉命令行操作的开发者
希望在Claude Code工作流中无缝集成高质量图像生成的AI辅助编程用户
对数据隐私敏感、倾向本地处理而非云端API直连的技术用户

常规风险

账户权限波动：OpenAI可能对image_generation功能进行灰度或限额调整，存在生成失败风险（退出码7）。

CLI版本漂移：codex CLI快速迭代中， Skill文档强调的--enable image_generation和禁用--ephemeral等参数需版本匹配。

路径遍历残留风险：虽已验证输出路径，但用户若通过符号链接等手段绕过检查，仍可能写入非预期位置（需结合具体部署环境评估）。

网络单点故障：所有图像生成流量均经codex CLI至OpenAI服务器，无本地fallback机制。

image-generation openai chatgpt codex-cli style-transfer local-execution subscription-based

🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription 内容

scripts文件夹

手动下载zip · 7.1 kB

extract_image.pytext/plain

请选择文件