🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription

🪞 用 ChatGPT 订阅本地生图,零 API 成本

将 ChatGPT Plus/Pro 的 GPT Image 2 能力接入 Claude Code,支持文生图、图生图编辑及风格迁移,无需额外 API 密钥,依赖本地 Codex CLI 运行。

收藏
11.3k
安装
4.5k
版本
1.0.5
CLS 安全性认证2026-05-06
点击查看完整报告 >

使用说明

核心用法

GPT Image 2 技能允许用户在 Claude Code 环境中直接调用 ChatGPT Plus 或 Pro 订阅包含的 GPT Image 2(ChatGPT Images 2.0)图像生成能力。通过本地 codex CLI 工具执行图像生成任务,无需单独申请 OpenAI API、无需按量计费,也无需第三方平台(如 Fal、Replicate)的 token。

支持两种主要模式:

  • 文生图(Text-to-Image):直接根据文本描述生成图像
  • 图生图(Image-to-Image):以上传图片为参考,进行重绘、风格迁移、编辑等操作,支持多参考图组合

调用方式简洁,通过 bash scripts/gen.sh 脚本封装,自动处理会话快照、图像提取和文件输出。脚本会扫描 codex exec 生成的会话文件,提取 base64 编码的图像数据并解码保存。

显著优点

  • 零额外成本:复用现有 ChatGPT 订阅,无单独计费
  • 无需 API 管理:不依赖 OpenAI 开发者账号或 API key
  • 本地化执行:通过 Codex CLI 在本地运行,数据不经过第三方中转
  • 功能完整:支持 GPT Image 2 全特性,包括复杂图文排版、多参考图合成
  • 透明数据:仅读取本次调用产生的会话文件,不触碰历史数据

潜在缺点与局限性

  • 硬性依赖:必须同时满足 ChatGPT Plus/Pro 订阅 + 本地安装并登录 Codex CLI 两个条件
  • 功能开关限制:需显式启用 --enable image_generation,该功能仍在开发中,可能不稳定
  • 无并发支持:单次调用串行执行,文件系统快照机制不支持并发
  • 平台限制:Codex CLI 主要面向 macOS/Linux,Windows 支持可能有限
  • 故障排查复杂:退出码涵盖从认证失败到模型拒绝的多种情况,用户需自行判断层级

适合人群

  • 已订阅 ChatGPT Plus/Pro 且希望在工作流中集成图像生成的开发者
  • 不想管理多套 API 凭证、偏好使用现有订阅的技术用户
  • 需要图生图编辑、风格迁移等高级功能的创意工作者
  • 注重数据本地化、不希望图像数据经过第三方平台的隐私敏感用户

常规风险

  • 订阅失效风险:ChatGPT 订阅到期或 OpenAI 调整功能策略将直接导致技能不可用
  • CLI 版本漂移:Codex CLI 快速迭代,特定 flag(如 --ephemeral 禁用要求)可能随版本变化
  • 认证状态依赖codex login 会话过期或被封禁会中断服务,且错误信息可能模糊(退出码 5/7 涵盖多种失败场景)
  • 功能灰度风险image_generation 为开发中功能,存在被移除或调整的可能
  • 本地环境依赖:Python 3 和 codex 二进制必须可用,跨设备迁移需重新配置
  • 无 fallback 机制:文档明确要求不得自动切换至其他模型或 HTML mockup,硬性失败时体验中断

安全解读

核心用法

gpt-image-2 是一个桥接型 Skill,允许用户在 Claude Code 环境中通过本地 Codex CLI 调用 ChatGPT Plus/Pro 订阅内置的 GPT Image 2(ChatGPT Images 2.0)图像生成功能。用户无需单独申请 OpenAI API Key、无需按量计费、无需第三方推理服务(如 Fal/Replicate)的 Token。

触发条件:用户明确提及 "gpt image 2"、"gpt-image-2"、"ChatGPT Images 2.0"、"image 2" 或明确要求通过 ChatGPT 订阅生成/编辑图片时触发。Skill 不会自动介入普通的 "generate an image" 请求。

调用方式

  • 文生图bash scripts/gen.sh --prompt "..." --out /path/to/output.png
  • 图生图/风格迁移bash scripts/gen.sh --prompt "..." --ref /path/to/ref.png --out /path/to/output.png
  • 支持多参考图组合(--ref 可重复)

技术原理:脚本先快照 ~/.codex/sessions/ 目录,执行 codex exec --enable image_generation --sandbox read-only(必须启用该功能标志,且禁用 --ephemeral 以便持久化会话),然后通过差异比对定位新生成的 rollout JSONL,由 Python 脚本提取 base64 编码的最大图像 blob 并解码保存。

显著优点

1. 零额外成本:直接复用现有的 ChatGPT Plus/Pro 订阅,无按图像计费、无 API 账单
2. 本地执行:所有操作通过用户本地已登录的 Codex CLI 完成,无外部服务托管风险

3. 功能完整:支持文本生成图像、图像编辑(inpainting/outpainting)、风格迁移、多参考图合成

4. 文本渲染优秀:Image 2 在信息图、时间轴等含大量文字的布局上表现良好

5. 数据隔离:通过目录快照机制确保仅读取本次调用产生的会话数据,不触碰历史记录

潜在缺点与局限性

1. 硬性依赖门槛:必须同时具备 (a) ChatGPT Plus/Pro 订阅且含图像生成权益;(b) 本地安装并登录 Codex CLI。两者缺一不可
2. 功能标志限制--enable image_generation 处于开发阶段,可能不稳定或被调整

3. 单租户序列化:并发调用会被文件系统快照机制序列化,不适合高并发场景

4. 无直接 API 兜底:若用户无 ChatGPT 订阅,需改用 RunComfy 等托管方案(文档已提供链接),无法通过本 Skill 降级处理

5. 平台限制:Codex CLI 主要支持 macOS(Homebrew)和 Linux,Windows 支持有限

适合人群

  • 已有 ChatGPT Plus/Pro 订阅的开发者/创作者,希望在不增加开支的前提下将图像生成整合到 Claude Code 工作流
  • 需要频繁进行图生图编辑(风格迁移、局部重绘)且偏好本地执行的用户
  • 数据隐私敏感,希望图像生成过程完全在本地环境完成、不经过第三方托管服务的团队
  • 制作信息图、时间轴、含文字布局等 Image 2 擅长领域的用户

常规风险

  • 订阅失效风险:ChatGPT 订阅过期或图像生成功能被调整时,Skill 将返回 exit code 7(无图像负载)
  • 功能标志变更:OpenAI 可能调整 image_generation 功能的可用性或参数要求
  • 路径遍历风险:已通过 FORBIDDEN_OUTPUT_PREFIXES 白名单机制缓解(安全认证确认)
  • 依赖项风险:Codex CLI 版本更新可能引入不兼容变更,需保持更新
  • 无运行时沙箱:虽然调用时使用 --sandbox read-only,但 Skill 本身以用户权限运行,需信任来源(已通过 T2 级可信组织认证)

🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription 内容

scripts文件夹
手动下载zip · 7.1 kB
extract_image.pytext/plain
请选择文件