🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription

🪞 ChatGPT 订阅即用的 AI 绘图引擎

creative榜 #10

通过本地 Codex CLI 调用 ChatGPT Plus/Pro 订阅的 GPT Image 2 能力,实现文生图、图生图与风格迁移,无需额外 API 密钥或按图计费

收藏
9.2k
安装
4.5k
版本
1.0.3
CLS 安全性认证2026-05-20
点击查看完整报告 >

使用说明

核心用法

GPT Image 2 是一款桥接型技能,允许用户在 Claude Code 环境中直接调用其已订阅的 ChatGPT Plus/Pro 账户中的图像生成能力(GPT Image 2 / ChatGPT Images 2.0)。该技能通过本地安装的 codex CLI 工具执行,支持三种主要工作模式:

1. 文生图(Text-to-Image):直接传递自然语言提示词生成新图像
2. 图生图(Image-to-Image):上传参考图像并基于提示词进行编辑、重绘或风格转换

3. 多参考合成(Multi-reference Composition):通过重复 --ref 参数引用多张图像进行复杂构图

命令执行通过 bash scripts/gen.sh 完成,核心机制为:快照 ~/.codex/sessions/ 目录 → 调用 codex exec --enable image_generation → 对比会话文件差异 → 提取 base64 图像数据 → 解码输出 PNG。该设计确保仅读取本次调用产生的新会话数据,不触碰历史文件。

显著优点

  • 零额外成本:复用现有 ChatGPT 订阅,无需单独申请 OpenAI API、无需 Fal/Replicate 等第三方 token、无按图计费
  • 原生能力接入:直接调用 ChatGPT 最新的 Image 2 模型,支持复杂排版、信息图表(infographics)和文字渲染
  • 隐私可控:纯本地执行,图像数据仅流经用户已登录的 Codex CLI,技能本身不发起网络请求、不收集遥测
  • 灵活输出:支持自定义输出路径,默认按时间戳命名避免覆盖

潜在缺点与局限性

  • 硬性依赖门槛:必须同时满足(1)ChatGPT Plus/Pro 订阅;(2)本地 codex CLI 安装且已登录;(3)python3 环境。任一缺失即无法运行
  • 功能标志限制:需显式传递 --enable image_generation,该功能仍处于开发阶段,存在未来变更风险
  • 非持久化设计:禁止使用 --ephemeral 标志(否则无法提取图像),导致会话文件必须落盘
  • 串行执行:基于文件系统快照的 diff 机制决定了并发调用会被序列化
  • 错误码暴露有限:失败时仅返回单句错误层级描述(如认证、网络、配额问题),无详细调试信息

适合人群

  • 已订阅 ChatGPT Plus/Pro 且希望在开发工作流(Claude Code)中无缝集成图像生成的开发者
  • 对 API 申请流程感到繁琐、希望"即开即用"的个人用户
  • 需要频繁进行风格迁移、图像编辑而非单纯文生图的场景
  • 注重数据隐私、偏好本地处理而非云端 SaaS 替代方案的用户

常规风险

1. 订阅状态波动:ChatGPT 的图像生成功能可能受区域、配额或功能标志调整影响,技能通过 exit code 7 暴露"能力被拒绝"状态
2. 本地凭证安全:依赖 codex login 的会话有效性,若用户长期未使用导致登录失效,需手动重新认证

3. 文件系统残留:虽设计有 mktemp 日志自动清理,但会话 JSONL 文件由 Codex CLI 管理,可能长期占据 ~/.codex/sessions/

4. 模型行为变更:Image 2 作为新模型,其提示词理解、风格表现可能随 OpenAI 迭代而变化,技能本身不做版本锁定

5. 无降级路径:若用户未满足前提条件,技能明确拒绝执行,不会自动回退至其他图像模型或 HTML mockup

安全解读

核心用法

该Skill通过本地codex CLI将ChatGPT Plus/Pro订阅的图像生成功能接入Claude Code。用户只需一句自然语言指令(如"用GPT Image 2生成一张赛博朋克风格的猫"),即可触发文生图、图生图编辑或多参考图合成。技术实现上,脚本通过codex exec --enable image_generation调用OpenAI的imagegen工具,从会话回滚文件中提取base64图像数据并解码保存。

显著优点

订阅复用:无需单独申请OpenAI API密钥、Fal或Replicate令牌,零额外成本调用Image 2模型。

功能完整:支持文本到图像、图像编辑重绘、风格迁移、多参考图组合构图,且对文字排版和图表生成有良好支持。

安全设计:严格的输出路径验证阻止系统目录写入;临时文件自动清理;仅访问自身创建的会话文件,通过前后快照diff隔离其他Codex会话数据。

透明可控:MIT开源、代码简洁(4个文件/378行)、依赖仅Python标准库和官方codex CLI。

潜在缺点与局限性

前置门槛高:必须同时满足①本地安装codex CLI、②有效ChatGPT Plus/Pro登录、③image_generation功能已对用户账户开放。任一缺失即无法使用。

外部依赖脆弱:核心功能完全绑定codex CLI的稳定性和版本兼容性;若OpenAI调整CLI接口或会话文件格式,Skill可能失效。

无并发支持:通过文件系统快照diff串行化调用,无法并行处理多任务。

路径硬编码:默认依赖~/.codex/sessions/结构,用户若自定义会话存储路径会导致功能异常。

适合人群

  • 已订阅ChatGPT Plus/Pro且熟悉命令行操作的开发者
  • 希望在Claude Code工作流中无缝集成高质量图像生成的AI辅助编程用户
  • 对数据隐私敏感、倾向本地处理而非云端API直连的技术用户

常规风险

账户权限波动:OpenAI可能对image_generation功能进行灰度或限额调整,存在生成失败风险(退出码7)。

CLI版本漂移:codex CLI快速迭代中, Skill文档强调的--enable image_generation和禁用--ephemeral等参数需版本匹配。

路径遍历残留风险:虽已验证输出路径,但用户若通过符号链接等手段绕过检查,仍可能写入非预期位置(需结合具体部署环境评估)。

网络单点故障:所有图像生成流量均经codex CLI至OpenAI服务器,无本地fallback机制。

🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription 内容

scripts文件夹
手动下载zip · 7.1 kB
extract_image.pytext/plain
请选择文件