🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription

🪞 复用ChatGPT订阅,本地无限生图

image-generation榜 #8

通过本地Codex CLI复用ChatGPT订阅调用GPT Image 2生图,支持文生图、图生图及多参考合成,无需额外API密钥或按次计费

收藏
16.6k
安装
4.5k
版本
1.0.4
CLS 安全性认证2026-05-20
点击查看完整报告 >

使用说明

核心用法

该skill作为GPT Image 2(ChatGPT Images 2.0)的本地代理层,让用户在Claude Code中直接调用已通过ChatGPT Plus/Pro订阅获得的图像生成能力。通过封装codex CLI命令,实现零配置复用现有登录态:文生图直接透传prompt,图生图通过--ref参数支持多参考图合成与风格迁移。

技术路径:执行codex exec --enable image_generation,利用本地session目录diff检测新生成的rollout,从中提取base64图像payload解码输出。关键约束包括必须启用image_generationfeature flag、禁止使用--ephemeral模式(否则session不持久化导致无法提取图像)。

显著优点

1. 成本结构友好:零边际成本复用ChatGPT订阅,无Fal/Replicate等第三方推理平台的按次计费
2. 本地化隐私:图像生成全程走用户自有Codex CLI会话,无额外网络出口或telemetry

3. 功能完整性:支持多参考图组合、风格迁移、图文混排等Image 2原生能力,非简化版API封装

4. 权限隔离设计:脚本仅读写本次调用产生的session文件,通过目录快照diff机制避免触碰历史Codex对话数据

潜在局限与风险

硬性依赖门槛:必须同时满足①本地安装codex CLI ②有效ChatGPT Plus/Pro登录态且账户已开通Image 2权限。任一缺失即完全不可用(exit code 3/5/7)。无订阅用户需转向RunComfy托管方案,形成体验断点。

版本耦合脆弱性:依赖特定CLI行为(0.111.0+的flag语义),OpenAI后续迭代可能破坏提取逻辑。--enable image_generation作为under-development flag存在随时变更或移除风险。

并发与性能:文件系统快照diff机制天然串行化,无并发调用支持;300秒默认超时对大尺寸多参考合成可能不足。

授权边界模糊:通过codex exec复用ChatGPT网页版权限,处于OpenAI ToS灰色地带——虽技术上可行,但官方未明确CLI调用是否等同于网页版合理使用范畴。

适合人群

  • 已订阅ChatGPT Plus/Pro且频繁使用Image 2的重度用户
  • 追求"订阅费已付即无限使用"成本模型、厌恶按次计费波动的价格敏感者
  • 对数据不出本地有强需求(医疗、法律、金融视觉内容生成)的企业/个人
  • 需要将Image 2集成进自动化工作流(配合Claude Code的agent能力)的开发者

常规风险提示

  • 订阅失效即服务归零:ChatGPT订阅中断或Image 2功能权限调整将直接导致技能失效
  • 输出路径污染:默认写入当前工作目录,多agent并行时需注意文件名冲突
  • 提取失败兜底弱:exit code 6/7时仅返回错误层定位,用户需自行排查session目录状态或重新登录
  • 无内容过滤层:直接透传用户prompt至OpenAI,敏感内容拦截依赖OpenAI后端策略,可能产生不可预期的拒绝或账户风险

安全解读

核心用法

GPT Image 2 是一个桥接型 Skill,允许用户通过 Claude Code 调用 ChatGPT Plus/Pro 订阅中的 GPT Image 2(即 ChatGPT Images 2.0)图像生成功能。它并非独立图像模型,而是通过本地 codex CLI 复用用户已登录的 ChatGPT 会话,实现零额外成本的图像生成。

触发方式:用户需显式提及 "gpt image 2"、"ChatGPT Images 2.0" 或类似指令。Skill 不会自动接管普通的 "生成图片" 请求。

两大模式

  • 文生图bash scripts/gen.sh --prompt "..." --out /path/to/output.png
  • 图生图/风格迁移:添加 --ref /path/to/reference.png 参数,可重复用于多图参考合成

技术实现上,Skill 通过快照对比 ~/.codex/sessions/ 目录,定位 codex exec 创建的会话文件,从中提取 base64 图像数据并解码输出。

显著优点

1. 成本优势:零边际成本,不消耗 OpenAI API 额度,无需 Fal/Replicate 等第三方 token
2. 功能完整:支持文本生成、图像编辑、风格迁移、多参考合成,且 Image 2 对图文混排(infographics、时间线)表现优异

3. 数据隔离:仅读取自身调用产生的会话文件,通过"快照-对比"机制确保不触碰用户历史 Codex 对话

4. 代码精简:250 行 Python/Bash,无第三方依赖,仅依赖系统标准库与 codex CLI

5. 安全设计:路径遍历防护、输出扩展名白名单(.png/.jpg/.webp)、临时文件自动清理

潜在缺点与局限性

1. 硬性前置依赖:必须同时满足(1)ChatGPT Plus/Pro 订阅含图像生成权限;(2)本地安装并登录 codex CLI。任一条件不满足即完全不可用
2. 非官方 API 通道:依赖 codex CLI 的 --enable image_generation 实验性功能,该接口可能随 OpenAI 更新而变更或失效

3. 单会话串行:并发调用被文件系统快照机制串行化,不适合高频批量生成场景

4. 无云端兜底:纯本地 workflow,无法像 RunComfy 托管方案那样脱离本地环境使用

5. 错误码需人工解读:失败时需对照 exit code(3=CLI 缺失、5=生成失败、7=无图像产出等),对用户不够友好

适合人群

  • 已订阅 ChatGPT Plus/Pro 且希望"物尽其用"的开发者
  • 注重隐私、希望图像数据不经过第三方中转的本地优先用户
  • 需要快速风格迁移、多参考合成的设计师/创作者
  • 不想管理额外 API Key 或按图计费的企业内部工具场景

常规风险

  • 功能可用性风险image_generation 为实验性功能,OpenAI 可能随时调整权限或移除
  • 认证过期风险codex login 会话可能过期,需用户手动重新登录
  • 生成配额风险:ChatGPT 订阅层的图像生成存在隐性速率限制,大量调用可能触发限流
  • 路径安全虽完善,但仍需信任:虽实施路径验证,但 Skill 仍需读写本地文件系统,建议在隔离环境运行
  • 非官方 Skill 的维护风险:由 agentspace-so 社区维护,非 OpenAI 官方集成,更新响应取决于维护者

🪞 GPT Image 2 — Image Generation via Your ChatGPT Subscription 内容

scripts文件夹
手动下载zip · 7.1 kB
extract_image.pytext/plain
请选择文件