使用说明

核心用法

Gemini Image Simple 是一个极简图像生成与编辑工具，基于 Google Gemini 2.0 Flash 实验性图像生成 API 构建。其最大特点是完全依赖 Python 标准库（urllib.request、json、base64），无需任何外部包即可运行。

两种工作模式：
1. 文生图：python3 generate.py "prompt" output.png
2. 图生图（编辑）：python3 generate.py "edit prompt" output.png --input source.png

支持 PNG、JPG、JPEG、GIF、WEBP 格式输入，输出为 PNG。

显著优点

| 优势 | 说明 |

|------|------|

| **零依赖** | 纯标准库实现，无需 pip/uv/conda |

| **环境普适** | 可在 Fly.io 免费层、受限容器、离线环境运行 |

| **零配置** | 仅需设置 `GEMINI_API_KEY` 环境变量 |

| **功能完整** | 同时支持生成与编辑，与官方 SDK 能力对齐 |

潜在局限

API 依赖：必须持有 Google AI Studio API Key，受 Google 服务可用性与定价策略约束
实验性 API：基于 Gemini 2.0 Flash 实验版本，接口稳定性与长期支持存在不确定性
无高级功能：缺少批量处理、异步队列、本地缓存等企业级特性
Python 版本要求：需 Python 3.10+

适合人群

在受限网络/无包管理环境中需要图像生成的开发者
Fly.io、AWS Lambda、边缘容器等轻量级部署场景
追求极简依赖栈的运维敏感型项目
快速原型验证与 CI/CD 自动化图像生成

常规风险

API 密钥泄露：GEMINI_API_KEY 需妥善保管，避免硬编码
内容合规：Gemini 图像生成受 Google 安全过滤器约束，可能拒绝特定提示词
费用累积：按 Google 定价计费，高频调用需监控成本
输出质量波动：实验性模型在不同提示词下表现可能不稳定

image-generation gemini google-ai stdlib zero-dependency cli container-friendly fly-io python-only

Gemini Image Simple 内容

scripts文件夹

手动下载zip · 3.2 kB

generate.pytext/plain

请选择文件