核心用法
Gemini Image Simple 是一个极简的图像生成与编辑工具,通过 Google Nano Banana Pro(Gemini 3 Pro Image)模型实现高质量 AI 绘图。使用方式极为直接:
生成图像:python3 {baseDir}/scripts/generate.py "prompt" output.png
编辑图像:python3 {baseDir}/scripts/generate.py "edit instructions" output.png --input source.png
支持 PNG、JPG、JPEG、GIF、WEBP 格式输入,仅需设置 GEMINI_API_KEY 环境变量即可运行。
显著优点
1. 真正的零依赖:仅使用 Python 标准库(urllib.request、json、base64),无需安装任何第三方包
2. 环境适应性极强:可在 Fly.io 免费实例、锁定的容器、无 pip/uv 权限的系统中直接运行
3. 完整的模型能力:支持 Nano Banana Pro 全功能,包括图像生成与图像编辑
4. 多模型可选:内置 Imagen 4.0 Ultra、Gemini 2.5 Flash Image 等模型切换选项
潜在局限
- 功能接口较为底层,缺乏高级参数控制(如分辨率、采样步数等精细调节)
- 错误处理相对简单,API 限流或网络异常时容错能力有限
- 不支持批量生成或异步队列,单任务串行执行
- 无内置图像后处理(压缩、格式转换、水印等)
适合人群
- 在受限环境(企业内网、安全容器、无 root 权限服务器)中需要图像生成的开发者
- 追求极简部署、拒绝依赖地狱的运维/全栈工程师
- 快速原型验证场景,不愿花时间配置 Python 虚拟环境
常规风险
- API 密钥安全:需妥善保管
GEMINI_API_KEY,避免硬编码或日志泄露 - 内容合规:Google 的图像生成模型有内置安全过滤,可能拒绝特定提示词
- 成本可控:按图像生成量计费,高频调用需关注用量配额与费用
- 模型预览稳定性:
nano-banana-pro-preview为预览版 API,可能存在变更或下线风险