核心用法
Gemini Image Simple 是一个极简图像生成与编辑工具,基于 Google Gemini 2.0 Flash 实验性图像生成 API 构建。其最大特点是完全依赖 Python 标准库(urllib.request、json、base64),无需任何外部包即可运行。
两种工作模式:
1. 文生图:python3 generate.py "prompt" output.png
2. 图生图(编辑):python3 generate.py "edit prompt" output.png --input source.png
支持 PNG、JPG、JPEG、GIF、WEBP 格式输入,输出为 PNG。
显著优点
| 优势 | 说明 |
|------|------|
| **零依赖** | 纯标准库实现,无需 pip/uv/conda |
| **环境普适** | 可在 Fly.io 免费层、受限容器、离线环境运行 |
| **零配置** | 仅需设置 `GEMINI_API_KEY` 环境变量 |
| **功能完整** | 同时支持生成与编辑,与官方 SDK 能力对齐 |
潜在局限
- API 依赖:必须持有 Google AI Studio API Key,受 Google 服务可用性与定价策略约束
- 实验性 API:基于 Gemini 2.0 Flash 实验版本,接口稳定性与长期支持存在不确定性
- 无高级功能:缺少批量处理、异步队列、本地缓存等企业级特性
- Python 版本要求:需 Python 3.10+
适合人群
- 在受限网络/无包管理环境中需要图像生成的开发者
- Fly.io、AWS Lambda、边缘容器等轻量级部署场景
- 追求极简依赖栈的运维敏感型项目
- 快速原型验证与 CI/CD 自动化图像生成
常规风险
- API 密钥泄露:
GEMINI_API_KEY需妥善保管,避免硬编码 - 内容合规:Gemini 图像生成受 Google 安全过滤器约束,可能拒绝特定提示词
- 费用累积:按 Google 定价计费,高频调用需监控成本
- 输出质量波动:实验性模型在不同提示词下表现可能不稳定