核心功能
Gemini Image Gen 是一款纯 Python 标准库实现的图像生成 CLI 工具,通过 Google Gemini API 提供两种生成引擎:
- Gemini 原生引擎:支持文本生成图像及图像编辑(img2img),可基于现有图片进行修改
- Imagen 3 引擎:Google 最新图像生成模型,支持多种宽高比(1:1、16:9、9:16、4:3、3:4)
主要特性
| 特性 | 说明 |
|------|------|
| 零依赖 | 仅使用 Python 标准库,无需额外安装包 |
| 批量生成 | 支持一次性生成多张图片(默认4张) |
| 风格预设 | 内置10种风格:photo、anime、watercolor、cyberpunk、minimalist、oil-painting、pixel-art、sketch、3d-render、pop-art |
| 智能输出 | 自动生成带时间戳的输出目录及 HTML 画廊页面 |
使用场景
适合开发者快速原型设计、内容创作者批量生成素材、设计师探索风格概念。命令行接口简洁,支持随机提示词自动生成创意灵感。
局限性与风险
技术局限:
- 依赖 Google API 可用性及网络连接
- Imagen 3 不支持图像编辑功能
- 免费额度有限,高频使用需关注计费
安全风险:
- API 密钥以环境变量明文存储,存在泄露风险
- 生成内容受 Google 安全策略约束,可能触发内容过滤
- 无本地模型支持,所有数据上传至云端处理
适合人群
- 熟悉命令行的开发者与技术用户
- 需要快速、批量图像生成的内容工作者
- 已拥有 Google AI Studio/GCP 账户的用户
常规风险提示
- 妥善保管
GEMINI_API_KEY,避免硬编码或日志泄露 - 注意 API 速率限制(429 错误),合理设置
--count - 商用需确认 Google Gemini API 服务条款及授权范围