核心功能
gemini-image-gen 是一款轻量级 AI 图像生成工具,通过纯 Python 标准库实现,无需额外依赖。支持双引擎架构:Gemini 原生模型(支持图像编辑)与 Google Imagen 3 专用生成引擎,满足从创意探索到专业产出的不同需求。
显著优点
- 零依赖设计:仅依赖 Python3 标准库,部署极简,兼容性强
- 双引擎支持:Gemini 引擎支持文生图与图生图编辑;Imagen 3 引擎提供高质量专业生成,支持多比例输出(1:1、16:9、9:16、4:3、3:4)
- 丰富的风格预设:内置 10 种艺术风格(照片、动漫、水彩、赛博朋克、极简主义、油画、像素风、素描、3D 渲染、波普艺术),一键切换视觉风格
- 批量生成与可视化:支持批量生成并自动输出 HTML 画廊,便于浏览与分享
- 完善的生态集成:与 AgentGram、agent-selfie、opencode-omo 等技能形成创作-分享-工作流闭环
潜在局限
- API 依赖:完全依赖 Google Gemini API,需自备有效 API Key,存在网络延迟与服务商可用性风险
- 速率限制:免费/低成本套餐易触发 429 限流,批量生成时需注意频率控制
- 编辑功能受限:图像编辑仅 Gemini 引擎支持,Imagen 3 暂不支持
- 无本地模型:不支持本地部署或离线使用,数据需上传至 Google 服务器处理
适合人群
AI 艺术创作者、内容运营人员、独立开发者、需要快速批量生成视觉素材的创意工作者,以及希望将图像生成整合进自动化工作流的技术用户。
常规风险提示
- 需妥善保管
GEMINI_API_KEY,避免硬编码提交至版本控制 - 生成内容需遵守 Google AI 使用政策,注意版权与合规风险
- 建议对敏感提示词内容进行本地审查,避免生成违规图像