核心用法
image-gen是一款基于Google Gemini Flash Image API的AI图像生成工具,通过命令行脚本调用实现文生图功能。用户需配置IMAGE_GEN_API_KEY和可选的IMAGE_GEN_BASE_URL环境变量,执行scripts/generate_image.py脚本并传入提示词即可完成图片生成。
工具提供极其丰富的模型选择,涵盖标准、2K、4K三种分辨率,以及1:1、3:2、16:9、21:9等10种常见比例,总计30+个模型变体。默认使用gemini-3.1-flash-image-2k-16x9(2K横屏),平衡了质量与生成速度。
显著优点
1. 分辨率覆盖全面:从社交头像到超宽屏壁纸,从竖版海报到4K印刷级输出,几乎覆盖所有常见用途
2. API集成成熟:基于Google Gemini官方API,模型能力和稳定性有基本保障
3. 提示词优化友好:官方文档提供了详细的中文提示词技巧指导,降低使用门槛
4. 输出可控性强:支持指定输出路径,便于集成到自动化工作流
潜在缺点与局限性
- 依赖外部API:需自行申请API密钥,存在配额和费用限制
- 仅支持文生图:不支持图生图、局部重绘、ControlNet等高级编辑功能
- 无内置审核机制:用户需自行承担生成内容的合规责任
- 自定义代理地址:默认base URL指向
code.newcli.com,非Google官方域名,存在中间人风险
适合人群
- 需要快速生成概念图、配图的设计师和运营人员
- 构建自动化内容生产流程的开发者
- 对图片质量要求中等、追求效率的创作者
常规风险
API密钥泄露可能导致配额被盗用;生成内容可能涉及版权敏感风格(如吉卜力风);自定义代理服务器的数据隐私需额外评估。建议生产环境使用专用API密钥并设置调用限制。