gemini-image-simple

🎨 零依赖原生AI图像生成专家

基于Google Nano Banana Pro模型的零依赖图像生成方案,仅需Python标准库即可在受限环境中生成高质量AI图片。

收藏
2.1k
安装
841
版本
v1.1.0
CLS 安全性认证2026-05-10
点击查看完整报告 >

使用说明

Gemini Image Simple 是一个专注于极简部署的AI图像生成技能,它彻底打破了传统AI工具对复杂依赖环境的束缚。该技能基于Google最高质量的图像生成模型Nano Banana Pro(Gemini 3 Pro Image),通过纯Python标准库实现,无需安装任何第三方包即可在Python 3.10+环境中运行。

核心用法:通过命令行脚本调用,支持从零生成图像(generate.py "prompt" output.png)和基于现有图像进行编辑(--input参数指定源文件)。用户只需设置GEMINI_API_KEY环境变量即可开始使用,系统会自动处理与Google Generative Language API的HTTPS通信、Base64编解码及JSON解析。

显著优点:最大的优势在于零依赖架构,使用urllib.request替代requests库,利用标准库完成所有网络操作。这使得它能在Fly.io免费 tier、Docker容器、企业受限环境等无法使用pip/uv的场景中稳定运行。同时直接调用Google顶级图像模型,生成质量与依赖繁重的替代方案无异。纯原生实现也意味着更小的攻击面和更快的冷启动速度。

潜在局限:功能相对聚焦,仅支持图像生成和基础编辑,缺乏复杂的图像处理管线(如批量处理、高级后处理)。必须保持网络连接至Google API,无法离线使用。此外,图像编辑功能需要将用户图片上传至Google服务器,对数据隐私敏感的场景需谨慎评估。

适合群体:特别适合DevOps工程师在CI/CD流水线中生成测试素材、在受限企业环境工作的开发者、以及追求极简部署的独立开发者。对于需要快速验证AI图像效果而不愿配置复杂Python环境的用户尤为友好。

使用风险:主要风险在于API密钥管理(需确保环境变量安全)和网络稳定性(依赖Google服务可用性)。虽然代码本身无恶意行为,但使用者需意识到图像数据会传输至Google进行处理,敏感内容应避免使用。此外,180秒超时设置虽防止挂起,但在弱网环境下可能导致生成失败。

安全解读

核心用法

本 Skill 通过纯 Python 标准库(urllib.request + json + base64)调用 Google Gemini Nano Banana Pro 模型(nano-banana-pro-preview),实现图像生成与编辑功能。无需安装任何第三方包,直接在 Python 3.10+ 环境运行。

生成图像:

python3 {baseDir}/scripts/generate.py "prompt描述" output.png

编辑图像:

python3 {baseDir}/scripts/generate.py "编辑指令" output.png --input source.png

支持 PNG、JPG、JPEG、GIF、WEBP 格式输入,输出为 PNG。

显著优点

1. 零依赖部署:无需 pip/uv,无供应链攻击风险,规避依赖包的 CVE 漏洞
2. 受限环境兼容:完美运行于 Fly.io 免费 tier、只读容器、无网络权限安装包的场景

3. 模型质量高:使用 Google 当前最高质量图像模型 Nano Banana Pro(Gemini 3 Pro Image)

4. 功能完整:支持文生图和图生图(编辑)双模态

5. 代码简洁:仅 258 行 Python,易于审计和维护

潜在缺点与局限性

  • 无高级功能:不支持 Imagen 4.0 Ultra 的精细参数控制(如 seed、aspect ratio 精确调整)
  • 错误处理基础:API 异常和错误码解析较简单,调试体验有限
  • 输入验证待增强--input 参数的路径遍历防护可进一步完善
  • 社区维护级别:来源为个人开发者(T3),非 Google 官方维护

适合人群

  • 运行在受限容器/Serverless 环境的开发者
  • 对供应链安全极度敏感、希望零依赖部署的团队
  • 需要快速验证 Gemini 图像能力而不想配置复杂环境的用户
  • Fly.io、AWS Lambda、Google Cloud Run 等冷启动敏感场景

常规风险

  • API 密钥管理:需配置 GEMINI_API_KEY,存在密钥泄露风险,建议定期轮换
  • 网络依赖:必须能访问 generativelanguage.googleapis.com
  • 模型更新nano-banana-pro-preview 为预览版 API,Google 可能调整或弃用
  • 隐私合规:图像数据上传至 Google API,需符合相关隐私政策
  • 成本风险:Gemini API 按调用计费,大量生成可能产生费用

gemini-image-simple 内容

scripts文件夹
手动下载zip · 3.4 kB
generate.pytext/plain
请选择文件