nano-banana-pro-openrouter

🖼️ OpenRouter 高清 AI 图像生成助手

基于 Gemini 3 Pro Image 模型,通过 OpenRouter API 生成 1K-4K 高清图像,支持草稿-迭代-定稿的高效工作流。

收藏
7k
安装
1.5k
版本
v1.0.1
CLS 安全性认证2026-05-13
点击查看完整报告 >

使用说明

该 Skill 为用户提供通过 OpenRouter 平台调用 Nano Banana Pro(Gemini 3 Pro Image Preview)模型生成高质量图像的能力。它采用 Shell 脚本封装,支持从 1K 到 4K 的多种分辨率输出,并内置了"草稿-迭代-定稿"的科学工作流,帮助用户在确认提示词效果后再生成高分辨率成品,有效节省时间和成本。

核心用法上,用户通过调用 generate_image.sh 脚本并传入 --prompt 参数描述图像需求,可选择 --resolution 指定 1K/2K/4K 分辨率,使用 --filename auto 自动生成带时间戳的文件名。脚本会自动处理 API 请求、图像解码和本地存储,输出路径固定于 ~/.openclaw/workspace/outputs/nano-banana-pro-openrouter 目录,确保文件管理有序。API Key 和 Base URL 可通过环境变量或 .env 文件灵活配置。

显著优点包括:首先,分级工作流设计(1K 快速预览 → 提示词调优 → 4K 最终输出)大幅降低了迭代成本;其次,严格的参数白名单验证(仅允许 1K/2K/4K)和路径处理(使用 basename 防止目录遍历)确保了操作安全;再者,依赖仅使用系统标准工具(curl、base64),无外部包管理器依赖,部署轻量;最后,自动文件名生成和明确的错误提示提升了用户体验。

潜在局限性方面,当前 Shell 版本仅支持文生图,不支持图生图编辑功能;必须依赖 OpenRouter 外部服务,无法离线使用;作为 T3 来源(个人开发者账号)的社区项目,长期维护稳定性相对较弱;且仅针对 Nano Banana Pro/Gemini 3 Pro Image 模型优化,模型选择灵活性不足。

适合群体主要包括:需要批量生成高质量 AI 图像的内容创作者、希望通过 API 自动化图像生成流程的开发者、以及对图像分辨率有明确要求(如需要 4K 商用级输出)的设计师和营销人员。特别适合已拥有 OpenRouter API 访问权限的用户。

使用风险需注意:用户需自行妥善保管 API Key,虽然 Skill 本身不硬编码密钥,但建议通过 .env 文件而非命令行参数传递以避免历史记录泄露;图像生成依赖网络连接和 OpenRouter 服务可用性;所有提示词和生成的图像元数据会传输至 OpenRouter 服务器,对隐私敏感场景需谨慎评估;此外,4K 图像生成消耗较多 API 配额,需注意成本控制。

安全解读

核心用法

本Skill是OpenRouter平台Nano Banana Pro(Google Gemini 3 Pro Image Preview)的图像生成封装工具,采用Shell脚本实现轻量级调用。用户通过generate_image.sh脚本,以自然语言描述生成PNG格式图像,支持1K(约1024px)、2K(约2048px)、4K(约4096px)三种分辨率输出。

关键特性

  • 智能迭代工作流:推荐"草稿(1K)→迭代→终稿(4K)"流程,避免高分辨率试错成本
  • 自动命名机制--filename auto生成时间戳+描述性名称的组合文件名
  • 灵活密钥管理:支持命令行参数--api-key或环境变量OPENROUTER_API_KEY,自动读取.env文件
  • 标准化输出:所有图像保存至~/.openclaw/workspace/outputs/nano-banana-pro-openrouter,并输出MEDIA_URL便于直接引用

技术实现:纯Shell脚本依赖系统标准工具(curl/base64),无第三方包引入,143行代码实现完整的API调用、Base64解码、文件保存流程。

显著优点

1. 成本效率优化:官方推荐的1K草稿→4K终稿流程,显著降低高分辨率试错成本
2. 零依赖部署:仅依赖curl/base64/sh,任何Unix-like环境均可直接运行

3. OpenRouter生态整合:无缝接入OpenRouter统一接口,可利用其密钥管理与模型路由能力

4. 安全设计:API密钥不硬编码,支持环境变量与.env文件隔离敏感信息

5. 输出标准化:固定输出目录+自动媒体URL生成,便于下游自动化处理

潜在局限

1. 功能单一:当前仅支持文生图,不支持图生图编辑(SKILL.md明确标注Not Supported)
2. 分辨率语义映射局限:用户需理解"high-res/4K/ultra"等自然语言描述会被映射到固定档位,非任意尺寸

3. 网络依赖刚性:必须可访问openrouter.ai,无离线/本地回退方案

4. 错误处理简约:curl失败时依赖脚本退出码,无重试机制或降级策略

5. 跨平台限制:Windows原生环境需WSL/Git Bash等兼容层

适合人群

  • AI图像创作者:需要快速原型迭代后输出高质量终稿的设计师
  • 自动化工作流搭建者:希望将Gemini图像生成集成到Shell脚本的开发者
  • OpenRouter生态用户:已持有OpenRouter密钥,希望统一管理多模型API调用
  • 轻量级环境用户:无法安装Python/Node等重型依赖的受限环境

常规风险

1. API密钥泄露风险:命令行传入的--api-key可能留存于shell历史记录;.env文件权限不当可能导致密钥被同系统其他用户读取
2. 配额与成本控制:4K分辨率生成消耗更多token/积分,高频调用可能触发OpenRouter速率限制

3. 内容安全合规:Gemini 3 Pro Image的内容过滤策略可能拒绝特定提示词,需用户了解Google AI使用政策

4. 服务可用性依赖:OpenRouter或Google API的服务中断将完全阻断功能

5. 输出目录空间管理:长期高频使用~/.openclaw/workspace/outputs/可能累积大量图像文件,需定期清理

nano-banana-pro-openrouter 内容

scripts文件夹
手动下载zip · 5.1 kB
generate_image.shtext/x-shellscript
请选择文件