使用说明

该 Skill 为用户提供通过 OpenRouter 平台调用 Nano Banana Pro（Gemini 3 Pro Image Preview）模型生成高质量图像的能力。它采用 Shell 脚本封装，支持从 1K 到 4K 的多种分辨率输出，并内置了"草稿-迭代-定稿"的科学工作流，帮助用户在确认提示词效果后再生成高分辨率成品，有效节省时间和成本。

核心用法上，用户通过调用 generate_image.sh 脚本并传入 --prompt 参数描述图像需求，可选择 --resolution 指定 1K/2K/4K 分辨率，使用 --filename auto 自动生成带时间戳的文件名。脚本会自动处理 API 请求、图像解码和本地存储，输出路径固定于 ~/.openclaw/workspace/outputs/nano-banana-pro-openrouter 目录，确保文件管理有序。API Key 和 Base URL 可通过环境变量或 .env 文件灵活配置。

显著优点包括：首先，分级工作流设计（1K 快速预览 → 提示词调优 → 4K 最终输出）大幅降低了迭代成本；其次，严格的参数白名单验证（仅允许 1K/2K/4K）和路径处理（使用 basename 防止目录遍历）确保了操作安全；再者，依赖仅使用系统标准工具（curl、base64），无外部包管理器依赖，部署轻量；最后，自动文件名生成和明确的错误提示提升了用户体验。

潜在局限性方面，当前 Shell 版本仅支持文生图，不支持图生图编辑功能；必须依赖 OpenRouter 外部服务，无法离线使用；作为 T3 来源（个人开发者账号）的社区项目，长期维护稳定性相对较弱；且仅针对 Nano Banana Pro/Gemini 3 Pro Image 模型优化，模型选择灵活性不足。

适合群体主要包括：需要批量生成高质量 AI 图像的内容创作者、希望通过 API 自动化图像生成流程的开发者、以及对图像分辨率有明确要求（如需要 4K 商用级输出）的设计师和营销人员。特别适合已拥有 OpenRouter API 访问权限的用户。

使用风险需注意：用户需自行妥善保管 API Key，虽然 Skill 本身不硬编码密钥，但建议通过 .env 文件而非命令行参数传递以避免历史记录泄露；图像生成依赖网络连接和 OpenRouter 服务可用性；所有提示词和生成的图像元数据会传输至 OpenRouter 服务器，对隐私敏感场景需谨慎评估；此外，4K 图像生成消耗较多 API 配额，需注意成本控制。

安全解读

核心用法

本Skill是OpenRouter平台Nano Banana Pro（Google Gemini 3 Pro Image Preview）的图像生成封装工具，采用Shell脚本实现轻量级调用。用户通过generate_image.sh脚本，以自然语言描述生成PNG格式图像，支持1K（约1024px）、2K（约2048px）、4K（约4096px）三种分辨率输出。

关键特性：

智能迭代工作流：推荐"草稿(1K)→迭代→终稿(4K)"流程，避免高分辨率试错成本
自动命名机制：--filename auto生成时间戳+描述性名称的组合文件名
灵活密钥管理：支持命令行参数--api-key或环境变量OPENROUTER_API_KEY，自动读取.env文件
标准化输出：所有图像保存至~/.openclaw/workspace/outputs/nano-banana-pro-openrouter，并输出MEDIA_URL便于直接引用

技术实现：纯Shell脚本依赖系统标准工具（curl/base64），无第三方包引入，143行代码实现完整的API调用、Base64解码、文件保存流程。

显著优点

1. 成本效率优化：官方推荐的1K草稿→4K终稿流程，显著降低高分辨率试错成本
2. 零依赖部署：仅依赖curl/base64/sh，任何Unix-like环境均可直接运行
3. OpenRouter生态整合：无缝接入OpenRouter统一接口，可利用其密钥管理与模型路由能力
4. 安全设计：API密钥不硬编码，支持环境变量与.env文件隔离敏感信息
5. 输出标准化：固定输出目录+自动媒体URL生成，便于下游自动化处理

潜在局限

1. 功能单一：当前仅支持文生图，不支持图生图编辑（SKILL.md明确标注Not Supported）
2. 分辨率语义映射局限：用户需理解"high-res/4K/ultra"等自然语言描述会被映射到固定档位，非任意尺寸
3. 网络依赖刚性：必须可访问openrouter.ai，无离线/本地回退方案
4. 错误处理简约：curl失败时依赖脚本退出码，无重试机制或降级策略
5. 跨平台限制：Windows原生环境需WSL/Git Bash等兼容层

适合人群

AI图像创作者：需要快速原型迭代后输出高质量终稿的设计师
自动化工作流搭建者：希望将Gemini图像生成集成到Shell脚本的开发者
OpenRouter生态用户：已持有OpenRouter密钥，希望统一管理多模型API调用
轻量级环境用户：无法安装Python/Node等重型依赖的受限环境

常规风险

1. API密钥泄露风险：命令行传入的--api-key可能留存于shell历史记录；.env文件权限不当可能导致密钥被同系统其他用户读取
2. 配额与成本控制：4K分辨率生成消耗更多token/积分，高频调用可能触发OpenRouter速率限制
3. 内容安全合规：Gemini 3 Pro Image的内容过滤策略可能拒绝特定提示词，需用户了解Google AI使用政策
4. 服务可用性依赖：OpenRouter或Google API的服务中断将完全阻断功能
5. 输出目录空间管理：长期高频使用~/.openclaw/workspace/outputs/可能累积大量图像文件，需定期清理

image-gen content-media api productivity

nano-banana-pro-openrouter 内容

scripts文件夹

手动下载zip · 5.1 kB

generate_image.shtext/x-shellscript

请选择文件