使用说明

OpenClaw Media Gen 综合评估

核心用法

OpenClaw Media Gen 是一个整合型 AI 媒体生成工具，通过单一 AIsa API 密钥提供图片生成与视频生成两大核心功能：

图片生成：基于 Google Gemini 3 Pro Image (gemini-3-pro-image-preview)，支持文生图，返回 base64 编码的图像数据。

视频生成：基于阿里通义万相 Qwen Wan 2.6 (wan2.6-t2v)，支持图生视频，采用异步任务模式（需轮询查询状态），可生成 720P、5秒时长的高质量视频片段。

该工具提供 Python 客户端脚本，封装了 curl 调用、异步轮询、自动下载等流程，降低了使用门槛。

显著优点

统一入口：单一 API 密钥打通 Google 与阿里两大生态，无需分别注册管理
模型前沿：Gemini 3 Pro 与 Wan 2.6 均为当前第一梯队生成模型
异步友好：视频生成采用标准异步模式，支持超时控制与自动轮询
工作流完整：从创建任务、状态查询到自动下载形成闭环

潜在缺点与局限性

依赖第三方聚合平台：AIsa 作为中间层，存在服务稳定性与政策合规风险
视频生成限制多：仅支持 5 秒时长、720P 分辨率，且必须提供参考图（img_url 必填）
无直接模型访问：无法自定义种子、精细控制生成参数，灵活性受限
异步延迟不可控：视频任务排队时间可能较长，影响实时性场景
合规风险：生成内容需遵守 Google 与阿里的双重使用政策，商业用途需额外确认授权

适合人群

快速原型开发者：需要低成本验证 AI 媒体生成场景
内容创作者：批量生成短视频素材、概念图
自动化工作流构建者：需要将媒体生成集成到 CI/CD 或批处理管道

常规风险

API 密钥泄露：AISA_API_KEY 需严格保管，避免硬编码提交
成本失控：视频生成单价较高，异步轮询可能产生额外请求费用
内容安全：生成内容可能触发平台审核，导致任务失败或账号限制
服务连续性：AIsa 平台若调整合作策略，可能导致模型可用性变化

安全解读

核心用法

OpenClaw Media Gen 是一个 AI 媒体生成工具，通过单一 AIsa API 密钥即可调用两大主流生成模型：

图片生成：基于 Gemini 3 Pro Image 模型，通过 POST /models/gemini-3-pro-image-preview:generateContent 接口直接生成图片。用户只需提供文本描述，API 返回包含 base64 编码的图片数据，客户端脚本自动解析保存为本地文件。支持赛博朋克、电影感、超写实等多种风格提示词。

视频生成：基于通义万相（Qwen Wan 2.6）异步视频合成服务，通过 POST /services/aigc/video-generation/video-synthesis 创建任务，需配合 GET /services/aigc/tasks 轮询获取结果。支持图生视频，可指定 720P 分辨率、5 秒时长、镜头运动（推轨、浅景深等电影级效果）。

Python 客户端封装了完整工作流：image 直接生成图片；video-create/video-status/video-wait 管理视频任务生命周期，支持自动下载 MP4。

显著优点

一站式接入：单 API Key 打通 Google Gemini 与阿里通义两大生态，无需分别申请多家平台账号
模型质量顶尖：Gemini 3 Pro Image 在提示词遵循和美学表现上处于第一梯队；Wan 2.6 是国内领先的图生视频开源模型，物理一致性和运镜控制优秀
异步任务友好：视频生成天然异步设计，客户端提供 --poll/--timeout 智能等待机制，避免阻塞
零依赖轻量：Python 脚本仅使用标准库（urllib、json、argparse），无需 pip 安装，部署极简易
开源可审计：代码完全透明，4 个文件共 522 行，安全扫描零发现

潜在局限

T3 来源可信度：个人开发者/社区项目（0xjordansg），非企业级背书，长期维护稳定性存疑
API 供应商依赖：功能完全绑定 AIsa 平台，若其调整定价、限流或终止服务，Skill 将失效
异步等待成本：视频生成需轮询等待（通常数分钟），不适合实时交互场景
无内置重试机制：网络波动或 API 超时需用户自行处理
功能边界明确：仅支持文生图、图生视频，无视频编辑、延长、对口型等进阶功能

适合人群

需要快速产出营销素材、社交媒体内容的独立创作者
希望低成本试用 Gemini + 万相组合的技术爱好者
已有 AIsa 订阅、寻求命令行自动化集成的开发者
对 Python 轻量脚本有部署能力、注重隐私（数据直送官方 API 不经第三方）的用户

常规风险

| 风险类型 | 说明 | 缓释措施 |

|---------|------|---------|

| API 密钥泄露 | AISA_API_KEY 为唯一凭证，泄露可导致资源盗刷 | 严格环境变量注入，定期轮换，避免提交至代码仓库 |

| 输出路径覆盖 | `--out` 参数若指向现有文件将直接覆盖 | 显式指定独立输出目录，使用前确认路径安全 |

| 上游 API 变更 | AIsa 接口版本迭代可能导致 Skill 失效 | 关注官方文档，预留升级窗口 |

| 异步任务堆积 | 大量视频任务创建后未跟踪可能造成资源浪费 | 及时查询状态或设置合理超时 |

| 生成内容合规 | AI 生成的图片/视频需符合平台内容政策 | 用户自行审核输出内容，遵守 AIsa 使用条款 |

安全认证方面，CLS-Certify v2.1.0 六维扫描均获满分，无危险函数、无敏感信息硬编码、无第三方依赖，安全等级 S 级。

image-generation video-generation gemini qwen wan2.6 async-api python-client multi-modal tongyi-wanxiang aisa-api

Generate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key 内容

scripts文件夹

手动下载zip · 6.7 kB

media_gen_client.pytext/plain

请选择文件