核心用法
Antigravity Image Generation 是一个基于 Node.js 的图像生成技能,通过直接调用 Google 内部 Antigravity API(Gemini 3 Pro Image)实现高质量图像生成。用户只需提供文本提示词(prompt),即可通过命令行脚本生成图像,支持 1:1、16:9、9:16、4:3、3:4 等多种宽高比。该技能绕过了传统的浏览器自动化方案,采用原生 HTTPS 请求与 Google 沙盒端点通信,响应速度更快、稳定性更高。
使用前需预先配置 Google Antigravity OAuth 凭据,存储于 ~/.clawdbot/agents/main/agent/auth-profiles.json。执行时通过 generate.js 脚本传递参数,生成的图像会自动保存至指定路径,并通过 MEDIA: <path>> 格式输出供 Clawdbot 识别展示。
显著优点
1. 原生 API 调用:相比 Selenium/Puppeteer 等浏览器自动化方案,直接调用 API 大幅提升了执行效率和稳定性,减少了资源占用。
2. 高质量输出:依托 Gemini 3 Pro Image 模型,生成图像质量达到专业水准,适用于多种视觉创作场景。
3. 灵活配置:支持多种宽高比和自定义输出路径,满足不同场景需求。
4. 零外部依赖:仅使用 Node.js 内置模块(fs、https、path、buffer),无需安装额外 npm 包,部署简单。
5. 集成友好:输出格式标准化,可与 Clawdbot 等 Agent 框架无缝集成。
潜在缺点与局限性
1. 非公开 API 风险:依赖 Google 内部沙盒端点(daily-cloudcode-pa.sandbox.googleapis.com),无官方文档支持,API 可能随时变更或下线。
2. 凭据管理复杂:需要预先获取并配置 OAuth 凭据,对普通用户门槛较高。
3. 配额限制:可能遇到 429 Resource Exhausted 错误,受 Google 项目配额限制。
4. 合规性存疑:代码中包含伪造 User-Agent 和 Client-Metadata 的逻辑以绕过服务端验证,可能违反 Google 服务条款。
5. 内容安全过滤:模型可能对特定提示词进行安全拦截,导致生成失败。
适合的目标群体
- 开发者与工程师:具备 OAuth 配置和命令行操作能力的技术用户
- AI 应用构建者:需要将图像生成能力集成到自动化工作流或 Agent 系统的开发者
- 内容创作者:追求高质量 AI 图像、愿意接受一定技术门槛的设计师和艺术家
- 企业内部工具团队:在受控环境中部署内部图像生成服务的组织
使用风险
- 凭据泄露风险:OAuth 配置文件若权限设置不当,可能导致凭据被窃取
- 服务可用性风险:内部 API 随时可能变更或受限,导致技能失效
- 合规风险:伪造请求头和使用非公开 API 可能违反服务条款
- 路径遍历风险:用户指定的输出路径未充分验证,存在理论上的文件系统安全风险