NanoBanana PPT Skills

🎨 AI一键生成专业PPT与视频

AI一键生成专业PPT图片与视频,支持智能转场、多风格模板,适合商务演示与教育培训场景。

收藏
6k
安装
2.8k
版本
0.1.0
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

PPT Generator Pro 综合评估

核心用法

PPT Generator Pro 是一款基于 Claude Code 的 AI 驱动 PPT 生成技能,用户只需提供文档内容或路径,即可自动完成从内容分析到成品输出的全流程。操作路径为:调用 /ppt-generator-pro 命令 → 选择风格(渐变毛玻璃/矢量插画)→ 确认页数与分辨率 → 自动生成结构化大纲 → 调用 Nano Banana Pro API 生成高清图片 → 可选生成可灵 AI 转场视频 → 输出交互式播放器或完整视频文件。

显著优点

1. 全流程自动化:从文档解析、内容规划、视觉设计到视频合成一站式完成,无需手动排版
2. 高质量视觉输出:支持 2K/4K 分辨率,内置专业级设计系统(Apple Keynote 风格玻璃拟态、扁平矢量插画)

3. 智能视频增强:业界首创的 AI 转场生成,基于实际 PPT 画面差异定制提示词,避免文字模糊问题

4. 灵活部署模式:支持独立脚本运行与 Claude Code Skill 模式,环境变量智能查找机制完善

5. 交互式体验:提供键盘导航的图片播放器与视频播放器,支持循环预览、自动播放、全屏切换

潜在局限

1. API 依赖性强:核心功能依赖 Google Gemini(Nano Banana Pro)与可灵 AI,国内用户存在网络访问门槛
2. 成本不确定性:视频生成调用可灵 AI 专业模式,商业场景下需关注 token 与时长计费

3. 生成时效性:4K 图片约 60 秒/页,5 秒转场视频 30-60 秒/段,25 页完整 PPT 视频总耗时可能超过 30 分钟

4. 内容可控性:AI 自动规划的内容结构可能需要人工微调,复杂数据可视化场景支持有限

5. 平台绑定:专为 Claude Code 设计,其他 AI 编程助手无法直接调用

适合人群

  • 企业市场/产品团队:快速产出投资人 Pitch、发布会 Keynote、季度汇报材料
  • 教育培训从业者:将讲义转化为视觉化课件,矢量插画风格尤其适合 K12 与素质教育场景
  • 自媒体/内容创作者:生成短视频脚本配套的高质感配图与动态素材
  • 咨询与投行人士:紧急响应客户需求,1 小时内交付 10-15 页专业级演示文稿

常规风险

  • 版权与合规:Nano Banana Pro 生成图片的商用授权需确认 Google AI 条款;可灵 AI 视频存在生成内容不可控风险
  • 数据安全:文档内容上传至第三方 API,敏感商业信息建议脱敏或本地部署替代方案
  • 输出稳定性:AI 图像生成存在随机性,同一提示词多次运行结果可能不一致,关键项目建议预留返工时间
  • 环境配置门槛:FFmpeg 安装、多平台环境变量管理对非技术用户存在学习成本

安全解读

核心用法

PPT Generator Pro 是一款面向 Claude Code 的 AI 驱动演示文稿生成工具。用户通过 /ppt-generator-pro 命令或自然语言触发,提供文档内容后即可自动完成从内容分析到视觉交付的全流程。执行分为六个阶段:收集输入(文档/风格/页数/分辨率/视频选项)→ 智能规划内容结构 → 调用 Nano Banana Pro(Gemini API)生成 2K/4K 高清图片 → 由 Claude 分析图片差异并生成转场提示词 → 可选调用可灵 AI 生成 5 秒转场视频 → FFmpeg 合成完整演示视频。输出包含交互式图片播放器、视频播放器及独立 MP4 文件,支持键盘导航与自动播放。

显著优点

  • 全流程自动化:无需手动撰写提示词,AI 自动完成内容提炼、视觉设计、转场逻辑,大幅降低专业 PPT 制作门槛
  • 双专业风格:内置 Apple Keynote 风格的渐变毛玻璃(科技感)与扁平矢量插画(温暖教育风),视觉品质对标顶级设计
  • 视频化升级:首创 AI 转场视频生成,静态 PPT 升级为动态演示,配合交互式播放器实现类 Keynote 演讲体验
  • 工程化设计:支持 2K/4K 分辨率、环境变量智能查找、uv/pip 双模式运行,输出目录结构化清晰
  • 安全合规:无硬编码密钥,通过 .env 管理敏感信息,依赖均为知名开源库,通过多项安全扫描

潜在缺点与局限性

  • 外部 API 依赖:核心功能依赖 Google Gemini(图像)与可灵 AI(视频),服务可用性、成本控制及合规性需用户自行评估
  • 视频功能门槛:可灵 AI 需单独申请密钥,视频生成耗时较长(30-60 秒/段),不适合紧急场景
  • 内容可控性有限:AI 生成的视觉布局与转场效果虽专业,但微调需手动修改 prompts.json 后重新生成,交互编辑能力弱
  • 硬件与系统要求:视频功能需本地安装 FFmpeg,对非技术用户存在一定配置门槛
  • 风格扩展性:当前仅内置 2 种风格,自定义风格需按 Markdown 模板编写,无可视化编辑器

适合人群

  • 产品经理/创业者:快速将 PRD、商业计划书转化为投资人级别的演示材料
  • 教育工作者/培训师:将讲义内容转化为视觉化课件,矢量风格适合知识传播
  • 企业市场团队:季度汇报、品牌发布会等场景的高质感输出
  • 技术文档工程师:将技术文档自动生成结构化的演示版本
  • AI 爱好者:希望探索 AI 原生工作流、体验端到端生成式创作的用户

常规风险

  • API 成本风险:Gemini 与可灵 AI 均为按量计费服务,批量生成或高分辨率(4K)可能产生意外费用,建议设置用量上限
  • 数据隐私考量:文档内容需上传至 Google 与可灵 AI 服务器处理,敏感商业信息需谨慎评估
  • 生成结果一致性:AI 图像生成存在随机性,同一内容多次生成可能出现风格漂移,关键项目建议固定随机种子或多次生成择优
  • 转场效果不可控:视频转场由可灵 AI 黑盒生成,文字清晰度与运动逻辑偶有瑕疵,重要场合建议预渲染审查
  • 密钥泄露风险:虽然 Skill 本身无硬编码,但用户需自行保管 .env 文件,避免误提交至 Git 仓库

NanoBanana PPT Skills 内容

prompts文件夹
styles文件夹
templates文件夹
手动下载zip · 83.0 kB
transition_template.mdtext/markdown
请选择文件