nanobanana-ppt-skills

📊 AI 驱动的专业演示文稿生成器

基于 Gemini 与可灵 AI 的 PPT 生成器,支持文档解析、高清图片及转场视频,快速产出专业商务演示文稿。

收藏
2.5k
安装
1.1k
版本
v0.1.0
CLS 安全性认证2026-05-01
点击查看完整报告 >

使用说明

核心用法

PPT Generator Pro 采用六阶段智能工作流实现自动化演示文稿制作。首先通过交互式对话收集用户输入,支持文档路径读取、直接文本输入或主动询问三种方式获取内容,并引导选择渐变毛玻璃或矢量插画风格、页数范围(5-25页)及分辨率(2K/4K)。第二阶段利用 Claude 进行智能文档分析,根据页数自动规划内容结构,生成包含封面、目录、核心内容、数据可视化及总结的标准化 JSON 规划文件。

第三阶段调用 Nano Banana Pro API(Google Gemini)生成 16:9 高清 PPT 图片,支持批量并行处理。第四阶段是核心差异化功能:Claude 自动分析相邻页面的视觉差异,为每个转场生成精准的视频提示词,确保文字清晰度和风格一致性。第五阶段可选调用可灵 AI 生成 5 秒转场视频,最终通过 FFmpeg 合成包含所有转场的完整演示视频,输出交互式 HTML 播放器。

显著优点

双模态输出能力:不仅生成静态高清图片(2K/4K),还可产出带 AI 转场动画的专业视频,满足现代演示对动态效果的需求。智能视觉分析:相比简单的图片拼接,该 Skill 能深度分析页面间的视觉逻辑,生成符合玻璃拟态风格的流畅转场提示词。专业视觉风格:内置渐变毛玻璃(科技感)和矢量插画(教育/创意)两种高质量风格模板,基于 Apple Keynote 极简主义设计美学。交互式体验:提供完整的键盘导航播放器,支持视频+图片混合播放模式,可循环预览首页并手动控制转场节奏。灵活的内容适配:支持从简短 5 页快速演示到 25 页深度报告的智能内容规划,自动匹配演讲时长(5-60分钟)。

潜在缺点与局限性

外部依赖较重:核心功能依赖 Google Gemini API 和可灵 AI API,需稳定的网络连接和有效的 API 密钥,离线环境无法使用。成本考量:高清图片生成(特别是 4K)和 AI 视频转场消耗较多 Token 和 API 额度,长演示(20+页)成本较高。本地环境要求:视频功能需额外安装 FFmpeg,对非技术用户有一定门槛。生成耗时:每页图片约 30-60 秒,加上视频生成,完整流程可能需要数十分钟,不适合紧急场景。风格扩展性:目前仅内置两种风格,自定义新风格需要编写 Markdown 模板,有一定技术门槛。

适合的目标群体

商务人士与顾问:需要快速将会议纪要和商业计划转化为高质量提案,支持 2K/4K 分辨率满足投影和打印需求。产品经理与运营:制作产品发布会 PPT 和数据分析报告,AI 转场视频提升演示专业度。教育工作者:矢量插画风格适合课件制作,交互式播放器便于课堂控制节奏。市场营销人员:生成品牌故事和营销方案演示,支持视频导出便于社交媒体传播。技术开发者:需要为开源项目或技术分享生成文档化演示,支持代码友好的内容结构。

使用风险

API 密钥安全:需在本地配置 GEMINI_API_KEY 和可灵 AI 密钥,建议使用 .env 文件并加入 .gitignore,避免意外提交到版本控制。存储空间占用:4K 图片单张约 8MB,加上视频文件,一个 15 页演示可能占用 200MB+ 空间,需注意磁盘容量。网络超时风险:API 调用可能因网络波动失败,长演示建议分批次生成。FFmpeg 兼容性:视频合成功能依赖系统 FFmpeg 版本,不同操作系统(macOS/Ubuntu)安装方式不同,可能出现编码兼容性问题。

安全解读

核心用法

PPT Generator Pro 是一款集成文档分析、AI 图像生成与视频合成的自动化 PPT 创作工具。用户通过 /ppt-generator-pro 命令或直接对话触发,提供文档路径或粘贴内容后,Skill 自动完成:内容结构规划 → 风格选择(渐变毛玻璃/矢量插画)→ Nano Banana Pro 生成 16:9 高清图片 → 可选可灵 AI 转场视频 → FFmpeg 合成完整视频。交互式播放器支持键盘导航,实现「视频+静态图」混合播放体验。

显著优点:全流程自动化大幅降低 PPT 制作门槛;2K/4K 双分辨率满足日常与专业场景;Claude 智能分析生成定制化转场提示词,无需额外 API 密钥;开源代码透明可审计,环境变量管理 API 密钥安全规范。

潜在局限:依赖 Google Gemini 和可灵 AI 外部服务,网络稳定性影响体验;视频功能需额外配置可灵密钥并安装 FFmpeg;单页生成耗时约 30-60 秒,大规模文档处理时间较长;风格系统目前仅内置 2 种,自定义风格需手动编写 Markdown。

适合人群:产品经理、市场运营、教育培训者、咨询顾问等需要快速产出视觉化内容的职场人士;技术背景用户可通过修改风格文件实现深度定制。

常规风险:API 调用成本需自行控制;4K 分辨率图片单张约 8MB,批量生成需注意存储空间;视频生成功能消耗可灵 AI 额度,建议先试用图片模式验证效果。

nanobanana-ppt-skills 内容

prompts文件夹
styles文件夹
templates文件夹
手动下载zip · 82.1 kB
transition_template.mdtext/markdown
请选择文件