clawdbites

🦞 AI 解析视频语音,一键生成食谱

🥥69总安装量 14评分人数 11
100% 的用户推荐

基于 yt-dlp 与 Whisper 开源工具链,自动解析 Instagram Reels 的字幕与语音,将碎片化视频转化为结构化食谱,无需登录即可保存美味秘方。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无可执行脚本文件,无 eval/exec/system 等动态代码执行风险
  • ✅ 无静默数据上传行为,食谱数据仅存储于本地 memory/recipe-wishlist.json
  • ⚠️ Markdown 中包含 yt-dlp、ffmpeg、Whisper 等外部命令示例,需用户自行安装依赖工具
  • ⚠️ T3 级个人开发者来源(kylelol),建议用户审查代码内容后再使用
  • ✅ 仅处理公开 Instagram reels,无需账号登录,无密码或 API Key 等敏感信息收集

使用说明

核心用法

该 Skill 通过三层递进式提取策略,将 Instagram Reels 中的非结构化视频内容转化为标准化食谱数据。首先利用 yt-dlp 提取视频元数据与字幕文本;若字幕信息不完整,自动触发第二层音频转录,通过 ffmpeg 提取音轨并由本地 Whisper 模型识别语音内容;最后辅以 Vision 模型进行关键帧分析,识别屏幕文字。整个过程无需 Instagram 账号登录,仅需提供公开 Reels 链接即可自动完成从"观看"到"收藏"的转化。

显著优点

智能化程度高,能自动识别食谱完整性并决定是否需要音频转录,避免用户手动干预;采用全本地化处理流程,Whisper 语音转录完全在本地运行,无需上传至云端 API,保障隐私安全;具备智能推断能力,当视频未明确提及用量时,能基于上下文和标准包装规格自动估算食材分量;输出格式规范统一,自动生成包含营养成分、食材清单和步骤的结构化数据,便于与 meal-planner 等技能联动;依赖工具均为开源业界标准(yt-dlp、ffmpeg、OpenAI Whisper),生态成熟可靠。

潜在缺点

作为 T3 级个人开发者项目,长期维护和功能更新存在不确定性;依赖 yt-dlp 等工具可能受 Instagram 反爬机制影响,若平台调整接口可能导致功能失效;对于私人账户内容完全无法访问;当创作者将完整食谱置于置顶评论而非视频内时,当前技术方案无法自动获取(需用户手动粘贴);估算的食材分量可能存在偏差,对严格遵循配比的烘焙等场景不够精确;需要用户自行配置 Python 环境和多个命令行工具,技术门槛相对较高。

适合群体

适合习惯在 Instagram 浏览美食内容、希望快速保存食谱的烹饪爱好者;适合需要构建个人食谱库并进行膳食规划的健康管理者;适合内容创作者批量整理参考素材;适合需要将视频食谱结构化以便后续编辑或分享的美食博主;不适合对食材配比精度要求极高的专业烘焙师,或对命令行工具安装感到困难的技术小白。

使用风险

主要风险在于外部依赖的稳定性,yt-dlp 与 Instagram 之间存在持续的"猫鼠游戏",可能因平台策略调整导致下载失败;本地运行 Whisper 基础模型对计算资源有一定要求,低配设备可能出现转录缓慢或内存占用过高;虽然工具本身开源,但下载第三方视频内容仍需遵守 Instagram 服务条款和当地版权法规;建议仅从可信渠道安装依赖工具,避免通过非官方 pip 或 brew 源安装被篡改的版本。

clawdbites 内容

手动下载zip · 6.5 kB
README.mdtext/markdown
请选择文件