Name: 多模态智能内容摘要助手
Author: steipete

使用说明

核心用法

summarize 是一个封装了同名 CLI 工具的 Agent Skill，旨在为 Claude 提供一键式内容总结能力。用户可通过自然语言指令，让 Claude 调用该技能对网页 URL、本地文件（PDF、图片、音频）以及 YouTube 视频链接进行智能摘要。核心交互方式简洁直观：直接提供目标内容地址，技能会自动调用本地安装的 summarize CLI 执行处理。

该技能支持多厂商 AI 后端，包括 OpenAI、Anthropic、xAI 和 Google，默认采用 google/gemini-3-flash-preview 模型。用户可通过环境变量灵活配置 API Key，也可在 ~/.summarize/config.json 中预设默认模型。输出长度支持五级调节（short 至 xxl），并提供 --json 机器可读模式便于后续自动化处理。

显著优点

多模态覆盖能力是最大亮点，单一工具即可处理文本网页、PDF 文档、图像 OCR、音频转录及 YouTube 视频，无需切换多个工具。供应商中立性设计出色，不绑定任何单一 AI 服务商，用户可根据成本、质量或隐私偏好自由切换。对于被反爬机制阻挡的网站，可选集成 Firecrawl 服务；YouTube 处理也提供 Apify 回退方案，增强了复杂场景的可用性。

配置层面，技能采用纯环境变量驱动，无敏感信息硬编码风险。Claw 框架的集成使得安装流程标准化，通过 Homebrew 一键安装依赖，降低了技术门槛。

潜在缺点与局限性

外部依赖链条较长是首要顾虑：skill 本身仅为配置层，核心功能完全依赖 steipete 个人维护的 Homebrew tap 中的 summarize CLI 工具。该依赖未锁定版本，且未纳入本次安全审查范围，存在供应链风险。隐私边界模糊，用户需自行承担内容上传至第三方 AI 服务商的数据暴露风险，技能本身不提供本地离线处理能力。

功能层面，YouTube 总结依赖可选的 Apify 服务，若未配置 APIFY_API_TOKEN 可能失败；Firecrawl 同样为付费增值服务。对于超长文档或视频，受限于 AI 模型上下文窗口，可能存在截断或遗漏关键信息的情况。

适合的目标群体

知识工作者：需要快速消化大量网页文章、研究报告或会议录音
内容创作者：提取视频脚本要点、整理采访素材
研究人员：批量处理 PDF 文献，生成阅读笔记
多语言用户：利用 AI 模型跨语言总结外文资料

不适合对数据隐私有严格合规要求的企业环境，或需要完全离线处理的敏感场景。

使用风险

供应链风险：summarize CLI 由个人开发者维护，更新节奏和安全响应能力存疑。API 成本风险：高频使用可能产生显著的 AI 服务调用费用，尤其在使用 GPT-4 级别模型时。数据残留风险：用户内容会被发送至 Google、OpenAI 等服务商，需自行了解其数据保留与训练政策。配置泄露风险：环境变量虽比硬编码安全，但在共享环境中仍可能因 env 命令或日志泄露。

安全解读

核心用法

summarize 是一款命令行工具，可将任意网页、PDF、图片、音频及 YouTube 视频内容快速转换为 AI 生成摘要。核心使用方式极其简单：

summarize "https://example.com" --model google/gemini-3-flash-preview
summarize "/path/to/file.pdf"
summarize "https://youtu.be/xxx" --youtube auto

支持 OpenAI、Anthropic、xAI、Google 四大主流模型，通过环境变量配置 API 密钥即可切换。默认使用 Gemini 3 Flash，兼顾速度与成本。输出长度可自定义（short 至 xxl 或指定字符数），支持 JSON 格式输出便于自动化集成。

显著优点

格式全覆盖：单一工具处理网页、PDF、图片、音频、YouTube，无需切换工具链
模型灵活：四平台 API 任选，可按内容复杂度与成本偏好自由切换
智能降级：内置 Firecrawl 与 Apify 备用机制，应对网站反爬或 YouTube 解析失败
零配置启动：默认模型即开即用，新手无需复杂设置
结构化输出：--json 标志支持流水线集成，适合自动化工作流

潜在缺点与局限

外部依赖重：核心功能完全依赖 summarize CLI 及第三方 AI API，离线不可用
T3 来源风险：维护者为个人开发者（pin-alt），非知名基金会或企业，长期维护稳定性存疑
隐私灰色地带：文档/视频内容需上传至 summarize.sh 或模型服务商处理，敏感数据存在外泄理论风险
成本累积：高频调用下，多模型支持与长文本处理可能产生显著 API 费用
YouTube 限制：依赖 Apify 备用方案，需额外配置 token，部分区域或受限视频无法解析

适合人群

研究人员、记者、学生：需快速消化大量网页/论文/视频内容
开发者与运维：构建自动化监控、周报生成、知识库归档流程
内容创作者：提取竞品分析素材、脚本要点整理

常规风险

| 风险类型 | 说明 | 缓解建议 |

|---------|------|---------|

| 数据外泄 | 敏感文档上传至第三方服务 | 避免处理机密/个人信息；优先本地部署模型 |

| API 密钥泄露 | 环境变量配置不当 | 使用密钥管理工具，勿硬编码或提交至版本控制 |

| 服务中断 | T3 项目维护不确定性 | 锁定版本，准备备用摘要工具 |

| 内容合规 | AI 摘要可能遗漏关键法律/医疗细节 | 关键决策仍需人工核对原文 |

productivity content-media docs ai-ml api automation

summarize 内容

手动下载zip · 1.2 kB

SKILL.mdtext/markdown

请选择文件