notion-clipper-skill

📎 一键剪藏网页到 Notion

🥥4总安装量 1评分人数 1
100% 的用户推荐

基于 Chrome CDP 的网页剪藏工具,可将任意网页完整渲染后转换为 Notion 结构化内容,解决知识管理中的信息归档痛点。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无危险函数调用(eval/exec/system),代码注入风险为零
  • ✅ 网络请求严格限定于官方 Notion API (api.notion.com),无数据外泄
  • ✅ 依赖版本已锁定,无动态代码下载或远程执行
  • ⚠️ 需读取本地 API Key 文件(~/.config/notion/api_key),建议设置 600 权限
  • ⚠️ 启动本地 Chrome 浏览器进行网页抓取,使用独立 Profile 隔离个人数据

使用说明

核心用法

Notion Clipper 是一款命令行网页剪藏工具,通过 Chrome DevTools Protocol (CDP) 启动本地浏览器,完整渲染目标网页(包括 JavaScript 动态内容),提取正文后转换为 Notion Block 格式,最终保存至用户指定的 Notion 数据库或页面。支持两种主要工作模式:自动模式(网络空闲即捕获)适用于公开静态页面;等待模式(--wait)允许用户先登录或完成页面交互后再触发捕获,适用于需要身份验证或懒加载内容的场景。

显著优点

1. 完整渲染能力:不同于传统爬虫仅获取静态 HTML,CDP 方案能执行页面 JavaScript、触发懒加载,确保剪藏内容与浏览器中看到的完全一致。
2. 智能内容提取:内置清理脚本自动移除广告、导航栏等干扰元素,精准提取正文内容。

3. 灵活的存储目标:支持按名称搜索数据库、直接指定数据库 ID、或追加到现有页面三种方式,适应不同知识管理 workflow。

4. 鲁棒的网络处理:实现 6 次指数退避重试机制,针对代理冲突、DNS 污染等常见问题提供明确的故障排除指南。

5. 零配置依赖管理:首次运行时自动安装 npm 依赖,降低使用门槛。

潜在缺点与局限性

1. 本地环境依赖:必须安装 Chrome/Chromium 和 Node.js,对纯云端环境不友好。
2. 网络环境敏感:代理配置不当会导致 ECONNREFUSED 或空响应错误,需要用户理解并调整网络设置。

3. 链接丢失问题:为避免 Notion API 校验失败,脚本默认移除所有 Markdown 链接,仅保留纯文本内容,可能损失部分信息价值。

4. Notion 结构限制:复杂网页的排版(如多栏布局、特殊交互组件)在转换为 Notion Block 后可能丢失格式。

5. T3 来源可信度:作为个人开发者项目,长期维护稳定性和安全更新频率存在不确定性。

适合的目标群体

  • 知识管理重度用户:使用 Notion 作为第二大脑,需要系统化归档网络文章、教程、参考资料。
  • 研究人员与内容策展人:需要保存可能失效的网页原文,建立个人可检索的资料库。
  • 自动化工作流构建者:希望将网页剪藏集成到更大的自动化 pipeline 中(配合 cron、IFTTT 等)。
  • 跨平台阅读需求者:将网页内容转入 Notion 后利用其移动端、离线访问能力进行后续阅读。

使用风险

1. 性能开销:每次剪藏需启动 Chrome 进程,内存占用较高(约 100-300MB),频繁操作可能影响系统响应。
2. API 速率限制:Notion API 存在请求频率限制,批量剪藏大量页面时可能触发限流。

3. 内容隐私:网页内容需经过本地处理后经 HTTPS 发送至 Notion 服务器,敏感信息存在云端暴露风险。

4. 依赖项漂移:尽管存在 package-lock.json,但 @tryfabric/martian 等依赖的更新可能引入不兼容变更。

5. Chrome 版本兼容性:CDP 协议版本与本地 Chrome 版本不匹配时可能导致连接失败。

notion-clipper-skill 内容

文件夹图标scripts文件夹
手动下载zip · 21.8 kB
cdp.tstext/plain
请选择文件