note-processor

📝 零依赖智能笔记分析助手

OpenClaw官方出品的本地研究笔记分析工具,零依赖纯标准库实现,快速提取关键词、生成摘要与搜索笔记内容,助力高效知识管理。

收藏
3.8k
安装
1.6k
版本
v1.0.0
CLS 安全性认证2026-05-19
点击查看完整报告 >

使用说明

核心用法

note-processor 是一款专为 research-assistant 配套设计的本地研究笔记分析工具,通过命令行接口提供四大核心功能:

1. summarize <topic>:生成主题概览,包含笔记数量、字数统计、时间范围、Top 5 标签、关键要点及最近3条笔记
2. keywords <topic>:提取高频关键词(过滤停用词),展示前20个关键词及其出现频次

3. extract <topic> <keyword>:在指定主题中搜索包含特定关键词的所有笔记,高亮显示匹配内容

4. list:列出所有研究主题及其基础统计信息

工具直接读取 ~/.openclaw/workspace/research_db.json 数据库文件,与 research-assistant 共享数据格式,形成「记录→分析→输出」的完整工作流。

显著优点

  • 零成本零依赖:仅使用 Python 标准库(sys/json/re/pathlib/datetime/collections),无需安装任何第三方包,无 API Key 需求
  • 极速响应:本地文件读取,无网络延迟,适合高频次查询场景
  • 智能关键要点识别:通过模式匹配自动标记包含 "important/key/critical/must/should/note/remember/warning/priority" 等信号词的句子,帮助快速定位 actionable insights
  • 完善的停用词过滤:内置20+常见英语停用词过滤,提升关键词质量
  • 清晰的输出格式:采用结构化视觉设计(emoji分隔、缩进层级、高亮标记),便于快速浏览

潜在缺点与局限性

  • 无语义理解能力:关键词提取基于纯频率统计,非 NLP/ML 方案,无法识别同义词或进行主题建模
  • 英语中心化:停用词列表针对英语优化,其他语言需手动定制
  • 关键要点检测机械化:仅依赖关键词模式匹配,无法理解句子真正重要性
  • 单用户本地架构:无多用户支持、无跨设备同步、无协作功能
  • 数据格式强绑定:仅兼容 research-assistant 的特定 JSON 结构,灵活性受限

适合的目标群体

  • 个人研究者/知识工作者:需要定期回顾和整理研究笔记,提取写作素材
  • 学生与学术用户:管理课程笔记、文献阅读记录,准备报告前快速定位关键信息
  • 独立开发者/技术写作者:追踪技术调研过程,整理实验记录和结论
  • research-assistant 现有用户:希望扩展笔记分析能力,形成完整工具链
  • 隐私敏感型用户:拒绝云端笔记服务,坚持本地优先的数据策略

使用风险

  • 数据可用性依赖:若 research_db.json 文件被移动、损坏或权限变更,工具将无法正常读取
  • research-assistant 强耦合:单独使用价值有限,需前置配合 research-assistant 积累笔记数据
  • 关键词质量波动:笔记写作风格直接影响提取效果,口语化、缩写过多会导致关键词无意义
  • 无备份机制:工具本身不提供数据备份功能,用户需自行管理数据库文件安全
  • 扩展性天花板:纯标准库实现虽保证安全,但也限制了高级功能(如向量化检索、语义搜索)的演进空间

安全解读

核心用法

note-processor 是一款专为研究笔记设计的纯本地分析工具,与 research-assistant 配合使用。通过四个核心命令实现笔记价值的深度挖掘:

  • summarize <topic>:生成主题概览,包含笔记数量、词量统计、创建/更新时间、Top 5 标签、关键要点(自动识别包含 important/critical/must 等关键词的句子)及最新 3 条笔记
  • keywords <topic>:提取高频关键词,自动过滤 4 字符以下词汇及 22 个英语停用词,输出 Top 20 关键词及频次
  • extract <topic> <keyword>:精确搜索含指定关键词的所有笔记,高亮显示匹配项并附带时间戳和标签
  • list:展示所有研究主题的基础统计(笔记数、词量、最后更新)及最新笔记预览

显著优点

1. 零成本零依赖:仅使用 Python 标准库(sys/json/re/pathlib/datetime/collections),无第三方包、无 API 密钥、无订阅费用
2. 离线安全:无网络通信、无外部 API 调用、不上传任何数据,适合敏感研究场景

3. 即装即用:单文件架构,407 行代码,无需复杂配置

4. 研究闭环:与 research-assistant 共享 research_db.json 数据库,形成「记录→积累→分析→输出」完整工作流

5. 智能关键点检测:通过模式匹配自动提取行动导向句子,降低人工筛选成本

潜在局限

1. 无语义理解:基于词频统计,无法识别同义词(如 "AI" 与 "artificial intelligence" 被分别计数)
2. 英语中心化:停用词过滤列表针对英语设计,其他语言效果受限

3. 关键词质量依赖输入:若笔记用词随意,提取结果价值有限

4. 无可视化输出:纯文本终端界面,不支持图表或交互式浏览

5. 单用户设计:无多用户协作或权限管理功能

适合人群

  • 独立研究者、知识工作者需定期复盘大量笔记
  • 技术写作者在撰写报告前快速定位素材
  • 个人项目管理场景(如实验记录、安全事件复盘、内容创作追踪)
  • 注重数据隐私、偏好本地优先工具的用户
  • 需要与 research-assistant 形成工作流组合的 ClawHub 用户

常规风险

  • 数据位置固定:数据库路径硬编码为 ~/.openclaw/workspace/research_db.json,迁移需手动操作
  • 输入验证宽松:当前版本对 topic/keyword 参数无严格长度或特殊字符过滤,极端输入可能导致异常输出
  • 无版本控制:笔记修改历史依赖外部 Git 等工具,skill 本身不提供回滚功能
  • T3 来源等级:由个人开发者维护,长期维护承诺弱于企业级项目

综合评价

note-processor 是研究笔记管理的「轻量级分析层」,不追求 AI 驱动的智能摘要,而是以确定性、可审计的文本处理满足「快速检索+模式发现」的核心需求。92 分安全评级和 S 级安全等级使其成为隐私敏感场景的理想选择,适合作为 research-assistant 的配套工具而非独立使用。对于需要语义搜索、跨语言支持或团队协作的用户,需额外引入其他工具补充。

note-processor 内容

scripts文件夹
手动下载zip · 5.9 kB
note_processor.pytext/plain
请选择文件