使用说明

核心用法

note-processor 是一款专为 research-assistant 配套设计的本地研究笔记分析工具，通过命令行接口提供四大核心功能：

1. summarize <topic>：生成主题概览，包含笔记数量、字数统计、时间范围、Top 5 标签、关键要点及最近3条笔记
2. keywords <topic>：提取高频关键词（过滤停用词），展示前20个关键词及其出现频次
3. extract <topic> <keyword>：在指定主题中搜索包含特定关键词的所有笔记，高亮显示匹配内容
4. list：列出所有研究主题及其基础统计信息

工具直接读取 ~/.openclaw/workspace/research_db.json 数据库文件，与 research-assistant 共享数据格式，形成「记录→分析→输出」的完整工作流。

显著优点

零成本零依赖：仅使用 Python 标准库（sys/json/re/pathlib/datetime/collections），无需安装任何第三方包，无 API Key 需求
极速响应：本地文件读取，无网络延迟，适合高频次查询场景
智能关键要点识别：通过模式匹配自动标记包含 "important/key/critical/must/should/note/remember/warning/priority" 等信号词的句子，帮助快速定位 actionable insights
完善的停用词过滤：内置20+常见英语停用词过滤，提升关键词质量
清晰的输出格式：采用结构化视觉设计（emoji分隔、缩进层级、高亮标记），便于快速浏览

潜在缺点与局限性

无语义理解能力：关键词提取基于纯频率统计，非 NLP/ML 方案，无法识别同义词或进行主题建模
英语中心化：停用词列表针对英语优化，其他语言需手动定制
关键要点检测机械化：仅依赖关键词模式匹配，无法理解句子真正重要性
单用户本地架构：无多用户支持、无跨设备同步、无协作功能
数据格式强绑定：仅兼容 research-assistant 的特定 JSON 结构，灵活性受限

适合的目标群体

个人研究者/知识工作者：需要定期回顾和整理研究笔记，提取写作素材
学生与学术用户：管理课程笔记、文献阅读记录，准备报告前快速定位关键信息
独立开发者/技术写作者：追踪技术调研过程，整理实验记录和结论
research-assistant 现有用户：希望扩展笔记分析能力，形成完整工具链
隐私敏感型用户：拒绝云端笔记服务，坚持本地优先的数据策略

使用风险

数据可用性依赖：若 research_db.json 文件被移动、损坏或权限变更，工具将无法正常读取
research-assistant 强耦合：单独使用价值有限，需前置配合 research-assistant 积累笔记数据
关键词质量波动：笔记写作风格直接影响提取效果，口语化、缩写过多会导致关键词无意义
无备份机制：工具本身不提供数据备份功能，用户需自行管理数据库文件安全
扩展性天花板：纯标准库实现虽保证安全，但也限制了高级功能（如向量化检索、语义搜索）的演进空间

安全解读

核心用法

note-processor 是一款专为研究笔记设计的纯本地分析工具，与 research-assistant 配合使用。通过四个核心命令实现笔记价值的深度挖掘：

summarize <topic>：生成主题概览，包含笔记数量、词量统计、创建/更新时间、Top 5 标签、关键要点（自动识别包含 important/critical/must 等关键词的句子）及最新 3 条笔记
keywords <topic>：提取高频关键词，自动过滤 4 字符以下词汇及 22 个英语停用词，输出 Top 20 关键词及频次
extract <topic> <keyword>：精确搜索含指定关键词的所有笔记，高亮显示匹配项并附带时间戳和标签
list：展示所有研究主题的基础统计（笔记数、词量、最后更新）及最新笔记预览

显著优点

1. 零成本零依赖：仅使用 Python 标准库（sys/json/re/pathlib/datetime/collections），无第三方包、无 API 密钥、无订阅费用
2. 离线安全：无网络通信、无外部 API 调用、不上传任何数据，适合敏感研究场景
3. 即装即用：单文件架构，407 行代码，无需复杂配置
4. 研究闭环：与 research-assistant 共享 research_db.json 数据库，形成「记录→积累→分析→输出」完整工作流
5. 智能关键点检测：通过模式匹配自动提取行动导向句子，降低人工筛选成本

潜在局限

1. 无语义理解：基于词频统计，无法识别同义词（如 "AI" 与 "artificial intelligence" 被分别计数）
2. 英语中心化：停用词过滤列表针对英语设计，其他语言效果受限
3. 关键词质量依赖输入：若笔记用词随意，提取结果价值有限
4. 无可视化输出：纯文本终端界面，不支持图表或交互式浏览
5. 单用户设计：无多用户协作或权限管理功能

适合人群

独立研究者、知识工作者需定期复盘大量笔记
技术写作者在撰写报告前快速定位素材
个人项目管理场景（如实验记录、安全事件复盘、内容创作追踪）
注重数据隐私、偏好本地优先工具的用户
需要与 research-assistant 形成工作流组合的 ClawHub 用户

常规风险

数据位置固定：数据库路径硬编码为 ~/.openclaw/workspace/research_db.json，迁移需手动操作
输入验证宽松：当前版本对 topic/keyword 参数无严格长度或特殊字符过滤，极端输入可能导致异常输出
无版本控制：笔记修改历史依赖外部 Git 等工具，skill 本身不提供回滚功能
T3 来源等级：由个人开发者维护，长期维护承诺弱于企业级项目

综合评价

note-processor 是研究笔记管理的「轻量级分析层」，不追求 AI 驱动的智能摘要，而是以确定性、可审计的文本处理满足「快速检索+模式发现」的核心需求。92 分安全评级和 S 级安全等级使其成为隐私敏感场景的理想选择，适合作为 research-assistant 的配套工具而非独立使用。对于需要语义搜索、跨语言支持或团队协作的用户，需额外引入其他工具补充。

productivity docs education-research data-analytics automation

note-processor 内容

scripts文件夹

手动下载zip · 5.9 kB

note_processor.pytext/plain

请选择文件