research-assistant

📝 本地化智能研究笔记管家

基于纯Python标准库构建的本地化研究笔记管理工具,支持跨会话结构化知识存储、标签检索与Markdown导出,数据完全本地可控。

收藏
19.3k
安装
4k
版本
v1.0.1
CLS 安全性认证2026-05-11
点击查看完整报告 >

使用说明

核心用法

Research Assistant 是一款面向 Agent 的本地化研究笔记管理技能,通过命令行工具 research_organizer.py 实现知识的结构化沉淀。核心功能包括:添加带标签的笔记(add)、列出所有主题(list)、查看主题详情(show)、全文搜索(search)以及导出为 Markdown(export)。数据以 JSON 格式存储于 ~/.openclaw/workspace/research_db.json,支持跨会话持久化,特别适合需要长期跟踪的多阶段项目。

显著优点

安全架构扎实:v1.0.1 版本引入的 is_safe_path()() 路径验证机制,明确限制导出目录为工作区、home 目录和 /tmp,有效阻断对 /etc//、//usr//、//var// 等系统路径及 ~/.bashrc~/.ssh//` 等敏感配置文件的写入,从设计层面防范提示注入导致的权限提升攻击。

零依赖轻量设计:仅依赖 Python 标准库(json、sys、pathlib、datetime),无外部包引入,彻底规避供应链攻击风险,部署和维护成本极低。

数据主权完全归属用户:所有数据本地存储,无网络传输,不收集任何敏感信息,用户可自由备份、迁移或删除 research_db.json 文件。

检索与导出体验完善:支持大小写不敏感的全文搜索,结果包含时间戳和预览;Markdown 导出格式规范,含主题元数据、笔记时间线和标签,便于分享或归档。

潜在缺点与局限性

单机架构限制协作:数据存储于本地单文件,无法原生支持多用户协作或云端同步,团队场景需配合 Git 等工具手动管理。

T3 来源可信度:当前为个人开发者账号发布,虽代码审计通过,但缺乏组织背书或代码签名,长期维护稳定性存在不确定性。

功能边界较窄:专注于纯文本笔记管理,不支持富媒体附件、版本历史、笔记关联图谱等进阶知识管理功能。

搜索能力基础:仅支持关键词匹配,无语义搜索、模糊搜索或相关性排序,大规模数据下检索效率可能下降。

适合的目标群体

  • 独立研究者与开发者:需要跨会话跟踪技术调研、实验结果或项目思路的个人用户
  • 内容创作者:规划内容日历、整理参考资料、沉淀写作素材
  • Agent 技能开发者:系统化管理技能创意、技术方案和市场调研笔记
  • 隐私敏感用户:拒绝云端服务、要求数据完全本地可控的知识工作者

使用风险

数据丢失风险:JSON 单文件存储虽便于迁移,但无内置备份机制,建议用户定期手动备份 research_db.json

性能瓶颈:随着笔记量增长,全量加载和搜索的线性时间复杂度可能导致响应延迟,超大规模使用需考虑数据分片。

导出路径误操作:虽有路径限制,但用户仍需确保导出目标在允许范围内,否则将触发阻塞并需重新指定路径。

隔离环境建议:尽管代码审计通过,T3 来源仍建议在容器或虚拟机中运行,以符合纵深防御原则。

安全解读

核心用法

Research Assistant 是一款面向 AI Agent 的本地化知识管理工具,用于结构化存储、检索和导出研究笔记。核心工作流围绕 research_organizer.py 脚本展开,支持以下操作:

  • add: 向指定主题添加带标签的笔记,自动记录时间戳
  • list: 查看所有研究主题及其元数据(创建时间、更新时间、笔记数量)
  • show: 展示特定主题下的全部笔记详情
  • search: 跨主题、跨内容的全文检索(不区分大小写)
  • export: 将主题导出为格式化的 Markdown 文件

数据以 JSON 格式持久化存储于 ~/.openclaw/workspace/research_db.json,支持多会话连续性,适合长期项目跟踪。

显著优点

1. 零依赖安全架构:纯 Python 标准库实现(json、pathlib、datetime 等),无外部依赖包,供应链攻击面为零
2. 完善的路径验证:Export 功能内置 is_safe_path() 机制,严格限制输出目录为 workspace、home 或 /tmp,阻止写入系统路径(/etc、/usr 等)及敏感配置文件(~/.bashrc、~/.ssh 等),有效防御路径遍历攻击

3. 隐私优先设计:完全本地运行,无网络请求、无外部 API 调用,用户研究数据零外泄风险

4. 多场景适配:支持技能开发调研、商业实验追踪、内容规划等多种知识管理工作流

潜在局限

  • 无云端同步:纯本地存储,多设备协作需手动迁移 JSON 文件
  • 无版本控制:笔记更新为追加模式,历史版本需手动管理
  • 符号链接未校验:路径验证未显式解析符号链接,存在理论上绕过限制的可能(需配合特定文件系统配置)
  • 输入长度无限制:topic 和 note 参数未设长度上限,极端情况下可能导致资源占用

适合人群

  • 需要跨 AI 会话维持知识连续性的开发者与研究者
  • 进行多轮实验、需系统记录过程与结论的自动化收入探索者
  • 重视数据隐私、倾向本地优先存储的安全敏感用户

常规风险

| 风险类型 | 评估 | 说明 |
|---------|------|------|
| 数据丢失 | 中 | 单点存储于本地 JSON,建议定期备份 |
| 权限提升 | 极低 | 路径验证机制已阻断系统文件写入 |
| 数据外泄 | 极低 | 无网络功能,完全离线运行 |
| 供应链攻击 | 无 | 零外部依赖 |

research-assistant 内容

scripts文件夹
手动下载zip · 4.5 kB
research_organizer.pytext/plain
请选择文件