vault

🗄️ 本地智能研究管家

🥥14总安装量 3评分人数 3
100% 的用户推荐

本地优先的研究编排引擎,基于SQLite实现零成本、高可靠性的长期研究任务管理,确保数据完全本地可控。

S

安全性较高,可在多数场景中优先使用

  • 来自可信来源(Github / Microsoft / 官方仓库)
  • ✅ SSRF 防护机制完善:IP 范围限制、主机名验证、协议白名单和 15 秒超时控制全面生效
  • ✅ 100% 本地数据处理:SQLite 存储于 `~/.researchvault/`,无云端上传或数据外泄风险
  • ✅ 全面参数化查询:所有数据库操作采用参数化语句,彻底杜绝 SQL 注入攻击
  • ✅ 无危险代码执行:未检出 eval/exec 动态执行、命令注入或反序列化漏洞
  • ⚠️ 文件名格式兼容性:存在反斜杠格式文件名,在类 Unix 系统上可能造成路径解析问题

使用说明

核心用法

ResearchVault Brain 是一款专为长期研究任务设计的本地编排引擎,采用 SQLite 作为核心存储,所有数据默认保存在 ~/.researchvault// 目录下。用户通过命令行工具 vault.py 完成全流程操作:使用 init 初始化研究项目并设定目标;通过 scuttle 命令安全摄取多源数据(支持 Reddit、YouTube、Grokipedia 及 Web 等),内置 SSRF 防护确保网络安全;借助 summarystatus 实时监控项目进展;最终通过 export 将研究成果导出为 Markdown 等格式。此外,该工具还提供 MCP 服务器接口、分歧推理分支管理、本地向量相似性合成分析、低置信度发现自动验证,以及 Watchdog 后台监控模式等高级功能。

显著优点

零外部成本与完全本地可控:所有数据存储于本地 SQLite 数据库,无需云服务订阅,杜绝数据外泄风险,特别适合处理敏感研究内容。企业级安全防护:内置多层 SSRF 防护机制,包括 IP 范围限制、主机名验证、协议白名单和请求超时控制;全面采用参数化查询,彻底杜绝 SQL 注入;无动态代码执行或反序列化风险。丰富的功能生态:不仅支持基础的项目管理,还整合了多源数据摄取、智能合成分析、自动验证协议和持续监控能力,形成完整的研究闭环。开源透明可审计:完整 Python 源码托管于 GitHub,由 AI 辅助开发并经人工审核,版本迭代活跃,文档完善。标准化接口:MCP 服务器支持实现跨代理协作,提升团队研究效率。

潜在缺点与局限性

外部 API 依赖:Brave Search 等搜索功能需要外部网络访问和 API 密钥,无网络环境或密钥时功能受限。平台兼容性瑕疵:文件名中存在反斜杠格式,在类 Unix 系统上可能造成路径解析问题。技术门槛:命令行操作界面要求用户具备一定终端使用经验,非技术背景用户上手成本较高。本地资源占用:长期运行的 Watchdog 监控模式和大量本地向量计算可能对低配置设备造成性能压力。协作局限:虽然支持 MCP 协议,但缺乏原生多人实时协作功能,团队场景需额外配置。

适合的目标群体

学术研究人员:需要长期追踪文献、管理研究假设、确保数据隐私的博士生、博士后及课题组。情报分析师:从事开源情报(OSINT)工作,需要多源信息整合、可信度评估和溯源管理的从业者。独立开发者与技术写作者:进行技术调研、竞品分析、文档撰写的个人工作者。隐私敏感型用户:对数据主权有严格要求,拒绝云端存储的企业安全团队和个人用户。AI 辅助研究团队:利用 MCP 协议构建多代理研究工作流的早期技术采纳者。

使用风险

性能风险:大规模项目的本地向量相似性计算可能消耗显著 CPU 和内存资源;Watchdog 后台监控持续占用系统资源。依赖风险:requests、beautifulsoup4 等核心依赖若出现安全漏洞需及时更新;Brave API 服务中断将影响搜索功能。数据风险:虽为本地存储,但 SQLite 文件损坏或误删除将导致不可恢复的数据丢失,建议定期备份。配置风险RESEARCHVAULT_DB 环境变量若指向共享目录或网络挂载点,可能意外暴露研究数据。网络风险:尽管 SSRF 防护完善,但用户自定义的 URL 仍可能指向恶意站点,需保持安全意识。

vault 内容

文件夹图标scripts文件夹
文件夹图标tests文件夹
手动下载zip · 40.9 kB
__init__.pytext/plain
请选择文件