hxxra

📚 一站式学术文献智能管理助手

🥥7总安装量 2评分人数 2
100% 的用户推荐

集成arXiv、Google Scholar与Zotero的学术助手,支持智能搜索、批量下载、AI分析,为研究者打造端到端文献管理自动化工作流。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 代码层面无高危操作:未使用 eval/exec/system 等危险函数,无动态代码加载行为
  • ✅ 敏感信息安全管理:API Key 通过 config.json 或环境变量读取,无硬编码凭证
  • ⚠️ 外部服务依赖风险:核心功能依赖 arXiv、Google Scholar、Zotero 及 OpenAI 等第三方 API,需用户自行配置密钥并承担服务可用性风险
  • ⚠️ 数据隐私注意事项:PDF 分析功能需将文档内容传输至 OpenAI 等 LLM 服务商,涉及敏感研究数据的外流风险
  • ✅ 输入输出安全防护:具备完善的参数类型检查、文件路径规范化(防路径遍历)、PDF 文件头验证及错误处理机制

使用说明

hxxra 是一款专为学术研究者设计的全链路文献管理工作流技能,通过 stdin/stdout JSON 接口与 OpenClaw 框架集成,提供从文献检索到知识库归档的完整解决方案。该技能围绕四个核心命令构建:search 命令支持通过 arXiv API 与 Google Scholar 爬虫进行多源学术搜索,可精准定位研究领域内的前沿论文;download 命令提供批量 PDF 获取能力,支持基于搜索结果的 selective 下载并自动规范化文件名;analyze 命令集成 PyMuPDF 与 OpenAI API,能够自动提取 PDF 文本内容并生成结构化的研究综述(涵盖背景、方法论、实验结果等维度);save 命令则通过 Zotero API 实现与主流文献管理软件的无缝对接,自动构建个人学术知识库。

该技能的显著优势在于其模块化设计与标准化数据流。基于 scholarly、pymupdf 等成熟开源库构建,确保了学术数据抓取的稳定性与 PDF 解析的准确性;JSON 格式的命令接口使得该技能可轻松嵌入自动化脚本或与其他工具链集成;完善的错误处理机制(包含错误码与修复建议)降低了使用门槛。此外,文件操作具备安全防护(正则过滤危险字符、PDF 文件头验证),并设置请求超时与反爬延迟,体现了工程实现的严谨性。

然而,作为 T3 来源的个人开发者项目,其长期维护稳定性与代码审计深度不及 institutional 级项目。功能层面存在明显的外部依赖风险:Google Scholar 搜索可能受服务条款限制且缺乏官方 API 支持,大规模检索存在被封禁风险;PDF 分析功能强制依赖 OpenAI 等第三方 LLM 服务,不仅产生额外成本,更意味着敏感研究内容需上传至外部服务器,对涉及商业机密或未公开研究成果的用户存在数据隐私隐患。此外,当前版本缺乏依赖版本锁定机制(requirements.txt),可能因库更新导致兼容性问题。

该技能最适合高校研究人员、研究生及科研助理使用,特别是需要处理大量文献综述、构建个人论文库的学术工作者。对于已使用 Zotero 作为主力文献管理工具的用户,其 save 命令可显著提升归档效率;对于需要快速筛选大量论文并生成初步内容分析的研究场景,该自动化工作流可节省数小时人工阅读时间。

使用风险主要包括:外部 API 的可用性与速率限制(arXiv 虽无需密钥但有访问频率限制,OpenAI API 按 token 计费);网络环境要求(需稳定连接至国际学术网络);以及潜在的数据合规问题(上传 PDF 至 LLM 服务需确认符合机构数据安全政策)。建议用户在配置 API 密钥时优先使用环境变量而非配置文件,并避免分析包含敏感信息的内部文档。

hxxra 内容

文件夹图标scripts文件夹
手动下载zip · 11.7 kB
hxxra.pytext/plain
请选择文件