Literature Review

📚 四大数据库一键检索,综述写作事半功倍

学术文献综述助手,整合Semantic Scholar、OpenAlex、Crossref、PubMed四大数据库,支持多源检索、自动去重与智能文献合成。

收藏
35.7k
安装
8.4k
版本
1.2.0
CLS 安全性认证2026-05-01
点击查看完整报告 >

使用说明

核心功能

Literature Review是一个专为学术研究设计的文献检索与综述生成工具,通过Python脚本lit_search.py实现对四大主流学术数据库的统一访问:

  • Semantic Scholar (S2):侧重引用网络与AI生成的TL;DR摘要
  • OpenAlex:开放学术图谱,数据覆盖全面,支持"礼貌池"访问优化
  • Crossref:DOI元数据权威源,适合精确文献定位
  • PubMed:生物医学领域金标准,通过efetch获取完整XML记录

显著优势

1. 多源聚合与智能去重--source all/both模式自动按DOI去重,避免人工筛选冗余
2. 完整摘要获取:PubMed调用efetch API返回全文摘要,OpenAlex通过倒排索引重建摘要文本

3. 灵活检索策略:支持宽泛主题搜索与DOI精确查询双模式

4. 学术规范友好:自动生成包含作者、年份、期刊、引用量的结构化数据,便于后续引用管理

局限性与风险

  • API依赖性:需配置USER_EMAIL以获取OpenAlex/Crossref礼貌池权限,部分功能受限于外部服务稳定性
  • 摘要覆盖不均:Crossref本身不提供摘要,OpenAlex摘要质量因源数据而异
  • 合成能力边界:"撰写综述"功能本质是模板化文本组织,不具备真正的文献理解与批判性分析能力,用户需人工验证论点准确性
  • 环境配置门槛:需Python环境及可选API密钥配置,非技术用户上手成本较高

适用人群

  • 研究生及科研人员需快速建立文献清单
  • 系统性综述/meta分析初期的文献筛选阶段
  • 跨学科研究者需同时检索生物医学与综合学术数据库

安全提示

工具本身为只读检索,无数据写入风险;但需注意学术合规——自动生成内容不可直接用于正式出版物,必须人工核实原始文献。

安全解读

核心用法

literature-review 是一款面向学术研究者的文献检索与综述辅助工具,通过整合 Semantic Scholar、OpenAlex、Crossref 和 PubMed 四大权威学术数据库,实现一站式文献 discovery。用户可通过 CLI 执行多源搜索、单库精准检索、DOI 详情获取及文献主题聚类,最终输出结构化元数据支持综述写作。

核心工作流包括:
1. 广度搜索 (--source all):并行查询四大数据库,自动基于 DOI 去重

2. 精准定位 (--source pm/s2/oa/cr):针对生物医学优先选用 PubMed,需要引用数据选 Semantic Scholar

3. 详情深挖:通过 DOI 获取 S2 的 TL;DR 摘要及完整元数据

4. 综述生成:按主题或时序聚类文献,逐步合成学术段落

输出字段标准化包含:ID、DOI、标题、年份、作者列表、完整摘要、期刊、被引次数及数据来源标识。

显著优点

  • 多源互补:覆盖 2 亿+ 论文(OpenAlex 全覆盖 + PubMed 生物医学金标准 + S2 引用网络 + Crossref DOI 权威元数据)
  • 数据完整:支持完整摘要获取(PubMed 通过 efetch XML 解析,OpenAlex 自动重建倒排索引摘要)
  • 智能去重:跨库搜索结果自动 DOI 比对去重,避免人工筛选
  • 学术友好:自动注入 User-Agent 与机构邮箱至 "Polite Pool",符合 API 使用伦理
  • 零本地依赖:纯 Python 实现,仅依赖 requests 标准库

潜在局限

  • Crossref 无摘要:仅返回题录元数据,需配合其他库补全
  • 实时调用无缓存:每次搜索均请求远程 API,高频使用可能触发限流
  • 网络依赖强:学术 API 可达性因地区/机构而异(尤其 NCBI E-utilities)
  • T3 来源维护:独立开发者维护,长期更新稳定性需关注
  • 无全文获取:仅限开放元数据,付费论文全文需另行获取

适合人群

  • 高校科研人员撰写系统性综述(systematic review)
  • 研究生快速建立研究领域的文献全景图
  • 文献计量学者进行多源数据交叉验证
  • 跨学科研究者整合生物医学与计算机科学文献

常规风险

  • 环境变量泄露:EMAIL 与 API Key 通过环境变量注入,需避免在共享环境硬编码
  • API 限流:免费层级存在调用频率上限(S2: 100 req/5min;OpenAlex: ~100k/日)
  • 数据时效性:依赖各数据库更新周期,预印本与正式出版可能存在滞后
  • 误引风险:自动生成的引用格式需人工核对 DOI/PMID 准确性

Literature Review 内容

scripts文件夹
手动下载zip · 6.3 kB
lit_search.pytext/plain
请选择文件