literature-search

📚 多源学术文献智能检索助手

基于Semantic Scholar、PubMed等主流学术数据库的文献检索指南,帮助研究者快速定位核心论文并生成规范引用列表,提升科研效率。

收藏
2.8k
安装
597
版本
v1.0.3
CLS 安全性认证2026-04-30
点击查看完整报告 >

使用说明

核心用法

literature-search 是一个纯指导性的学术文献检索 Skill,旨在帮助用户系统性地从多个权威学术数据库中查找和整理相关文献。使用时,系统会自动在输入前添加"please think very deeply"前缀以优化检索深度。工作流程包括:明确检索范围(关键词、子领域、时间范围)、选择合适的数据源、迭代式多源搜索、去重筛选,最终输出标准化的引用列表。

该 Skill 支持的数据源覆盖全面:Semantic Scholar(API友好)、PubMed(生物医学)、arXiv(预印本)、IEEE/ACM(计算机/工程)、Scopus/Web of Science(综合索引,需订阅)以及 Google Scholar(仅限用户手动提供结果)。输出格式统一为:作者. 标题. 期刊/会议. 年份. DOI/URL。

显著优点

合规性设计突出:明确禁止未经授权的网络爬虫行为,严格区分公开API与付费订阅资源,将访问权限责任清晰界定给用户,有效规避法律风险。

数据源覆盖全面:横跨8大主流学术索引,从预印本到顶会期刊、从免费资源到机构订阅服务,满足不同学科、不同阶段的文献需求。

输出质量可控:内置去重机制,优先保留高被引或最新版本,期刊/会议版本优先于预印本,确保引用列表的学术规范性。

扩展性强:支持后续筛选(年份、期刊、子主题)和格式转换(BibTeX/CSV),适配论文写作的不同场景。

潜在缺点与局限性

无自动化执行能力:该 Skill 仅为操作指南,不包含实际调用API或抓取网页的代码,用户需自行执行每一步操作,对新手不够友好。

Google Scholar 使用受限:由于官方无API且禁止自动化抓取,该重要数据源只能依赖用户手动导出,效率大打折扣。

付费资源依赖用户凭证:Scopus、Web of Science 等高质量综合索引需要用户自行解决机构访问权限,无权限时只能标注"not available",可能遗漏关键文献。

无智能相关性排序:文档未提及基于引用网络或主题模型的智能推荐,多源搜索结果的去重和筛选依赖人工判断。

适合的目标群体

  • 研究生与博士生:撰写文献综述、开题报告时需要系统性梳理领域进展
  • 科研人员:快速定位某细分方向的奠基性工作和最新进展
  • 学术写作人员:需要生成格式规范的引用列表用于论文Related Work章节
  • 跨学科研究者:需要同时检索计算机、生物医学、工程等多领域文献
  • 图书情报人员:为用户提供文献检索策略咨询

使用风险

性能风险:由于依赖外部数据库的响应速度和用户手动操作,大规模检索可能耗时较长;部分API(如Semantic Scholar)存在速率限制。

依赖项风险:各学术平台的API政策可能变更,需定期关注官方文档;PubMed、arXiv等免费服务的稳定性虽高,但极端情况下可能出现服务中断。

合规风险:尽管 Skill 本身强调合规,但用户若误解指导、擅自使用爬虫工具访问受限资源,可能违反网站服务条款或学术数据库使用政策,导致IP封禁或机构问责。

结果完整性风险:付费数据库的缺失可能导致重要文献遗漏;预印本与正式版本的区分依赖人工判断,存在误判可能。

安全解读

核心用法

literature-search 是一款纯文档型 Skill,旨在系统性地指导 AI Agent 完成学术文献检索任务。其核心使用场景包括:为论文撰写「相关工作」章节、收集特定研究领域的奠基性或综述文献、追踪最新进展、以及生成规范的引用列表。

用户触发后,Skill 首先会要求澄清检索范围(关键词、子领域、文献类型偏好、时间跨度),随后指导 Agent 跨多个学术数据库迭代检索:优先使用 Semantic Scholar、PubMed(生物医学)、arXiv(预印本)、IEEE/ACM(计算机/工程)等开放或 API 友好的来源;Scopus 和 Web of Science 仅在用户主动提供机构访问权限时才纳入;Google Scholar 因无官方 API,仅接受用户提供的导出结果或手动检索数据,严禁自动化爬取。

检索完成后,Agent 需执行去重与筛选(优先保留高被引、近期发表、期刊/会议正式版本),最终以统一格式(作者. 标题. venue. 年份. DOI/URL)输出文献列表。Skill 还支持扩展检索、按条件过滤及格式转换(BibTeX/CSV)等后续操作。

显著优点

1. 架构极度安全:纯 Markdown 文档设计,零可执行代码、零外部依赖、零网络调用,从根本上消除代码注入、供应链攻击和数据泄露风险。

2. 数据源覆盖全面:整合 8 大主流学术索引,涵盖从生物医学到计算机科学的多学科资源,兼顾开放获取与付费数据库的灵活使用策略。

3. 操作规范严谨:内置明确的访问约束(尊重 robots.txt、禁止未授权爬取)、去重逻辑(版本优先级)和输出标准,确保检索结果的可复现性与学术规范性。

4. 合规意识突出:主动识别并规避潜在的法律与伦理风险(如版权受限内容、未经授权的数据库访问),符合学术诚信与平台服务条款。

潜在局限

  • 功能依赖 Agent 能力:本身不提供执行代码,检索质量与效率受限于底层 Agent 的工具调用能力、API 可用性及网络环境。
  • 实时性不确定:Semantic Scholar、arXiv 等 API 的更新延迟可能影响最新文献的收录;Google Scholar 的手动输入方式降低了自动化程度。
  • 去重算法未细化:虽提出「优先期刊/会议版本」原则,但未明确具体匹配算法(如 DOI 比对、标题相似度计算),极端情况下可能出现漏判。
  • 无内置评价机制:缺乏对文献质量(如期刊分区、影响因子、引用网络分析)的自动评估,筛选依赖用户主观判断。

适合人群

  • 科研人员与研究生:撰写综述、开题报告或论文「相关工作」章节,需快速建立领域文献图谱。
  • 学术写作者:需要规范格式的引用列表,支持 BibTeX/CSV 导出以适配 LaTeX、EndNote 等工具。
  • 跨学科研究者:利用多数据库整合能力,追踪分散在不同索引中的相关研究。
  • 对安全性敏感的用户:纯文档架构满足高安全环境(如企业内网、涉密项目)的代码审计要求。

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| 数据源访问失败 | API 限流、密钥过期或机构网络限制 | 提前确认权限,优先使用开放 API |
| 引用格式不一致 | 不同来源元数据字段差异 | 手动校验关键条目,利用导出功能二次处理 |
| 文献版本混淆 | 预印本与正式发表版本并存 | 严格遵循「期刊/会议优先」去重规则 |
| 版权合规 | 部分全文受出版商版权保护 | 仅获取公开元数据,不绕过付费墙下载全文 |

总体评价

literature-search 以其「零代码、全透明」的设计理念,为学术文献检索提供了一种低风险、高可控的解决方案。尽管功能深度受限于 Agent 生态,但其规范的工作流设计、全面的数据源覆盖和突出的安全特性,使其成为学术写作场景下的可靠辅助工具。

literature-search 内容

手动下载zip · 1.8 kB
SKILL.mdtext/markdown
请选择文件