arxiv-summarizer-orchestrator

📚 自动化 arXiv 论文追踪总结系统

🥥51总安装量 17评分人数 23
100% 的用户推荐

OpenClaw 社区维护的学术编排器,自动化完成 arXiv 论文收集、智能总结与报告生成,支持周期性文献追踪与多语言输出。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型编排技能,无可执行脚本,无危险函数(eval/exec/system)
  • ✅ 无网络通信、动态代码加载或敏感信息处理逻辑
  • ⚠️ 实际执行依赖三个子技能,需单独进行 BSS 安全认证审查
  • ⚠️ 来源为 T3 级社区/个人开发者,建议谨慎评估子技能来源可信度
  • ⚠️ 并行处理时需严格遵守 max_parallel_papers 限制,避免文件冲突

使用说明

这是一个面向学术研究场景的高级工作流编排 Skill,旨在自动化完成从 arXiv 论文检索到结构化报告生成的完整 pipeline。作为顶层编排器,它通过协调三个专业子技能(arxiv-search-collector、arxiv-paper-processor、arxiv-batch-reporter),构建了一套标准化的三阶段工作流:Stage A 负责智能检索与元数据收集,Stage B 执行论文下载与深度内容总结,Stage C 完成报告整合与渲染。

核心用法方面,用户只需配置主题参数与语言选项,Skill 即可自动驱动整个流程。Stage A 通过生成多维度查询计划并并行抓取 arXiv 元数据,支持增量式迭代优化检索结果;Stage B 提供灵活的并行(默认最大 5 并发)或串行处理模式,自动下载 PDF 或 LaTeX 源文件并生成结构化摘要;Stage C 则汇总所有论文摘要,通过模板引擎生成包含层级结构的最终研究报告。整个流程支持通过 cron 定时任务实现每日、每周或每月的周期性执行。

显著优点体现在其高度的模块化设计与工程化思维。三阶段架构使得每个环节可独立维护与替换,并行处理策略大幅提升了大批量论文的处理效率,内置的速率限制与重试机制(自动处理 arXiv API 的访问限制)保证了流程的稳定性。多语言支持能力(可输出非英语报告)与详细的文件目录规范,使其能够无缝融入国际化的科研团队协作流程。

潜在局限主要在于其依赖复杂性。作为纯编排文档,该 Skill 本身不执行任何实际代码,必须依赖三个子技能的具体实现,这意味着用户需要单独安装、配置并确保子技能的安全性。此外,T3 级的社区来源可信度要求用户自行评估子技能安全等级。Workflow 的复杂度对新手不够友好,需要理解 Stage A/B/C 的概念以及并行处理的文件冲突规避机制。

适合的目标群体包括需要持续跟踪特定领域前沿进展的研究人员、定期生成文献综述的科研团队、以及需要自动化科研情报收集的技术管理者。特别适合有周期性(每日/周/月)论文监控需求,且具备一定技术背景能够理解多阶段 pipeline 架构的用户。

使用风险主要集中在依赖项安全与 API 限制两个方面。由于实际的数据抓取、文件下载和内容处理均由子技能执行,若子技能存在安全漏洞(如恶意代码执行、数据泄露),本编排器无法提供防护。arXiv API 的严格速率限制可能导致大规模收集任务耗时较长,虽然 Skill 建议了 --min-interval-sec 等参数,但极端情况下仍可能触发封禁。并行处理模式下若配置不当(如超过默认的 5 并发),可能导致文件系统冲突或 API 限流。

arxiv-summarizer-orchestrator 内容

文件夹图标agents文件夹
文件夹图标references文件夹
手动下载zip · 4.4 kB
openai.yamltext/plain
请选择文件