arxiv-summarizer-orchestrator - 自动化 arXiv 论文追踪总结系统

使用说明

这是一个面向学术研究场景的高级工作流编排 Skill，旨在自动化完成从 arXiv 论文检索到结构化报告生成的完整 pipeline。作为顶层编排器，它通过协调三个专业子技能（arxiv-search-collector、arxiv-paper-processor、arxiv-batch-reporter），构建了一套标准化的三阶段工作流：Stage A 负责智能检索与元数据收集，Stage B 执行论文下载与深度内容总结，Stage C 完成报告整合与渲染。

核心用法方面，用户只需配置主题参数与语言选项，Skill 即可自动驱动整个流程。Stage A 通过生成多维度查询计划并并行抓取 arXiv 元数据，支持增量式迭代优化检索结果；Stage B 提供灵活的并行（默认最大 5 并发）或串行处理模式，自动下载 PDF 或 LaTeX 源文件并生成结构化摘要；Stage C 则汇总所有论文摘要，通过模板引擎生成包含层级结构的最终研究报告。整个流程支持通过 cron 定时任务实现每日、每周或每月的周期性执行。

显著优点体现在其高度的模块化设计与工程化思维。三阶段架构使得每个环节可独立维护与替换，并行处理策略大幅提升了大批量论文的处理效率，内置的速率限制与重试机制（自动处理 arXiv API 的访问限制）保证了流程的稳定性。多语言支持能力（可输出非英语报告）与详细的文件目录规范，使其能够无缝融入国际化的科研团队协作流程。

潜在局限主要在于其依赖复杂性。作为纯编排文档，该 Skill 本身不执行任何实际代码，必须依赖三个子技能的具体实现，这意味着用户需要单独安装、配置并确保子技能的安全性。此外，T3 级的社区来源可信度要求用户自行评估子技能安全等级。Workflow 的复杂度对新手不够友好，需要理解 Stage A/B/C 的概念以及并行处理的文件冲突规避机制。

适合的目标群体包括需要持续跟踪特定领域前沿进展的研究人员、定期生成文献综述的科研团队、以及需要自动化科研情报收集的技术管理者。特别适合有周期性（每日/周/月）论文监控需求，且具备一定技术背景能够理解多阶段 pipeline 架构的用户。

使用风险主要集中在依赖项安全与 API 限制两个方面。由于实际的数据抓取、文件下载和内容处理均由子技能执行，若子技能存在安全漏洞（如恶意代码执行、数据泄露），本编排器无法提供防护。arXiv API 的严格速率限制可能导致大规模收集任务耗时较长，虽然 Skill 建议了 --min-interval-sec 等参数，但极端情况下仍可能触发封禁。并行处理模式下若配置不当（如超过默认的 5 并发），可能导致文件系统冲突或 API 限流。

education-research automation content-media productivity docs

arxiv-summarizer-orchestrator 内容

agents文件夹

references文件夹

手动下载zip · 4.4 kB

openai.yamltext/plain

请选择文件