Paper Recommendation

AI论文自动追踪与智能简报生成器

基于arXiv的AI论文自动发现与深度分析工具,支持子代理并行阅读、结构化简报生成,适合科研人员高效追踪前沿动态

收藏
7.1k
安装
3.2k
版本
1.0.1
CLS 安全性认证2026-05-07
点击查看完整报告 >

使用说明

核心用法

Paper Recommendation Skill 是一套完整的AI论文研究自动化工作流工具,主要服务于需要追踪学术前沿的科研人员和技术团队。

标准工作流程
1. 论文获取:通过 fetch_papers.py 从arXiv API按关键词抓取最新论文,支持PDF批量下载

2. 并行评审review_papers.py 生成子代理任务,利用多代理并发阅读多篇论文

3. 深度分析:子代理通过arXiv HTML页面提取完整信息(机构、摘要、贡献、实验、结论)

4. 智能筛选:基于评分(1-5分)和推荐标志综合决策

5. 简报生成:按强制格式输出结构化Markdown简报,含完整中文翻译

6. 自动推送:支持Telegram定时投递,可配置Cron每日10:00自动执行

技术亮点:采用"主代理决策+子代理执行"的分层架构,将论文阅读这一耗时任务并行化;标准简报格式强制要求包含实验结果和机构信息,避免信息缺失。

显著优点

  • 全流程自动化:从发现到简报生成无需人工干预,支持Cron定时任务
  • 结构化输出:强制标准格式确保信息完整性,特别适合团队知识沉淀
  • 并行加速:子代理并发阅读突破单线程瓶颈,适合批量处理
  • 领域聚焦:预配置具身智能、多智能体等热门方向关键词
  • 零第三方依赖:仅使用Python标准库,供应链风险极低

潜在局限

  • 来源单一:仅支持arXiv,未覆盖NeurIPS/ICML等会议论文或PubMed等其他领域
  • PDF解析依赖:需系统预装pdftotext(Poppler),Windows环境配置较复杂
  • 硬编码配置:Telegram用户ID、本地网关地址硬编码,缺乏多用户支持
  • 评分主观性:子代理评分依赖模型判断,缺乏领域专家校准机制
  • 中文翻译质量:摘要翻译质量取决于子代理能力,专业术语可能不准确

适合人群

  • AI/ML研究人员:需要每日追踪arXiv最新成果的博士生、博士后、研究科学家
  • 技术团队Leader:希望为团队自动化收集技术情报的工程经理
  • 学术自媒体:需要稳定内容源的科技博主、 Newsletter 运营者
  • 企业技术战略部:关注具身智能、多智能体等前沿方向的产业研究岗位

常规风险

  • 硬编码敏感信息:Telegram ID硬编码存在轻微隐私泄露风险,建议迁移至环境变量
  • subprocess调用:多处使用curl/pdftotext外部命令,虽无注入风险但增加环境依赖
  • 代码缺陷:read_pdf.py存在未导入re模块的bug,可能导致运行时错误
  • 网络依赖:完全依赖arXiv服务可用性,无本地缓存降级机制
  • Cron任务管理:自动任务失败时依赖Telegram反馈,若推送失败可能静默丢失

安全解读

核心用法

Paper Recommendation Skill 是一套完整的AI论文研究工作流工具,专为自动化学术信息获取设计。核心工作流包含四个脚本协同:

1. fetch_papers.py —— 从arXiv API按分类和关键词获取最新论文,支持PDF批量下载
2. review_papers.py —— 将论文列表转换为子代理任务,实现并行评审

3. read_pdf.py —— 提取PDF全文或特定章节(摘要、实验等)供子代理分析

4. daily_workflow.py —— 完整自动化流程,整合获取→评审→生成简报→Telegram推送

用户可通过Cron配置每日10:00自动执行,默认主题为具身智能(Embodied Intelligence),覆盖cs.AI/cs.LG/cs.MA等分类。

显著优点

  • 高效并行架构:采用子代理(sub-agent)模式同时评审多篇论文,大幅缩短研究周期
  • 标准化输出:强制统一的简报格式,包含机构、中文摘要、核心贡献、实验结果等完整字段,避免信息遗漏
  • 零依赖设计:纯Python标准库实现(subprocess/json/re/urllib),无第三方包供应链风险
  • 可信数据来源:仅访问arXiv官方学术站点,网络边界清晰可控
  • 自动化闭环:从发现到推送一站式完成,适合 researchers 每日情报获取

潜在局限

  • 硬编码配置:Telegram ID和本地Gateway URL写死在代码中(RISK-001),跨用户迁移需手动修改
  • 输入验证不足:arXiv API响应缺乏字段存在性校验,异常格式可能导致解析失败(RISK-002)
  • 功能聚焦单一:仅支持arXiv源,未覆盖OpenReview、ACL Anthology等会议平台
  • 子代理依赖:评审质量取决于底层模型能力,无内置的跨评审一致性校验机制
  • 本地化限制:PDF提取依赖系统pdftotext工具,Windows环境需额外配置Poppler

适合人群

  • AI/ML领域研究者需每日追踪前沿论文
  • 课题组管理员需定期向团队推送文献精选
  • 智能体开发者研究多代理协作(multi-agent)任务分发模式

常规风险

  • 配置泄露风险:硬编码的Telegram ID虽为接收方而非凭证,仍建议环境变量化
  • API限流风险:高频请求可能触发arXiv速率限制,建议添加time.sleep(1)礼貌延迟
  • 本地服务依赖:Telegram推送依赖127.0.0.1:18789本地网关,服务未启动时消息将失败

Paper Recommendation 内容

scripts文件夹
手动下载zip · 16.4 kB
daily_workflow.pytext/plain
请选择文件