使用说明

核心用法

Paper Recommendation Skill 是一套完整的AI论文研究自动化工作流工具，主要服务于需要追踪学术前沿的科研人员和技术团队。

标准工作流程：
1. 论文获取：通过 fetch_papers.py 从arXiv API按关键词抓取最新论文，支持PDF批量下载
2. 并行评审：review_papers.py 生成子代理任务，利用多代理并发阅读多篇论文
3. 深度分析：子代理通过arXiv HTML页面提取完整信息（机构、摘要、贡献、实验、结论）
4. 智能筛选：基于评分（1-5分）和推荐标志综合决策
5. 简报生成：按强制格式输出结构化Markdown简报，含完整中文翻译
6. 自动推送：支持Telegram定时投递，可配置Cron每日10:00自动执行

技术亮点：采用"主代理决策+子代理执行"的分层架构，将论文阅读这一耗时任务并行化；标准简报格式强制要求包含实验结果和机构信息，避免信息缺失。

显著优点

全流程自动化：从发现到简报生成无需人工干预，支持Cron定时任务
结构化输出：强制标准格式确保信息完整性，特别适合团队知识沉淀
并行加速：子代理并发阅读突破单线程瓶颈，适合批量处理
领域聚焦：预配置具身智能、多智能体等热门方向关键词
零第三方依赖：仅使用Python标准库，供应链风险极低

潜在局限

来源单一：仅支持arXiv，未覆盖NeurIPS/ICML等会议论文或PubMed等其他领域
PDF解析依赖：需系统预装pdftotext（Poppler），Windows环境配置较复杂
硬编码配置：Telegram用户ID、本地网关地址硬编码，缺乏多用户支持
评分主观性：子代理评分依赖模型判断，缺乏领域专家校准机制
中文翻译质量：摘要翻译质量取决于子代理能力，专业术语可能不准确

适合人群

AI/ML研究人员：需要每日追踪arXiv最新成果的博士生、博士后、研究科学家
技术团队Leader：希望为团队自动化收集技术情报的工程经理
学术自媒体：需要稳定内容源的科技博主、 Newsletter 运营者
企业技术战略部：关注具身智能、多智能体等前沿方向的产业研究岗位

常规风险

硬编码敏感信息：Telegram ID硬编码存在轻微隐私泄露风险，建议迁移至环境变量
subprocess调用：多处使用curl/pdftotext外部命令，虽无注入风险但增加环境依赖
代码缺陷：read_pdf.py存在未导入re模块的bug，可能导致运行时错误
网络依赖：完全依赖arXiv服务可用性，无本地缓存降级机制
Cron任务管理：自动任务失败时依赖Telegram反馈，若推送失败可能静默丢失

安全解读

核心用法

Paper Recommendation Skill 是一套完整的AI论文研究工作流工具，专为自动化学术信息获取设计。核心工作流包含四个脚本协同：

1. fetch_papers.py —— 从arXiv API按分类和关键词获取最新论文，支持PDF批量下载
2. review_papers.py —— 将论文列表转换为子代理任务，实现并行评审
3. read_pdf.py —— 提取PDF全文或特定章节（摘要、实验等）供子代理分析
4. daily_workflow.py —— 完整自动化流程，整合获取→评审→生成简报→Telegram推送

用户可通过Cron配置每日10:00自动执行，默认主题为具身智能（Embodied Intelligence），覆盖cs.AI/cs.LG/cs.MA等分类。

显著优点

高效并行架构：采用子代理（sub-agent）模式同时评审多篇论文，大幅缩短研究周期
标准化输出：强制统一的简报格式，包含机构、中文摘要、核心贡献、实验结果等完整字段，避免信息遗漏
零依赖设计：纯Python标准库实现（subprocess/json/re/urllib），无第三方包供应链风险
可信数据来源：仅访问arXiv官方学术站点，网络边界清晰可控
自动化闭环：从发现到推送一站式完成，适合 researchers 每日情报获取

潜在局限

硬编码配置：Telegram ID和本地Gateway URL写死在代码中（RISK-001），跨用户迁移需手动修改
输入验证不足：arXiv API响应缺乏字段存在性校验，异常格式可能导致解析失败（RISK-002）
功能聚焦单一：仅支持arXiv源，未覆盖OpenReview、ACL Anthology等会议平台
子代理依赖：评审质量取决于底层模型能力，无内置的跨评审一致性校验机制
本地化限制：PDF提取依赖系统pdftotext工具，Windows环境需额外配置Poppler

适合人群

AI/ML领域研究者需每日追踪前沿论文
课题组管理员需定期向团队推送文献精选
智能体开发者研究多代理协作（multi-agent）任务分发模式

常规风险

配置泄露风险：硬编码的Telegram ID虽为接收方而非凭证，仍建议环境变量化
API限流风险：高频请求可能触发arXiv速率限制，建议添加time.sleep(1)礼貌延迟
本地服务依赖：Telegram推送依赖127.0.0.1:18789本地网关，服务未启动时消息将失败

arxiv paper-recommendation research-automation multi-agent embodied-ai academic-research pdf-processing telegram-bot cron-job briefing-generation

Paper Recommendation 内容

scripts文件夹

手动下载zip · 16.4 kB

daily_workflow.pytext/plain

请选择文件