使用说明

核心用法

ai-research-scraper 是一款面向AI产品从业者和研究者的信息聚合技能，通过命令行脚本从预设的权威AI媒体站点（TechCrunch AI、VentureBeat AI、MIT Technology Review、Google/Microsoft/NVIDIA官方博客等）自动抓取最新内容，生成带链接的精简摘要。

基础调用：python3 /root/.openclaw/workspace/skills/ai-research-scraper/scripts/scraper.py

支持通过 --max-tokens、--days、--topic 等参数控制摘要长度、时间范围和主题聚焦；网站列表可通过 references/websites.txt 自定义管理。

显著优点

权威信源聚合：直接对接头部科技媒体与厂商官方博客，信息源质量较高
轻量化输出：限制token和摘要长度，适合快速扫读，避免信息过载
稳定性优化：内置超时重试、1小时缓存机制，并支持tavily-search作为网络超时时的备用方案
灵活配置：网站列表、摘要长度、主题筛选均可自定义
链接溯源：每条摘要保留原始URL，便于深度阅读与验证

潜在缺点与局限性

翻译功能已移除：当前版本暂不支持多语言翻译，国际化用户需自行处理
RSS依赖：信息获取依赖于目标站点的RSS/Feed可用性，部分站点结构变更可能导致抓取失败
摘要质量波动：自动摘要的准确性受限于原始文章质量和解析规则，复杂技术细节可能丢失
无主动推送：需手动执行或配合外部定时任务（cron等）实现定期更新
地域限制：部分源站点可能存在访问延迟或区域封锁问题

适合人群

AI产品经理、创业者：需要快速掌握竞品动态与行业趋势
技术研究人员：追踪前沿论文落地与产品化进展
科技媒体编辑、投资人：高效筛选每日AI领域重要资讯

常规风险

信息时效性：缓存机制可能导致1小时内的最新动态延迟呈现
源站变更风险：目标网站改版或反爬策略升级可能导致抓取失效
内容准确性：自动摘要可能产生歧义，关键决策建议核对原文
网络依赖：尽管有备用搜索方案，极端网络环境下仍可能获取失败

ai-research web-scraping news-aggregator product-intelligence tech-monitoring rss-parser

Ai Research Scraper 内容

暂无文件树

手动下载zip · 13.6 kB

contentapplication/octet-stream

请选择文件