tech-news-digest

📰 五源聚合·智能去重·多格式输出

五层数据源聚合的自动化科技新闻摘要系统,支持 RSS、Twitter KOL、GitHub Releases、Reddit 和网页搜索,具备质量评分与去重机制。

收藏
34.8k
安装
8.4k
版本
3.12.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Tech News Digest 是一款面向科技从业者与研究员的自动化新闻聚合工具,通过统一的五层数据模型(RSS、Twitter/X KOL、GitHub Releases、Reddit、网页搜索)采集前沿科技动态。用户可通过配置 JSON 文件自定义信源与主题,运行统一流水线脚本实现并行抓取、智能去重、质量评分,最终输出 Discord、邮件或 PDF 格式的摘要报告。

显著优点

1. 多源聚合与智能评分:138 个预配置信源覆盖 AI 实验室、开源社区、社交平台,内置 85% 标题相似度去重算法与多维度质量评分机制
2. 高可配置性:支持工作区级配置覆盖,用户可灵活启用/禁用信源、自定义主题搜索策略与展示样式

3. 鲁棒性设计:全脚本实现指数退避重试、API 限流自适应、多种认证降级策略(GitHub App Token 自动生成、多 API Key 轮询)

4. 零依赖执行:纯 Python 3.8+ 标准库实现,可选依赖增强体验但不强制安装

5. 多格式输出:内置 Discord、邮件、PDF 模板,支持中文排版(Noto Sans CJK SC)

潜在局限

  • Twitter/X 数据依赖付费第三方 API(twitterapi.io $3-5/月)或官方 API,免费层级受限
  • 网页搜索需配置 Brave/Tavily API Key,否则降级为搜索界面提示
  • GitHub 未认证时仅 60 req/hr,大规模监控需配置 Token
  • 跨平台分发需创建独立定时任务(OpenClaw 安全隔离机制)

适合人群

  • AI/LLM 研究员与开发者需追踪前沿模型发布与技术博客
  • 开源社区维护者关注依赖库 Release 动态
  • 科技媒体编辑或社区运营者需要自动化内容策展
  • 投资机构分析师监控加密与前沿科技赛道

常规风险

  • API 密钥泄露风险:需通过环境变量管理,避免硬编码
  • 信息茧房效应:自定义配置过度收敛可能导致视野局限,建议保留默认多元信源
  • 内容可信度参差:自动聚合内容需人工复核,尤其 Reddit/社交平台的非官方信源
  • 依赖服务可用性:RSS 源失效、API 政策变更可能影响数据采集完整性

tech-news-digest 内容

暂无文件树

手动下载zip · 112.7 kB
contentapplication/octet-stream
请选择文件