tech-news-digest

📰 六源聚合 · 智能评分 · 多格式推送

六源聚合的自动化科技新闻摘要系统,支持RSS/Twitter/GitHub/Reddit/Web搜索,具备质量评分、去重和多格式输出(Discord/邮件/PDF)。

收藏
22.9k
安装
8.4k
版本
3.13.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Tech News Digest 是一个全自动化的科技新闻聚合与摘要系统,通过统一的六源数据模型(RSS、Twitter/X KOL、GitHub Releases、GitHub Trending、Reddit、Web搜索)采集信息,经质量评分流水线处理后,生成多格式输出(Discord、邮件、PDF)。

典型工作流程
1. 配置 sources.jsontopics.json 定义关注源和主题

2. 设置环境变量(Twitter API、Brave/Tavily搜索、GitHub Token)

3. 运行统一流水线 run-pipeline.py 并行采集6大来源,自动去重评分

4. 应用模板生成最终摘要(Discord/邮件/PDF)

关键特性

  • 151个预配置默认源(62 RSS + 48 Twitter + 28 GitHub + 13 Reddit + 4搜索主题)
  • 智能质量评分系统,基于来源优先级、时效性、参与度计算
  • 多层级GitHub认证:PAT → GitHub App自动Token → gh CLI → 匿名
  • 双Twitter后端:twitterapi.io($3-5/月,推荐)或官方X API v2
  • Web搜索自动降级:Tavily → Brave → 手动搜索界面

显著优点

| 维度 | 优势 |
|------|------|
| **覆盖广度** | 六源聚合,从官方博客到社区讨论,从代码发布到KOL动态 |
| **自动化程度** | 单一命令完成采集→评分→去重→输出,支持Cron定时任务 |
| **配置灵活** | workspace配置覆盖机制,可禁用默认源、追加自定义源 |
| **输出多样** | Discord(移动端优化)、富文本邮件、A4 PDF(中文支持) |
| **可靠性** | 指数退避重试、ETag缓存、速率限制智能处理、源健康监控 |
| **零依赖运行** | 纯Python 3.8+标准库,可选feedparser/jsonschema增强 |
| **安全设计** | 零用户输入插值进shell命令,URL协议白名单,XSS-safe邮件HTML |

潜在局限

1. API成本:Twitter采集需要付费API(twitterapi.io约$3-5/月),免费层级受限
2. 中文内容:默认源以英文为主,中文科技媒体需手动配置

3. 实时性边界:GitHub Trending依赖API估算而非官方趋势算法

4. 全文获取:付费墙内容无法自动提取,依赖Cloudflare Markdown服务可用性

5. 跨平台隔离:OpenClaw安全模型限制单会话只能投递一个平台,多平台需多Cron任务

适合人群

  • 技术团队TL/CTO:每日快速掌握AI、开源、Crypto领域关键动态
  • 开发者社区运营:自动生成Discord/Telegram频道每日摘要
  • 投资人/分析师:追踪前沿技术信号和开源项目热度变化
  • 个人知识工作者:替代手动刷Twitter/GitHub的信息获取习惯

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| API密钥泄露 | Token配置在环境变量,若系统被入侵可能泄露 | 使用GitHub App自动Token减少长期PAT暴露;定期轮换 |
| 信息过载 | 151默认源可能产生过多噪音 | 通过`enabled: false`精简源,调整`max_items`限制输出 |
| 依赖服务故障 | Cloudflare Markdown、第三方API不稳定 | 多级降级逻辑(首选→HTML提取→跳过),本地缓存机制 |
| 内容误判 | 自动评分可能漏掉重要但低信号新闻 | 定期人工review `priority: true`的高优先级源 |
| 隐私合规 | 采集Twitter个人账号、Reddit用户内容 | 仅限公开数据,遵守各平台ToS;企业用户需确认合规 |

版本:v3.13.0 | 维护状态:活跃开发(draco-agent组织)

tech-news-digest 内容

暂无文件树

手动下载zip · 118.3 kB
contentapplication/octet-stream
请选择文件