tech-news-digest

📰 6大信源智能聚合,一键生成技术日报

自动化科技新闻聚合系统,6大信源并行采集、智能质量评分、多格式输出,适合开发者和技术决策者高效追踪前沿动态

收藏
22.8k
安装
8.4k
版本
3.16.0
CLS 安全性认证2026-05-04
点击查看完整报告 >

使用说明

Tech News Digest 技术新闻聚合器

Tech News Digest 是一款面向开发者和技术决策者的自动化新闻聚合工具,采用统一数据源模型、质量评分管道和模板化输出生成,实现从信息采集到分发的全链路自动化。

核心用法

该工具通过统一的 run-pipeline.py 管道脚本,并行运行6大信源采集:RSS订阅源(62个)、Twitter/X KOL监控(48位)、GitHub发布追踪(28个仓库)、GitHub Trending热门仓库、Reddit讨论(13个子版块)以及网络搜索(4个主题领域)。整个流程约30秒完成,输出经去重、质量评分后的结构化JSON数据,支持Discord、邮件、Markdown、PDF四种格式输出。

用户可通过覆盖 workspace/config/ 目录下的配置文件来自定义信源和主题,支持追加新源、禁用默认源、完全替换主题定义。系统内置151个预配置高质量信源,涵盖OpenAI、Google DeepMind、Anthropic等AI实验室,LangChain、vLLM等开源项目,以及Sam Altman、Andrej Karpathy等技术领袖。

显著优点

全自动化管道:一键运行即可完成采集、清洗、评分、归档,无需人工干预。支持Cron定时任务集成,通过读取模板化提示文件实现可维护的调度配置。

智能质量评分:多维度评分算法综合考虑来源权威性、时效性、互动数据(点赞/转发/星标)和内容相关性,自动过滤低质量信息。

灵活输出格式:原生支持Discord移动端优化格式(2000字符限制感知)、富文本邮件、Markdown报告和A4 PDF(含中文排版支持)。

弹性架构设计:所有脚本基于Python 3.8+标准库编写,零强制依赖;API密钥采用环境变量注入,支持多后端自动降级(Twitter官方API/twitterapi.io、Brave/Tavily搜索)。

开发者友好:提供完整的配置验证、源健康监控、详细日志和调试模式,GitHub认证支持PAT、App令牌自动生成、CLI工具三种方式。

潜在局限

API成本:Twitter数据需要付费API(twitterapi.io约$3-5/月或官方API),Brave/Tavily搜索也有免费额度限制。完全免费运行将缺失Twitter层和部分搜索功能。

内容深度限制:自动化摘要难以替代人工策展的深度分析,高价值长文需要配合 enrich-articles.py 全文抓取才能充分理解。

中文内容覆盖:默认信源以英文为主,中文技术媒体需用户自行添加RSS源配置。

平台隔离约束:OpenClaw架构限制单次会话只能投递到一个平台(Discord或Telegram),多平台分发需配置多个独立定时任务。

适合人群

  • 需要高效追踪AI/LLM、开源工具、加密货币等领域动态的技术开发者
  • 运营技术社区、需要定期内容分发的社区管理员
  • 关注前沿科技趋势的产品经理和技术决策者
  • 希望减少信息噪音、建立个性化信息流的知识工作者

常规风险

API密钥泄露:所有密钥通过环境变量管理,需确保 ~/.zshenv 等配置文件权限正确(600),避免意外提交到版本控制。

信息茧房效应:高度定制化的信源配置可能导致视野窄化,建议定期审视 sources.json 的多样性和覆盖盲区。

自动化依赖:关键业务决策不应仅基于自动聚合内容,重要信息需人工核实原始来源。

网络稳定性:RSS源失效、API限速、网络波动会影响采集完整性,需监控 source-health.py 报告并及时处理异常源。

安全解读

核心用法

tech-news-digest 是一款面向开发者和科技资讯运营者的自动化新闻聚合系统。核心工作流为:通过统一管道并行采集6大数据源(RSS订阅、Twitter/X KOL、GitHub Releases/Trending、Reddit、网页搜索)→ 质量评分与去重 → 模板化输出(Discord/邮件/PDF)。

快速启动:配置环境变量(Twitter/GitHub/搜索API密钥可选)→ 复制默认配置到workspace自定义 → 运行 run-pipeline.py 生成聚合JSON → 套用模板输出。全程约30秒完成。

关键配置sources.json 定义151个预设源(62 RSS + 48 Twitter + 28 GitHub + 13 Reddit),topics.json 配置4大主题(LLM/AI Agent/Crypto/Frontier Tech)的搜索策略与展示规则。支持用户配置覆盖默认源,新增或禁用特定来源。

显著优点

  • 全链路自动化:从采集、评分、去重到多格式输出,无需人工干预
  • 质量评分体系:基于来源优先级、时效性、历史表现的多维评分,自动筛选高价值内容
  • 优雅降级:API密钥缺失时自动跳过对应源(如无Twitter密钥则不采集KOL),GitHub支持PAT/App Token/未认证三档fallback
  • 企业级输出:支持PDF(中文排版优化)、安全HTML邮件、Discord富文本三种模板
  • 可审计性:完整的安全认证报告(CLS-2026-0505-TND316),代码11,820行经静态+动态扫描

潜在局限

  • API成本:Twitter数据需付费第三方服务(twitterapi.io约$3-5/月)或官方API权限;Brave/Tavily搜索有调用限额
  • 中文内容覆盖有限:预设源以英文科技媒体为主,中文RSS需手动添加
  • 实时性边界:RSS默认48小时窗口,非即时推送,不适合突发新闻场景
  • 运维复杂度:多API密钥管理、GitHub App配置对非技术用户有门槛

适合人群

  • 开发者/技术团队:需追踪开源项目Release、AI论文、工具链更新
  • 科技媒体运营者:自动化生成日报/周报素材,降低信息筛选成本
  • 投资者/研究员:聚合Crypto、Frontier Tech多源信号辅助决策

常规风险

  • API密钥泄露风险:需妥善保管环境变量,避免共享环境暴露
  • RSS源失效:依赖外部feed可用性,建议定期运行 source-health.py 监控
  • 数据偏见:预设源偏向欧美科技圈,可能形成信息茧房
  • 合规注意:Twitter/Reddit数据使用需遵守各平台ToS,商业用途建议确认授权范围

tech-news-digest 内容

config文件夹
defaults文件夹
references文件夹
templates文件夹
scripts文件夹
tests文件夹
fixtures文件夹
手动下载zip · 123.2 kB
sources.jsonapplication/json
请选择文件