核心用法
x-timeline-digest 是一个 X/Twitter 信息流聚合技能,利用第三方 CLI 工具 bird 抓取用户的 For You 和 Following 两个时间线的推文,经过多层过滤后生成结构化摘要。核心流程包括:增量获取(基于 lastRunAt 避免重复处理)、硬去重(推文 ID)、模糊去重(文本相似度 0.9 阈值)、启发式过滤(自动剔除 "gm"、广告、短垃圾内容)、排序裁剪,最终输出中文摘要 JSON 供上游工作流消费。
显著优点
- 增量状态管理:通过本地 JSON 状态文件持久化已推送推文 ID,默认保留 30 天,有效控制重复内容
- 双源聚合:同时抓取算法推荐(For You)和关注列表(Following),兼顾广度与深度
- 多层降噪:ID 去重 + 相似度去重 + 启发式过滤,显著提升信噪比
- 开放架构:输出纯 JSON 载荷,推送渠道(Telegram、邮件等)由上游 OpenClaw 工作流决定,解耦灵活
- 中文摘要:原生生成中文 digestText,降低中文用户阅读成本
潜在缺点与局限性
- 外部依赖重:必须预先安装
bird并完成 Cookie 认证,工具链断裂即失效 - 非官方 API:基于
bird的逆向/非官方接口,存在随时失效或账号风控风险 - 无内置推送:仅生成 JSON,需用户自行搭建 LLM 处理(读 PROMPT.md + 注入数据)才能产出最终可阅读摘要
- 配置门槛:相似度阈值、抓取数量等参数需手动调优,默认配置可能不适合高频用户
- 状态单点:状态文件本地存储,多设备或分布式场景下同步困难
适合人群
技术背景较强的信息焦虑者、需要定时扫读 X 平台但不希望被算法流绑架的深度用户、已有 OpenClaw 或类似自动化基建的开发者。
常规风险
- 账号安全:非官方登录方式存在 Cookie 泄露和封号风险
- 内容合规:抓取内容可能包含敏感信息,下游推送需注意属地法规
- 隐私泄露:状态文件明文存储推文 ID 和时间戳,共享环境需权限管控