使用说明

核心用法

weixin-reader-oc 专用于读取微信公众号（mp.weixin.qq.com）文章内容。当用户发送微信文章链接或请求提取微信文章时，调用 extract_content_from_websites 工具完成解析，返回结构化数据包括标题、作者、发布日期和正文全文。

显著优点

免登录突破：无需微信账号即可提取内容，解决了微信生态的封闭性限制
格式纯净：自动过滤 HTML 标签、导航栏、广告等干扰元素，输出 clean text
字段完整：结构化提取标题、作者、发布时间、正文，便于后续处理
专用性强：针对微信文章域名校验优化，比通用网页抓取工具成功率更高
替代方案明确：文档明确禁用 web_fetch，避免用户走入登录要求的死胡同

潜在局限

平台依赖风险：微信反爬策略升级可能导致提取失效，需持续维护
多媒体缺失：专注于文字提取，图片、视频、音频等内容未提及处理能力
动态内容限制：若文章含 JavaScript 渲染的交互式内容，可能无法完整获取
版权合规边界：批量抓取可能触及微信服务条款，需关注使用场景合规性

适合人群

需要快速消化微信长文内容的效率用户
构建微信内容聚合、存档、分析系统的开发者
researchers 进行社交媒体内容研究
无法/不愿登录微信但需要访问公开文章的用户

常规风险

| 风险类型 | 说明 |

|---------|------|

| 服务可用性 | 微信域名策略变更可能导致工具突然失效 |

| 内容完整性 | 付费/受限文章可能无法提取 |

| 合规风险 | 需遵守《微信公众平台服务协议》及版权法规 |

| 隐私边界 | 虽无需登录，但请求行为可能被微信服务器记录 |

安全解读

核心用法

weixin-reader-oc 是一款专门用于读取微信公众号文章的轻量级 skill。当用户发送以 mp.weixin.qq.com 为域名的文章链接时，该 skill 会自动调用 extract_content_from_websites 工具提取页面内容，并过滤 HTML 标签、导航栏、广告等干扰信息，最终输出结构化的文章信息：标题、作者、发布日期和完整正文。

与常规网页抓取工具不同，该 skill 明确避开了需要登录验证的 web_fetch 方案，采用专门适配微信文章结构的提取策略，解决了微信生态的内容获取壁垒。

显著优点

零登录门槛：无需微信账号授权，即可获取公众号文章全文，极大降低使用门槛
精准内容提取：自动识别并过滤页面噪声，输出纯净的阅读文本
纯文档架构：无可执行代码，无外部依赖，部署简单，运行稳定
合规安全：不收集用户数据，符合 GDPR、CCPA 等隐私法规

潜在局限

功能单一：仅支持微信公众号文章，不适用于其他内容平台
依赖外部工具：实际提取能力由 extract_content_from_websites 提供，若该工具失效则功能中断
反爬风险：微信官方可能更新反爬策略，存在未来可用性不确定因素
无交互增强：不支持评论提取、点赞数据、多媒体下载等扩展功能

适合人群

需要批量整理公众号文章资料的内容运营者
希望快速获取文章核心信息而不愿登录微信的研究人员
构建知识库、进行文本分析的开发者与数据工作者

常规风险

链接失效：原始文章可能被作者删除或设为私密，导致提取失败
格式变化：微信页面改版可能导致提取规则暂时失效
版权注意：提取内容仅供个人学习研究，商用需遵守原创作者版权

wechat content-extraction web-scraping mp.weixin.qq.com article-parser no-login-required

Weixin Reader 内容

手动下载zip · 989 B

SKILL.mdtext/markdown

请选择文件