使用说明

核心用法

小红书搜索聚合分析器（Xiaohongshu Search & Summarize）是一款面向社媒内容研究的专业级自动化工具，专为解决小红书平台强反爬机制下的数据采集难题而设计。该技能采用双阶段工作流：第一阶段通过 Playwright 模拟真实用户浏览器行为，完整加载懒加载图片、提取标题/正文/热评及高清图像；第二阶段由 AI 进行多模态深度合成，将文本与视觉信息整合为结构化的综合分析报告。

显著优点

1. 反爬绕过能力：不同于直接 HTTP 请求易被 404 拦截，Playwright headed 模式模拟真人操作，大幅提升采集成功率
2. 多模态完整捕获：不仅抓取文本，更通过滑动交互强制加载完整图片轮播，获取其他工具遗漏的视觉信息
3. AI 视觉理解：明确要求调用方使用 vision 能力解读图像内容（如图表、流程图、UI 截图），实现真正的图文融合分析
4. 智能信息提炼：内置评论质量过滤机制（自动丢弃"私信我"等噪音），保留多元观点与有价值的反驳意见
5. 主题化重组输出：禁止简单罗列帖子，要求按概念、步骤、优缺点等维度重组信息，输出具有分析深度的综合报告

潜在局限性与风险

人工介入门槛：遇登录挑战时需用户手动完成浏览器内认证，无法全自动运行
环境依赖严格：需预装 playwright-cli、python3 及 requests 包，跨平台兼容性受限
法律合规灰区：虽技术层面规避反爬，但大规模采集小红书内容可能触及平台 ToS 及数据合规边界
稳定性风险：平台反爬策略升级可能导致脚本失效，需持续维护
输出质量控制依赖 AI：最终报告质量高度依赖调用方的 synthesis 能力，若跳过图像读取则沦为文件名清单

适合人群

市场研究员与品牌分析师：追踪消费趋势、竞品口碑、用户痛点
内容创作者与运营者：研究爆款结构、视觉风格、评论区互动模式
产品经理人：收集真实用户场景反馈、UI/UX 参考案例
学术研究者：社交媒体多模态话语分析、数字民族志素材采集

常规风险提示

数据合规：建议仅用于个人研究或小规模分析，避免商业性大规模爬取；注意遵守《网络安全法》《个人信息保护法》对公开个人信息采集的限制。账号安全：频繁操作可能触发平台风控，建议配合备用账号或控制采集频率。输出可靠性：AI 对图像的解读可能存在偏差，关键决策建议人工复核原始图片。

安全解读

核心功能

小红书搜索聚合分析器（Xiaohongshu Search Summarizer）是一款面向社交媒体研究的智能内容聚合工具。该 Skill 通过 Playwright 模拟真实浏览器环境，自动绕过小红书的反爬机制，提取指定关键词下的热门帖子内容（含标题、正文、评论及高清图片），最终由 AI 进行多模态深度合成，输出结构化的综合分析报告。

显著优点

1. 反爬绕过能力强：采用 Playwright headed 模式模拟真实用户行为，有效应对小红书激进的反爬策略，避免传统 HTTP 请求导致的 404 或封禁问题。

2. 多模态内容整合：不仅提取文本信息，更完整抓取帖子图片并通过 AI 视觉能力进行语义解读，实现图文深度融合分析。

3. 智能降噪与主题聚合：自动识别并过滤无效评论（如 "pm me" 等噪音），将分散的帖子内容按主题、观点、步骤等维度重组，而非简单罗列。

4. 输出质量高：最终报告以学术化、结构化的方式呈现，保留信息丰富度与多元观点，适合深度研究场景。

潜在局限与风险

1. 外部依赖较重：需预装 playwright-cli、python3 及 requests 包，环境配置门槛较高；Playwright 启动真实浏览器进程，资源消耗较大。

2. 动态代码执行：采用 Bash heredoc 动态生成并执行 JavaScript 代码，虽功能必需，但存在潜在注入风险（当前已做清理防护）。

3. 平台依赖风险：小红书 DOM 结构可能随时变更，导致选择器失效；需登录验证时可能中断流程。

4. 社区维护属性：T3 级别社区项目，更新频率与安全响应速度不及官方维护项目。

适合人群

市场研究员与品牌分析师（竞品分析、趋势洞察）
内容创作者与自媒体运营者（选题挖掘、爆款分析）
产品经与 UX 研究员（用户反馈聚合、场景洞察）
学术研究者（社交媒体数据收集与舆情分析）

常规风险

合规风险：需确保抓取内容仅用于个人研究或已获得授权的商业分析，遵守小红书平台协议及数据保护法规。
账号封禁风险：频繁或大量抓取可能触发平台风控，建议控制请求频率并添加随机延时。
登录依赖：部分搜索结果可能要求登录验证，需人工介入处理。

social-media web-scraping multi-modal playwright content-analysis xiaohongshu market-research vision-capable browser-automation

Xiaohongshu Search Summarizer 内容

scripts文件夹

手动下载zip · 6.5 kB

parse.pytext/plain

请选择文件