skills/tankebuaa/Web Browsing

Web Browsing

🌐 实时联网·秒搜全网信息

实时联网浏览与信息检索工具，支持URL内容提取、网页搜索与结构化数据抓取，快速获取最新在线信息

收藏

37.7k

安装

9.1k

版本

1.0.0

CLS 安全性认证2026-05-11

点击查看完整报告 >

使用说明

核心用法

web-browsing 是一项互联网信息获取技能，提供三种核心能力：

1. 直接URL访问：访问指定网页并提取主要内容，适用于用户分享链接后的内容解析
2. 网页搜索：基于关键词执行全网检索，返回相关结果摘要
3. 结构化数据提取：从目标网站抓取特定信息（如新闻头条、产品价格等）

显著优点

时效性强：突破训练数据时间限制，获取实时信息
覆盖广泛：可访问任意公开网页，扩展知识边界
场景灵活：支持从快速概览到深度数据挖掘的多层次需求
零配置：无需API密钥或复杂设置，直接调用

潜在缺点与局限性

| 限制类型 | 具体说明 |

|---------|---------|

| 动态内容 | 无法执行JavaScript，可能错过单页应用(SPA)的交互内容 |

| 访问屏障 | 部分网站启用反爬虫机制，导致内容获取失败 |

| 媒体支持 | 无法播放视频/音频，仅能描述页面文本提及的多媒体信息 |

| 认证内容 | 无法访问登录保护的页面（需凭证的场景不适用） |

适合人群

需要追踪实时新闻、股价、赛事结果的资讯型用户
研究特定网站内容（论文、文档、产品页）的学习者
验证信息真伪、交叉比对多来源的事实核查场景

常规风险

信息可靠性：来源网站质量参差不齐，需用户自行判断可信度
隐私暴露：访问行为可能被目标站点记录（常规HTTP请求痕迹）
内容时效幻觉：抓取快照非实时流，高频更新页面可能存在延迟

安全解读

核心用法

Web Browsing Skill 是一款网页浏览与信息检索工具，提供三种主要工作模式：

1. 直接URL访问：访问指定网页并提取主要内容进行摘要
2. 网络搜索：通过DuckDuckGo搜索引擎查找实时信息
3. 内容提取：从特定网站抓取结构化数据（如新闻标题、价格信息等）

技术实现

底层使用Python requests库进行HTTP请求
BeautifulSoup解析HTML内容
内置10-15秒超时保护机制
支持错误处理和异常捕获

显著优点

功能聚焦：专为网页浏览场景设计，接口简洁明确
安全合规：通过完整安全审计，无高危漏洞，符合GDPR/CCPA隐私要求
透明可控：仅访问用户明确指定的URL或DuckDuckGo搜索，无隐蔽网络行为
性能稳定：代码结构清晰，静态分析得分95分，依赖审计满分
隐私优先：不收集用户个人信息，仅获取公开网页内容

潜在局限

JavaScript支持不足：无法渲染动态内容（SPA、懒加载等），可能错过JS生成的信息
反爬限制：部分网站会阻止自动化访问
登录壁垒：无法访问需要认证的页面
多媒体受限：仅能描述音视频元数据，无法播放
来源等级：T3级个人开发者项目，建议人工复核后用于生产环境

适合人群

需要获取实时公开网络信息的用户
希望快速摘要网页内容的场景
对安全合规有基本要求的办公环境
轻量级信息检索任务（非复杂动态站点）

常规风险

网络依赖：需访问html.duckduckgo.com和目标网站，受限网络环境可能失效
输入风险：建议增加URL协议白名单（当前未过滤file://等危险协议）
速率限制：文档声明"每分钟10请求"但代码未强制执行，存在意外封禁风险
内容准确性：依赖第三方网页的可用性和内容质量

总体评价

代码层面安全可靠（S级/92分），功能实现与文档一致，是值得信赖的基础网页浏览工具。建议开发者补充依赖版本声明、增强URL校验、实现速率限制机制以进一步提升健壮性。

web-search url-fetch content-extraction real-time-data information-retrieval browsing

Web Browsing 内容

references文件夹

scripts文件夹

手动下载zip · 4.0 kB

usage-guide.mdtext/markdown

请选择文件