Web Search Pro

🔎 多源智能搜索,零配置开箱即用

多源聚合网络搜索工具,支持零配置开箱即用,可选接入10+家专业搜索API,实现智能路由与可解释的结果聚合。

收藏
14.3k
安装
6.4k
版本
2.1.0
CLS 安全性认证2026-06-23
点击查看完整报告 >

使用说明

核心功能

Web Search Pro 是一款面向 Agent 设计的网络检索工具,覆盖实时搜索、新闻追踪、文档查找、代码检索、企业调研、站点爬取等全场景需求。其最大亮点是无密钥基线模式——无需任何 API 密钥即可通过 DuckDuckGo 和原生 fetch 实现基础搜索与网页提取,极大降低使用门槛。

显著优点

  • 多源聚合架构:支持 Tavily、Exa、Querit、Serper、Brave、SerpAPI、You.com、SearXNG、Perplexity/Sonar 等 10+ 家专业搜索提供商,可按需灵活配置
  • 智能路由机制:内置 selectedProviderroutingSummary 语义,自动选择最优搜索路径并解释决策依据
  • 企业级研究能力:提供结构化证据包(topicTypetopicSignalsresearchAxes),支持竞品分析、公司调研等复杂任务
  • 隐私友好选项:原生支持自托管 SearXNG 实例,满足数据合规需求
  • 多语言与地域覆盖:Querit 提供原生多语言与地理过滤,SerpAPI 支持百度等中文搜索引擎

潜在局限

  • 无密钥基线模式(DuckDuckGo)在反爬严格或动态渲染页面场景下可能受限
  • 高级功能(深度提取、语义搜索、LLM 原生答案)需配置付费 API 密钥
  • 多提供商并发(fanout)模式可能增加成本与延迟
  • 自托管 SearXNG 需额外运维投入

适用人群

  • AI Agent 开发者与 LLM 应用构建者
  • 需要实时信息增强的知识工作者
  • 企业研究、竞品分析、投资调研人员
  • 对搜索隐私有要求的个人或组织

风险提示

  • API 密钥管理需遵循最小权限原则,避免密钥泄露
  • 搜索结果受各提供商内容政策约束,需合规使用
  • 实时搜索存在信息时效性风险,关键决策建议交叉验证

安全解读

核心功能

Web Search Pro 是一款面向 AI Agent 的多引擎网络搜索与检索工具,核心能力覆盖:

  • 实时网络搜索:支持 DuckDuckGo 免密钥基础搜索,同时集成 Tavily、Exa、Querit、Serper、Brave、SerpAPI、You.com、Perplexity/Sonar、SearXNG 等 10+ 付费/开源搜索引擎
  • 深度内容提取:网页正文提取、文档解析、代码片段抓取
  • 站点拓扑发现:站点地图生成、全站爬虫、API 文档自动检索
  • 智能路由:基于查询类型的引擎自动选择(answer-first routing),支持多引擎联邦搜索提高覆盖率
  • 结构化输出:带引用的答案包、研究主题标签、缓存遥测等机器友好格式

显著优点

1. 零门槛启动
无需任何 API 密钥即可使用 DuckDuckGo 基础搜索,降低试用成本,适合个人开发者和小型项目。

2. 引擎生态丰富
覆盖通用搜索(Tavily、Brave)、语义搜索(Exa)、多语言/地理本地化(Querit)、企业级 Google 搜索(Serper、SerpAPI)、LLM 原生搜索(Perplexity/Sonar、You.com)、隐私优先自托管(SearXNG),几乎满足所有场景需求。

3. 安全设计严谨

  • URL 安全检查:阻止私有 IP、localhost、内部域名访问
  • 重定向限制:默认最多 4 次跳转,防范开放重定向攻击
  • 内容类型白名单:仅接受预期 MIME 类型
  • 纯内置模块:零第三方 npm 依赖,供应链攻击面极小

4. 隐私合规
不收集用户敏感信息,API 密钥仅通过环境变量读取,无持久化用户数据,遵守 robots.txt 爬虫协议,已通过 GDPR、CCPA 合规检查。

局限与风险

1. 来源可信度约束(T3)
项目由个人开发者(Zjianru)维护,GitHub 账号虽创建 10 年但本项目仓库较新(2026-02 创建,2 stars),企业级生产环境需评估长期维护风险。

2. 外部命令执行风险
为兼容性支持 curlpython 作为 HTTP 传输层回退,虽使用 execFile 数组参数传递(非 shell 解释器)并设置超时,但仍属潜在攻击面。建议在安全敏感环境禁用外部命令回退。

3. API 密钥管理依赖宿主环境
密钥通过环境变量读取,若宿主环境配置不当可能泄露;错误日志在极端情况下可能包含 URL 片段。

4. 无本地速率限制
联邦搜索模式下快速轮询多引擎可能导致 IP 被临时封禁,需依赖外部 API 的速率限制或自行添加熔断机制。

5. 外部 API 可用性绑定
搜索结果质量与可用性完全依赖第三方服务商,若某引擎故障或变更 API,需等待版本更新。

适合人群

  • AI Agent 开发者:需要为 LLM 提供实时网络搜索能力的工具链集成
  • 研究人员与分析师:需要进行公司调研、竞品分析、技术文档检索的知识工作者
  • 自动化工作流工程师:构建新闻监控、代码搜索、站点审计等自动化流程
  • 隐私敏感用户:可通过 SearXNG 自托管实现完全可控的搜索基础设施
  • 初创团队/个人开发者:免密钥基础版降低初期成本,按需升级付费引擎

常规风险提示

| 风险类别 | 等级 | 说明 |
|---------|------|------|
| 供应链安全 | 极低 | 零第三方依赖,纯 Node.js 内置模块 |
| 网络传输安全 | 低 | 全 HTTPS/TLS 1.2+,但无证书固定 |
| 命令注入 | 中 | curl/python 回退路径存在理论风险,实际可控 |
| 数据隐私 | 低 | 无用户数据持久化,API 密钥环境变量管理 |
| 服务可用性 | 中 | 强依赖外部搜索 API 可用性与定价策略 |
| 长期维护 | 中 | 个人项目,企业需评估 fork 自建能力 |

Web Search Pro 内容

docs文件夹
scripts文件夹
engines文件夹
lib文件夹
research文件夹
手动下载zip · 108.1 kB
clawhub-compliance.mdtext/markdown
请选择文件