Web Search Pro

🔎 多引擎智能搜索,精准信息掌控

多引擎精细化搜索工具,支持域名过滤、日期范围、深度搜索等高级功能,自动选择最优引擎,AI场景下信息检索的强力补充。

收藏
23.3k
安装
6.4k
版本
1.0.0
CLS 安全性认证2026-05-12
点击查看完整报告 >

使用说明

核心功能

web-search-pro 是一款专为 AI Agent 设计的多引擎精细化搜索工具,作为 OpenClaw 内置 web_search(Brave/Perplexity)的功能补充,提供了更专业的搜索控制能力。

支持的搜索引擎

  • Tavily(推荐):AI 优化搜索,最佳答案质量,原生支持全参数过滤 + 内容提取,免费 1000 次/月
  • Exa:语义/神经网络搜索,适合深度研究,$10 免费额度
  • Serper:真实 Google SERP,新闻覆盖最广,免费 100 次/月
  • SerpAPI:多引擎支持(Google/Bing/百度/Yandex/DuckDuckGo),中文搜索首选,免费 250 次/月

核心用法

# 基础搜索(自动选引擎)
node scripts/search.mjs "query"
# 域名过滤:仅搜索 GitHub/Stack Overflow
node scripts/search.mjs "query" --include-domains "github.com,stackoverflow.com"
# 日期范围 + 深度搜索
node scripts/search.mjs "query" --from 2024-01-01 --to 2024-12-31 --deep
# 新闻模式
node scripts/search.mjs "query" --news --days 7
# 内容提取
node scripts/extract.mjs "https://example.com/article"

显著优点
1. 智能引擎选择:根据查询类型自动匹配最优引擎(深度搜索→Tavily/Exa、新闻→Serper、中文→百度)

2. 全参数控制:域名白名单/黑名单、绝对日期/相对时间范围、结果数量、国家/语言定位

3. 双模式输出:默认 Markdown 格式便于 AI 消费,--json 支持程序化调用

4. 内容提取:支持 Tavily Extract 和 Exa livecrawl,直接获取网页正文

潜在局限
1. API 成本:深度搜索消耗更多额度(Tavily 2x 倍),高频使用需关注配额

2. 配置门槛:必须至少配置一个 API Key,国内用户获取 Tavily/Exa 可能需境外支付方式

3. 引擎差异:Serper/SerpAPI 的域名过滤通过 site: 操作符模拟,非原生支持,精准度略逊于 Tavily/Exa

4. 提取限制:内容提取仅支持 Tavily 和 Exa,Serper/SerpAPI 无法使用此功能

适合人群

  • 需要超越基础搜索的 AI 开发者(精准溯源、学术调研、竞品监控)
  • 中文搜索场景用户(SerpAPI 百度支持)
  • 需要域名白名单构建可信知识库的场景(如仅搜索 .edu/.gov 站点)

常规风险

  • API Key 泄露风险(需妥善保管环境变量)
  • 搜索结果质量依赖第三方引擎,存在时效性偏差或信息茧房
  • 深度搜索的高消耗可能导致免费额度快速耗尽

安全解读

核心功能

web-search-pro 是一款面向 AI Agent 的多引擎精细化搜索工具,作为 OpenClaw 内置搜索的强力补充,提供四大主流搜索引擎的统一接口:Tavily(AI 优化)、Exa(语义/神经搜索)、Serper(Google SERP)、SerpAPI(多引擎支持)。核心能力包括:

  • 智能引擎选择:根据查询类型自动匹配最优引擎(深度搜索优先 Tavily/Exa,新闻搜索优先 Serper)
  • 精细过滤控制:支持域名白名单/黑名单、绝对日期范围、相对时间范围(day/week/month/year)
  • 专业搜索模式:深度搜索(消耗更多 credits)、新闻模式(限定天数)、多引擎切换(Google/Bing/Baidu/Yandex/DuckDuckGo)
  • 内容提取:支持从 URL 提取可读内容(Tavily Extract / Exa livecrawl)

显著优点

1. 功能完备:填补了内置搜索在域名过滤、日期范围、深度模式等方面的能力空白
2. 引擎互补:四大引擎各有侧重,Tavily 的 AI 答案质量最优,Serper 的新闻覆盖最广,SerpAPI 支持中文搜索(Baidu)

3. 零依赖设计:纯 Node.js 原生代码,无第三方依赖包,供应链攻击面极小

4. 代码结构清晰:模块化引擎封装,无危险函数,无硬编码密钥

5. 输出友好:默认 Markdown 格式便于 AI 消费,支持 --json 程序化调用

潜在局限

1. 成本依赖:免费额度有限(Tavily 1000次/月,Serper 100次/月),高频使用需付费
2. API Key 配置门槛:必须至少配置一个 API Key 才能使用,对新手不够友好

3. 隐私数据外泄:搜索查询内容需发送至第三方服务,敏感信息存在泄露风险

4. 来源可信度:T3 级别个人开发者项目,缺乏企业级代码审查和长期维护保障

适合人群

  • 需要域名限定搜索的研究人员(如仅搜索 github.com、arxiv.org)
  • 需要时间范围过滤的资讯追踪者(如只看本周新闻)
  • 需要深度搜索模式的深度研究用户
  • 需要中文搜索支持的用户(通过 SerpAPI 调用 Baidu)
  • 内置搜索结果质量不满意的高级用户

常规风险

  • 数据隐私:搜索关键词、提取的 URL 内容均会传输至第三方 API
  • API 密钥泄露:需在环境变量中配置密钥,共享环境存在误泄露风险
  • 成本失控:深度搜索模式消耗 2 倍 credits,高频调用可能快速耗尽免费额度
  • 服务依赖:完全依赖第三方搜索服务的可用性和定价策略
  • 供应链:虽无 npm 依赖,但仍依赖作者 GitHub 仓库的持续维护

Web Search Pro 内容

scripts文件夹
engines文件夹
手动下载zip · 10.7 kB
exa.mjstext/javascript
请选择文件