使用说明

核心功能

web-search-pro 是一款专为 AI Agent 设计的多引擎精细化搜索工具，作为 OpenClaw 内置 web_search（Brave/Perplexity）的功能补充，提供了更专业的搜索控制能力。

支持的搜索引擎：

Tavily（推荐）：AI 优化搜索，最佳答案质量，原生支持全参数过滤 + 内容提取，免费 1000 次/月
Exa：语义/神经网络搜索，适合深度研究，$10 免费额度
Serper：真实 Google SERP，新闻覆盖最广，免费 100 次/月
SerpAPI：多引擎支持（Google/Bing/百度/Yandex/DuckDuckGo），中文搜索首选，免费 250 次/月

核心用法：

# 基础搜索（自动选引擎）
node scripts/search.mjs "query"
# 域名过滤：仅搜索 GitHub/Stack Overflow
node scripts/search.mjs "query" --include-domains "github.com,stackoverflow.com"
# 日期范围 + 深度搜索
node scripts/search.mjs "query" --from 2024-01-01 --to 2024-12-31 --deep
# 新闻模式
node scripts/search.mjs "query" --news --days 7
# 内容提取
node scripts/extract.mjs "https://example.com/article"

显著优点：
1. 智能引擎选择：根据查询类型自动匹配最优引擎（深度搜索→Tavily/Exa、新闻→Serper、中文→百度）
2. 全参数控制：域名白名单/黑名单、绝对日期/相对时间范围、结果数量、国家/语言定位
3. 双模式输出：默认 Markdown 格式便于 AI 消费，--json 支持程序化调用
4. 内容提取：支持 Tavily Extract 和 Exa livecrawl，直接获取网页正文

潜在局限：
1. API 成本：深度搜索消耗更多额度（Tavily 2x 倍），高频使用需关注配额
2. 配置门槛：必须至少配置一个 API Key，国内用户获取 Tavily/Exa 可能需境外支付方式
3. 引擎差异：Serper/SerpAPI 的域名过滤通过 site: 操作符模拟，非原生支持，精准度略逊于 Tavily/Exa
4. 提取限制：内容提取仅支持 Tavily 和 Exa，Serper/SerpAPI 无法使用此功能

适合人群：

需要超越基础搜索的 AI 开发者（精准溯源、学术调研、竞品监控）
中文搜索场景用户（SerpAPI 百度支持）
需要域名白名单构建可信知识库的场景（如仅搜索 .edu/.gov 站点）

常规风险：

API Key 泄露风险（需妥善保管环境变量）
搜索结果质量依赖第三方引擎，存在时效性偏差或信息茧房
深度搜索的高消耗可能导致免费额度快速耗尽

安全解读

核心功能

web-search-pro 是一款面向 AI Agent 的多引擎精细化搜索工具，作为 OpenClaw 内置搜索的强力补充，提供四大主流搜索引擎的统一接口：Tavily（AI 优化）、Exa（语义/神经搜索）、Serper（Google SERP）、SerpAPI（多引擎支持）。核心能力包括：

智能引擎选择：根据查询类型自动匹配最优引擎（深度搜索优先 Tavily/Exa，新闻搜索优先 Serper）
精细过滤控制：支持域名白名单/黑名单、绝对日期范围、相对时间范围（day/week/month/year）
专业搜索模式：深度搜索（消耗更多 credits）、新闻模式（限定天数）、多引擎切换（Google/Bing/Baidu/Yandex/DuckDuckGo）
内容提取：支持从 URL 提取可读内容（Tavily Extract / Exa livecrawl）

显著优点

1. 功能完备：填补了内置搜索在域名过滤、日期范围、深度模式等方面的能力空白
2. 引擎互补：四大引擎各有侧重，Tavily 的 AI 答案质量最优，Serper 的新闻覆盖最广，SerpAPI 支持中文搜索（Baidu）
3. 零依赖设计：纯 Node.js 原生代码，无第三方依赖包，供应链攻击面极小
4. 代码结构清晰：模块化引擎封装，无危险函数，无硬编码密钥
5. 输出友好：默认 Markdown 格式便于 AI 消费，支持 --json 程序化调用

潜在局限

1. 成本依赖：免费额度有限（Tavily 1000次/月，Serper 100次/月），高频使用需付费
2. API Key 配置门槛：必须至少配置一个 API Key 才能使用，对新手不够友好
3. 隐私数据外泄：搜索查询内容需发送至第三方服务，敏感信息存在泄露风险
4. 来源可信度：T3 级别个人开发者项目，缺乏企业级代码审查和长期维护保障

适合人群

需要域名限定搜索的研究人员（如仅搜索 github.com、arxiv.org）
需要时间范围过滤的资讯追踪者（如只看本周新闻）
需要深度搜索模式的深度研究用户
需要中文搜索支持的用户（通过 SerpAPI 调用 Baidu）
对内置搜索结果质量不满意的高级用户

常规风险

数据隐私：搜索关键词、提取的 URL 内容均会传输至第三方 API
API 密钥泄露：需在环境变量中配置密钥，共享环境存在误泄露风险
成本失控：深度搜索模式消耗 2 倍 credits，高频调用可能快速耗尽免费额度
服务依赖：完全依赖第三方搜索服务的可用性和定价策略
供应链：虽无 npm 依赖，但仍依赖作者 GitHub 仓库的持续维护

web-search information-retrieval tavily exa serper serpapi domain-filter news-search content-extraction ai-agent

Web Search Pro 内容

scripts文件夹

engines文件夹

手动下载zip · 10.7 kB

exa.mjstext/javascript

请选择文件