skills/zjianru/Web Search Pro

Web Search Pro

🔎 AI Agent 的智能检索中枢

零配置即用的智能检索引擎，聚合多路搜索API，支持研究、爬取、诊断与缓存管理，开发者与知识工作者的信息获取利器。

收藏

19.4k

安装

6.4k

版本

2.0.1

CLS 安全扫描中

预计需要 3 分钟...

使用说明

核心用法

Web Search Pro 是一套面向 AI Agent 的检索基础设施，无需 API Key 即可启动基础功能，通过环境变量注入可选服务商（Tavily、Exa、Serper、SerpAPI）实现增强覆盖。

基础能力矩阵

| 命令 | 功能 | 无Key fallback |

|------|------|----------------|

| `search.mjs` | 多源搜索 | DuckDuckGo (ddg) |

| `extract.mjs` | 单页内容提取 | 原生 fetch |

| `crawl.mjs` | 站点级爬取 | 原生 fetch |

| `map.mjs` | 链接拓扑映射 | 原生 fetch |

| `research.mjs` | 结构化研究输出 | 组合基础源 |

| `doctor.mjs` / `health.mjs` | 诊断与自检 | 本地执行 |

| `capabilities.mjs` | 能力清单导出 | 本地执行 |

| `review.mjs` | 结果复盘 | 本地执行 |

| `cache.mjs` | 检索缓存管理 | 本地存储 |

智能路由机制：selectedProvider 由规划器动态选择；federated.providersUsed 记录多路并发时的实际响应源。研究模块输出包含 topicType、topicSignals、researchAxes 的结构化摘要，便于下游模型消费。

显著优点

零门槛启动：Node.js 环境即装即用，无密钥依赖降低试用成本
渐进增强架构：基线功能完备，按需叠加付费 API 不破坏既有代码
研究原生设计：非简单搜索包装，内置主题分解、信号提取、研究轴规划等 AI 友好输出
全链路可观测：诊断、复盘、健康检查脚本齐全，便于生产环境运维
开源可控：GitHub 托管，可审计、可 fork、可定制

潜在缺点与局限性

基线质量波动：DuckDuckGo 与原生 fetch 的稳定性、反爬策略、时效性弱于专业商业 API
并发与速率限制：无 Key 模式下缺乏服务商级别的 SLA 保障，大规模采集易触发源站限流
中文/区域内容：DDG 对中文搜索结果优化有限，国内站点（如百度）需依赖 SerpAPI 等可选源
缓存一致性：cache.mjs 为本地文件级实现，多机部署需自行解决同步
错误恢复粒度：文档未明确描述失败源自动剔除与降级策略的透明度

适合人群

构建 RAG/Agent 系统的开发者，需要可插拔的检索层
知识管理工具构建者，追求「搜索-提取-研究」一体化工作流
预算敏感型用户，希望从免费方案起步、业务验证后再升级
数据分析师与研究人员，需要结构化研究输出而非原始网页堆砌

常规风险

API Key 泄露：Tavily/Exa/Serper/SerpAPI 等密钥若硬编码存在泄露风险，建议配合机密管理服务
网络侧信道：fetch fallback 直接暴露客户端 IP，高匿名场景需配合代理
内容合规：爬取与提取行为需遵守目标站点的 robots.txt 及当地法规（如 GDPR 数据留存）
依赖供应链：Node.js 运行时与 npm 生态的安全更新需持续跟踪

web-search data-extraction web-crawling research-automation api-aggregation rag ai-agent open-source

Web Search Pro 内容

docs文件夹

scripts文件夹

engines文件夹

lib文件夹

research文件夹

手动下载zip · 85.6 kB

clawhub-compliance.mdtext/markdown

请选择文件