Web Search Pro

🔎 AI Agent的智能检索中枢

AI智能检索中枢,零API密钥即可启动,支持多引擎联邦搜索、浏览器渲染提取与结构化研究包生成,专为Agent设计的多层级信息获取系统。

收藏
31.2k
安装
6.4k
版本
2.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心功能

Web Search Pro 2.0 是一款面向AI Agent的多引擎检索系统,突破了传统搜索脚本的单一工具定位,构建起完整的智能信息获取架构。其核心价值体现在三个维度:

检索层 —— 采用可解释路由机制,整合DuckDuckGo零密钥基线与Tavily、Exa、Serper、SerpAPI等增强引擎,支持智能联邦查询(federated fanout),针对新闻、模糊查询、关键领域、研究对比等场景自动触发多源并行检索,并输出合并统计与去重遥测。

提取层 —— 提供三级内容获取能力:extract.mjs安全单页提取(可选浏览器回退)、render.mjs强制本地浏览器渲染、crawl.mjs多页BFS爬取、map.mjs站点结构发现。浏览器渲染通道默认关闭,启用后采用本地headless浏览器,支持同源策略与反爬虫拦截识别。

研究层 —— research.mjs并非面向人类的报告生成器,而是向上游模型输出结构化的「计划+证据包」,包含主题分类、研究维度、子问题意图、证据权威性评分、声明聚类与不确定性标注,实现检索与推理的职责分离。

显著优点

  • 零门槛启动:无需任何API密钥即可运行基线检索,显著降低试用成本
  • 安全设计纵深:Safe Fetch自动拒绝非HTTP(S)、含凭证、本地及私有地址;浏览器渲染可配置同源限制;挑战页面识别为降级而非虚假成功
  • 可观测性强:路由解释、健康状态、提供者冷却、缓存统计、诊断报告全透明输出
  • 结构化输出稳定:JSON Schema 1.0保持向后兼容,程序化集成友好
  • 联邦智能:基于查询类型的自动多源扩展,结果合并与去重机制完善

局限与风险

  • 基线能力边界:DuckDuckGo无密钥模式可能遭遇挑战页面,稳定性低于付费API
  • 浏览器渲染依赖:本地Node环境需满足headless浏览器运行条件,跨平台兼容性需验证
  • 研究层非终端输出:需要上游模型承担最终推理与叙事合成,非开箱即用的完整报告
  • 配置复杂度:多层配置优先级(CLI→环境变量→配置文件→默认值)与大量策略参数对新手形成学习曲线
  • 合规灰色地带:大规模爬取与站点映射需关注目标站点的robots.txt与服务条款

适合人群

AI Agent开发者、需要可控多源检索的研究自动化场景、对检索过程可解释性有要求的工程团队、以及希望在「免费基线」与「付费增强」间灵活切换的成本敏感型用户。

常规风险

运行时密钥暴露风险可通过capabilities.mjsreview.mjs审计缓解;浏览器通道的本地执行需确保隔离环境;联邦查询的多API调用可能产生预期外费用;缓存机制虽提升效率但需关注敏感数据滞留。

Web Search Pro 内容

暂无文件树

手动下载zip · 182.9 kB
contentapplication/octet-stream
请选择文件