Web Search Plus

🔍 十源合一 · 智能路由搜索

productivity榜 #15

一站式多源搜索与网页内容提取工具,自动路由10家搜索提供商,最低仅需1个API密钥即可启动,支持隐私优先的SearXNG自托管方案

收藏
81.8k
安装
20.5k
版本
3.0.0
CLS 安全性认证2026-05-13
点击查看完整报告 >

使用说明

核心用法

Web Search Plus 是一款统一多提供商搜索与URL内容提取的技能,通过智能自动路由将用户查询分配到最优搜索源。用户只需执行 python3 scripts/search.py -q "查询内容" 即可完成搜索,无需手动选择提供商;内容提取则通过 python3 scripts/extract.py --url 网址 实现。

搜索功能:支持10家提供商——Serper(购物/本地)、Brave(独立索引)、Tavily(研究综合)、Querit(多语言)、Linkup(引证优先)、Exa(语义发现)、Firecrawl(抓取就绪)、Perplexity(直接答案)、You.com(RAG友好)、SearXNG(隐私/免费自托管)。系统按默认优先级自动路由,也可通过 -p 参数强制指定。

提取功能:自动在Firecrawl、Linkup、Tavily、Exa、You.com五家间降级容错,支持Markdown/HTML格式、图片保留、批量URL等选项。

显著优点

  • 零摩擦启动:仅需任意一个提供商API密钥或SearXNG实例URL即可运行
  • 智能路由:基于查询意图自动匹配最佳提供商(研究→Tavily/Exa,引证→Linkup,当前资讯→Brave/Serper,隐私优先→SearXNG)
  • 成本灵活:SearXNG完全免费自托管,其余提供商多有免费额度
  • 提取鲁棒性:五层降级机制确保内容获取成功率
  • 隐私选项:SearXNG不依赖商业API,数据自主可控

潜在缺点与局限性

  • 密钥管理复杂度:多提供商优势需积累多个API密钥才能充分发挥
  • 路由黑盒风险:自动选择可能不符合特定场景的精细需求
  • SearXNG运维成本:虽无API费用,但自托管需维护服务器实例
  • 提供商稳定性差异:部分新兴服务(如Querit、Linkup)的长期可用性待观察
  • 中文支持不均:部分提供商对中文语义理解和结果质量参差

适合人群

  • 研究人员与知识工作者:需要跨源验证和引证追踪
  • 开发者与RAG构建者:需要结构化、带来源的网页内容输入
  • 隐私敏感用户:可通过SearXNG实现零商业API依赖
  • 多语言信息需求者:Querit和Tavily对非英语内容支持较好
  • 成本敏感场景:SearXNG免费方案适合批量低频查询

常规风险

  • API密钥泄露.env文件需妥善保管,避免提交至版本控制
  • SearXNG SSRF防护绕过:虽已内置基础防护(阻断云元数据端点、私有IP),但SEARXNG_ALLOW_PRIVATE=1开启时需自行评估内网暴露风险
  • 数据留存政策:各商业提供商对查询日志的保留策略不一,敏感查询建议优先SearXNG
  • 提取内容合规:自动化抓取需遵守目标网站的robots.txt和服务条款
  • 路由误判:关键场景建议 --explain-routing 调试确认后再依赖自动选择

安全解读

核心功能

Web Search Plus 是一个多提供商搜索引擎聚合工具,将 10 个搜索服务(Serper、Brave、Tavily、Querit、Linkup、Exa、Firecrawl、Perplexity、You.com、SearXNG)统一为单一接口。用户无需选择提供商——系统通过查询意图分析自动路由:通用搜索走 Brave/Serper,研究类问题走 Tavily/Exa,需要引用溯源走 Linkup,隐私优先走自托管 SearXNG。

配套 URL 提取功能支持从任意网页抓取 markdown/HTML 内容,自动在 Firecrawl、Linkup、Tavily、Exa、You.com 五家服务间故障转移。

显著优点

  • 零决策成本:智能路由消除"选哪个搜索引擎"的认知负担
  • 极低启动门槛:仅需任意一个 API 密钥即可运行,后续按需扩展
  • 成本灵活:SearXNG 自托管方案实现零 API 费用
  • 架构干净:纯 Python 标准库实现,零第三方依赖,代码约 1,800 行
  • 安全设计完善:内置 SSRF 防护(阻断云元数据端点、私有 IP),HTTPS 强制,密钥仅通过环境变量读取

局限性与风险

  • 网络依赖复杂:10 个外部 API 意味着 10 个潜在故障点,虽已实现自动降级,但提供商策略变更可能影响功能
  • 无本地索引:所有搜索必须联网,无法离线使用
  • 缓存敏感边界:本地缓存机制虽有过期策略,但多用户场景下需注意缓存隔离
  • SearXNG 配置门槛:自托管方案需要用户自行部署实例,技术门槛高于纯 SaaS

适合人群

  • 研究人员:需要跨源验证、引用溯源、多语言信息
  • 开发者:构建 RAG 应用需要结构化网页内容提取
  • 隐私敏感用户:可通过 SearXNG 实现去中心化搜索
  • 自动化工作流:CLI 工具形态适合脚本集成

常规风险

| 风险项 | 等级 | 说明 |
|--------|------|------|
| API 密钥泄露 | 低 | 仅存储于环境变量/本地配置文件,无硬编码 |
| 数据传输 | 低 | 全链路 HTTPS,无明文传输 |
| SSRF 攻击 | 低 | 已实施协议限制、IP 黑名单、私有网络隔离 |
| 提供商服务中断 | 中 | 自动降级缓解,但极端情况下可能影响可用性 |
| 缓存数据残留 | 低 | 本地 .cache/ 目录需用户定期清理 |

安全认证评分 S 级(85/100),静态分析、依赖审计、隐私合规均通过,网络分析因多外部依赖标记为 warn。

Web Search Plus 内容

scripts文件夹
tests文件夹
手动下载zip · 61.7 kB
docker_detect.pytext/plain
请选择文件