核心用法
cn-web-search 是一款多引擎聚合搜索技能,通过纯网页抓取(web_fetch)方式接入17个免费搜索引擎,完全零API依赖、零成本使用。覆盖六大类别:公众号搜索(搜狗微信、必应索引)、中文综合(百度、360、搜狗、必应中文、头条)、英文综合(Brave、DDG、Qwant、Startpage、Bing、Yahoo、Mojeek)、技术社区(Stack Overflow、GitHub Trending)、财经投资(东方财富、集思录、财新)、知识百科(Wikipedia中英文)。
使用方式为直接调用 web_fetch 拼接引擎URL,指定关键词和 extractMode="text" 提取内容。典型场景:投研分析时并行调用百度+360+搜狗交叉验证英伟达财报数据;技术排查时直达Stack Overflow;投资研究时查询东方财富、集思录的可转债讨论。
显著优点
1. 完全免费:17个引擎均无需API Key,无调用配额限制,无商业授权成本
2. 覆盖全面:中文搜索(含公众号)、英文隐私搜索、技术社区、财经投资、知识百科一站式覆盖
3. 实时性强:直接抓取搜索引擎结果页,获取最新资讯,解决大模型知识截止痛点
4. 多源验证:同一查询可并行调用多个引擎,交叉验证数据准确性(如实战案例中英伟达营收数据三源确认)
5. 隐私友好:Brave、Mojeek、DDG等引擎不追踪用户,独立索引非大厂代理
潜在缺点与局限性
1. 稳定性依赖目标网站:搜索引擎反爬策略变化可能导致抓取失败(如百度需关注验证机制)
2. 结果质量参差:免费引擎排序算法不如Google精准,需人工筛选或Rerank
3. 速率限制风险:高频调用可能触发IP限制,建议配合合理间隔和重试机制
4. 无结构化输出:返回原始HTML文本,需额外解析提取有效信息
5. 公众号覆盖局限:搜狗微信搜索结果受微信生态限制,部分文章可能缺失
适合人群
- 投研分析师:需要实时财经数据、A股资讯、管理层表态交叉验证
- 技术开发者:快速检索Stack Overflow、GitHub Trending解决代码问题
- 内容创作者:追踪公众号热点、头条资讯获取选题灵感
- 隐私敏感用户:倾向Brave、Mojeek等非追踪搜索引擎
- 低成本AI应用:希望零API成本为Agent赋予联网能力的开发者
常规风险
1. 合规风险:网页抓取需遵守各搜索引擎robots.txt及使用条款,商业场景建议评估法律边界
2. 数据准确性:搜索引擎结果可能包含未经核实信息,关键决策需人工复核原始来源
3. 服务可用性:目标网站改版或反爬升级会导致特定引擎失效,需持续关注维护
4. 信息时效偏差:抓取延迟(通常分钟级)不适合高频实时交易场景