核心用法
Web Search Skill 是一款通用网络搜索技能,通过 main() 函数统一入口,支持三种操作模式:
- 基础搜索 (
action: search):快速获取搜索结果列表 - 深度搜索 (
action: deep_search):搜索并抓取详情页内容 - 网页爬取 (
action: crawl):直接提取指定URL页面内容
配置极简,仅需 query/url 和可选的 num_results(默认5,最大20)、region 参数即可调用。
显著优点
1. 零门槛使用:无需申请任何API密钥,通过浏览器自动化和网页抓取技术直接访问搜索引擎
2. 多引擎智能调度:四层 fallback 策略(baidusearch库 → Playwright+百度 → DuckDuckGo → Bing),确保高可用性
3. 异步高性能:基于 Playwright 的浏览器自动化,支持并发请求
4. 结构化输出:返回包含 title、href、body 的标准化结果,便于下游处理
5. 深度内容提取:集成 crawl4ai 实现详情页内容抓取,超越传统搜索摘要
潜在缺点与局限性
- 首启动成本:首次使用需下载 Chromium 浏览器(约100MB)
- 反爬风险:依赖浏览器自动化,可能触发搜索引擎反爬机制导致临时封禁
- 稳定性波动:搜索结果受引擎算法、地理位置、网络环境影响,无法保证一致性
- 性能开销:相比API直连,Playwright模式内存和CPU占用更高
- 合规灰色地带:大规模爬取可能违反搜索引擎服务条款
适合人群
- 个人开发者/研究者:快速验证信息、原型开发
- 小型项目:预算有限、不愿维护API密钥的场景
- 自动化工作流:需要实时网络信息的LLM Agent、RAG系统
常规风险
- IP封禁:高频请求可能导致搜索引擎临时限制访问
- 内容准确性:抓取结果未经人工审核,存在过时或错误信息风险
- 依赖维护:依赖多个第三方库(baidusearch、crawl4ai、playwright),版本兼容性需关注
- 隐私暴露:搜索查询通过第三方库传输,存在潜在的隐私泄露风险