核心用法
Tavily 是一款面向 AI Agent 的搜索 API 服务,通过 Node.js 脚本封装为本地可调用技能,主要提供两类功能:
1. 智能搜索 (`search.mjs`)
- 基础搜索:
node {baseDir}/scripts/search.mjs "query" - 结果数量控制:
-n <count>(默认 5,最大 20) - 深度研究模式:
--deep(更慢但更全面的分析) - 主题过滤:
--topic news配合--days <n>获取近期新闻
2. 网页内容提取 (`extract.mjs`)
- 直接提取指定 URL 的干净文本内容,去除广告和噪音
显著优点
- AI 原生设计:返回结果已针对 LLM 消费优化,包含摘要、关键信息点,减少 token 消耗
- 结构化输出:相比传统搜索引擎,提供更易解析的 JSON/片段格式
- 深度研究模式:支持复杂查询的多轮检索与综合
- 实时新闻支持:可按时间窗口过滤,适合时效性内容获取
- 内容提取服务:无需自行处理网页清洗,降低开发成本
潜在缺点与局限性
- 依赖外部 API:需注册 Tavily 账号并获取 API Key,存在服务可用性和计费风险
- Node.js 环境依赖:本地执行需要 Node 运行时,非纯 Shell 方案
- 深度模式较慢:
--deep选项牺牲响应速度换取全面性,不适合实时场景 - 中文内容覆盖:作为海外服务,中文网页的索引深度可能不及百度等本土引擎
- 隐私考量:搜索查询需发送至第三方服务器
适合人群
- 构建 AI Agent 的开发者,需要可靠的搜索增强(RAG)能力
- 需要自动化信息检索的研究人员、分析师
- 希望减少网页清洗工作的内容聚合场景
常规风险
- API 密钥泄露:
TAVILY_API_KEY需妥善保管,避免硬编码提交至版本控制 - 成本控制:高频调用可能产生 API 费用,建议设置用量监控
- 数据合规:敏感查询通过境外服务处理,需评估合规要求
- 结果偏差:AI 优化的摘要可能引入模型偏见,关键信息建议交叉验证