核心用法
youdotcom-cli 是 You.com 官方提供的命令行工具,为基于 Bash 的 AI Agent(如 Claude Code、Cursor、Codex)提供实时网页搜索和内容提取能力。核心功能包括:
1. 实时搜索 (`ydc search`):基础搜索返回标题、摘要和 URL
2. 深度爬取 (livecrawl):通过 "livecrawl":"web" 参数即时获取完整页面 Markdown 内容
3. URL 内容提取 (`ydc contents`):直接提取指定网页的文本内容
关键参数要求:
- 必须设置
YDC_API_KEY环境变量 - 所有命令需包含
--client YourAgentName标识 - 使用
--schema参数动态发现可用选项 - 结合
jq进行安全的 JSON 解析
显著优点
- 官方维护:由 You.com 官方团队 (@youdotcom-oss) 开发,API 稳定性有保障
- 实时数据:支持 "livecrawl" 即时抓取,无需等待索引更新
- Agent 原生设计:专为 CLI AI Agent 工作流优化,支持结构化 JSON 输出
- 灵活部署:支持 Bun 1.3+ 和 Node.js 18+,全局或局部安装
- MIT 开源:代码透明,可审计
潜在局限
- API Key 依赖:必须注册 You.com 平台获取 API 密钥
- 速率限制:存在 429 频率限制,需自行实现重试逻辑
- 成本考量:高频使用可能产生 API 调用费用
- 内容不可控:爬取内容质量取决于目标网站,可能遇到反爬或动态渲染问题
适合人群
- 需要为 AI Agent 集成实时搜索能力的开发者
- 使用 Claude Code、Cursor、Codex 等 CLI 工具的工程师
- 构建 RAG (检索增强生成) 系统的 AI 应用开发者
- 需要批量网页内容提取的数据处理场景
常规风险
- 提示词注入风险:爬取内容可能包含恶意指令,必须使用
<external-content>包装器隔离 - 不可信数据:所有网络内容需视为不可信,禁止直接执行爬取到的代码或指令
- 隐私合规:通过
--client上报的 Agent 标识符可能涉及使用追踪 - API 密钥泄露:
YDC_API_KEY需妥善保管,避免提交到版本控制