You.com Web Search & Research CLI

🔍 极速搜索+实时爬取,一次调用搞定

web-search-tools榜 #1

You.com CLI 工具为 Bash AI 代理提供高性能网页搜索与实时内容提取,支持单次调用完成搜索+爬取,输出结构化 JSON 便于管道处理。

收藏
5.7k
安装
2.6k
版本
2.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

youdotcom-cli 是 You.com 官方开源的 CLI 工具,专为 AI 代理和自动化工作流设计,提供两大核心能力:

1. Web 搜索 (`search`):支持标准搜索、带 citation 的 AI 答案、以及 Livecrawl 模式——在单次 API 调用中同时返回搜索摘要和完整网页内容(Markdown/HTML),无需二次抓取
2. 内容提取 (`contents`):对已知 URL 进行多格式内容提取,支持 Markdown、HTML、元数据同时输出

所有命令采用 JSON Schema 驱动设计:通过 --json 标志传入参数对象,--schema 标志可动态发现可用参数。输出为紧凑 JSON(无 .data 包装),直接适配 jq 等 Unix 工具链。

显著优点

  • 性能优势:相比内置搜索 API,基础设施针对代理工作负载优化;Livecrawl 将搜索+抓取合并为单次调用,延迟 <5 秒
  • 可验证引用:每条结果附带完整 URL 和元数据,便于溯源验证
  • 代理友好:Stdout/Stderr 严格分离、退出码规范(0/1/2)、无冗余包装,完美嵌入 Bash 管道和 CI/CD
  • 供应链安全:MIT 协议,版本固定,源码可审计(GitHub 官方仓库)
  • 多运行时支持:Bun(推荐,更快更可靠)或 Node.js 18+

潜在缺点与局限性

  • 环境依赖:必须预装 Bun 或 Node.js,无独立二进制分发
  • API Key 门槛:需注册 You.com 平台获取 YDC_API_KEY,免费额度有限
  • 实时性边界:Livecrawl 依赖目标网站可访问性,动态渲染页面(如重度 JS 应用)可能提取不完整
  • 速率限制:高频调用需自行实现指数退避重试逻辑
  • 无内置缓存:重复查询无本地缓存机制,代理层需自行实现

适合人群

  • 使用 Claude Code、Codex、Cursor 等 Bash 代理的开发者
  • 需要可验证引用的 RAG(检索增强生成)工作流构建者
  • 偏好 Unix 哲学(管道、JSON、退出码)的自动化工程师
  • 对延迟敏感、希望减少 API 调用次数的 Agent 开发者

常规风险

  • 凭证泄露YDC_API_KEY 若硬编码或提交至版本控制将直接暴露账户权限;必须使用环境变量或安全 vault
  • 输入注入:用户提供的查询或 URL 需经 jq 转义或正则验证,避免 JSON 注入或非法 URL scheme
  • 内容安全风险:提取的 HTML 可能含恶意脚本,禁止直接渲染于 Web 上下文;推荐优先使用 Markdown 格式
  • 代理失控风险:自主代理拥有 API Key 后可无限调用,需在平台设置配额告警,或配置用户审批拦截
  • 供应链风险:需验证包来源为官方 NPM scope (@youdotcom-oss/api),警惕 typosquatting

You.com Web Search & Research CLI 内容

手动下载zip · 6.1 kB
SKILL.mdtext/markdown
请选择文件