核心功能
Deep Research Skill 是一个围绕 Google Gemini Deep Research Agent 构建的命令行研究工具,无需安装 Gemini CLI 即可调用 Google 的异步深度研究能力。其核心用法包括:启动研究查询、基于本地文件的 RAG 增强研究、实时状态监控、以及多格式报告导出。
该工具设计为AI 代理原生友好,所有命令均遵循 stderr 输出人类可读内容、stdout 输出机器可读 JSON 的双输出模式,便于 Claude Code、Amp、Codex 等 30+ 代理集成。
显著优点
1. RAG 原生支持:通过 --context 自动创建临时文件搜索存储,将代码库、文档目录作为研究上下文,无需手动预处理
2. 智能成本管理:--dry-run 提供研究前成本预估,避免意外支出;自适应轮询根据历史完成时间动态调整 API 调用频率
3. 结构化输出:--output-dir 生成标准化目录结构(report.md/metadata.json/sources.json),专为自动化工作流设计
4. 会话持久化:.gemini-research.json 缓存研究 ID 和存储映射,支持跨命令会话续接
5. 非交互安全:自动检测 TTY,AI 代理调用时跳过确认提示,避免管道挂起
潜在局限
- 成本不可控:实际费用依赖 Gemini API 内部计费,预估仅为启发式估算
- 异步复杂性:研究完成时间从数分钟到数小时不等,需要轮询或回调机制
- PDF 依赖外部工具:PDF 导出需要额外安装 weasyprint
- 历史数据敏感:自适应轮询依赖本地 .gemini-research.json,删除后优化失效
适用场景
适合需要对大规模代码库、技术文档进行深度分析的开发团队,以及构建自动化研究管道的 AI 代理开发者。特别适合安全审计、架构评审、竞品分析等需要引用原始材料的场景。
常规风险
- API 密钥泄露风险(需妥善管理 GOOGLE_API_KEY)
- 长时运行任务可能因网络中断导致状态丢失
- 文件上传存在 100MB 单文件限制,大代码库需分批处理