gemini-deep-research

🔬 AI 驱动的深度研究自动化引擎

基于 Google Gemini Deep Research API 的智能研究助手,可自动分解复杂查询、多源搜索并生成综合报告,适合深度市场调研与技术调研场景。

收藏
12.5k
安装
2.9k
版本
v1.0.0
CLS 安全性认证2026-05-19
点击查看完整报告 >

使用说明

核心用法

Gemini Deep Research 是一个调用 Google Gemini Deep Research Agent API 的命令行工具,专为复杂、长周期的研究任务设计。用户通过 scripts/deep_research.py 脚本提交研究查询,Agent 会自动将问题拆解为多个子问题,系统性搜索网络信息,最终合成结构化报告。支持自定义输出格式、文件搜索存储关联以及流式进度查看,结果自动保存为带时间戳的 Markdown 报告和 JSON 元数据文件。

显著优点

1. 自动化研究流程:无需手动整理搜索关键词,Agent 自主规划研究路径,大幅降低信息搜集的认知负担。
2. 多源信息整合:能够跨网页、文档进行综合分析,输出带有引用来源的完整报告,提升研究可信度。

3. 灵活输出控制:支持通过 --format 参数自定义报告结构,满足学术、商业、技术等不同场景的呈现需求。

4. 进度可感知--stream 模式提供实时进度反馈,长时任务(数分钟至数小时)的执行状态透明可见。

5. 与私有数据结合:可选接入 Gemini File Search Store,实现公开网络信息与内部文档的交叉分析。

潜在缺点与局限性

1. API 成本不可控:研究任务的 token 消耗与搜索轮次正相关,复杂主题可能产生较高费用,且难以预先估算。
2. 执行时间不确定:任务耗时从数分钟到数小时不等,缺乏明确的上限保证,不适合时效性极强的场景。

3. 依赖 Google 生态:必须使用 Google AI Studio 申请的 Gemini API key,不支持 Antigravity OAuth 等第三方认证方式。

4. 网络与地区限制:受 Google API 服务可用性影响,部分地区可能需要额外网络配置。

5. 结果质量波动:虽然能生成完整报告,但深度推理和事实核查仍依赖模型能力,关键结论建议人工复核。

适合的目标群体

  • 市场分析师:需要快速产出竞品分析、行业趋势报告
  • 学术研究人员:进行文献综述、技术路线调研
  • 产品经理:评估技术可行性、追踪新兴技术动态
  • 咨询顾问:生成客户交付物初稿,加速信息整理
  • 技术写作者:收集技术背景资料,构建知识库内容

使用风险

  • API 配额与计费:未设置用量上限可能导致意外账单,建议在 Google Cloud Console 中配置预算告警
  • 输出目录权限:脚本需写入文件系统,若指定系统敏感路径可能引发权限问题
  • 长时任务中断:网络波动或 API 服务异常可能导致研究任务失败,需做好重试准备
  • 数据隐私:研究查询内容会发送至 Google 服务器,涉密信息需谨慎评估

安全解读

核心功能

Gemini Deep Research Skill 是 Google Gemini Deep Research Agent 的命令行客户端封装,专为执行复杂、长周期的研究任务设计。该 Skill 将用户的研究需求自动拆解为子问题,通过系统性的网络搜索获取多源信息,最终综合生成结构化研究报告。

显著优点

1. 智能任务分解:自动将复杂研究主题拆解为可执行的子问题,降低用户研究设计门槛
2. 多源信息综合:集成 Gemini Deep Research Agent 的搜索能力,覆盖广泛网络资源

3. 灵活输出格式:支持自定义报告模板,可指定 Markdown 表格、章节结构等格式要求

4. 可选文件搜索:支持关联私有文档存储(File Search Store),实现内部资料与公开信息的交叉分析

5. 流式进度反馈--stream 参数提供实时研究进度,适合长周期任务的透明度需求

6. 双格式输出:同时生成易读的 Markdown 报告和完整的 JSON 元数据,便于后续处理

潜在局限

  • API 密钥门槛:需单独申请 Google AI Studio 的 Gemini API key,不支持 Antigravity OAuth 认证
  • 运行时长不确定:复杂研究可能耗时数分钟至数小时,不适合即时响应场景
  • 成本不可控性:长周期多轮搜索可能产生较高 API 费用,缺乏精确预算预估
  • 输出目录管理:默认写入当前目录,需用户主动指定 --output-dir 避免文件混乱
  • 网络依赖性强:完全依赖 Google API 可用性,无离线降级能力

适合人群

  • 市场研究员与战略分析师(竞争格局、行业趋势调研)
  • 技术调研人员(技术栈对比、架构演进研究)
  • 学术与政策研究者(多源文献综合、证据整合)
  • 投资与尽职调查团队(公司背景、供应链风险分析)
  • 内容创作者(深度主题背景资料准备)

常规风险

| 风险类型 | 说明 | 缓释建议 |
|---------|------|---------|
| API 密钥泄露 | 命令行参数可能记录于 shell 历史 | 优先使用环境变量,定期清理历史 |
| 敏感数据外泄 | 研究查询内容发送至 Google 服务器 | 避免在查询中包含 PII 或商业机密 |
| 成本超支 | 复杂任务可能消耗大量 token | 先测试简单查询,监控用量 |
| 结果时效性 | 依赖实时搜索,结果随时间变化 | 记录查询时间戳,必要时重新执行 |
| 输出文件积累 | 时间戳文件可能占用磁盘空间 | 定期清理或指定专用目录 |

gemini-deep-research 内容

scripts文件夹
手动下载zip · 3.5 kB
deep_research.pytext/plain
请选择文件