deepresearch

📌 多轮深度研究,智能生成专业报告

ai-research榜 #3

百度千帆 Deep Research 深度研究对话技能,支持多轮流式交互、文件上传解析与结构化大纲生成,适用于复杂课题的深度调研与报告撰写场景

收藏
14.9k
安装
6.8k
版本
1.0.4
CLS 安全性认证2026-05-22
点击查看完整报告 >

使用说明

核心用法

Deep Research Conversation 是百度千帆平台提供的深度研究型对话能力,区别于普通问答,采用多轮流式交互 + 任务式执行架构。核心流程为:创建会话 →(可选)上传文件 → 提交解析任务 → 轮询解析状态 → 启动深度对话 → 迭代确认大纲 → 生成研究报告。

支持两种启动模式

  • 纯对话模式:直接调用 DeepresearchConversation,系统自动生成会话
  • 文件增强模式:先通过 ConversationCreate 创建会话,经 FileUploadFileParseSumbitFileParseQuery 完成文件解析后,再启动对话

关键交互机制

  • SSE 流式返回,支持实时获取研究进度
  • 必须处理「需求澄清」和「大纲确认」两种中断场景,携带 interrupt_idstructured_outline 续会话
  • 提供 Lite(10分钟内快速生成)和 Standard(质量优先)两种版本策略

显著优点

  • 企业级文件支持:覆盖文本(PDF/Word/PPT/TXT,最大100MB)、表格(Excel,15万字符/行)、图片(10MB)、音频(WAV/PCM)全类型,单会话最多10个文件
  • 结构化产出:强制输出 JSON 格式大纲,支持用户修改确认后严格按大纲生成报告,确保内容可控
  • 上下文连续性:通过 conversation_id + interrupt_id + structured_outline 三元组维持长会话状态,适合数小时甚至数天的深度研究任务
  • 生态整合:原生对接百度千帆/文心生态,Authorization 统一认证,降低企业接入成本

潜在局限与风险

  • 流程复杂度高:涉及 4-5 个 API 的编排调用,文件场景需轮询解析状态(FileParseQuery),开发成本显著高于普通 Chat API
  • 状态管理严苛:第二轮起必须携带前序 structured_outline,遗漏即报错中断,对异常处理要求高
  • 实时性限制:Standard 模式下生成时间较长,未明确超时上限;轮询间隔需自行控制(文档建议「每隔几秒」)
  • 文件解析黑盒FileParseQuery 仅返回成功/失败状态,无进度百分比或详细错误信息,调试困难
  • 供应商锁定:深度依赖百度千帆生态,迁移成本高

适合人群

  • 企业知识管理/行业研究团队:需基于内部文档生成深度分析报告
  • 咨询与投研机构:进行多源信息整合与结构化输出
  • 学术研究人员:长周期课题的阶段性成果整理
  • 不适合:追求即时响应的简单问答场景、无技术团队维护的个体用户

常规风险

| 风险类别 | 具体表现 | 缓解建议 |
|---------|---------|---------|
| 会话中断 | 网络波动导致 SSE 连接断开,需用 `interrupt_id` 恢复 | 客户端实现断点续传逻辑,持久化存储关键字段 |
| 文件解析失败 | 格式/编码/大小超限,仅返回失败无明细 | 前置校验文件规范,设置解析超时熔断 |
| 大纲漂移 | 用户修改后 Agent 未严格遵循 `structured_outline` | 生成后对比校验关键章节标题一致性 |
| 密钥泄露 | `BAIDU_API_KEY` 硬编码或日志泄露 | 采用环境变量注入,屏蔽敏感头日志 |
| 成本失控 | Standard 模式长耗时任务堆积 | 设置并发上限,提供 Lite 模式降级选项 |

安全解读

核心用法

deepresearch-conversation 是百度千帆平台提供的深度研究型对话技能,区别于普通问答,采用多轮流式交互模式。用户需与 Agent 反复确认研究方向、修正大纲,直至获得满意结果。

典型工作流程:
1. 纯对话场景:直接调用 DeepresearchConversation 接口,系统自动生成会话

2. 带文件分析:先 ConversationCreate 创建会话 → FileUpload 上传文件 → FileParseSubmit 提交解析任务 → 轮询 FileParseQuery 确认完成 → 启动深度对话

3. 续接对话:携带前轮的 conversation_idinterrupt_idstructured_outline 继续交互

关键特性:

  • 支持 10 种格式文件上传(PDF/Word/PPT/Excel/图片/音频等),单文件最大 100MB
  • 流式 SSE 返回,实时感知 Agent 思考过程
  • 结构化大纲(structured_outline)驱动报告生成,用户可干预章节设计
  • 双版本策略:Lite(10 分钟快速版)与 Standard(深度质量版)

显著优点

  • T1 级可信来源:百度官方维护,API 端点 HTTPS 加密,无第三方数据滥用风险
  • 企业级文件处理:支持大体积文档(PDF 3000 页/100MB)、复杂表格、多模态输入
  • 深度可控交互:通过大纲确认环节,用户能精准把控最终报告结构,避免"黑箱"输出
  • 上下文完整保留:多轮对话状态通过 ID 体系无缝衔接,适合长周期研究任务

潜在缺点与局限性

  • 外部强依赖:功能完全绑定百度千帆服务,API 变更或限流将直接影响可用性
  • 隐私披露要求:用户查询内容、上传文件均需传输至百度服务器,敏感数据需谨慎评估
  • 交互门槛较高:相比单轮问答,需要用户理解"澄清→确认→续接"的交互范式,学习成本存在
  • 文件解析耗时:大文档需轮询等待解析完成,无法即时启动对话
  • 成本不透明:深度研究模式消耗 Token 量较大,官方未公开详细计费策略

适合人群

  • 研究人员/分析师:需要基于大量文献生成结构化研究报告
  • 企业咨询顾问:快速梳理行业资料、生成汇报框架
  • 内容创作者:深度选题调研、长文大纲规划
  • 开发者集成:需将深度研究能力嵌入自有 Agent 工作流的技术团队

常规风险

  • 数据出境考量:文件与查询上传至百度云服务,涉及合规性审查场景需额外评估
  • 会话状态丢失:若未妥善保存 interrupt_idstructured_outline,续接对话可能失败
  • 版本策略误用:Lite 模式牺牲深度换速度,关键研究场景需显式选择 Standard 模式
  • API 密钥管理:依赖 BAIDU_API_KEY 环境变量,多租户环境需防止密钥泄露

deepresearch 内容

scripts文件夹
手动下载zip · 4.5 kB
deepresearch_conversation.pytext/plain
请选择文件