deepresearch

📌 深度研究·多轮对话·智能大纲

ai-research榜 #2

百度千帆深度研究对话代理,支持多轮流式交互、文件解析与结构化大纲生成,适用于复杂议题的渐进式深度调研。

收藏
14.9k
安装
6.8k
版本
1.0.3
CLS 安全性认证2026-05-21
点击查看完整报告 >

使用说明

核心用法

Deep Research Conversation 是百度千帆平台提供的长流程多轮对话代理,区别于即时问答,它通过「需求澄清→大纲确认→深度生成」的渐进式交互,完成复杂议题的系统性研究。

典型工作流
1. 纯对话模式:首次讨论直接调用 DeepresearchConversation,自动创建会话

2. 文件驱动模式:先 ConversationCreate 创建会话 → FileUpload 上传文件(支持 PDF/Word/Excel/PPT/图片/音频,最多10个)→ FileParseSubmit 提交解析任务 → 轮询 FileParseQuery 确认解析成功 → 启动深度对话

3. 断点续谈:携带前轮的 interrupt_id + conversation_id + structured_outline 继续交互

4. 大纲确认:Agent 生成结构化大纲后,用户可修改确认,后续严格按此框架生成报告

关键技术特性

  • SSE 流式返回,支持实时进度感知
  • 双版本策略:Lite(10分钟内快速生成) vs Standard(深度优先,质量优先)
  • 结构化大纲递归嵌套,支持多级章节体系

显著优点

| 维度 | 亮点 |
|------|------|
| **交互深度** | 非一次性输出,通过多轮澄清确保研究方向符合用户预期 |
| **文件兼容** | 覆盖办公全格式,PDF 支持 3000 页/100MB,Excel 支持 15 万字符/行 |
| **工程化设计** | 会话状态机完整(创建→上传→解析→对话→续谈),支持断点恢复 |
| **企业级输出** | 结构化大纲可直接转为正式报告框架,减少后期排版成本 |

潜在局限

1. 时效门槛:Standard 版本耗时较长,不适合秒级响应场景
2. 轮询负担:文件解析状态需客户端主动轮询(FileParseQuery),无推送机制

3. 状态耦合:续谈时必须携带完整 structured_outline,会话状态较重

4. 百度生态绑定:依赖千帆平台账号与 BAIDU_API_KEY,迁移成本高

适合人群

  • 行业研究员:需要基于大量文档生成系统性分析报告
  • 咨询顾问:通过多轮交互校准客户需求,输出结构化交付物
  • 学术用户:处理论文、数据集,生成文献综述或研究框架
  • 企业知识管理:将内部文档转化为可交互的研究知识库

常规风险

| 风险类型 | 说明 | 缓释建议 |
|----------|------|---------|
| 数据出境 | 文件上传至百度云服务 | 敏感文件脱敏或选用私有部署 |
| 解析失败 | 超大文件或复杂版式可能截断/失败 | 提前拆分文档,控制单文件页数 |
| 会话丢失 | `interrupt_id` 或 `conversation_id` 未持久化导致断链 | 关键节点本地备份状态参数 |
| 大纲锁定 | 确认后的 `structured_outline` 严格约束后续生成,灵活性下降 | 确认前充分迭代修改 |

安全解读

核心用法

Deep Research Conversation 是百度千帆平台提供的多轮深度研究对话能力,区别于普通问答,采用"深度研究"模式——通过多步推理与执行完成长流程任务。用户需反复验证与修正,直至获得满意答案。

典型工作流

1. 纯对话场景:直接调用 DeepresearchConversation 接口,自动生成新会话
2. 带文件研究:先 ConversationCreateFileUploadFileParseSumbit → 轮询 FileParseQuery 确认解析成功 → 启动深度对话

3. 持续交互:多轮对话需携带 conversation_idinterrupt_id 及上一轮生成的 structured_outline(结构化大纲),支持用户修改确认后进入下一阶段

关键特性

  • SSE流式响应:实时获取研究进度与大纲生成结果
  • 文件解析:支持 PDF(≤100MB/3000页)、Office 文档、图片、音频等格式
  • 版本策略Lite(10分钟内快速生成)与 Standard(质量优先深度搜索)

---

显著优点

| 维度 | 说明 |
|------|------|
| **官方背书** | 百度千帆T1级可信来源,企业级服务稳定性 |
| **深度研究** | 非单次问答,支持大纲确认、方向校准、多轮迭代 |
| **文件原生** | 内置上传-解析-查询完整链路,无需外部文档处理 |
| **流式体验** | SSE实时反馈研究进度,降低长任务等待焦虑 |
| **安全合规** | 通过GDPR/CCPA/数据最小化/传输加密等合规检查 |

---

潜在局限

1. 学习成本:多接口协作流程(创建→上传→解析→轮询→对话)对新手不够友好
2. 异步等待:文件解析需主动轮询 FileParseQuery,无Webhook回调机制

3. 会话状态:需客户端妥善管理 conversation_idinterrupt_idstructured_outline,中断恢复逻辑复杂

4. 生态绑定:深度依赖百度千帆平台,迁移成本较高

---

适合人群

  • 研究人员:需要系统性文献综述、报告框架生成的学术/行业研究者
  • 知识工作者:律师、咨询师、分析师等需基于文档深度挖掘信息的职业
  • 企业用户:已有百度云服务架构,追求合规与稳定性的B端场景
  • 复杂查询场景:简单问答无法满足、需要多轮澄清与结构化输出的需求

---

常规风险

| 风险类型 | 说明 | 缓解措施 |
|---------|------|---------|
| **会话中断** | 长流程中网络波动导致状态丢失 | 客户端持久化存储关键ID |
| **文件解析失败** | 超大/格式异常文档导致任务失败 | 严格预审文件规格限制 |
| **API配额** | 深度搜索消耗较高额度 | 合理选择 `Lite`/`Standard` 版本 |
| **输出控制** | 结构化大纲需用户确认,自动化程度受限 | 设计人机协作的确认机制 |

deepresearch 内容

scripts文件夹
手动下载zip · 4.5 kB
deepresearch_conversation.pytext/plain
请选择文件