核心用法
Deep Research Conversation 是百度千帆平台提供的长流程多轮对话代理,区别于即时问答,它通过「需求澄清→大纲确认→深度生成」的渐进式交互,完成复杂议题的系统性研究。
典型工作流:
1. 纯对话模式:首次讨论直接调用 DeepresearchConversation,自动创建会话
2. 文件驱动模式:先 ConversationCreate 创建会话 → FileUpload 上传文件(支持 PDF/Word/Excel/PPT/图片/音频,最多10个)→ FileParseSubmit 提交解析任务 → 轮询 FileParseQuery 确认解析成功 → 启动深度对话
3. 断点续谈:携带前轮的 interrupt_id + conversation_id + structured_outline 继续交互
4. 大纲确认:Agent 生成结构化大纲后,用户可修改确认,后续严格按此框架生成报告
关键技术特性:
- SSE 流式返回,支持实时进度感知
- 双版本策略:
Lite(10分钟内快速生成) vsStandard(深度优先,质量优先) - 结构化大纲递归嵌套,支持多级章节体系
显著优点
| 维度 | 亮点 |
|------|------|
| **交互深度** | 非一次性输出,通过多轮澄清确保研究方向符合用户预期 |
| **文件兼容** | 覆盖办公全格式,PDF 支持 3000 页/100MB,Excel 支持 15 万字符/行 |
| **工程化设计** | 会话状态机完整(创建→上传→解析→对话→续谈),支持断点恢复 |
| **企业级输出** | 结构化大纲可直接转为正式报告框架,减少后期排版成本 |
潜在局限
1. 时效门槛:Standard 版本耗时较长,不适合秒级响应场景
2. 轮询负担:文件解析状态需客户端主动轮询(FileParseQuery),无推送机制
3. 状态耦合:续谈时必须携带完整 structured_outline,会话状态较重
4. 百度生态绑定:依赖千帆平台账号与 BAIDU_API_KEY,迁移成本高
适合人群
- 行业研究员:需要基于大量文档生成系统性分析报告
- 咨询顾问:通过多轮交互校准客户需求,输出结构化交付物
- 学术用户:处理论文、数据集,生成文献综述或研究框架
- 企业知识管理:将内部文档转化为可交互的研究知识库
常规风险
| 风险类型 | 说明 | 缓释建议 |
|----------|------|---------|
| 数据出境 | 文件上传至百度云服务 | 敏感文件脱敏或选用私有部署 |
| 解析失败 | 超大文件或复杂版式可能截断/失败 | 提前拆分文档,控制单文件页数 |
| 会话丢失 | `interrupt_id` 或 `conversation_id` 未持久化导致断链 | 关键节点本地备份状态参数 |
| 大纲锁定 | 确认后的 `structured_outline` 严格约束后续生成,灵活性下降 | 确认前充分迭代修改 |