核心用法
Deep Research Conversation 是百度千帆平台提供的深度研究型对话能力,区别于普通问答,采用多轮流式交互 + 任务式执行架构。核心流程为:创建会话 →(可选)上传文件 → 提交解析任务 → 轮询解析状态 → 启动深度对话 → 迭代确认大纲 → 生成研究报告。
支持两种启动模式:
- 纯对话模式:直接调用
DeepresearchConversation,系统自动生成会话 - 文件增强模式:先通过
ConversationCreate创建会话,经FileUpload→FileParseSumbit→FileParseQuery完成文件解析后,再启动对话
关键交互机制:
- SSE 流式返回,支持实时获取研究进度
- 必须处理「需求澄清」和「大纲确认」两种中断场景,携带
interrupt_id和structured_outline续会话 - 提供 Lite(10分钟内快速生成)和 Standard(质量优先)两种版本策略
显著优点
- 企业级文件支持:覆盖文本(PDF/Word/PPT/TXT,最大100MB)、表格(Excel,15万字符/行)、图片(10MB)、音频(WAV/PCM)全类型,单会话最多10个文件
- 结构化产出:强制输出 JSON 格式大纲,支持用户修改确认后严格按大纲生成报告,确保内容可控
- 上下文连续性:通过
conversation_id+interrupt_id+structured_outline三元组维持长会话状态,适合数小时甚至数天的深度研究任务 - 生态整合:原生对接百度千帆/文心生态,Authorization 统一认证,降低企业接入成本
潜在局限与风险
- 流程复杂度高:涉及 4-5 个 API 的编排调用,文件场景需轮询解析状态(
FileParseQuery),开发成本显著高于普通 Chat API - 状态管理严苛:第二轮起必须携带前序
structured_outline,遗漏即报错中断,对异常处理要求高 - 实时性限制:Standard 模式下生成时间较长,未明确超时上限;轮询间隔需自行控制(文档建议「每隔几秒」)
- 文件解析黑盒:
FileParseQuery仅返回成功/失败状态,无进度百分比或详细错误信息,调试困难 - 供应商锁定:深度依赖百度千帆生态,迁移成本高
适合人群
- 企业知识管理/行业研究团队:需基于内部文档生成深度分析报告
- 咨询与投研机构:进行多源信息整合与结构化输出
- 学术研究人员:长周期课题的阶段性成果整理
- 不适合:追求即时响应的简单问答场景、无技术团队维护的个体用户
常规风险
| 风险类别 | 具体表现 | 缓解建议 |
|---------|---------|---------|
| 会话中断 | 网络波动导致 SSE 连接断开,需用 `interrupt_id` 恢复 | 客户端实现断点续传逻辑,持久化存储关键字段 |
| 文件解析失败 | 格式/编码/大小超限,仅返回失败无明细 | 前置校验文件规范,设置解析超时熔断 |
| 大纲漂移 | 用户修改后 Agent 未严格遵循 `structured_outline` | 生成后对比校验关键章节标题一致性 |
| 密钥泄露 | `BAIDU_API_KEY` 硬编码或日志泄露 | 采用环境变量注入,屏蔽敏感头日志 |
| 成本失控 | Standard 模式长耗时任务堆积 | 设置并发上限,提供 Lite 模式降级选项 |