核心用法
Deep Research Conversation 是百度千帆提供的深度研究智能体对话服务,区别于普通问答,采用多步推理执行的长流程任务模式。核心交互路径分为两类:
无文件场景(Path A):直接调用 DeepresearchConversation API,自动创建会话流式返回研究结果。
带文件场景(Path B):需先创建会话 → 上传文件(本地/URL)→ 提交解析任务 → 轮询解析状态 → 最终发起研究对话。支持 10 类格式:文本(doc/pdf/ppt/txt,最大 100MB)、表格(xlsx/xls,单 Sheet)、图片(png/jpg 等,≤10MB)、音频(wav/pcm,≤10MB)。
多轮对话机制:首次调用可选 conversation_id,后续必须携带;若返回 interrupt_id(需求澄清/大纲确认),下次调用必须传入;若返回 structured_outline,需展示给用户确认修改后再提交。
显著优点
1. 双版本策略:Lite 版(10 分钟内快速响应)与 Standard 版(深度研究,质量优先)灵活切换
2. 结构化输出:自动生成符合 JSON Schema 的研究报告大纲,支持层级嵌套(title/locale/description/sub_chapters)
3. 文件生态完整:从上传到解析的全链路 API 闭环,无需外部 OCR 或文档处理工具
4. SSE 流式体验:增量返回研究过程,降低长等待焦虑
潜在局限
- 单 Sheet 限制:Excel 仅支持单工作表,复杂多表分析需预处理
- 轮询开销:文件解析状态需客户端主动轮询,无 WebSocket 推送机制
- 中断依赖:interrupt_id 与 structured_outline 的传递规则较复杂,易因遗漏导致会话断裂
- 生态锁定:深度依赖百度千帆 API 体系,迁移成本较高
适合人群
学术研究者、行业分析师、咨询顾问、内容创作者等需要系统性深度调研并输出结构化报告的专业用户;企业内部知识库构建与竞品分析团队。
常规风险
- 数据隐私:文件上传至百度云服务,敏感文档需评估合规性
- API 密钥管理:依赖 BAIDU_API_KEY 环境变量,多租户场景需严格隔离
- 解析失败兜底:大文件/复杂格式解析可能超时,需设计重试与降级策略
- 版本漂移:Lite/Standard 的输出深度差异显著,切换时需用户预期管理