使用说明

核心用法

Deep Research Conversation 是百度千帆平台提供的深度研究型对话能力，区别于普通问答，采用多轮流式交互 + 任务式执行架构。核心流程为：创建会话 →（可选）上传文件 → 提交解析任务 → 轮询解析状态 → 启动深度对话 → 迭代确认大纲 → 生成研究报告。

支持两种启动模式：

纯对话模式：直接调用 DeepresearchConversation，系统自动生成会话
文件增强模式：先通过 ConversationCreate 创建会话，经 FileUpload → FileParseSumbit → FileParseQuery 完成文件解析后，再启动对话

关键交互机制：

SSE 流式返回，支持实时获取研究进度
必须处理「需求澄清」和「大纲确认」两种中断场景，携带 interrupt_id 和 structured_outline 续会话
提供 Lite（10分钟内快速生成）和 Standard（质量优先）两种版本策略

显著优点

企业级文件支持：覆盖文本（PDF/Word/PPT/TXT，最大100MB）、表格（Excel，15万字符/行）、图片（10MB）、音频（WAV/PCM）全类型，单会话最多10个文件
结构化产出：强制输出 JSON 格式大纲，支持用户修改确认后严格按大纲生成报告，确保内容可控
上下文连续性：通过 conversation_id + interrupt_id + structured_outline 三元组维持长会话状态，适合数小时甚至数天的深度研究任务
生态整合：原生对接百度千帆/文心生态，Authorization 统一认证，降低企业接入成本

潜在局限与风险

流程复杂度高：涉及 4-5 个 API 的编排调用，文件场景需轮询解析状态（FileParseQuery），开发成本显著高于普通 Chat API
状态管理严苛：第二轮起必须携带前序 structured_outline，遗漏即报错中断，对异常处理要求高
实时性限制：Standard 模式下生成时间较长，未明确超时上限；轮询间隔需自行控制（文档建议「每隔几秒」）
文件解析黑盒：FileParseQuery 仅返回成功/失败状态，无进度百分比或详细错误信息，调试困难
供应商锁定：深度依赖百度千帆生态，迁移成本高

适合人群

企业知识管理/行业研究团队：需基于内部文档生成深度分析报告
咨询与投研机构：进行多源信息整合与结构化输出
学术研究人员：长周期课题的阶段性成果整理
不适合：追求即时响应的简单问答场景、无技术团队维护的个体用户

常规风险

| 风险类别 | 具体表现 | 缓解建议 |

|---------|---------|---------|

| 会话中断 | 网络波动导致 SSE 连接断开，需用 `interrupt_id` 恢复 | 客户端实现断点续传逻辑，持久化存储关键字段 |

| 文件解析失败 | 格式/编码/大小超限，仅返回失败无明细 | 前置校验文件规范，设置解析超时熔断 |

| 大纲漂移 | 用户修改后 Agent 未严格遵循 `structured_outline` | 生成后对比校验关键章节标题一致性 |

| 密钥泄露 | `BAIDU_API_KEY` 硬编码或日志泄露 | 采用环境变量注入，屏蔽敏感头日志 |

| 成本失控 | Standard 模式长耗时任务堆积 | 设置并发上限，提供 Lite 模式降级选项 |

安全解读

核心用法

deepresearch-conversation 是百度千帆平台提供的深度研究型对话技能，区别于普通问答，采用多轮流式交互模式。用户需与 Agent 反复确认研究方向、修正大纲，直至获得满意结果。

典型工作流程：
1. 纯对话场景：直接调用 DeepresearchConversation 接口，系统自动生成会话
2. 带文件分析：先 ConversationCreate 创建会话 → FileUpload 上传文件 → FileParseSubmit 提交解析任务 → 轮询 FileParseQuery 确认完成 → 启动深度对话
3. 续接对话：携带前轮的 conversation_id、interrupt_id 及 structured_outline 继续交互

关键特性：

支持 10 种格式文件上传（PDF/Word/PPT/Excel/图片/音频等），单文件最大 100MB
流式 SSE 返回，实时感知 Agent 思考过程
结构化大纲（structured_outline）驱动报告生成，用户可干预章节设计
双版本策略：Lite（10 分钟快速版）与 Standard（深度质量版）

显著优点

T1 级可信来源：百度官方维护，API 端点 HTTPS 加密，无第三方数据滥用风险
企业级文件处理：支持大体积文档（PDF 3000 页/100MB）、复杂表格、多模态输入
深度可控交互：通过大纲确认环节，用户能精准把控最终报告结构，避免"黑箱"输出
上下文完整保留：多轮对话状态通过 ID 体系无缝衔接，适合长周期研究任务

潜在缺点与局限性

外部强依赖：功能完全绑定百度千帆服务，API 变更或限流将直接影响可用性
隐私披露要求：用户查询内容、上传文件均需传输至百度服务器，敏感数据需谨慎评估
交互门槛较高：相比单轮问答，需要用户理解"澄清→确认→续接"的交互范式，学习成本存在
文件解析耗时：大文档需轮询等待解析完成，无法即时启动对话
成本不透明：深度研究模式消耗 Token 量较大，官方未公开详细计费策略

适合人群

研究人员/分析师：需要基于大量文献生成结构化研究报告
企业咨询顾问：快速梳理行业资料、生成汇报框架
内容创作者：深度选题调研、长文大纲规划
开发者集成：需将深度研究能力嵌入自有 Agent 工作流的技术团队

常规风险

数据出境考量：文件与查询上传至百度云服务，涉及合规性审查场景需额外评估
会话状态丢失：若未妥善保存 interrupt_id 与 structured_outline，续接对话可能失败
版本策略误用：Lite 模式牺牲深度换速度，关键研究场景需显式选择 Standard 模式
API 密钥管理：依赖 BAIDU_API_KEY 环境变量，多租户环境需防止密钥泄露

baidu-qianfan deep-research multi-turn-conversation file-processing sse-streaming structured-output report-generation enterprise-ai

deepresearch 内容

scripts文件夹

手动下载zip · 4.5 kB

deepresearch_conversation.pytext/plain

请选择文件