核心用法
百度千帆 DeepResearch Conversation 是一项面向复杂研究场景的对话式 AI 能力,区别于普通问答,采用"多步推理+用户协同验证"的长流程任务模式。用户需通过多轮交互逐步澄清需求、确认大纲、迭代内容,最终获得深度研究报告。
标准工作流:
- 首次讨论:直接调用
DeepresearchConversation自动生成会话 - 带文件讨论:先
ConversationCreate创建会话 →FileUpload上传文件(支持本地/URL,最多10个)→FileParseSumbit提交解析任务 → 轮询FileParseQuery确认解析成功 → 启动深度对话 - 续接对话:携带前轮的
conversation_id+interrupt_id+structured_outline继续交互
关键交互节点:Agent 会在"需求澄清"和"大纲确认"阶段暂停,强制用户参与决策,确保研究方向准确。
显著优点
- 深度协同机制:不同于一次性生成,通过反复验证确保研究质量
- 多模态文件支持:覆盖文本(PDF/DOC/PPT/TXT)、表格(Excel)、图片、音频,单文件最大100MB
- 双版本策略:Lite 版10分钟快速输出 vs Standard 版质量优先的深度报告
- 结构化大纲控制:用户可编辑 JSON 格式大纲,Agent 严格按此生成报告
- SSE 流式响应:实时感知研究进度,提升等待体验
潜在缺点与局限性
- 流程复杂度高:带文件场景需 4-5 个 API 串联,错误处理链路长
- 强制人工介入:"需求澄清"和"大纲确认"不可跳过,自动化场景受限
- 文件解析瓶颈:超大文档(PDF 3000页/Word 2500页)自动截断,可能丢失信息
- 轮询成本:
FileParseQuery需客户端主动轮询,无 webhook 回调机制 - 会话状态敏感:遗漏
interrupt_id或structured_outline直接导致错误中断
适合人群
- 学术研究者:需系统性文献综述或课题调研
- 行业分析师:基于多源资料输出深度行研报告
- 内容创作者:需要结构化长文(白皮书、深度解读)的协作生产
- 不适合:追求即时答案、零交互成本的简单问答场景
常规风险
- API 密钥暴露风险:
BAIDU_API_KEY需注入环境变量,多用户场景需隔离管理 - 文件隐私边界:上传文件暂存百度服务器,敏感资料需脱敏处理
- 长会话稳定性:深度研究生成耗时长,网络抖动可能导致 SSE 中断需续传
- 版本策略误选:Lite 版牺牲搜索深度,关键研究可能遗漏信源