使用说明

核心用法

百度千帆 DeepResearch Conversation 是一项面向复杂研究场景的对话式 AI 能力，区别于普通问答，采用"多步推理+用户协同验证"的长流程任务模式。用户需通过多轮交互逐步澄清需求、确认大纲、迭代内容，最终获得深度研究报告。

标准工作流：

首次讨论：直接调用 DeepresearchConversation 自动生成会话
带文件讨论：先 ConversationCreate 创建会话 → FileUpload 上传文件（支持本地/URL，最多10个）→ FileParseSumbit 提交解析任务 → 轮询 FileParseQuery 确认解析成功 → 启动深度对话
续接对话：携带前轮的 conversation_id + interrupt_id + structured_outline 继续交互

关键交互节点：Agent 会在"需求澄清"和"大纲确认"阶段暂停，强制用户参与决策，确保研究方向准确。

显著优点

深度协同机制：不同于一次性生成，通过反复验证确保研究质量
多模态文件支持：覆盖文本（PDF/DOC/PPT/TXT）、表格（Excel）、图片、音频，单文件最大100MB
双版本策略：Lite 版10分钟快速输出 vs Standard 版质量优先的深度报告
结构化大纲控制：用户可编辑 JSON 格式大纲，Agent 严格按此生成报告
SSE 流式响应：实时感知研究进度，提升等待体验

潜在缺点与局限性

流程复杂度高：带文件场景需 4-5 个 API 串联，错误处理链路长
强制人工介入："需求澄清"和"大纲确认"不可跳过，自动化场景受限
文件解析瓶颈：超大文档（PDF 3000页/Word 2500页）自动截断，可能丢失信息
轮询成本：FileParseQuery 需客户端主动轮询，无 webhook 回调机制
会话状态敏感：遗漏 interrupt_id 或 structured_outline 直接导致错误中断

适合人群

学术研究者：需系统性文献综述或课题调研
行业分析师：基于多源资料输出深度行研报告
内容创作者：需要结构化长文（白皮书、深度解读）的协作生产
不适合：追求即时答案、零交互成本的简单问答场景

常规风险

API 密钥暴露风险：BAIDU_API_KEY 需注入环境变量，多用户场景需隔离管理
文件隐私边界：上传文件暂存百度服务器，敏感资料需脱敏处理
长会话稳定性：深度研究生成耗时长，网络抖动可能导致 SSE 中断需续传
版本策略误选：Lite 版牺牲搜索深度，关键研究可能遗漏信源

安全解读

核心用法

deepresearch-conversation 是百度千帆（Baidu Qianfan）官方 Deep Research Agent 的 API 封装 Skill，专为需要多轮深度研究对话的场景设计。与普通问答不同，它支持长流程、多步推理的交互模式，用户需反复验证和修正直至获得满意答案。

典型工作流程

纯对话场景：直接调用 DeepresearchConversation 接口，系统自动生成会话。

带文件分析场景：
1. ConversationCreate → 创建会话获取 conversation_id
2. FileUpload → 上传本地文件或 URL（支持 doc/pdf/ppt/xlsx/图片/音频等，最多10个）
3. FileParseSumbit → 提交文件解析任务
4. FileParseQuery → 轮询查询解析状态（需间隔几秒重试）
5. DeepresearchConversation → 基于解析后的文件进行深度研究对话

断点续传：若对话中断，需携带上一轮的 interrupt_id 和结构化大纲 structured_outline 继续。

关键特性

SSE 流式返回：实时获取研究进度
大纲确认机制：Agent 生成报告大纲后需用户确认或修改
版本策略：Lite（10分钟内快速生成）vs Standard（深度质量优先）
结构化输出：最终报告遵循标准 JSON 大纲格式

显著优点

官方 API 封装：直接调用百度千帆企业级服务，无需自建模型基础设施
多模态文件支持：涵盖办公文档、表格、图片、音频等常见格式
深度研究能力：非简单问答，支持多轮迭代、需求澄清、大纲确认
流式交互体验：SSE 实时推送，用户可感知研究进度
断点续传：长任务场景支持中断恢复，提升可靠性

潜在缺点与局限性

流程复杂度高：涉及 5 个 API 的协调调用，文件场景需处理轮询等待
百度生态绑定：依赖百度千帆平台，存在供应商锁定风险
文件限制严格：单文件大小、页数、字符数均有明确上限，超规自动截断
实时性约束：文件解析需轮询等待，非即时可用
成本不透明：未披露定价模型，企业用户需额外商务确认

适合人群

企业研究人员：需基于内部文档生成深度研究报告
知识工作者：法律、金融、咨询等需多源信息综合分析的场景
开发者：希望快速集成百度 Deep Research 能力至自有产品
教育/学术用户：需结构化梳理文献、生成研究报告

常规风险

API 密钥管理：依赖 BAIDU_API_KEY 环境变量，泄露可能导致账号滥用
数据隐私：用户查询内容及上传文件发送至百度服务器，需符合企业数据合规要求
服务可用性：依赖百度云服务稳定性，建议实现重试与降级机制
内容合规：生成内容受百度平台审核策略约束，敏感话题可能被拦截
结构化大纲维护：断点续传时若大纲格式错误会导致对话失败，需严格校验 JSON 结构

baidu-qianfan deep-research multi-turn-conversation file-analysis streaming-api sse collaborative-ai research-agent outline-generation

deepresearch 内容

scripts文件夹

手动下载zip · 4.4 kB

deepresearch_conversation.pytext/plain

请选择文件