核心概述
STP(Structured Task Planning)V2 是一款面向复杂任务异步执行的高级编排框架,通过创新的子代理架构将长耗时任务从主会话解耦,实现真正的非阻塞执行体验。
核心用法
系统采用计划书驱动的工作模式:用户提出需求后,AI 首先生成结构化任务计划书(含任务描述、技术方案、执行步骤及检验标准),经用户确认后通过 stp_orchestrator.py start 启动执行。每个步骤独立创建执行子代理(session_spawn),完成后由检验子代理(LLM)验证结果,主会话仅负责任务编排与状态监控,通过 Heartbeat 机制(每10分钟)自动追踪子代理健康状态。
关键特性
- 异步子代理架构:每个步骤运行在独立隔离会话,主会话零阻塞
- 强制检验机制:执行完成后必须通过独立 LLM 子代理检验,禁止跳过
- 状态持久化:所有执行状态保存在
~/.openclaw/workspace/tasks/task-{ID}/task_steps.md - 智能监控:Heartbeat 自动检测子代理挂起(30分钟无活动判定为卡住)
- 安全中断:支持
中断 task-{ID}命令,自动清理子代理及残留进程
显著优点
1. 彻底解决长任务阻塞:V1 版本长任务会冻结主会话,V2 通过子代理异步执行实现主会话始终可用
2. 执行可靠性提升:强制检验步骤避免"假成功",执行-检验-决策的闭环设计降低错误传播
3. 容错与可观测性:Heartbeat 监控 + 超时重试(2次机会)+ 详细状态追踪,复杂任务可管控
4. 资源隔离:每个步骤独立会话,失败不影响其他步骤,便于精准重试
潜在局限
- 架构复杂度高:需理解主会话、执行子代理、检验子代理三层交互,学习曲线陡峭
- 串行执行效率:严格串行(必须检验通过才能下一步)限制了并行优化空间
- 状态文件依赖:
task_steps.md若损坏可能导致状态混乱,缺乏数据库级事务保障 - 检验标准设计依赖用户:检验标准质量直接影响任务成功率,对提示工程能力有要求
适合人群
- 需要执行多步骤复杂任务(如数据爬取、批量处理、自动化工作流)的开发者
- 对主会话响应性有硬性要求、无法接受长时间阻塞的生产环境用户
- 愿意投入学习成本换取任务可靠性的进阶用户
常规风险
- 子代理泄漏:若中断流程未正确执行,残留子代理可能持续占用资源
- 检验误判:LLM 检验子代理可能因标准模糊产生误判,建议检验标准具体可验证
- 路径依赖:硬编码路径变量(
<STP_ROOT>等)若配置错误导致任务失败 - 超时配置敏感:默认30分钟超时可能不适合网络波动大的场景(如大文件下载)