核心用法
STP V2 是一套面向复杂任务的异步执行框架,用户通过自然语言描述需求后,系统自动生成结构化计划书,经用户确认后逐步执行。核心流程包括:
1. 计划生成:AI 根据需求动态拆解为带检验标准的步骤清单
2. 子代理执行:每个步骤通过 session_spawn 创建独立子代理运行,主会话保持响应
3. LLM 检验:执行完成后必须由检验子代理(独立 LLM 会话)验证结果,禁止主会话直接判断
4. 心跳监控:每 10 分钟自动检查子代理状态,识别挂死/超时情况
5. 任务中断:用户可随时终止任务,系统自动清理子代理及残留进程
所有状态持久化存储于 ~/.openclay/workspace/tasks/task-{ID}/ 目录,支持断点恢复与审计追踪。
显著优点
- 非阻塞架构:V2 彻底解决了 V1 长任务卡死主会话的问题,用户可在任务执行期间继续交互
- 严格验证机制:强制检验子代理复核结果,避免执行幻觉导致的错误传播
- 自动化运维:内置 cron 心跳、超时重试、进程清理,降低人工干预成本
- 状态可视化:
task_steps.md实时追踪步骤状态、子代理 ID、超时计数
潜在局限
- 串行执行:必须等前一步检验通过才能启动下一步,无法利用并行加速
- 检验成本:每个步骤需额外创建检验子代理,增加 Token 消耗与延迟
- 调试复杂度:子代理异步运行,问题定位需跨会话追踪 announce 链
- 无并行扩展:当前架构不支持多步骤同时执行,大规模任务效率受限
适合人群
- 需要执行 30 分钟以上长耗时任务(如批量数据处理、代码仓库克隆编译)
- 对 结果正确性要求高、需要自动验证的场景(如金融数据查询、配置部署)
- 希望 后台异步运行、不阻塞当前会话的多任务用户
常规风险
- 检验标准设计不当:模糊的检验条件可能导致误通过或无限重试
- 残留进程泄漏:极端情况下子代理进程未被正确清理,需依赖心跳超时机制兜底
- 计划书质量依赖:AI 生成的步骤拆解质量直接影响执行成功率,复杂任务建议人工审核计划
- Token 消耗累积:长链条任务(多步骤 × 执行+检验双会话)成本显著高于单次对话模式