核心功能
STP V2 是一款面向复杂任务的结构化规划与执行框架,采用异步子代理架构彻底解决了长任务阻塞主会话的核心痛点。每个执行步骤通过 session_spawn 创建独立子代理运行,主会话保持非阻塞状态,用户可同时进行其他操作。
显著优点
1. 非阻塞执行:V2 架构让每个步骤在独立子代理中运行,主会话无需等待,大幅提升交互体验
2. 严格的检验机制:强制使用检验子代理(LLM)验证执行结果,禁止主会话直接判断,确保质量可控
3. 完善的状态管理:基于 task_steps.md 的持久化状态机,涵盖"待执行→执行中→待检验→检验中→已完成"完整生命周期
4. 自动化监控:Heartbeat 机制每 10 分钟检查子代理状态,自动识别 pending/running/completed/stuck 四种状态
5. 可靠的任务中断:支持 中断 task-{ID} 指令,自动杀掉子代理并清理残留进程(通过解析 PID)
6. 智能 Cron 管理:任务启动自动创建 heartbeat job,完成或中断后自动清理,无需手动配置
潜在局限
1. 串行执行约束:步骤必须严格串行,检验通过才能执行下一步,无法并行处理独立子任务
2. 检验开销:每个步骤需启动检验子代理,增加额外 LLM 调用成本和时间
3. 状态依赖文件系统:任务状态依赖本地文件系统,分布式部署需额外适配
4. 超时判定阈值固定:30 分钟 stuck 判定、2 次重试机会为硬编码,缺乏动态调整机制
适合人群
- 需要执行多步骤复杂任务(代码生成、数据分析、批量操作)的开发者
- 对任务可追溯性、可检验性有要求的团队协作场景
- 希望"提交任务后离开"、异步获取结果的高效工作模式用户
常规风险
- 子代理异常退出可能导致状态不一致,依赖 heartbeat 兜底
- 残留进程清理依赖
sessions_history解析,极端情况下可能失败 - 检验子代理的判断标准若设计不当,可能误判有效结果
- 大量并发任务可能产生过多 cron job 和子代理,需关注资源上限