核心定位
Agent Step Sequencer 是一款专为复杂多步骤任务设计的智能调度框架,通过将用户请求分解为可执行的步骤序列,实现跨会话的工作流持久化与自动恢复。
核心用法
当检测到用户请求涉及3个以上动作、存在步骤依赖关系或高范围/风险操作时,智能体(Agent)会:
1. 生成结构化的步骤计划(含标题、指令和可选的输出文件要求)
2. 持久化保存至 state.json
3. 立即触发检查脚本启动执行
4. 通过心跳机制(如每5分钟)保持任务同步,即使网关重置也能从断点恢复
步骤执行采用 Runner 模式,支持可配置的步骤间隔延迟(0或2分钟),内置自动重试机制:失败后会重置状态并附带故障诊断提示重新执行,最多重试3次后转入阻塞列表。
显著优点
- 断点续传能力:state.json 持久化设计确保网关中断后可无缝恢复
- 故障自愈:自动重试+备选方案策略,减少人工介入
- 安全管控:STEP_AGENT_CMD 严格限制为可信代理二进制文件,禁止 shell 解释器注入
- 透明可控:每个步骤的执行状态和输出文件都有明确校验
潜在局限
- 环境依赖:需要预配置 Python 3 和 STEP_AGENT_CMD 环境变量
- 单点执行:当前设计为单 Runner 模式,未原生支持并行步骤
- 心跳耦合:长期任务依赖外部心跳调度,若心跳服务中断需手动触发检查脚本
- 重试上限固定:max_retries=3 为硬编码或环境变量配置,动态调整能力有限
适合人群
- 需要执行跨会话长周期任务的自动化开发者
- 涉及多 API 调用、文件生成链路的复杂工作流场景(如研究报告生成、数据迁移)
- 对任务可观测性和故障恢复有高要求的企业级用户
常规风险
- 状态文件损坏:state.json 若被手动修改可能导致调度异常
- 代理命令注入:虽 Runner 会拒绝 shell 解释器,但仍需确保 STEP_AGENT_CMD 指向可信路径
- 资源泄漏:步骤失败未清理的临时文件可能累积,需配合 artifacts 字段跟踪
- 无限阻塞:网络/API 持续不可用且备选方案耗尽时,步骤会转入 blockers 需人工清理