核心用法
Self-Evolving Skill 是一套元认知自学习系统,核心机制围绕预测编码理论构建:系统持续比较「预测输出」与「实际结果」的差异(残差),当残差能量超过自适应阈值时触发反思学习。用户可通过 CLI、MCP 服务器或 TypeScript SDK 三种方式交互,创建 Skill、执行并记录反馈、分析嵌入向量、查看系统统计等。
关键操作流程:
1. 创建 Skill:skill_create 定义初始能力
2. 执行迭代:skill_execute 传入上下文与成功/价值反馈
3. 残差分析:skill_analyze 对嵌入向量进行 SVD 金字塔分解,输出残差比率、建议抽象层级(POLICY/SUB_SKILL/PREDICATE)及新颖性评分
4. 自动跃迁:根据覆盖率(>80%调整策略权重、40-80%生成子 Skill、<40%归纳新谓词)实现三层演化
显著优点
- 量化认知缺口:ResidualPyramid 通过 SVD/PCA 将高维嵌入分解为多层残差,把「不知道自己不知道什么」转化为可计算的 residual_ratio
- 自适应触发机制:ReflectionTrigger 动态调节阈值,维持约 15% 的目标触发率,避免过度学习或学习不足
- 经验回放缓存:降低重复模式的处理开销,提升效率
- 价值门控过滤:仅当变异带来长期价值增益(>20%)时才接受,防止无效演化
- 持久化与 MCP 兼容:经验自动保存,无缝对接 OpenClaw 生态
潜在缺点与局限性
- 冷启动问题:初期缺乏足够经验样本,金字塔分解和阈值自适应可能不稳定
- SVD 计算成本:高维嵌入的实时分解在资源受限环境可能成为瓶颈
- 价值函数依赖:「长期价值」的定义和量化依赖外部反馈(
value参数),若反馈延迟或噪声大,门控可能失效 - 抽象层级硬编码:三层跃迁规则(80%/40% 阈值)是启发式设计,未必适配所有任务分布
- 无内置安全隔离:Skill 变异过程缺乏沙箱机制,存在潜在副作用风险
适合人群
- 需要持续迭代优化 AI 工作流的开发者(如客服机器人、个性化推荐系统)
- 研究元认知、预测编码、神经符号 AI 的学术/工业研究者
- 构建长期运行、自我改进 Agent 的系统架构师
- 熟悉 OpenClaw/MCP 生态、愿意投入调优成本的技术团队
常规风险
| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| 反馈回路偏差 | 价值估计错误导致 Skill 向错误方向演化 | 引入人工审核节点,定期抽样验证 |
| 存储膨胀 | 经验回放缓存无限增长 | 设置 TTL 或容量上限,定期归档 |
| MCP 配置暴露 | 服务器配置文件含敏感路径 | 限制文件权限,避免版本控制提交 |
| 阈值漂移 | 自适应机制在分布偏移场景失效 | 监控触发率指标,必要时手动重置 |
> 注意:安全认证报告标注为「系统自动生成占位,未执行安全扫描」,生产部署前建议补充完整审计。