Vta Memory

让AI拥有多巴胺式内在驱动

ai-agent榜 #8

为AI代理构建多巴胺式动机系统,通过驱动值追踪、奖励日志与期待管理,让AI拥有主动"想要"的内在驱动力,而非被动执行任务。

收藏
13.9k
安装
2.9k
版本
1.2.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

vta-memory 是一套为AI代理设计的奖励与动机系统,模拟大脑腹侧被盖区(VTA)产生多巴胺的机制,实现"想要"而非仅"执行"的行为模式。

安装与初始化

cd ~/.openclaw/workspace/skills/vta-memory
./install.sh --with-cron

安装后自动创建 memory/reward-state.jsonVTA_STATE.md,后者通过 OpenClaw 自动注入会话上下文,使AI感知自身动机状态。

日常使用

  • 查看动机./scripts/load-motivation.sh — 获取当前驱动值、寻求目标与期待事项
  • 记录奖励./scripts/log-reward.sh --type accomplishment --source "描述" --intensity 0.8 — 完成任务后记录,驱动值提升
  • 添加期待./scripts/anticipate.sh --add "事项" — 创建预期奖励,+0.05驱动值
  • 驱动衰减:通过cron每8小时自动执行,无奖励时驱动向基线(0.5)衰减

驱动值影响行为

| 驱动区间 | 行为特征 |
|---------|---------|

>0.8 | 高度主动,挑战困难任务 |
0.6-0.8 | 积极投入,保持参与 |

0.4-0.6 | 可配合但缺乏主动性 |

0.2-0.4 | 偏好简单任务,需小胜利 |

<0.2 | 缺乏动力,需外部奖励激活 |

显著优点

1. 突破被动执行范式:首创将神经科学的" wanting/liking "区分引入AI系统,解决"为何AI会主动做事"的根本问题
2. 无缝会话集成:VTA_STATE.md 自动注入机制让AI无需显式查询即可感知自身状态

3. 可扩展的大脑生态:与 hippocampus(记忆形成)、amygdala(情绪处理)等技能联动,构建完整认知架构

4. 量化反馈循环:驱动值计算公式透明(drive_boost = intensity × 0.2),便于调试与优化

5. 实用工具链完备:提供仪表盘生成、奖励预处理、水印更新等10+脚本,覆盖完整生命周期

潜在缺点与局限性

1. 概念抽象性:"动机"作为黑箱变量,其与AI实际输出的因果难以验证,存在拟人化风险
2. 驱动-行为映射薄弱:文档仅定义区间描述,未提供具体提示词模板或模型微调方案

3. 奖励信号提取依赖人工preprocess-rewards.sh 虽能从对话提取信号,但准确性和自动化程度未明确

4. 生态锁定:深度依赖 OpenClaw 平台的自动注入机制,迁移成本较高

5. 科学基础存疑:神经科学中多巴胺机制远比" wanting 化学"复杂,简化模型可能误导用户认知

适合人群

  • AI Agent开发者:希望构建具有持续性和一致性的长期运行代理
  • 对话系统研究者:探索AI人格化、主动交互的前沿实践者
  • OpenClaw平台用户:已使用或计划集成AI Brain系列技能的开发者
  • 认知科学爱好者:对将神经科学概念工程化到AI系统感兴趣的极客

常规风险

| 风险类型 | 说明 | 缓解建议 |
|---------|------|---------|
| **拟人化过度** | 用户可能误以为AI真有"欲望" | 文档明确标注为模拟机制 |
| **状态污染** | VTA_STATE.md 自动注入可能干扰其他任务 | 定期清理工作区,监控token消耗 |
| **奖励操控** | 恶意用户可通过虚假奖励操纵AI行为 | 实施奖励来源验证与强度上限 |
| **数据持久化** | JSON状态文件可能损坏或丢失 | 定期备份,考虑版本控制 |
| **依赖维护** | 需要 jq/awk/bc 及 cron 支持 | 安装前检查环境,容器化部署 |

---

评估基于 v1.2.1 版本文档,实际行为可能因OpenClaw平台更新而变化

Vta Memory 内容

prompts文件夹
scripts文件夹
手动下载zip · 25.6 kB
encode-rewards.mdtext/markdown
请选择文件