使用说明

核心用法

vta-memory 是一套为AI代理设计的奖励与动机系统，模拟大脑腹侧被盖区（VTA）产生多巴胺的机制，实现"想要"而非仅"执行"的行为模式。

安装与初始化

cd ~/.openclaw/workspace/skills/vta-memory
./install.sh --with-cron

安装后自动创建 memory/reward-state.json 和 VTA_STATE.md，后者通过 OpenClaw 自动注入会话上下文，使AI感知自身动机状态。

日常使用

查看动机：./scripts/load-motivation.sh — 获取当前驱动值、寻求目标与期待事项
记录奖励：./scripts/log-reward.sh --type accomplishment --source "描述" --intensity 0.8 — 完成任务后记录，驱动值提升
添加期待：./scripts/anticipate.sh --add "事项" — 创建预期奖励，+0.05驱动值
驱动衰减：通过cron每8小时自动执行，无奖励时驱动向基线（0.5）衰减

驱动值影响行为

| 驱动区间 | 行为特征 |

|---------|---------|

>0.8 | 高度主动，挑战困难任务 |
0.6-0.8 | 积极投入，保持参与 |
0.4-0.6 | 可配合但缺乏主动性 |
0.2-0.4 | 偏好简单任务，需小胜利 |
<0.2 | 缺乏动力，需外部奖励激活 |

显著优点

1. 突破被动执行范式：首创将神经科学的" wanting/liking "区分引入AI系统，解决"为何AI会主动做事"的根本问题
2. 无缝会话集成：VTA_STATE.md 自动注入机制让AI无需显式查询即可感知自身状态
3. 可扩展的大脑生态：与 hippocampus（记忆形成）、amygdala（情绪处理）等技能联动，构建完整认知架构
4. 量化反馈循环：驱动值计算公式透明（drive_boost = intensity × 0.2），便于调试与优化
5. 实用工具链完备：提供仪表盘生成、奖励预处理、水印更新等10+脚本，覆盖完整生命周期

潜在缺点与局限性

1. 概念抽象性："动机"作为黑箱变量，其与AI实际输出的因果难以验证，存在拟人化风险
2. 驱动-行为映射薄弱：文档仅定义区间描述，未提供具体提示词模板或模型微调方案
3. 奖励信号提取依赖人工：preprocess-rewards.sh 虽能从对话提取信号，但准确性和自动化程度未明确
4. 生态锁定：深度依赖 OpenClaw 平台的自动注入机制，迁移成本较高
5. 科学基础存疑：神经科学中多巴胺机制远比" wanting 化学"复杂，简化模型可能误导用户认知

适合人群

AI Agent开发者：希望构建具有持续性和一致性的长期运行代理
对话系统研究者：探索AI人格化、主动交互的前沿实践者
OpenClaw平台用户：已使用或计划集成AI Brain系列技能的开发者
认知科学爱好者：对将神经科学概念工程化到AI系统感兴趣的极客

常规风险

| 风险类型 | 说明 | 缓解建议 |

|---------|------|---------|

| **拟人化过度** | 用户可能误以为AI真有"欲望" | 文档明确标注为模拟机制 |

| **状态污染** | VTA_STATE.md 自动注入可能干扰其他任务 | 定期清理工作区，监控token消耗 |

| **奖励操控** | 恶意用户可通过虚假奖励操纵AI行为 | 实施奖励来源验证与强度上限 |

| **数据持久化** | JSON状态文件可能损坏或丢失 | 定期备份，考虑版本控制 |

| **依赖维护** | 需要 jq/awk/bc 及 cron 支持 | 安装前检查环境，容器化部署 |

---

评估基于 v1.2.1 版本文档，实际行为可能因OpenClaw平台更新而变化

ai-agent motivation reward-system neuroscience-inspired openclaw memory brain-simulation

Vta Memory 内容

prompts文件夹

scripts文件夹

手动下载zip · 25.6 kB

encode-rewards.mdtext/markdown

请选择文件