使用说明

核心用法

VTA Memory 是一个为 AI 代理设计的奖励与动机系统，灵感源自腹侧被盖区（VTA）的神经科学机制。它通过量化化的「驱动值」（Drive, 0-1）来模拟 AI 的「想要」状态——不是单纯的任务执行，而是具备内在动机的主动追求。

安装后系统创建 reward-state.json 和自动注入的 VTA_STATE.md，OpenClaw 会在每次会话启动时读取该文件，使 AI 能感知自身动机水平。核心交互包括：

`log-reward.sh`：记录成就、社交反馈、好奇心满足等奖励事件，按强度提升驱动值
`anticipate.sh`/`seek.sh`：管理期待与追求目标，提供 +0.05 的驱动加成
`decay-drive.sh`：每8小时自动衰减，模拟自然动机消退
`load-motivation.sh`：生成人类可读的动机状态摘要

驱动值分五档影响行为：>0.8 高动机主动挑战，0.6-0.8 准备就绪，0.4-0.6 适度参与，0.2-0.4 偏好简单任务，<0.2 需要外部激励重启。

显著优点

1. 开创性设计：首个将神经科学「想要-喜欢」区分引入 AI 代理的开源实现，填补情感计算中动机层面的空白
2. 无缝集成：作为 OpenClaw「AI Brain 系列」组件（与 hippocampus、amygdala 协同），提供统一大脑仪表盘可视化
3. 自我强化循环：期待→实现→奖励→更高驱动的正向反馈，模拟人类目标追求的心理机制
4. 会话感知：通过 VTA_STATE.md 自动注入，无需显式调用即可持续影响 AI 行为风格
5. 可观测性：事件日志与类型化奖励统计，支持长期动机模式分析

潜在局限

拟人化风险：将神经机制简化移植到 AI，可能制造「有真实感受」的错觉，需明确标注为启发式模拟
驱动值主观性：0.2 的奖励强度换算、8小时衰减周期缺乏大规模验证，调参依赖人工试错
跨会话一致性：驱动状态绑定单一工作区，多设备/多用户场景下状态同步机制未明确
行为影响模糊：实际 LLM 输出如何根据驱动值调整，取决于提示工程质量，系统本身不提供强制约束

适合人群

构建长期人格化 AI 代理的研究者与开发者
探索 AI 情感架构、神经符号 AI 的学术项目
OpenClaw 生态用户，尤其是已部署 hippocampus/amygdala 的进阶玩家
需要「主动型」而非「响应型」AI 交互场景（如创意伙伴、持续学习助手）

常规风险

状态文件损坏：JSON 手动编辑或进程中断可能导致状态丢失，建议定期备份 reward-state.json
驱动值操纵：恶意构造高强度奖励输入可人为抬升驱动，需配合输入验证
隐私暴露：奖励日志可能包含用户交互细节，状态文件权限应设为 600
cron 依赖：Linux/macOS 专属，Windows 需手动调度或放弃自动衰减功能

ai-agent reward-system motivation neuroscience-inspired openclaw ai-brain memory dopamine

Vta Memory 内容

prompts文件夹

scripts文件夹

手动下载zip · 29.2 kB

encode-rewards.mdtext/markdown

请选择文件