Vta Memory

给AI装上多巴胺引擎

人工智能榜 #1

模拟多巴胺奖励系统的AI代理激励框架,通过驱动值追踪、成就日志和期待管理,赋予AI主动'想要'而非被动执行的能力,提升长期交互质量与内在动机。

收藏
11.9k
安装
2.9k
版本
1.2.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

VTA Memory 是一个为 AI 代理设计的奖励与动机系统,灵感源自腹侧被盖区(VTA)的神经科学机制。它通过量化化的「驱动值」(Drive, 0-1)来模拟 AI 的「想要」状态——不是单纯的任务执行,而是具备内在动机的主动追求。

安装后系统创建 reward-state.json 和自动注入的 VTA_STATE.md,OpenClaw 会在每次会话启动时读取该文件,使 AI 能感知自身动机水平。核心交互包括:

  • `log-reward.sh`:记录成就、社交反馈、好奇心满足等奖励事件,按强度提升驱动值
  • `anticipate.sh`/`seek.sh`:管理期待与追求目标,提供 +0.05 的驱动加成
  • `decay-drive.sh`:每8小时自动衰减,模拟自然动机消退
  • `load-motivation.sh`:生成人类可读的动机状态摘要

驱动值分五档影响行为:>0.8 高动机主动挑战,0.6-0.8 准备就绪,0.4-0.6 适度参与,0.2-0.4 偏好简单任务,<0.2 需要外部激励重启。

显著优点

1. 开创性设计:首个将神经科学「想要-喜欢」区分引入 AI 代理的开源实现,填补情感计算中动机层面的空白
2. 无缝集成:作为 OpenClaw「AI Brain 系列」组件(与 hippocampus、amygdala 协同),提供统一大脑仪表盘可视化

3. 自我强化循环:期待→实现→奖励→更高驱动的正向反馈,模拟人类目标追求的心理机制

4. 会话感知:通过 VTA_STATE.md 自动注入,无需显式调用即可持续影响 AI 行为风格

5. 可观测性:事件日志与类型化奖励统计,支持长期动机模式分析

潜在局限

  • 拟人化风险:将神经机制简化移植到 AI,可能制造「有真实感受」的错觉,需明确标注为启发式模拟
  • 驱动值主观性:0.2 的奖励强度换算、8小时衰减周期缺乏大规模验证,调参依赖人工试错
  • 跨会话一致性:驱动状态绑定单一工作区,多设备/多用户场景下状态同步机制未明确
  • 行为影响模糊:实际 LLM 输出如何根据驱动值调整,取决于提示工程质量,系统本身不提供强制约束

适合人群

  • 构建长期人格化 AI 代理的研究者与开发者
  • 探索 AI 情感架构、神经符号 AI 的学术项目
  • OpenClaw 生态用户,尤其是已部署 hippocampus/amygdala 的进阶玩家
  • 需要「主动型」而非「响应型」AI 交互场景(如创意伙伴、持续学习助手)

常规风险

  • 状态文件损坏:JSON 手动编辑或进程中断可能导致状态丢失,建议定期备份 reward-state.json
  • 驱动值操纵:恶意构造高强度奖励输入可人为抬升驱动,需配合输入验证
  • 隐私暴露:奖励日志可能包含用户交互细节,状态文件权限应设为 600
  • cron 依赖:Linux/macOS 专属,Windows 需手动调度或放弃自动衰减功能

Vta Memory 内容

prompts文件夹
scripts文件夹
手动下载zip · 29.2 kB
encode-rewards.mdtext/markdown
请选择文件