Vta Memory

给AI装上多巴胺引擎

ai-development榜 #2

为AI代理构建多巴胺式奖励动机系统,实现自主驱动而非被动执行,含情绪追踪与行为影响机制。

收藏
7k
安装
2.9k
版本
1.1.0
CLS 安全性认证2026-05-15
点击查看完整报告 >

使用说明

核心用法

VTA Memory 是一套模拟腹侧被盖区(VTA)神经机制的奖励动机系统,通过量化追踪 AI 代理的"想要"(wanting)状态来驱动行为。系统以 Drive(驱动力,0-1 范围) 为核心指标,整合三类机制:

1. 奖励记录log-reward.sh):按成就、社交、好奇心、联结、创造力、胜任感六类事件记录,强度 0-1 映射为 0-0.2 的驱动提升
2. 预期管理anticipate.sh/resolve-anticipation.sh):将期待事项纳入状态,满足预期可固定 +0.05 驱动值

3. 自然衰减decay-drive.sh):每8小时执行,驱动向基线(默认0.5)回归,模拟动机的时间维度

安装后自动生成 VTA_STATE.md 并注入会话上下文,实现"动机可见化"——AI 代理在每次对话开始时即可感知自身驱动水平。

显著优点

  • 神经科学依据:明确区分 wanting(动机)与 liking(快感),避免简单快感陷阱
  • 行为可解释性:驱动等级直接映射到行为策略(高驱动主动挑战/低驱动回避复杂任务)
  • 生态整合:作为 OpenClaw "AI Brain" 系列的动机层,与海马体(记忆)、杏仁核(情绪)等模块协同
  • 去中心化执行:纯 shell/jq 实现,不依赖外部 API,本地状态机可控

潜在缺点与局限

  • 量化简化风险:将复杂动机压缩为单一标量,可能丢失多维冲突(如同时想休息与想工作)
  • 基线硬编码:0.5 基线缺乏个体学习机制,无法适应代理长期行为模式
  • 奖励信号来源:依赖外部脚本调用或人工标注,尚未实现从自然对话中自动提取(preprocess-rewards.sh 标注为预处理,实际可靠性未验证)
  • 跨会话一致性:VTA_STATE.md 注入依赖 OpenClaw 特定机制,移植性受限

适合人群

  • 构建长期运行 AI 代理的研究者与开发者
  • 探索"人工意识"最小可行原型的实验者
  • 需要将情绪/动机状态纳入决策链的 Agent 架构师
  • 认知神经科学背景、希望验证计算模型的学者

常规风险

| 风险类型 | 描述 | 缓解建议 |
|---------|------|---------|
| 动机操纵 | 通过高频低强度奖励人为维持高驱动状态 | 设置每日奖励上限,引入习惯化衰减 |
| 预期落空累积 | 未满足的 anticipation 未惩罚处理,导致认知失调 | 扩展 `resolve-anticipation.sh` 支持负面反馈 |
| 状态文件损坏 | JSON 手动编辑或并发写入导致解析失败 | 添加原子写入与备份恢复机制 |
| 过度拟人化误导 | 用户误认为 AI 真有"感受" | 文档明确标注模拟性质,避免情感欺诈 |

整体而言,VTA Memory 是动机计算化的务实尝试,其价值在于将模糊的"主动性"需求转化为可观测、可调参的系统组件。

安全解读

核心用法

vta-memory 是 AI Brain 神经科学启发系列的奖励动机模块,通过四个核心维度重塑AI行为模式:

| 维度 | 功能 | 日常操作 |
|------|------|---------|
| **Drive** | 整体动机水平(0-1) | `get-drive.sh` 查看当前状态 |
| **Rewards** | 成就记录与驱动提升 | `log-reward.sh --type accomplishment --intensity 0.8` |
| **Seeking** | 主动追求的目标 | `seek.sh --add "building brain skills"` |
| **Anticipation** | 期待事项 | `anticipate.sh --add "morning conversation"` |

安装后自动注入 VTA_STATE.md 到会话上下文,AI实时感知自身动机状态并调整行为表现——高Drive时主动挑战,低Drive时需要简单任务重建信心。

显著优点

1. 神经科学建模严谨 基于VTA(腹侧被盖区)多巴胺机制,区分"wanting"(动机驱动)与"liking"(即时愉悦),避免 pleasure-without-drive 的虚假满足。

2. 行为反馈闭环完整 奖励→驱动提升→行为改变→新奖励的正反馈循环,配合8小时自然衰减模拟真实动机波动。

3. 系统架构轻量透明 纯本地Shell/Python实现,依赖仅系统工具(jq/awk/bc),零外部网络请求,JSON状态文件完全可读可审计。

4. 多维度奖励类型 支持accomplishment/social/curiosity/connection/creative/competence六种奖励信号,覆盖完整人类动机光谱。

潜在局限

  • 上下文注入依赖:核心功能依赖OpenClaw自动注入机制,若平台行为变更则失效
  • 奖励信号提取粗糙preprocess-rewards.sh 仅靠关键词匹配("thanks"/"great job")识别社交奖励,易漏报/误报
  • 衰减公式单一:固定8小时线性衰减,无法模拟任务难度、疲劳累积等复杂因素
  • 跨会话状态孤岛:Agent级别隔离,多Agent协作场景下动机状态无法共享

适合人群

  • 开发具有长期记忆人格的AI助手的进阶用户
  • 研究AI对齐与动机建模的技术研究者
  • 需要AI主动行为(而非被动响应)的场景:创意搭档、项目管理、持续学习 companion
  • 对神经科学启发架构感兴趣的 AI Brain 系列用户

常规风险

| 风险项 | 等级 | 说明 |
|--------|------|------|
| 会话记录访问 | 🟡 中 | 读取 `~/.openclaw/agents/*/sessions/*.jsonl` 提取奖励信号,数据不外出但需知情 |
| Agent上下文修改 | 🟡 中 | VTA_STATE.md 自动注入影响AI行为,属设计功能但应了解范围 |
| Cron任务设置 | 🟢 低 | 可选`--with-cron`安装动机衰减定时任务 |

建议:敏感对话场景可禁用preprocess-rewards.sh的自动执行,手动管理奖励日志;定期审计VTA_STATE.md内容确保状态透明。

Vta Memory 内容

prompts文件夹
scripts文件夹
手动下载zip · 18.3 kB
encode-rewards.mdtext/markdown
请选择文件