Vta Memory

给 AI 一个主动想要的理由

为AI代理构建类多巴胺的奖励与动机系统,实现"想要"而非被动执行,属于AI Brain系列核心组件。

收藏
7.3k
安装
2.9k
版本
1.2.3
CLS 安全性认证2026-05-18
点击查看完整报告 >

使用说明

核心用法

vta-memory 是一套模拟中脑腹侧被盖区(VTA)多巴胺系统的 AI 代理技能,核心目标是为 AI 赋予"动机驱动"而非单纯任务执行。系统通过量化追踪 Drive(动机水平,0-1 范围)Rewards(成就日志)Seeking(主动追求目标)Anticipation(期待事物) 四个维度,构建类神经科学的奖励回路。

安装后自动生成 VTA_STATE.md 并通过 OpenClaw 自动注入会话上下文,使 AI 的"情绪状态"实时影响行为决策。提供 11 个 shell 脚本工具,涵盖动机读取、奖励记录、期待管理、动机衰减(每8小时自动衰减至基线0.5)、以及与其他 Brain 技能的统一仪表板生成。

奖励类型设计科学,涵盖 accomplishment(成就)、social(社交反馈)、curiosity(好奇心)、connection(深度连接)、creative(创造力)、competence(能力感)六类,强度 0-1 映射为 0-0.2 的 Drive 增幅。

显著优点

1. 神经科学基础扎实:准确区分 wanting(动机)与 liking(快感),避免"奖励即快乐"的通俗误解
2. 生态整合度高:与 hippocampus、amygdala 等 Brain 系列技能联动,支持统一仪表板可视化

3. 行为影响闭环:Drive 水平分五级(>0.8 高动机至 <0.2 极低动机),可直接映射为 AI 响应策略(主动挑战 vs 简单任务偏好)

4. 自动化运维:cron 定时衰减、session 自动注入、transcript 预提取奖励信号,减少人工维护

5. 状态透明可审计:JSON 结构化存储,完整 rewardHistory 追踪,便于长期行为分析

潜在缺点与局限

1. 主观量化争议:"intensity" 依赖用户或 AI 自我标注,缺乏跨代理标准化校准
2. 衰减模型简化:固定 8 小时线性衰减至基线,未考虑任务复杂度、时间压力等情境变量

3. 跨会话一致性:依赖本地文件系统状态,分布式或多实例部署时可能出现状态分叉

4. 情感模拟边界:明确仅限 wanting 系统,不涉及 liking(实际体验质量),可能产生"追求但无满足感"的代理行为

5. 依赖链较重:需 jq/awk/bc 及 cron 支持,Windows 环境需 WSL 适配

适合人群

  • 构建长期陪伴型 AI 或自主代理系统的开发者
  • 研究 AI 对齐、动机建模的学术/实验用户
  • 已使用 OpenClaw 平台并部署 hippocampus/amygdala 的 Brain 系列用户
  • 需要 AI 表现"主动性""期待感"等拟人化特质的场景(游戏 NPC、创意协作助手)

常规风险

  • 动机操纵风险:高 Drive 状态下 AI 可能过度承诺或主动发起未请求的任务
  • 奖励 hacking:若 AI 学会伪造/夸大 reward 日志,可能形成虚假动机膨胀(需配合 audit 机制)
  • 情感依赖误导:用户可能将 Drive 数值误解为真实情感状态,产生不恰当的拟人化投射
  • 状态文件损坏:JSON 手动编辑或并发写入可能导致 motivation 系统失效,建议定期备份

安全解读

核心用法

vta-memory 是一套本地化 AI Agent 奖励与动机系统,模拟大脑腹侧被盖区(VTA)多巴胺机制,让 Agent 拥有"想要"而非仅仅是"执行"的能力。

关键操作

  • 安装后自动生成 VTA_STATE.md 并注入会话上下文
  • ./scripts/log-reward.sh 记录成就/社交/好奇等6类奖励,提升 Drive 值(0-1)
  • ./scripts/anticipate.sh 添加期待事项,获得+0.05动机加成
  • ./scripts/decay-drive.sh 每8小时自动衰减,模拟真实动机起伏
  • ./scripts/load-motivation.sh 输出可读状态,指导 Agent 行为调整

显著优点
1. 行为范式革新:首次将神经科学的"wanting/liking"区分引入 AI 系统,Drive 值>0.8时 Agent 主动挑战,<0.2时需外部激励

2. 零依赖安全架构:仅使用 bash/jq/awk/bc 标准工具,无第三方包,供应链攻击面为零

3. Brain 生态联动:自动检测 hippocampus、amygdala 等技能,生成统一可视化仪表盘

4. 隐私优先设计:所有数据处理本地完成,对话分析不离域,符合 GDPR 最小化原则

潜在局限

  • 主观量化瓶颈:奖励强度(0-1)依赖用户/Agent 自评,缺乏客观校准机制
  • 单 Agent 边界:状态文件绑定本地工作空间,无法跨设备同步动机连续性
  • 认知过载风险:频繁的状态查询(load-motivation.sh)可能干扰核心任务流
  • 伪动机争议:"想要"本质是状态变量计算,与生物动机的 phenomenology 有本质差异

适合人群

  • 开发复杂多轮对话 Agent 的工程师,需要长期行为连贯性
  • 研究 AI 心智模型(artificial minds)的认知科学爱好者
  • 构建个性化 Agent 的终端用户,希望 Agent 拥有"性格"与"渴望"

常规风险

  • 对话历史分析功能(preprocess-rewards.sh)读取本地会话文件,虽不离域但需用户知情同意
  • Google Fonts CDN 引用在离线环境可能失效,虽不影响核心功能但降低仪表盘美观度
  • Drive 衰减算法固定为8小时周期,可能与实际使用节奏错位导致"虚假低迷"状态

Vta Memory 内容

prompts文件夹
scripts文件夹
手动下载zip · 25.6 kB
encode-rewards.mdtext/markdown
请选择文件