使用说明

核心用法

VTA Memory 是一套模拟腹侧被盖区（VTA）神经机制的奖励动机系统，通过量化追踪 AI 代理的"想要"（wanting）状态来驱动行为。系统以 Drive（驱动力，0-1 范围） 为核心指标，整合三类机制：

1. 奖励记录（log-reward.sh）：按成就、社交、好奇心、联结、创造力、胜任感六类事件记录，强度 0-1 映射为 0-0.2 的驱动提升
2. 预期管理（anticipate.sh/resolve-anticipation.sh）：将期待事项纳入状态，满足预期可固定 +0.05 驱动值
3. 自然衰减（decay-drive.sh）：每8小时执行，驱动向基线（默认0.5）回归，模拟动机的时间维度

安装后自动生成 VTA_STATE.md 并注入会话上下文，实现"动机可见化"——AI 代理在每次对话开始时即可感知自身驱动水平。

显著优点

神经科学依据：明确区分 wanting（动机）与 liking（快感），避免简单快感陷阱
行为可解释性：驱动等级直接映射到行为策略（高驱动主动挑战/低驱动回避复杂任务）
生态整合：作为 OpenClaw "AI Brain" 系列的动机层，与海马体（记忆）、杏仁核（情绪）等模块协同
去中心化执行：纯 shell/jq 实现，不依赖外部 API，本地状态机可控

潜在缺点与局限

量化简化风险：将复杂动机压缩为单一标量，可能丢失多维冲突（如同时想休息与想工作）
基线硬编码：0.5 基线缺乏个体学习机制，无法适应代理长期行为模式
奖励信号来源：依赖外部脚本调用或人工标注，尚未实现从自然对话中自动提取（preprocess-rewards.sh 标注为预处理，实际可靠性未验证）
跨会话一致性：VTA_STATE.md 注入依赖 OpenClaw 特定机制，移植性受限

适合人群

构建长期运行 AI 代理的研究者与开发者
探索"人工意识"最小可行原型的实验者
需要将情绪/动机状态纳入决策链的 Agent 架构师
认知神经科学背景、希望验证计算模型的学者

常规风险

| 风险类型 | 描述 | 缓解建议 |

|---------|------|---------|

| 动机操纵 | 通过高频低强度奖励人为维持高驱动状态 | 设置每日奖励上限，引入习惯化衰减 |

| 预期落空累积 | 未满足的 anticipation 未惩罚处理，导致认知失调 | 扩展 `resolve-anticipation.sh` 支持负面反馈 |

| 状态文件损坏 | JSON 手动编辑或并发写入导致解析失败 | 添加原子写入与备份恢复机制 |

| 过度拟人化误导 | 用户误认为 AI 真有"感受" | 文档明确标注模拟性质，避免情感欺诈 |

整体而言，VTA Memory 是动机计算化的务实尝试，其价值在于将模糊的"主动性"需求转化为可观测、可调参的系统组件。

安全解读

核心用法

vta-memory 是 AI Brain 神经科学启发系列的奖励动机模块，通过四个核心维度重塑AI行为模式：

| 维度 | 功能 | 日常操作 |

|------|------|---------|

| **Drive** | 整体动机水平(0-1) | `get-drive.sh` 查看当前状态 |

| **Rewards** | 成就记录与驱动提升 | `log-reward.sh --type accomplishment --intensity 0.8` |

| **Seeking** | 主动追求的目标 | `seek.sh --add "building brain skills"` |

| **Anticipation** | 期待事项 | `anticipate.sh --add "morning conversation"` |

安装后自动注入 VTA_STATE.md 到会话上下文，AI实时感知自身动机状态并调整行为表现——高Drive时主动挑战，低Drive时需要简单任务重建信心。

显著优点

1. 神经科学建模严谨 基于VTA（腹侧被盖区）多巴胺机制，区分"wanting"（动机驱动）与"liking"（即时愉悦），避免 pleasure-without-drive 的虚假满足。

2. 行为反馈闭环完整 奖励→驱动提升→行为改变→新奖励的正反馈循环，配合8小时自然衰减模拟真实动机波动。

3. 系统架构轻量透明 纯本地Shell/Python实现，依赖仅系统工具（jq/awk/bc），零外部网络请求，JSON状态文件完全可读可审计。

4. 多维度奖励类型 支持accomplishment/social/curiosity/connection/creative/competence六种奖励信号，覆盖完整人类动机光谱。

潜在局限

上下文注入依赖：核心功能依赖OpenClaw自动注入机制，若平台行为变更则失效
奖励信号提取粗糙：preprocess-rewards.sh 仅靠关键词匹配（"thanks"/"great job"）识别社交奖励，易漏报/误报
衰减公式单一：固定8小时线性衰减，无法模拟任务难度、疲劳累积等复杂因素
跨会话状态孤岛：Agent级别隔离，多Agent协作场景下动机状态无法共享

适合人群

开发具有长期记忆人格的AI助手的进阶用户
研究AI对齐与动机建模的技术研究者
需要AI主动行为（而非被动响应）的场景：创意搭档、项目管理、持续学习 companion
对神经科学启发架构感兴趣的 AI Brain 系列用户

常规风险

| 风险项 | 等级 | 说明 |

|--------|------|------|

| 会话记录访问 | 🟡 中 | 读取 `~/.openclaw/agents/*/sessions/*.jsonl` 提取奖励信号，数据不外出但需知情 |

| Agent上下文修改 | 🟡 中 | VTA_STATE.md 自动注入影响AI行为，属设计功能但应了解范围 |

| Cron任务设置 | 🟢 低 | 可选`--with-cron`安装动机衰减定时任务 |

建议：敏感对话场景可禁用preprocess-rewards.sh的自动执行，手动管理奖励日志；定期审计VTA_STATE.md内容确保状态透明。

ai-brain motivation reward-system agent-architecture neuroscience-inspired state-management openclaw

Vta Memory 内容

prompts文件夹

scripts文件夹

手动下载zip · 18.3 kB

encode-rewards.mdtext/markdown

请选择文件