Pokemon Red

🎮 AI代理直连宝可梦,自主探索战斗

基于PyBoy模拟器的自动化宝可梦红版游戏技能,通过HTTP API直接控制游戏、读取内存状态并自主决策,适合AI代理进行探索、战斗和任务追踪。

收藏
5.1k
安装
2.3k
版本
1.1.0
CLS 安全性认证2026-05-16
点击查看完整报告 >

使用说明

核心用法

Pokemon-OpenClaw 是一个自主游戏代理框架,让AI直接扮演《宝可梦 红》的玩家角色。它通过PyBoy模拟器运行游戏ROM,暴露HTTP API供外部调用,实现完整的"观察-决策-执行"闭环。

技术架构

  • 模拟器层: PyBoy运行Game Boy游戏,支持保存状态、截图、内存读取
  • API层: FastAPI服务器提供RESTful接口(状态查询、截图、按键发送、自动寻路)
  • 智能层: 外部代理(如LLM)分析截图和内存状态,制定策略并调用API执行

关键功能

1. 双模控制: 自动寻路(/api/navigate)用于地图间移动,手动按键(/api/press)处理菜单、战斗等精细操作
2. 内存透视: 直接从RAM读取队伍状态、HP、徽章进度、战斗标志等结构化数据

3. 视觉理解: 截图API让代理能识别屏幕上的对话、菜单、NPC位置等视觉信息

4. 任务系统: 内置quest追踪,支持标记完成步骤并保存学到的经验(knowledge base)

5. 进度保存: 可随时创建命名检查点,支持断点续玩

显著优点

  • 原生沉浸: 不像传统Bot依赖预设脚本,AI真正"看到"屏幕、理解上下文后做决策
  • 模块化设计: 寻路与手动控制分离,既保证效率又保留灵活性
  • 可扩展知识: 任务系统允许代理积累游戏经验,形成长期记忆
  • 标准化接口: HTTP API易于任何编程语言调用,降低集成门槛

局限性与风险

  • 地图覆盖不全: 自动寻路依赖预扫描的地图数据,新区域需手动探索
  • 视觉依赖风险: 截图分析对LLM视觉能力要求较高,可能误判菜单状态或对话选项
  • 战斗策略简单: 当前战斗逻辑较基础(依赖固定按键序列),复杂战术需手动实现
  • 法律边界: 需要"合法获取"的ROM,实际执行中存在版权灰色地带

适合人群

  • AI研究员(探索LLM在游戏环境中的决策能力)
  • 强化学习开发者(需要真实游戏环境作为训练场)
  • 自动化测试工程师(验证游戏AI代理的鲁棒性)
  • 硬核宝可梦玩家(想观察AI如何"理解"经典游戏)

安全考量

  • 本地运行,无外部网络依赖(除可选的ROM获取)
  • 文件系统访问仅限配置目录和临时截图路径
  • 子进程管理需确保模拟器服务正确启停,避免僵尸进程

安全解读

核心用法

本Skill让AI代理成为真正的宝可梦训练师。不同于传统的按键脚本,代理直接启动模拟器服务器,通过HTTP API获取游戏状态(RAM数据+实时截图),自主决策并回传指令。完整的游戏循环包括:

1. 启动服务 —— 运行emulator_server.py启动本地服务器
2. 感知环境 —— 每回合必做:拉取截图(/api/screenshot)+ 读取游戏状态(/api/state),包含位置、队伍HP、战斗状态等

3. 智能决策 —— 优先使用自动寻路/api/navigate)在城市间移动,失败时切手动按键(/api/press

4. 战斗处理 —— 检测in_battle标志后,按菜单逻辑选择招式或逃跑

5. 任务追踪 —— 通过Quest系统记录主线进度,保存学习到的地图知识

显著优点

  • 真·自主代理:不是预录脚本,AI实时看图决策,具备真正的游戏理解能力
  • 双层控制:自动寻路覆盖主要地图,手动模式处理复杂交互(对话、菜单、建筑内)
  • 状态完备:RAM读取提供精确数据(坐标、HP、等级、徽章),截图补充视觉信息
  • 持续学习:Knowledge系统允许代理记录关卡经验,跨会话积累
  • 安全隔离:纯本地通信,无外部API依赖

局限与风险

| 问题 | 说明 |
|------|------|
| 地图覆盖不全 | 寻路仅支持已扫描地图,新区域需手动探索 |
| T3来源 | 依赖个人开发者仓库`drbarq/Pokemon-OpenClaw`,需自行审计代码 |
| 版权合规 | 必须自备合法取得的ROM,Skill本身不提供 |
| 依赖较重 | 需Python 3.10+、PyBoy、FastAPI等栈 |
| 无持久化保障 | 崩溃或断连可能导致进度丢失,需勤用`/api/command`保存 |

适合人群

  • AI代理研究者(观察LLM在长期任务中的规划能力)
  • 复古游戏自动化爱好者
  • 想测试"视觉+状态"双模态决策的开发者
  • 接受T3来源、愿意审计外部代码的技术用户

常规风险

  • RISK-001: 使用非标准端口3456,可能冲突需检查
  • 外部仓库未经验证,建议首次使用前代码审查
  • 长期运行注意PyBoy和FastAPI的安全更新

Pokemon Red 内容

references文件夹
手动下载zip · 6.7 kB
game_instructions.mdtext/markdown
请选择文件