clawatar

🎭 AI 代理的 3D 虚拟化身引擎

🥥8总安装量 2评分人数 1
100% 的用户推荐

基于开源 Clawatar 项目的 3D VRM 虚拟形象技能,提供 162 种动画、表情控制与 TTS 唇形同步,让用户为 AI 代理赋予可视化虚拟身体。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无独立可执行代码,内容完全透明可审计
  • ✅ 无静默数据收集或远程上传行为,用户数据不离开本机
  • ✅ 无危险函数(eval/exec/system)或已知 CVE 漏洞
  • ⚠️ 实际功能依赖外部 GitHub 项目,需用户手动克隆安装,存在供应链风险
  • ⚠️ TTS 功能需用户自行配置 ElevenLabs API Key,存在密钥管理责任

使用说明

核心用法

Clawatar 是一款为 AI 代理赋予 3D 虚拟身体的可视化工具,基于 Web 技术栈构建。用户通过克隆 GitHub 仓库并执行 npm 命令即可在本地启动服务,默认在 http://localhost:3000 打开可视化界面,同时通过 ws://localhost:8765 提供 WebSocket 控制接口。该技能本身为纯文档型指南,核心功能依赖外部 Clawatar 项目实现。

使用时需用户自备 VRM 格式的 3D 模型文件,支持拖拽上传或配置文件指定路径。通过 WebSocket 发送 JSON 指令即可控制虚拟形象:play_action 触发 162 种预设动画(如挥手、思考、跳舞等),set_expression 设置五种基础表情权重,speak 指令结合 ElevenLabs TTS 实现语音与唇形同步。界面提供触屏交互、情绪快捷按钮、多场景背景和相机预设等丰富功能。

显著优点

开箱即用的可视化方案:无需从零开发 3D 渲染管线,基于成熟的三.js 和 VRM 标准快速部署虚拟形象。162 种来自 Mixamo 的专业动画覆盖日常交流、情绪表达、舞蹈表演等多种场景,大幅降低 VTuber 风格应用的开发门槛。

灵活的集成架构:WebSocket 控制协议设计简洁,任何能发送 JSON 的 AI 代理或脚本均可远程驱动 avatar。支持语音聊天闭环——麦克风输入经 AI 处理后,自动触发 TTS 并同步唇形动画,适合构建沉浸式对话体验。

高度可定制化:从模型、背景场景到语音参数均可配置,背景提供樱花庭院、夜空、咖啡馆、日落四种氛围选择,相机预设支持面部特写、全身、电影感等多种构图需求。

潜在缺点与局限性

版权与授权限制:核心动画资源来自 Adobe Mixamo,明确标注需署名且仅限非商业用途,商业项目需自行解决动画授权问题。VRM 模型完全由用户提供,技能不包含任何默认素材。

外部依赖较重:TTS 唇形同步功能强制依赖 ElevenLabs 付费 API,需用户自行申请和配置密钥;核心功能依赖 Node.js 环境和 npm 生态,对非技术用户有一定门槛。

性能与部署限制:基于浏览器 WebGL 渲染,复杂场景下性能受限于客户端硬件;默认仅支持本地访问,远程部署需自行配置网络安全措施。

适合的目标群体

  • AI 应用开发者:需要为聊天机器人、虚拟助手添加可视化形象的产品团队
  • VTuber 与内容创作者:寻求轻量级、可自定义的 3D 直播或录播解决方案的个人创作者
  • 教育演示与原型设计:需要快速搭建交互式 3D 角色演示的教学或设计场景
  • 技术爱好者:对 VRM 生态和 AI 驱动虚拟形象感兴趣,具备基础前端开发能力的用户

使用风险

供应链安全风险:实际功能依赖外部 GitHub 仓库,用户需自行执行 git clone 和 npm install,建议审查 Clawatar 项目源码及依赖包安全性。

API 密钥管理风险:ElevenLabs API Key 若硬编码在配置文件中存在泄露风险,建议使用环境变量或安全密钥管理服务。

网络暴露风险:WebSocket 服务默认监听本地端口,若配置不当暴露至公网,可能被未授权访问和控制。

模型版权风险:用户需确保自备 VRM 模型拥有合法使用权,避免商用场景下的知识产权纠纷。

clawatar 内容

手动下载zip · 1.9 kB
SKILL.mdtext/markdown
请选择文件