sam-tts

🤖 经典C64复古机器人语音合成

🥥6总安装量 2评分人数 3
100% 的用户推荐

基于经典C64 SAM引擎的复古机器人语音合成技能,支持实时TTS生成与个性化声线调节,为对话注入怀旧科技感。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无危险函数使用:代码中未检出 eval/exec/system/subprocess 等动态执行函数
  • ✅ 完全本地处理:TTS 合成无网络请求,用户数据不出境
  • ✅ 依赖版本锁定:package-lock.json 固定 sam-js@0.3.1,含 SHA512 完整性校验
  • ✅ 输入验证完善:对 pitch/speed/mouth/throat 参数进行 parseInt 转换与边界检查
  • ⚠️ 供应链风险:核心依赖 sam-js 为个人开发者维护的 T3 级来源,建议定期审计更新

使用说明

核心用法

SAM TTS 是一款将1982年经典 Commodore 64 语音合成引擎带入现代 Agent 环境的技能。用户可通过 /sam <文本>> 命令生成单次语音消息,或使用 /sam on 开启全局模式,让所有回复自动转换为标志性的机器人语音。技能支持 pitch(音高)、speed(语速)、mouth(口腔共鸣)、throat(喉音质感)四个维度的声线微调,参数范围均为 0-255,可创造出从尖锐电子音到低沉机械感的多样化音色。

技术实现上,技能通过 Node.js 调用 sam-js 库生成 22050Hz/8-bit 单声道 WAV 文件,输出路径可控。状态持久化存储于 memory/sam-mode.json,确保跨会话的偏好设置得以保留。对于需要特定音频格式的平台(如 Telegram 的 OGG/OPUS),技能提供 ffmpeg 转换示例,但强制要求用户确认后才执行安装,体现安全设计意识。

显著优点

1. 独特的复古美学价值:SAM 的机械音质感具有极高的辨识度,能为交互注入怀旧游戏氛围,区别于现代神经网络 TTS 的"过于自然"。
2. 完全离线处理:所有语音合成在本地完成,无网络传输延迟,无隐私泄露风险,适合敏感场景。

3. 精细的声线控制:四参数调节系统远超普通 TTS 的简单语速调节,可实现角色化配音效果。

4. 双模式灵活切换:单次生成与全局模式满足不同使用场景,状态持久化提升用户体验连续性。

5. 开源可审计:依赖链清晰,从1982年原始算法到现代 JavaScript 移植均有公开源码可追溯。

潜在缺点与局限性

1. 音质局限:8-bit/22kHz 的 WAV 输出在现代标准下属于低保真,缺乏现代 TTS 的自然韵律和情感表达。
2. 英语-centric:SAM 引擎基于英语音素设计,对中文等非拉丁语系支持有限,可能出现发音失真。

3. Node.js 依赖:需要预装 Node 18+ 环境,对轻量级部署场景不够友好。

4. 平台兼容性成本:原生 WAV 格式在部分即时通讯平台需额外转码,ffmpeg 依赖增加部署复杂度。

5. 无流式生成:必须等待完整音频文件生成后才能输出,长文本场景存在明显延迟。

适合的目标群体

  • 复古科技爱好者:追求8-bit美学、怀旧游戏氛围的内容创作者
  • 开发者与极客:需要为机器人/IoT 项目添加特色语音反馈的技术用户
  • 教育娱乐场景:为儿童编程教育、互动叙事增添趣味性的教育工作者
  • 隐私敏感用户:拒绝云端 TTS 服务、坚持本地处理的隐私倡导者
  • 英语内容创作者:播客、视频制作中需要特色机器人配音的媒体从业者

使用风险

1. 性能瓶颈:长文本合成可能阻塞事件循环,建议在独立进程中执行或限制单次输入长度。
2. 磁盘I/O压力:频繁生成临时 WAV 文件需注意 /tmp 目录清理,避免空间耗尽。

3. 依赖维护风险sam-js 作为个人维护项目,长期更新保障存疑,建议锁定版本。

4. 跨平台音频兼容性:不同平台对音频格式的要求可能迫使用户接受额外依赖安装,需提前评估部署环境。

sam-tts 内容

文件夹图标scripts文件夹
手动下载zip · 6.6 kB
sam-tts-wrapper.jstext/javascript
请选择文件