discord-voice-memo-upgrade - 语音备忘录TTS自动修复方案

使用说明

Discord Voice Memo Upgrades 是针对 Clawdbot（亦称 Moltbot）的专用核心补丁，旨在解决语音备忘录无法触发 TTS（文本转语音）自动回复的技术故障。该 Skill 并非传统意义上的插件扩展，而是一套包含详细文档和补丁文件的修复方案，通过精准修改核心模块的流式传输逻辑，确保语音消息能够正常触发语音合成响应。

核心用法方面，用户需要将补丁文件手动部署至 Clawdbot 安装目录，替换 dispatch-from-config.js 和 tts.js 两个核心文件。补丁通过检测入站消息是否包含音频附件、TTS 自动模式配置状态以及 API 密钥有效性，智能判断是否临时禁用块流式传输（block streaming）。当检测到语音消息且满足 TTS 触发条件时，系统会确保最终完整的文本 payload 能够送达 TTS 合成管道，而非被流式优化机制截断。

显著优点包括：精准定位并修复了块流式传输与 TTS 管道的兼容性问题；提供了详尽的调试日志，便于开发者追踪 [TTS-DEBUG]、[TTS-APPLY] 和 [TTS-SPEECH] 等关键节点的执行状态；补丁逻辑非侵入式，仅在必要时禁用流式传输，不影响常规文本消息的流式响应体验；同时提供了完整的备份和回滚脚本，降低了操作风险。

潜在缺点与局限性不容忽视：首先，该方案需要直接修改 Clawdbot 的编译后核心文件（dist 目录），属于"硬补丁"，在官方更新后需要手动重新应用，维护成本较高。其次，补丁内置了大量 console.log 调试语句，虽然便于排查问题，但在生产环境中会产生冗余日志，需要手动清理。此外，作为社区个人开发者（T3 来源）提供的非官方补丁，缺乏长期维护承诺和自动化更新机制。

适合的目标群体主要包括：正在使用 Clawdbot 搭建 Discord 机器人且依赖语音交互功能的开发者；需要实现"语音入、语音出"全双工对话场景的智能助手项目；以及具备一定 Node.js 和命令行操作能力，能够承担手动补丁维护工作的技术团队。

使用风险方面，除常规的 API 密钥配置错误风险外，还需关注：补丁修改核心文件可能导致未来版本更新时的合并冲突；禁用块流式传输在极端高并发场景下可能对内存占用产生轻微影响；调试日志若未清理可能泄露消息内容的片段信息（尽管已实现 80 字符截断）；以及依赖特定 TTS 提供商（OpenAI、ElevenLabs 或 Edge）的 API 稳定性。

content-media development-engineering backend automation discord voice

discord-voice-memo-upgrade 内容

patch文件夹

手动下载zip · 23.7 kB

dispatch-from-config.jstext/javascript

请选择文件