Telegram Voice Group

🔊 AI语音一键直达Telegram群组

通信与社交榜 #3

基于微软Edge-TTS向Telegram群组/话题发送高质量中文语音消息,支持上下文隔离的多话题管理

收藏
7.4k
安装
3.1k
版本
0.1.1
CLS 安全性认证2026-05-16
点击查看完整报告 >

使用说明

核心用法

本技能实现向Telegram群组及特定话题发送语音消息的全流程自动化。用户通过自然语言指令(如"向 agent:main:telegram:group:xxx:topic:yyy 发送语音: 内容")或程序化调用触发,系统自动完成TTS合成、格式转换和消息投递。支持三种调用方式:直接对话、sessions_spawn调用、原生JS函数调用。

显著优点

1. 高质量语音合成:采用Microsoft Edge-TTS引擎,内置zh-CN-XiaoxiaoNeural等优质中文音色,支持语速调节(rate参数)
2. 原生Telegram语音气泡:通过FFmpeg转换为OGG Opus格式(48k/单声道/48kHz/VOIP模式),以asVoice:true发送,呈现为可点击播放的语音气泡而非文件

3. 话题级上下文隔离:每个Telegram话题拥有独立会话键(agent:main:telegram:group:{groupId}:topic:{threadId}),对话历史、模型配置完全隔离,可替代Discord频道实现多话题并行管理

4. 文本智能清洗:自动移除Markdown标记、URL、特殊符号,避免朗读出格式符号

5. 临时文件自动清理:生成→转换→发送→清理全生命周期管理

潜在缺点与局限性

  • 平台依赖:仅限Telegram生态,不支持其他IM平台
  • 语音引擎单一:依赖Microsoft Edge-TTS,离线环境下无法工作,且音色选择受限于Edge-TTS内置库
  • Linux环境限制:metadata标注仅支持linux系统,跨平台部署受限
  • 权限门槛高:需Bot具备群组管理员权限(删除消息、编辑信息、发送媒体、限制/封禁成员等)
  • 话题功能前置条件:Telegram群组需先开启"话题"功能(Groups 2.0),旧版群组无法使用topic隔离特性

适合人群

  • 运营Telegram社区的管理员,需要自动化广播或互动语音
  • 将Telegram作为团队协作中枢的开发者/项目经理,希望用话题替代Discord频道
  • 需要中文TTS+即时通讯集成解决方案的自动化工作流构建者

常规风险

  • 权限滥用风险:Bot被授予过多管理员权限(如封禁成员、添加管理员),若API密钥泄露可能导致群组被恶意控制
  • 内容合规风险:自动生成的语音若包含未审核内容,可能违反Telegram社区准则或当地法规
  • 临时文件残留异常:若进程中断,/tmp下的mp3/ogg文件可能残留,长期累积占用磁盘
  • 会话键硬编码风险:示例代码中直接嵌入GROUP_ID/TOPIC_ID,生产环境应改用环境变量或配置中心
  • Edge-TTS服务依赖:微软服务可用性波动或区域限制可能影响语音生成功能

安全解读

核心功能

telegram-voice-group 是一个专为 OpenClaw 平台设计的语音消息发送工具,通过 Microsoft Edge-TTS 引擎生成自然流畅的中文语音,并自动转换为 Telegram 兼容的 OGG Opus 格式发送至指定群组话题。

显著优点

1. 话题级会话隔离:每个 Telegram 话题拥有独立的上下文会话(agent:main:telegram:group:{groupId}:topic:{threadId}),实现类似 Discord 频道的多房间组织能力,不同话题的 AI 模型和对话历史完全隔离
2. 高质量语音合成:基于微软 Edge-TTS 的神经网络语音,支持多种中文音色(如 zh-CN-XiaoxiaoNeural)和语速调节

3. 自动化格式处理:内置 FFmpeg 音频转换管道,自动处理编码参数(48k比特率、单声道、48kHz采样率),确保 Telegram 语音气泡完美兼容

4. 智能文本清洗:自动移除 Markdown 标记、URL 链接和特殊符号,避免朗读干扰

5. 临时文件安全:严格执行 try-catch-finally 资源清理,防止磁盘残留

潜在局限

  • 外部依赖强:运行环境必须预装 edge-tts(Python 包)和 ffmpeg,对部署环境有特定要求
  • 命令执行风险:使用 child_process.exec 调用外部程序,虽已做输入清洗,但仍存在理论上的 shell 注入边界情况
  • T3 来源可信度:维护者为个人开发者,缺乏组织级背书
  • 平台锁定:深度绑定 OpenClaw 框架和 Telegram Bot API,迁移成本较高

适合人群

  • 运营 Telegram 社区的管理员,需要 AI 助手定时播报或互动
  • 希望用话题功能替代 Discord 频道结构的社区组织者
  • 对语音交互体验有要求的中文用户群体
  • 已有 OpenClaw 基础设施的技术团队

常规风险

  • 语音内容需人工审核,避免 AI 生成不当言论在公开群组传播
  • 机器人权限配置不当可能导致消息发送失败或权限冲突
  • 依赖版本漂移可能影响语音生成质量(建议锁定 edge-tts 和 ffmpeg 版本)

Telegram Voice Group 内容

手动下载zip · 12.9 kB
DEPENDENCIES.mdtext/markdown
请选择文件