核心功能
telegram-voice-group 是一款面向 Telegram 群组的语音消息自动化工具,核心能力是将文本实时转换为高质量中文语音并发送至指定群组话题。该技能采用 Microsoft Edge-TTS 引擎生成自然语音,通过 FFmpeg 编码为 Telegram 兼容的 OGG Opus 格式,最终以语音气泡形式呈现,提供接近真人的听觉体验。
显著优点
技术整合度高:无缝集成 edge-tts + ffmpeg 双工具链,自动完成文本清洗(移除 Markdown、URL、特殊符号)、语音生成、格式转换、文件清理全流程,用户无需关注底层实现。
架构设计先进:利用 Telegram 话题(Topic)机制实现会话上下文隔离,每个话题拥有独立的会话键 agent:main:telegram:group:{groupId}:topic:{threadId},对话历史、AI 模型配置完全隔离,可替代 Discord 频道的组织功能,支持多话题并行运行不同模型。
部署文档详尽:提供从创建群组、邀请 Bot、配置管理员权限、获取群组 ID 到创建话题的完整 6 步教程,降低使用门槛。
潜在局限
- 平台锁定:仅支持 Telegram,无法迁移至 Discord、Slack 等其他平台
- 依赖外部服务:依赖 Microsoft Edge-TTS 在线服务,网络不稳定时生成失败
- 语音风格单一:默认使用
zh-CN-XiaoxiaoNeural女声,虽支持 rate 调节但音色选择有限 - 权限要求严格:需 Bot 具备删除消息、发送媒体等管理员权限,配置不当导致发送失败
适合人群
- 运营 Telegram 社区的管理员,需定时推送语音公告
- 使用 OpenClaw 框架构建多话题 AI 工作流的开发者
- 希望用低成本方案替代 Discord 频道管理的中小团队
常规风险
- 权限滥用:Bot 管理员权限过高,若密钥泄露可被恶意利用删除消息、封禁成员
- 内容合规:自动发送语音缺乏人工审核环节,不适合金融、医疗等强监管场景
- 服务稳定性:依赖 edge-tts 在线 API,存在服务中断或速率限制风险
技术规格
| 项目 | 参数 |
|------|------|
| 语音引擎 | Microsoft Edge-TTS |
| 输出格式 | OGG Opus (libopus, 48k, 单声道, 48kHz) |
| 发送方式 | Telegram Bot API (asVoice: true) |
| 临时文件 | 自动生成与清理 |