telegram-voice-to-voice-macos

🎙️ Telegram 本地语音交互助手

🥥62总安装量 15评分人数 14
100% 的用户推荐

OpenClaw官方技能,基于macOS Speech.framework实现Telegram语音本地转录与合成,确保隐私数据不上云,专为Apple Silicon优化。

S

安全性较高,可在多数场景中优先使用

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 代码安全规范,无 eval/exec/system 等危险函数调用,通过严格模式(set -euo pipefail)保障执行安全
  • ✅ 纯本地处理架构,语音数据通过 macOS Speech.framework 本地转录,不上传云端,隐私保护优秀
  • ⚠️ 严格平台限制,仅兼容 macOS Apple Silicon,Linux/Windows/Intel Mac 运行将导致失败
  • ⚠️ 依赖外部二进制工具(yap、ffmpeg、say),需用户自行安装维护,存在环境配置门槛
  • ✅ 无静默数据收集行为,权限申请与功能完全匹配,无敏感信息硬编码

使用说明

该 Skill 专为 macOS Apple Silicon 设备打造,实现 Telegram 端到端语音交互闭环。接收到 OGG 语音消息后,系统通过 yap 调用 Speech.framework 进行本地转录,AI 生成回复后利用 say+ffmpeg 合成 OGG 语音并发送。用户可通过 /audio on/off 切换语音或文本回复模式,偏好设置持久化存储于本地 JSON 文件。

核心优势在于隐私安全性本地化处理能力。所有语音数据均在设备端通过 Apple Silicon 神经网络引擎处理,无需上传云端,特别适合敏感场景。作为 OpenClaw 官方技能,代码开源透明且通过 S 级安全认证,无 eval/exec 等危险操作。支持多语言转录(YAP_LOCALE 环境变量配置),且能自适应 macOS 系统区域设置,响应速度快无网络延迟。

平台限制是最显著的局限。该技能严格依赖 macOS Speech.framework 与 Apple Silicon 架构,在 Intel Mac 或 Linux/Windows 上无法运行。此外,依赖管理门槛较高,用户需自行安装配置 yapffmpeg 等外部工具并确保 PATH 正确,对非技术用户不够友好。语音识别准确率受限于本地模型,可能不及云端专业 ASR 服务,且对非英语语种支持有限。

适合注重隐私的 macOS 用户(如医疗、法律从业者)、Telegram 社区管理员及自动化工作流开发者。由于需要命令行环境配置,更适合具备技术基础的用户。不适用于需要跨平台部署或依赖高精度云端语音识别的场景。

使用风险主要包括依赖缺失导致的运行时失败,若 yapffmpeg 未安装或版本不兼容将直接报错。平台误判风险也需警惕,在非 Apple Silicon 设备运行会产生不可预期错误。虽然脚本启用 set -euo pipefail 严格模式,但文件路径权限问题(~/.openclaw/ 目录)或磁盘空间不足可能导致临时文件堆积。建议定期检查依赖状态并确保系统 TTS 语音包已下载。

telegram-voice-to-voice-macos 内容

文件夹图标scripts文件夹
手动下载zip · 4.1 kB
transcribe_telegram_ogg.shtext/x-shellscript
请选择文件