phone-voice

📞 安全可控的电话 AI 助手方案

🥥16总安装量 4评分人数 3
100% 的用户推荐

基于 ElevenLabs + Twilio 的电话语音集成方案,支持来电身份验证、PIN 安全、记忆注入与成本追踪,将 OpenClaw 扩展为可通话的智能助手。

A

基本安全,请在特定环境下使用

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 无恶意代码或后门特征,网络请求仅限于 ElevenLabs、Twilio、Anthropic 官方 API
  • ✅ 多层安全机制完备:来电白名单认证、语音 PIN 挑战、速率限制、成本追踪
  • ⚠️ API 密钥集中存储于 `.env` 文件,需严格管控文件权限防止泄露
  • ⚠️ 语音 PIN 建议使用强密码,当前示例使用简单词汇存在暴力破解风险
  • ⚠️ 存在真实财务成本,需合理配置 RATE_LIMIT_PER_HOUR 防止账单失控

使用说明

核心用法

Phone Voice Integration 是一套完整的电话语音接入方案,让用户能够通过普通电话拨打与 OpenClaw 智能助手进行语音交互。其核心架构为:电话 → Twilio → ElevenLabs Agent → 自建桥接服务 → Anthropic Claude → OpenClaw 工具。用户需部署 FastAPI 桥接服务器,配置 Cloudflare 隧道或 ngrok 暴露服务,并在 ElevenLabs 控制台关联 Twilio 号码即可完成部署。

显著优点

该方案相比官方基础教程具备显著优势:多层安全机制(来电白名单、语音 PIN、速率限制)、跨通话记忆持久化(自动加载 MEMORY.md/USER.md)、详细的成本追踪与分析、永久稳定的 Cloudflare 隧道替代临时 ngrok,以及完整的通话转录与摘要功能。此外支持办公时间限制、外呼能力、实时数据注入(天气、日历)等高级特性,真正实现了生产级的电话 AI 助手。

潜在缺点与局限性

部署复杂度较高,需要同时管理 Twilio、ElevenLabs、Anthropic 三个平台的 API 密钥与账户;存在真实的通话成本(约 $0.07-0.10/分钟),虽有限额控制但仍需预算规划;依赖多个外部服务稳定性,任一环节故障都会影响可用性;桥接服务需要自行维护,对非技术用户门槛较高;语音交互的延迟和识别准确率受网络与 TTS 质量影响。

适合的目标群体

主要面向需要将 AI 助手接入电话渠道的技术用户与小型团队:OpenClaw 深度用户希望扩展语音交互能力、需要 7×24 电话客服或助理的个体经营者、追求数据自主可控不愿使用全托管方案的企业、以及具备基础 DevOps 能力希望定制化语音 AI 体验的开发者。

使用风险

财务风险为首要关注点——实际通话产生可计量的三方成本,需配置速率限制防止滥用;配置安全风险包括 .env 文件中集中存储的多平台 API 密钥,需严格管控文件权限;依赖项风险涉及 Twilio、ElevenLabs、Anthropic 的服务可用性与 API 变更;隐私层面通话内容本地存储但需确保转录文件安全;技术维护风险要求用户具备服务器运维与故障排查能力。

phone-voice 内容

手动下载zip · 4.0 kB
SKILL.mdtext/markdown
请选择文件