phone-voice

📞 安全可控的电话 AI 助手方案

基于 ElevenLabs + Twilio 的电话语音集成方案,支持来电身份验证、PIN 安全、记忆注入与成本追踪,将 OpenClaw 扩展为可通话的智能助手。

收藏
11.1k
安装
2.7k
版本
v2.0.0
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

Phone Voice Integration 是一套完整的电话语音接入方案,让用户能够通过普通电话拨打与 OpenClaw 智能助手进行语音交互。其核心架构为:电话 → Twilio → ElevenLabs Agent → 自建桥接服务 → Anthropic Claude → OpenClaw 工具。用户需部署 FastAPI 桥接服务器,配置 Cloudflare 隧道或 ngrok 暴露服务,并在 ElevenLabs 控制台关联 Twilio 号码即可完成部署。

显著优点

该方案相比官方基础教程具备显著优势:多层安全机制(来电白名单、语音 PIN、速率限制)、跨通话记忆持久化(自动加载 MEMORY.md/USER.md)、详细的成本追踪与分析、永久稳定的 Cloudflare 隧道替代临时 ngrok,以及完整的通话转录与摘要功能。此外支持办公时间限制、外呼能力、实时数据注入(天气、日历)等高级特性,真正实现了生产级的电话 AI 助手。

潜在缺点与局限性

部署复杂度较高,需要同时管理 Twilio、ElevenLabs、Anthropic 三个平台的 API 密钥与账户;存在真实的通话成本(约 $0.07-0.10/分钟),虽有限额控制但仍需预算规划;依赖多个外部服务稳定性,任一环节故障都会影响可用性;桥接服务需要自行维护,对非技术用户门槛较高;语音交互的延迟和识别准确率受网络与 TTS 质量影响。

适合的目标群体

主要面向需要将 AI 助手接入电话渠道的技术用户与小型团队:OpenClaw 深度用户希望扩展语音交互能力、需要 7×24 电话客服或助理的个体经营者、追求数据自主可控不愿使用全托管方案的企业、以及具备基础 DevOps 能力希望定制化语音 AI 体验的开发者。

使用风险

财务风险为首要关注点——实际通话产生可计量的三方成本,需配置速率限制防止滥用;配置安全风险包括 .env 文件中集中存储的多平台 API 密钥,需严格管控文件权限;依赖项风险涉及 Twilio、ElevenLabs、Anthropic 的服务可用性与 API 变更;隐私层面通话内容本地存储但需确保转录文件安全;技术维护风险要求用户具备服务器运维与故障排查能力。

安全解读

核心用法

Phone Voice 是一套完整的语音电话集成方案,让用户能通过真实电话号码呼叫 OpenClaw。架构为:电话 → Twilio → ElevenLabs Agent → 自建 Bridge → Claude → OpenClaw 工具。用户需自建 FastAPI Bridge 服务器,将 OpenAI 格式的请求转换为 Claude API 调用,并注入 MEMORY.md/USER.md 记忆上下文。

关键步骤:
1. 配置 Cloudflare Tunnel 或 ngrok 暴露本地 8013 端口

2. 在 ElevenLabs 创建 Agent,指向 Bridge 的 /v1/chat/completions 端点

3. 绑定 Twilio 电话号码到 ElevenLabs Agent

4. 配置来电白名单(contacts.json)和语音 PIN(.env)

显著优点

  • 完整安全层:Caller ID 白名单、语音 PIN 挑战、Rate Limiting、通话时间窗口
  • 持久记忆:自动加载 MEMORY.md、USER.md 及历史通话记录,实现跨对话记忆
  • 成本透明:按通话记录 ElevenLabs/Twilio/Anthropic 分项成本,支持月度分析
  • 永久隧道:推荐 Cloudflare Tunnel 替代临时 ngrok,生产级稳定性
  • 双向通话:支持呼入(自动应答)和呼出(API 触发)

潜在局限

  • 部署复杂度高:需同时配置 4 个外部服务(Twilio、ElevenLabs、Cloudflare/ngrok、Anthropic)
  • 按量计费风险:语音通话成本约 $0.07-0.10/分钟,无严格限制可能产生意外费用
  • Bridge 服务器需自建:文档仅提供架构,核心 server.py/fred_prompt.py 需用户独立获取或开发
  • 海外服务合规:ElevenLabs/Twilio 为境外服务,数据跨境传输需用户自行评估
  • 本地端口暴露:配置错误可能导致 8013 端口直接暴露公网

适合人群

  • 需要 hands-free AI 访问的场景(驾驶、做饭、远离电脑时)
  • 希望为家人/团队部署专属语音助手的技术用户
  • 已有 OpenClaw 工作流,希望扩展电话渠道的高级玩家
  • 能熟练配置 API、隧道、环境变量的自托管爱好者

常规风险

  • 凭证泄露:.env 文件含 5+ 个高价值 API 密钥,权限设置不当或误提交 Git 会导致直接经济损失
  • Bridge 服务器未经验证:Skill 仅含文档,实际运行代码来源需用户自行确认(DM @FredMolty 获取)
  • 成本失控:Rate Limiting 需手动配置,恶意或意外高频调用可能快速累积费用
  • 记忆文件权限:Bridge 读取本地记忆文件,若服务器被入侵可能暴露个人数据

phone-voice 内容

手动下载zip · 4.0 kB
SKILL.mdtext/markdown
请选择文件