使用说明

local-stt 是一个统一的本地语音转文本（Speech-to-Text）解决方案，基于 ONNX Runtime 实现 int8 量化推理，无需依赖云服务即可完成语音识别任务。

| 后端 | 优势 | 适用场景 |

|------|------|----------|

| **Parakeet** (默认) | 英语识别精度最高，能准确捕获专有名词和填充词 | 英语播客、会议记录 |

| **Whisper** | 推理速度最快，支持99种语言 | 多语言内容、实时转写 |

# 默认Parakeet v2（最佳英语精度）
local-stt.py audio.ogg

# 切换Whisper多语言
local-stt.py audio.ogg -b whisper

# 安静模式（适合脚本调用）
local-stt.py audio.ogg --quiet

隐私敏感用户、离线环境工作者、需要将语音自动化集成到CLI工作流的开发者。不适合需要实时字幕（RTF虽低但非流式）或专业级转写（无标点预测、说话人分离）的场景。

Local STT (Nvidia Parakeet + Whisper Support) 内容

暂无文件树

手动下载zip · 3.8 kB

contentapplication/octet-stream

请选择文件