LLMWhisperer

📄 手写笔记与表单智能识别专家

基于 Unstract LLMWhisperer API 的文档 OCR 工具,擅长手写体识别与复杂表格布局提取,免费额度 100 页/天

收藏
8.4k
安装
3k
版本
0.0.7
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

LLMWhisperer 是一个命令行工具,用于从图像和 PDF 文件中提取文本及保留原始布局。用户需先在 ~/.clawdbot/.env 配置 LLMWHISPERER_API_KEY,随后通过 llmwhisperer <file> 即可调用。支持将输出重定向保存或直接在终端查看。

显著优点

  • 手写体友好:相比传统 OCR,对非印刷体识别准确率更高
  • 布局保留output_mode=layout_preserving 模式可维持文档结构
  • 免费易用:100 页/天的免费额度适合个人轻量使用
  • 多格式支持:同时处理图片(JPG/PNG)和 PDF

潜在缺点与局限性

  • 依赖外部 API:网络波动或服务宕机直接影响可用性
  • 数据隐私风险:文件需上传至 Unstract 云端处理
  • 配额限制:免费 tier 仅 100 页/天,大量文档需付费
  • 无本地离线能力:纯云端方案,无法内网部署

适合人群

  • 需要处理手写笔记、表单的个人用户
  • 轻量级文档数字化需求的自由职业者
  • 快速原型验证阶段的开发者

常规风险

  • API 密钥泄露风险(需妥善保管 .env 文件)
  • 敏感文档外传合规问题(医疗、金融、法律场景慎用)
  • 服务持续性依赖第三方商业公司

LLMWhisperer 内容

暂无文件树

手动下载zip · 1.1 kB
contentapplication/octet-stream
请选择文件