使用说明

核心用法

ocr-local 是一款本地运行的 OCR 文字识别工具，基于成熟的 Tesseract.js 引擎，无需 API Key 或云端服务。用户通过命令行指定图像路径即可提取文字，支持简体中文（chi_sim）、繁体中文（chi_tra）及英文（eng）的单独或混合识别（如 chi_sim+eng）。首次运行时会自动从官方 CDN 下载语言数据文件（约 20MB/语言），后续完全离线使用。

显著优点

完全本地化：图像处理在本地完成，无数据上传风险，特别适合敏感文档处理
零 API 成本：无需订阅或 API Key，无调用次数限制
多语言支持：原生支持中英双语及混合识别
隐私合规：无数据外传，符合企业内网及隐私敏感场景需求
轻量易用：Node.js 单文件脚本，安装部署简单

潜在缺点与局限性

首次启动需联网：语言模型数据需下载，离线环境需提前准备
识别精度依赖图像质量：对模糊、低对比度、手写体或复杂排版识别效果有限
性能一般：相比云端 OCR（如 Google Vision、Azure OCR），本地处理速度较慢，大图像耗时明显
无高级功能：不支持表格识别、版面分析、自动倾斜校正等高级特性
依赖体积：多语言缓存可能占用数百 MB 磁盘空间

适合人群

注重隐私、需在本地处理敏感文档的个人用户或企业
内网/离线环境开发者，无法使用云端 API 的场景
轻量级 OCR 需求，对识别速度要求不高的自动化脚本场景
开源爱好者及成本敏感用户

常规风险

依赖项自动下载：Tesseract.js 从 CDN 拉取语言数据，需确保网络来源可信（实际为官方 GitHub 资源）
缓存管理：长期运行需关注语言数据缓存的磁盘占用
输入验证：当前版本依赖用户自行确保输入文件为有效图像格式

安全解读

核心用法

ocr-local 是一款基于 Tesseract.js 的本地 OCR（光学字符识别）工具，专为需要从图片中提取文字的场景设计。通过简单的 Node.js 命令行调用即可识别图片中的印刷文字，支持简体中文、繁体中文及英文，也可混合识别。

使用方式非常直观：

node scripts/ocr.js /path/to/image.jpg              # 默认中文简体+英文
node scripts/ocr.js /path/to/image.png --lang eng   # 仅英文
node scripts/ocr.js screenshot.png --lang chi_sim+eng --json  # 结构化输出

显著优点

纯本地运行，隐私零风险——所有 OCR 处理在本地完成，图片无需上传云端，适合处理敏感文档、截图或含隐私信息的图片。无需注册账号、无需配置 API Key，开箱即用。

多语言支持——内置 chi_sim（简体中文）、chi_tra（繁体中文）、eng（英文）支持，可通过 + 组合多语言模式，如 chi_sim+eng 适合中英混排场景。

输出灵活——默认输出纯文本，支持 --json 选项获取结构化数据（包含识别置信度、单词坐标位置），便于后续自动化处理。

开源生态背书——底层依赖 naptha 维护的 Tesseract.js，是 Google Tesseract OCR 的 JavaScript 移植版，社区成熟、持续维护。

潜在缺点与局限性

首次运行需下载语言数据——初次使用每种语言需下载约 20MB 训练数据（自动缓存），网络不佳时首次体验受影响。已下载语言后续完全离线可用。

识别精度依赖图片质量——对清晰、高对比度的印刷体效果最佳；手写文字、模糊、倾斜、复杂背景或低分辨率图片识别准确率会显著下降。

无 GPU 加速——纯 CPU 运行，大批量图片处理时速度有限，不适合高吞吐场景。

格式支持受限——依赖 Tesseract 本身，对特殊排版（如竖排文字、复杂表格）识别效果一般。

适合人群

需要处理敏感/私密截图，不愿上传云端的技术人员
轻量级文档数字化需求（发票、名片、屏幕截图文字提取）
离线环境或网络受限场景下的自动化工作流
个人开发者、隐私敏感用户、本地优先工具链爱好者

常规风险

该工具本身风险极低：代码结构简洁（127 行/6 文件），无危险函数调用，无网络外发行为（除首次语言数据下载）。唯一需注意：

首次运行时的 CDN 下载来源为 Tesseract.js 官方，属正常依赖行为
对特别敏感场景，建议预先下载语言包后断网使用，实现完全离线
识别结果准确性需人工复核，尤其是涉及重要决策的场景

ocr text-recognition tesseract local-processing privacy-friendly chinese-support offline document-processing image-to-text

OCR - Local (No API Key) 内容

scripts文件夹

手动下载zip · 4.6 kB

ocr.jstext/javascript

请选择文件