使用说明

核心用法

PaddleOCR Text Recognition是百度飞桨开源OCR框架的官方API封装技能，专精于从图像、截图、扫描件中提取机器可读文本。用户通过ocr_caller.py脚本调用，支持URL或本地文件输入，返回结构化JSON包含完整识别文本与可选检测框坐标。

关键操作流程：配置环境变量PADDLEOCR_OCR_API_URL和PADDLEOCR_ACCESS_TOKEN后，执行python scripts/ocr_caller.py --file-url "图片地址" --pretty，解析返回JSON的text字段即可获取纯文本。默认将原始JSON保存至系统临时目录，可通过--stdout改为直接输出。

显著优点

CJK文字专项优化：对中文、日文、韩文及手写体识别精度显著优于通用OCR
生产级精度：基于PP-OCRv5模型，支持小字号印刷体识别
灵活输出：可选bbox坐标输出，满足下游版面分析需求
双语路由：内置中英文触发词，便于智能路由发现

潜在局限

非结构化输出：不恢复表格网格、公式排版或阅读顺序，复杂版面需配合Document Parsing技能
API依赖：必须配置商业API端点，免费额度有限，大文档（50+页）可能耗时数分钟
无本地推理：纯云端方案，敏感文档存在传输隐私顾虑

适合人群

需批量处理中日韩文档的办公自动化用户
移动端截图、手写笔记数字化场景
需提取纯文本供下游NLP pipeline的开发者

常规风险

凭证泄露风险：Token为40位字符串，误粘贴至对话历史可能导致凭证暴露
配额耗尽：日API限额用完后服务中断
超时处理：复杂PDF需预留足够等待时间，避免误判失败

安全解读

核心用法

PaddleOCR Text Recognition 是百度PaddlePaddle开源项目的官方OCR技能，用于从图片、截图、扫描件或PDF中提取可编辑文本。支持两种输入方式：本地文件路径（--file-path）或网络URL（--file-url），自动识别文件类型或手动指定（--file-type）。

执行后返回标准化JSON结果，包含ok状态字段、text纯文本内容、result原始API响应及error错误信息。默认将结果保存至系统临时目录，也可通过--stdout直接输出或--output指定路径。典型调用示例：

python scripts/ocr_caller.py --file-url "https://example.com/doc.jpg" --pretty

显著优点

CJK识别领先：对中文、日文、韩文及手写体识别准确率行业顶尖，源于PaddleOCR多年技术积累
多格式支持：原生支持PNG/JPG/JPEG/BMP/TIFF/WEBP图片及PDF文档
输出规范完整：提供行级文本、置信度分数、边界框坐标（bbox）等结构化数据
安全控制到位：强制HTTPS通信、Token掩码显示、完整输入验证、120秒超时保护
T1可信来源：百度官方开源项目，代码经过完整安全审计

潜在局限

外部API依赖：必须联网调用PaddleOCR云服务，断网或服务故障时不可用；大文件（50+页PDF）处理可能耗时数分钟
配置门槛：需手动申请API密钥（PADDLEOCR_OCR_API_URL+PADDLEOCR_ACCESS_TOKEN），首次使用有 setup 成本
功能边界明确：专注纯文本提取，不支持表格结构恢复、公式识别或版面分析；复杂排版文档会丢失格式信息
隐私考量：文件需上传至第三方云服务，敏感文档需脱敏后处理

适合人群

需要批量提取图片/扫描件文字的内容工作者、研究员、档案管理员
处理中文古籍、手写笔记、小字号印刷品的专业用户
需要将非结构化图像文档转化为可搜索文本的自动化工作流
不适合：需要保留复杂表格结构、公式排版或版面还原的场景

常规风险

配额限制：API有日调用限额，超限时返回429错误需等待或升级
凭证安全：Token虽从环境变量读取，但在聊天中粘贴可能留存历史记录，建议通过宿主应用安全配置方式设置
识别置信度：低分辨率、模糊、反光或艺术字体可能导致识别失败，建议提供≥300 DPI的清晰图像
临时文件累积：结果默认写入系统临时目录，长期高频使用需定期清理释放磁盘空间

ocr text-recognition image-to-text paddlepaddle chinese-text cjk-languages handwriting-recognition baidu pp-ocr api-service

PaddleOCR Text Recognition 内容

references文件夹

scripts文件夹

手动下载zip · 12.7 kB

output_schema.mdtext/markdown

请选择文件