PaddleOCR 3.0 發布：開源更新提升 OCR 準確率 13%

百度 PaddleOCR 3.0：光学字符识别准确性的重大飞跃

在2025年5月20日，百度 Paddle团队正式推出了PaddleOCR 3.0，标志着光学字符识别（OCR）技术的一个重要里程碑。这个开源版本在文本识别准确性上有了显著的13%的提升，同时增强了多语言支持、手写识别和高精度文档解析能力。

自推出以来，PaddleOCR因其尖端算法和在多个知名开源项目中的实际应用而受到学术界和工业界的赞誉。最新版本PaddleOCR 3.0与PaddlePaddle框架3.0完全兼容，确保开发者能够无缝利用其先进功能。

PaddleOCR 3.0的主要特点

PaddleOCR 3.0的一大亮点是全场景文本识别模型PP-OCRv5。该模型支持五种不同的文本类型，包括简体中文、繁体中文、拼音、英语和日语，以及手写、竖排文本和稀有字符等复杂文本场景。PP-OCRv5的整体识别准确性已达到行业领先水平，显著提高了部署效率和速度。

在文档解析方面，PaddleOCR 3.0推出了通用文档解析解决方案PP-StructureV3。这个创新解决方案增强了布局检测、表格识别和公式识别的能力，同时改善了图表理解和恢复多列阅读顺序的功能。它可以以Markdown和JSON格式输出结果，展示了其在处理各种文档类型时的多样性。

高级文档理解

此外，PaddleOCR 3.0还具有智能文档理解解决方案PP-ChatOCRv4，原生支持Wenxin大模型4.5 Turbo。这个新解决方案在关键数据提取准确性上比其前身提高了15%。通过整合大模型和小模型的优势，PP-ChatOCRv4实现了多模态文档理解模型PP-DocBee2的离线使用。这个综合工具解决了复杂文档信息提取的挑战，包括布局分析、稀有字符识别、多页PDF、表格和印章识别。