English | 简体中文
PaddleOCR 旨在打造一套丰富、领先、且实用的OCR 工具库,助力开发者训练出更好的模型,并应用落地。
PaddleOCR 由PMC 监督。 Issues 和PRs 将在尽力的基础上进行审查。欲了解PaddlePaddle 社区的完整概况,请访问community。
??《PaddleOCR 2.9 发布,正式开源文本图像智能分析利器》,文本图像版面解析实现高精度实时预测,低代码全流程开发加速产业应用。集成文本图像矫正、版面区域检测、常规文本检测、印章文本检测、文本识别、表格识别等多功能。 6条模型产线一键调用,显着降低开发成本。支持高性能推理、服务化部署和端侧部署等多种部署方式。 10月24日(周四)19:00直播为您深度解析最新升级亮点。 报名链接
?2024.10.1 添加OCR领域低代码全流程开发能力:
?模型丰富一键调用:将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的17个模型整合为6条模型产线,通过极简的Python API一键调用,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计200+模型,形成20+单功能模块,方便开发者进行模型组合使用。
?提高效率降低门槛:提供基于统一命令和图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持高性能推理、服务化部署和端侧部署等多种部署方式。此外,对于各种主流硬件如英伟达GPU、昆仑芯、升腾、寒武纪和海光等,进行模型开发时,都可以无缝切换。
飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
支持文档场景信息抽取v3PP-ChatOCRv3-doc、基于RT-DETR的高精度版面区域检测模型和PicoDet的高效率版面区域检测模型、高精度表格结构识别模型SLANet_Plus、文本图像矫正模型UVDoc、公式识别模型LatexOCR 、基于PP-LCNet的文档图像方向分类模型
?2024.7 添加PaddleOCR 算法模型挑战赛冠军方案:
赛题一:OCR 端到端识别任务冠军方案——场景文本识别算法-SVTRv2;
赛题二:通用表格识别任务冠军方案——表格识别算法-SLANet-LCNetV2。
支持多种OCR 相关前沿算法,在此基础上打造产业级特色模型PP-OCR、PP-Structure和PP-ChatOCR,并打通数据生产、模型训练、压缩、预测部署全流程。
完整文档请移步:docs
《动手学OCR》电子书
本项目的发布受Apache License Version 2.0 许可认证。