PaddleOCR стремится создать богатую, ведущую и практичную библиотеку инструментов OCR, которая поможет пользователям лучше обучать модели и реализовывать их.
PP-OCR — это практичная сверхлегкая система оптического распознавания символов. В основном он состоит из трех частей: обнаружение текста БД, коррекция кадра обнаружения и распознавание текста CRNN. Система использует 19 эффективных стратегий по восьми аспектам: выбор и настройка магистральной сети, проектирование прогнозирующей головки, улучшение данных, стратегия преобразования скорости обучения, выбор параметров регуляризации, использование моделей предварительного обучения, а также автоматическое обрезка и количественная оценка модели. Модель была оптимизирована. и уменьшен в размерах, и, наконец, были получены сверхлегкие устройства оптического распознавания символов на китайском и английском языках общим размером 3,5 МБ и цифровое оптическое распознавание символов на английском языке размером 2,8 МБ.
1. Высококачественная модель предварительной подготовки серии PPOCR, точный эффект распознавания.
Сверхлегкая мобильная серия ppocr_mobile: обнаружение (2,6M) + классификатор направления (0,9M) + распознавание (4,6M) = 8,1M
Общая серия ppocr_server: обнаружение (47,2M) + классификатор направления (0,9M) + распознавание (107M) = 155,1M
Сверхлегкая серия сжатия ppocr_mobile_slim: обнаружение (1,4M) + классификатор направления (0,5M) + распознавание (1,6M) = 3,5M
2. Поддержка распознавания комбинаций номеров на китайском и английском языках, распознавание вертикального текста и распознавание длинного текста.
3. Поддержка распознавания нескольких языков: корейский, японский, немецкий, французский.
4. Поддержка пользовательского обучения и предоставление многофункциональных решений для развертывания прогнозного рассуждения.
5. Поддержка быстрой установки и использования PIP.
6. Может работать в Linux, Windows, MacOS и других системах.