Английский | Упрощенный китайский
PaddleOCR стремится создать богатую, ведущую и практичную библиотеку инструментов OCR, которая поможет разработчикам обучать более качественные модели и реализовывать их.
PaddleOCR контролируется PMC. Проблемы и запросы будут рассмотрены в максимально возможном объеме. Для получения полного обзора сообщества PaddlePaddle посетите сайт Community.
«PaddleOCR 2.9 выпущен, официально открытый инструмент интеллектуального анализа текстовых изображений», анализ макета текстового изображения для достижения высокоточного прогнозирования в реальном времени, разработка полного процесса с низким уровнем кода для ускорения промышленных приложений. Встроенная коррекция текстового изображения, обнаружение области макета, обнаружение обычного текста, обнаружение текста печати, распознавание текста, распознавание формы и другие функции. Шесть линий по производству моделей можно вызвать одним щелчком мыши, что значительно снижает затраты на разработку. Поддерживает несколько методов развертывания, таких как высокопроизводительный логический вывод, развертывание на основе служб и развертывание на стороне устройства. Прямая трансляция в 19:00 24 октября (четверг) предоставит вам подробный анализ основных моментов последнего обновления. Ссылка на регистрацию
?2024.10.1 Добавлены возможности полнопроцессной разработки с низким кодом в области OCR :
Обогащение модели одним щелчком мыши : интеграция 17 моделей, связанных с интеллектуальным анализом текстовых изображений, общим оптическим распознаванием текста, общим анализом макета, общим распознаванием таблиц, распознаванием формул и распознаванием текста печати, в 6 линий производства моделей с помощью минималистичного вызова Python API Key для быстро ощутить эффект модели. Кроме того, тот же набор API также поддерживает в общей сложности более 200 моделей, таких как классификация изображений, обнаружение целей, сегментация изображений и прогнозирование временных рядов, образуя более 20 однофункциональных модулей, облегчающих разработчикам использование комбинаций моделей .
? Повышение эффективности и снижение порога : Предоставляет два метода на основе унифицированных команд и графического интерфейса для реализации простого и эффективного использования, комбинирования и настройки моделей. Поддерживает несколько методов развертывания, таких как высокопроизводительный логический вывод, развертывание на основе служб и развертывание на стороне устройства . Кроме того, при разработке моделей вы можете легко переключаться между различным основным оборудованием, таким как NVIDIA GPU, Kunlun Core, Ascend, Cambrian и Haiguang .
PaddleX, инструмент разработки с низким кодом, опирается на передовую технологию PaddleOCR для поддержки возможностей полнопроцессной разработки с низким кодом в области оптического распознавания символов:
Поддерживает извлечение информации о сцене документа v3PP-ChatOCRv3-doc, высокоточную модель определения области макета на основе RT-DETR и высокоэффективной модели обнаружения области макета PicoDet, высокоточную модель распознавания структуры таблицы SLANet_Plus, модель коррекции текстового изображения UVDoc и формулу. модель распознавания LatexOCR, модель классификации ориентации изображения документа на основе PP-LCNet
?2024.7 Добавьте решение чемпиона по модели алгоритма PaddleOCR :
Вопрос конкурса 1: Чемпионское решение задачи сквозного распознавания OCR — алгоритм распознавания текста сцены — SVTRv2;
Конкурсный вопрос 2: Чемпионское решение общей задачи распознавания таблиц — алгоритм распознавания таблиц — SLANet-LCNetV2.
Он поддерживает множество передовых алгоритмов, связанных с распознаванием текста, и на этой основе создает характеристические модели промышленного уровня PP-OCR, PP-Structure и PP-ChatOCR, а также объединяет весь процесс производства данных, обучения моделей, сжатия и развертывание прогнозирования.
Полную документацию можно найти по адресу: docs
Электронная книга «Практическое обучение распознаванию текста»
Этот проект выпущен под лицензией Apache версии 2.0.