Французский | Португальский | испанский | 中文
Parsr — это набор инструментов для очистки, анализа и извлечения документов с минимальным размером ( изображение, pdf, docx, eml ), который генерирует легкодоступные, организованные и пригодные для использования данные в форматах JSON, Markdown (MD), CSV/Pandas DF или TXT .
Он предоставляет аналитикам, специалистам по данным и разработчикам набор четко структурированной и обогащенной метками информации для готовых к использованию приложений, начиная от автоматизации ввода данных и анализа документов, архивирования и многих других.
На данный момент Parsr может выполнять: очистку документов, восстановление иерархии (слов, строк, абзацев), обнаружение заголовков, таблиц, списков, оглавления, номеров страниц, верхних/нижних колонтитулов, ссылок и другие. Ознакомьтесь со всеми функциями.
-- Расширенное руководство по установке доступно здесь --
Самый быстрый способ установить и запустить API Parsr — через образ докера:
docker pull axarev/parsr
Если вы также хотите установить графический интерфейс для отправки документов и визуализации результатов:
docker pull axarev/parsr-ui-localhost
Примечание. Parsr также можно установить на «голое железо» (не через контейнеры Docker), процедура которого описана в руководстве по установке.
-- Расширенное руководство по использованию доступно здесь --
Чтобы запустить API, введите:
docker run -p 3001:3001 axarev/parsr
который запустит его по адресу http://localhost:3001.
Обратитесь к документации по использованию API.
Чтобы получить доступ клиента Python к API Parsr, введите:
pip install parsr-client
Чтобы попробовать Jupyter Notebook с помощью клиента Python, перейдите к демо-версии Jupyter.
docker run -t -p 8080:80 axarev/parsr-ui-localhost:latest
Обратитесь к документации по конфигурации, чтобы интерпретировать настраиваемые параметры в средстве просмотра графического интерфейса.
Использование API и командной строки описано в расширенном руководстве по использованию.
Все файлы документации можно найти здесь.
Пожалуйста, ознакомьтесь с правилами внесения взносов.
Лицензии сторонних библиотек на зависимости:
Copyright 2020 AXA Group Operations SA.
Лицензия Apache 2.0 (см. файл ЛИЦЕНЗИИ).