Français | Português | Espanhol | 中文
Parsr , é um conjunto de ferramentas de limpeza, análise e extração de documentos de tamanho mínimo ( imagem, pdf, docx, eml ) que gera dados prontamente disponíveis, organizados e utilizáveis nos formatos JSON, Markdown (MD), CSV/Pandas DF ou TXT .
Ele fornece aos analistas, cientistas de dados e desenvolvedores um conjunto de informações limpas, estruturadas e enriquecidas com rótulos para aplicativos prontos para uso, que vão desde entrada de dados e automação de analistas de documentos, arquivamento e muitos outros.
Atualmente, o Parsr pode realizar: limpeza de documentos, regeneração de hierarquia (palavras, linhas, parágrafos), detecção de títulos, tabelas, listas, índices, números de páginas, cabeçalhos/rodapés, links , entre outros. Confira todos os recursos.
-- O guia de instalação avançado está disponível aqui --
A maneira mais rápida de instalar e executar a API Parsr é por meio da imagem docker:
docker pull axarev/parsr
Se você também deseja instalar a GUI para envio de documentos e visualização de resultados:
docker pull axarev/parsr-ui-localhost
Nota: O Parsr também pode ser instalado bare-metal (não por meio de contêineres Docker), cujo procedimento está documentado no guia de instalação.
-- O guia de uso avançado está disponível aqui --
Para executar a API, emita:
docker run -p 3001:3001 axarev/parsr
que irá iniciá-lo em http://localhost:3001.
Consulte a documentação sobre o uso da API.
Para acessar o cliente python para a API Parsr, emita:
pip install parsr-client
Para experimentar o Jupyter Notebook , usando o cliente python, vá para a demonstração do jupyter.
docker run -t -p 8080:80 axarev/parsr-ui-localhost:latest
Consulte a documentação de configuração para interpretar as opções configuráveis no visualizador da GUI.
O uso baseado em API e o uso da linha de comando estão documentados no guia de uso avançado.
Todos os arquivos de documentação podem ser encontrados aqui.
Consulte as diretrizes de contribuição.
Licenças de bibliotecas de terceiros para suas dependências:
Direitos autorais 2020 AXA Group Operations SA
Licenciado sob a licença Apache 2.0 (veja o arquivo LICENSE).