Français | Portugais | Espagnol | Chine
Parsr est une chaîne d'outils de nettoyage, d'analyse et d'extraction de documents à empreinte minimale ( image, pdf, docx, eml ) qui génère des données facilement disponibles, organisées et utilisables aux formats JSON, Markdown (MD), CSV/Pandas DF ou TXT .
Il fournit aux analystes, aux scientifiques des données et aux développeurs un ensemble d'informations structurées et enrichies d'étiquettes pour des applications prêtes à l'emploi allant de la saisie de données à l'automatisation des analystes de documents, en passant par l'archivage et bien d'autres.
Actuellement, Parsr peut effectuer : le nettoyage de documents, la régénération de hiérarchies (mots, lignes, paragraphes), la détection de titres, tableaux, listes, table des matières, numéros de page, en-têtes/pieds de page, liens et autres. Découvrez toutes les fonctionnalités.
-- Le guide d'installation avancé est disponible ici --
Le moyen le plus rapide d'installer et d'exécuter l'API Parsr consiste à utiliser l'image Docker :
docker pull axarev/parsr
Si vous souhaitez également installer l'interface graphique d'envoi de documents et de visualisation des résultats :
docker pull axarev/parsr-ui-localhost
Remarque : Parsr peut également être installé sans système d'exploitation (pas via des conteneurs Docker), dont la procédure est documentée dans le guide d'installation.
-- Le guide d'utilisation avancée est disponible ici --
Pour exécuter l'API, exécutez :
docker run -p 3001:3001 axarev/parsr
qui le lancera sur http://localhost:3001.
Consultez la documentation sur l'utilisation de l'API.
Pour accéder au client Python à l'API Parsr, exécutez :
pip install parsr-client
Pour échantillonner Jupyter Notebook à l'aide du client python, rendez-vous sur la démo jupyter.
docker run -t -p 8080:80 axarev/parsr-ui-localhost:latest
Reportez-vous à la documentation de configuration pour interpréter les options configurables dans la visionneuse GUI.
L'utilisation basée sur l'API et l'utilisation de la ligne de commande sont documentées dans le guide d'utilisation avancée.
Tous les fichiers de documentation peuvent être trouvés ici.
Veuillez vous référer aux directives de contribution.
Licences de bibliothèques tierces pour ses dépendances :
Copyright 2020 Opérations du Groupe AXA SA
Sous licence Apache 2.0 (voir le fichier LICENSE).