Document AI Toolbox : Document AI Toolbox vise à réduire les frictions liées à la gestion, à la manipulation et à l'extraction d'informations à partir des sorties des méthodes Document AI BatchProcessDocuments()
(fichiers JSON écrits dans des compartiments GCS gérés par l'utilisateur) et ProcessDocument()
, par programmation.
Clause de non-responsabilité
La Document AI Toolbox est dans un état expérimental. Cette bibliothèque est un travail en cours et est susceptible de comporter des modifications rétrocompatibles. Les utilisateurs de la boîte à outils devront peut-être réécrire leur code lors de la mise à niveau de la version de la boîte à outils.
Pour utiliser cette bibliothèque, vous devez d'abord suivre les étapes suivantes :
L'activation de Document AI peut ne pas être techniquement requise pour utiliser cette bibliothèque, à moins que ProcessDocument()
ne soit destiné à être utilisé. Mais vous devez activer l'API de stockage pour accéder aux compartiments GCS contenant la sortie de BatchProcessDocument()
. Vous devrez activer l'API BigQuery si vous avez l'intention d'utiliser les fonctionnalités BigQuery.
Installez cette bibliothèque dans un virtualenv en utilisant pip. virtualenv est un outil pour créer des environnements Python isolés. Le problème fondamental qu'il résout est celui des dépendances et des versions, et indirectement des autorisations.
Avec virtualenv, il est possible d'installer cette bibliothèque sans avoir besoin des autorisations d'installation du système et sans entrer en conflit avec les dépendances du système installées.
Les exemples et extraits de code se trouvent dans le dossier samples/.
Nos bibliothèques clientes sont compatibles avec toutes les versions actives et de maintenance actuelles de Python.
Python >= 3,8
Python <= 3,7
REMARQUE : Python 3.7 a été marqué comme non pris en charge par la communauté Python en juin 2023. Nous recommandons à tous les développeurs de passer à Python 3.8 et versions ultérieures dès qu'ils le peuvent. La prise en charge de Python 3.7 sera supprimée de toutes les bibliothèques clientes après le 1er janvier 2024. Les bibliothèques clientes prenant en charge Python 3.7 continueront d'être disponibles au téléchargement, mais les versions postérieures au 1er janvier 2024 cibleront uniquement Python 3.8 et les versions ultérieures.
Si vous utilisez une version en fin de vie de Python, nous vous recommandons de la mettre à jour dès que possible vers une version activement prise en charge.
pip install virtualenv
virtualenv <your-env>
source <your-env>/bin/activate
<your-env>/bin/pip install google-cloud-documentai-toolbox
pip install virtualenv
virtualenv <your-env>
<your-env>Scriptsactivate
<your-env>Scriptspip.exe install google-cloud-documentai-toolbox