Document AI Toolbox: Die Document AI Toolbox zielt darauf ab, die Reibung beim programmgesteuerten Verwalten, Manipulieren und Extrahieren von Informationen aus Ausgaben der Methoden Document AI BatchProcessDocuments()
(JSON-Dateien, die in benutzerverwaltete GCS-Buckets geschrieben werden) und ProcessDocument()
zu reduzieren.
Haftungsausschluss
Die Document AI Toolbox befindet sich in einem experimentellen Zustand. Diese Bibliothek ist in Arbeit und weist wahrscheinlich abwärtsinkompatible Änderungen auf. Benutzer der Toolbox müssen möglicherweise ihren Code neu schreiben, wenn sie die Toolbox-Version aktualisieren.
Um diese Bibliothek nutzen zu können, müssen Sie zunächst die folgenden Schritte ausführen:
Die Aktivierung von Document AI ist möglicherweise technisch nicht erforderlich, um diese Bibliothek zu verwenden, es sei denn ProcessDocument()
ist für die Verwendung vorgesehen. Sie müssen jedoch die Storage-API aktivieren, um auf GCS-Buckets zugreifen zu können, die die Ausgabe von BatchProcessDocument()
enthalten. Sie müssen die BigQuery-API aktivieren, wenn Sie die BigQuery-Funktionen nutzen möchten.
Installieren Sie diese Bibliothek mit pip in einer virtuellen Umgebung. virtualenv ist ein Tool zum Erstellen isolierter Python-Umgebungen. Das grundlegende Problem, das es anspricht, betrifft Abhängigkeiten und Versionen sowie indirekt Berechtigungen.
Mit virtualenv ist es möglich, diese Bibliothek zu installieren, ohne dass Systeminstallationsberechtigungen erforderlich sind und ohne dass es zu Konflikten mit den installierten Systemabhängigkeiten kommt.
Codebeispiele und Snippets befinden sich im Ordner „samples/“.
Unsere Client-Bibliotheken sind mit allen aktuellen aktiven und Wartungsversionen von Python kompatibel.
Python >= 3.8
Python <= 3.7
HINWEIS : Python 3.7 wurde im Juni 2023 von der Python-Community als nicht unterstützt markiert. Wir empfehlen allen Entwicklern, so bald wie möglich ein Upgrade auf Python 3.8 und höher durchzuführen. Die Unterstützung für Python 3.7 wird nach dem 1. Januar 2024 aus allen Client-Bibliotheken entfernt. Client-Bibliotheken, die Python 3.7 unterstützen, stehen weiterhin zum Download zur Verfügung, aber Versionen nach dem 1. Januar 2024 zielen nur auf Python 3.8 und höher ab.
Wenn Sie eine End-of-Life-Version von Python verwenden, empfehlen wir Ihnen, so schnell wie möglich auf eine aktiv unterstützte Version zu aktualisieren.
pip install virtualenv
virtualenv <your-env>
source <your-env>/bin/activate
<your-env>/bin/pip install google-cloud-documentai-toolbox
pip install virtualenv
virtualenv <your-env>
<your-env>Scriptsactivate
<your-env>Scriptspip.exe install google-cloud-documentai-toolbox