Die automatisierte Python-Bibliothek bietet bequemen Zugriff auf die automatisierte REST-API von jeder Python 3.10+-Anwendung aus. Die Bibliothek enthält Typdefinitionen für alle Anforderungsparameter und Antwortfelder und bietet sowohl synchrone als auch asynchrone Clients mit httpx-Unterstützung.
Wichtig
Der Dokumentenextraktionsdienst befindet sich derzeit in einer geschlossenen Betaphase.
# von PyPipip installieren, automatische Installation
Definieren Sie das Zielmodell, das Sie füllen möchten, und übergeben Sie es mit der PDF-Datei, die Sie verarbeiten möchten, an die Methode .extract_model()
. Ihre ersten 1000 Dokumente sind kostenlos. Stellen Sie einfach sicher, dass Sie Ihre E-Mail-Adresse im API_KEY
ersetzen. Sie erhalten eine Bestätigungs-E-Mail mit einem Link, nachdem Sie Ihre Extraktion zum ersten Mal ausgeführt haben. Der erste Durchlauf schlägt fehl, da Ihre E-Mail-Adresse (definiert in Ihrem API-Schlüssel) noch nicht überprüft wurde. Nach der Überprüfung können Sie Ihr Skript erneut ausführen und es sollte funktionieren. Hier ist ein Beispiel:
from datetime import datefrom pydantic import Field, BaseModelfrom automaited import DocExtClient# from automaited import AsyncDocExtClientclass Article(BaseModel): Article_number: str | None = Field(None, description="Typischerweise alphabetisch oder alphanumerisch.") Beschreibung: str | None = Field(None, description="Beschreibung des Artikels.") Menge: float | None = Field(None, description="Anzahl der Teile.")class PurchaseOrder(BaseModel): customer_name: str | None = Field(None, description="Beispiele: Kaladent Inc., Henkel GmbH") order_number: str | None = Field(None, description="Die Bestellnummer.") order_date: date | None = Field(None, description="Das Bestelldatum.") items: list[Article] = Field(default_factory=list, description="Liste aller bestellten Artikel.")client = DocExtClient(API_KEY="TEST_BETA:you @company.com") # Ersetzen Sie die E-Mail-Adresse durch Ihre. Sobald wir die Betaversion verlassen haben, erhalten Sie einen richtigen API-Schlüssel für die Produktion. Ergebnis: PurchaseOrder = client.extract_model(PurchaseOrder, "./po.pdf") # automaited.dev/samplesprint(result)
Ein Beispiel-PDF können Sie hier herunterladen: automaited.dev/samples Wenn Sie mehr über die Definition von Zielmodellen erfahren möchten, schauen Sie sich einfach die Pydantic-Dokumente an