La bibliothèque Python automatisée offre un accès pratique à l'API REST automatisée à partir de n'importe quelle application Python 3.10+. La bibliothèque comprend des définitions de type pour tous les paramètres de requête et champs de réponse, et propose des clients synchrones et asynchrones alimentés par httpx.
Important
Le service d'extraction de documents est actuellement en version bêta fermée.
# installation à partir de PyPIpip installation automatique
Définissez le modèle cible que vous souhaitez remplir et transmettez-le avec le PDF que vous souhaitez traiter dans la méthode .extract_model()
. Vos 1000 premiers documents sont gratuits, assurez-vous simplement de remplacer votre email dans le API_KEY
. Vous recevrez un mail de vérification avec un lien après avoir exécuté votre extraction pour la première fois. La première exécution échouera, car votre e-mail (défini dans votre clé API) n'est pas encore vérifié. Après vérification, vous pouvez réexécuter votre script et cela devrait fonctionner. Voici un exemple :
à partir de datetime import datefrom pydantic import Field, BaseModelfrom importation automatique DocExtClient# à partir de l'importation automatique AsyncDocExtClientclass Article (BaseModel): numéro_article: str | Aucun = Champ(Aucun, description="Généralement alphabétique ou alphanumérique.") description : str | Aucun = Champ(Aucun, description="Description de l'article.") quantité : float | Aucun = Champ (Aucun, description = "Nombre de pièces.")class PurchaseOrder (BaseModel): customer_name: str | Aucun = Champ(Aucun, description="Exemples : Kaladent Inc., Henkel GmbH") numéro_de-commande : str | Aucun = Champ (Aucun, description = "Le numéro de bon de commande.") order_date: date | Aucun = Field(Aucun, description="La date du bon de commande.") items: list[Article] = Field(default_factory=list, description="Liste de tous les articles commandés.")client = DocExtClient(API_KEY="TEST_BETA:you @company.com") # Remplacez l'e-mail par le vôtre. Dès que nous ne serons plus en version bêta, vous recevrez une clé API appropriée pour production.result : PurchaseOrder = client.extract_model(PurchaseOrder, "./po.pdf") # automaited.dev/samplesprint(result)
Vous pouvez télécharger un exemple de PDF ici : automaited.dev/samples. Si vous souhaitez en savoir plus sur la façon de définir des modèles cibles, jetez simplement un œil à la documentation pydantic.