自動化 Python 庫提供從任何 Python 3.10+ 應用程式方便地存取自動化 REST API。該庫包含所有請求參數和回應欄位的類型定義,並提供由 httpx 提供支援的同步和非同步客戶端。
重要的
文檔提取服務目前處於封閉測試階段。
# 從 PyPIpip install 自動安裝
定義要填入的目標模型,並將其與要處理的 PDF 一起傳遞到.extract_model()
方法中。您的前 1000 個文件是免費的,只需確保替換API_KEY
中的電子郵件即可。首次執行提取後,您將收到一封帶有連結的驗證郵件。第一次運行將會失敗,因為您的電子郵件(在 api 金鑰中定義)尚未經過驗證。驗證後,您可以重新運行腳本,它應該可以工作。這是一個例子:
from datetime import datefrom pydantic import Field, BaseModelfrom automaited import DocExtClient# from automaited import AsyncDocExtClientclass 文章(BaseModel):文章編號:str | None = Field(None, description="通常按字母或字母數字排列。") 說明:str | None = Field(None, description="商品描述。") 數量:float | None = Field(None, description="件數。")class PurchaseOrder(BaseModel): customer_name: str | None = Field(None, description="範例:Kaladent Inc.、Henkel GmbH") order_number: str | None = Field(None, description="採購訂單編號。") order_date: 日期 | None = Field(None, description="購買訂單日期。") items: list[Article] = Field(default_factory=list, description="所有訂購商品的清單。")client = DocExtClient(API_KEY="TEST_BETA:you @ company.com") # 將電子郵件替換為您的電子郵件。一旦我們結束測試版,您將收到用於生產的正確 API 金鑰。
您可以在此處下載範例 PDF:automaited.dev/samples 如果您想了解有關如何定義目標模型的更多信息,只需查看 pydantic 文檔