A biblioteca Python automatizada fornece acesso conveniente à API REST automatizada de qualquer aplicativo Python 3.10+. A biblioteca inclui definições de tipo para todos os parâmetros de solicitação e campos de resposta e oferece clientes síncronos e assíncronos com tecnologia httpx.
Importante
O serviço de extração de documentos está atualmente em versão beta fechada.
# instalação do PyPIpip instalação automatizada
Defina o modelo de destino que deseja preencher e passe-o com o PDF que deseja processar para o método .extract_model()
. Seus primeiros 1.000 documentos são gratuitos, apenas certifique-se de substituir seu email na API_KEY
. Você receberá um e-mail de verificação com um link após executar a extração pela primeira vez. A primeira execução falhará porque seu e-mail (definido em sua chave de API) ainda não foi verificado. Após a verificação, você pode executar novamente o script e ele deverá funcionar. Aqui está um exemplo:
de data e hora de importação datade importação pydantic Campo, BaseModelde importação automatizada DocExtClient# de importação automatizada AsyncDocExtClientclass Article(BaseModel): article_number: str | Nenhum = Campo(Nenhum, descrição="Normalmente alfabético ou alfanumérico.") descrição: str | Nenhum = Campo(Nenhum, descrição="Descrição do item.") quantidade: float | Nenhum = Field(None, description="Número de peças.")class PurchaseOrder(BaseModel): customer_name: str | Nenhum = Campo(Nenhum, descrição="Exemplos: Kaladent Inc., Henkel GmbH") número_pedido: str | Nenhum = Field(Nenhum, description="O número do pedido de compra.") order_date: data | None = Field(None, description="A data do pedido de compra.") items: list[Article] = Field(default_factory=list, description="Lista de todos os artigos encomendados.")client = DocExtClient(API_KEY="TEST_BETA:you @empresa.com") # Substitua o e-mail pelo seu. Assim que sairmos da versão beta, você receberá uma chave de API adequada para produção.resultado: PurchaseOrder = client.extract_model(PurchaseOrder, "./po.pdf") # automaited.dev/samplesprint(result)
Você pode baixar um PDF de amostra aqui: automaited.dev/samples Se quiser saber mais sobre como definir modelos de destino, basta dar uma olhada na documentação do pydantic