La biblioteca Python automatizada proporciona un acceso conveniente a la API REST automatizada desde cualquier aplicación Python 3.10+. La biblioteca incluye definiciones de tipos para todos los parámetros de solicitud y campos de respuesta, y ofrece clientes sincrónicos y asincrónicos con tecnología httpx.
Importante
El servicio de extracción de documentos se encuentra actualmente en fase beta cerrada.
# instalación desde PyPIpip instalación automatizada
Defina el modelo de destino que desea completar y páselo con el PDF que desea procesar al método .extract_model()
. Sus primeros 1000 documentos son gratuitos, solo asegúrese de reemplazar su correo electrónico en API_KEY
. Recibirá un correo de verificación con un enlace después de ejecutar la extracción por primera vez. La primera ejecución fallará porque su correo electrónico (definido en su clave API) aún no está verificado. Después de la verificación, puede volver a ejecutar el script y debería funcionar. Aquí hay un ejemplo:
desde fecha y hora fecha de importación desde campo de importación pydantic, BaseModel desde importación automatizada DocExtClient# desde importación automatizada AsyncDocExtClientclass Artículo (BaseModel): número_artículo: cadena | Ninguno = Campo(Ninguno, descripción="Normalmente alfabético o alfanumérico.") descripción: str | Ninguno = Campo(Ninguno, descripción="Descripción del artículo.") cantidad: flotante | Ninguno = Campo(Ninguno, descripción="Número de piezas.")clase Orden de compra(Modelo base): nombre_cliente: cadena | Ninguno = Campo(Ninguno, descripción="Ejemplos: Kaladent Inc., Henkel GmbH") número_pedido: str | Ninguno = Campo(Ninguno, descripción="El número de orden de compra.") fecha_pedido: fecha | Ninguno = Campo(Ninguno, descripción="La fecha de la orden de compra.") elementos: lista[Artículo] = Campo(default_factory=lista, descripción="Lista de todos los artículos pedidos.")cliente = DocExtClient(API_KEY="TEST_BETA:usted @empresa.com") # Reemplace el correo electrónico con el suyo. Tan pronto como salgamos de la versión beta, recibirá una clave API adecuada para producción.resultado: PurchaseOrder = client.extract_model(PurchaseOrder, "./po.pdf") # automatited.dev/samplesprint(resultado)
Puede descargar un PDF de muestra aquí: automatited.dev/samples Si desea obtener más información sobre cómo definir modelos de destino, simplemente eche un vistazo a los documentos de Pydantic.