aipdf Télécharger - aipdf Téléchargement du code source

aipdf

Code Source AI

v0.0.4

Télécharger

AIPDF : OCR PDF simple avec des modèles multimodaux de type GPT

Au lieu des OCR traditionnels ou des bibliothèques lourdes pour obtenir des données à partir de PDF, GenAI fait un meilleur travail !

AIPDF est une bibliothèque Python pure autonome, minimaliste mais puissante qui exploite des modèles d'IA de génération multimodaux (OpenAI, lama3 ou alternatives compatibles) pour extraire des données de PDF et les convertir dans divers formats tels que Markdown ou JSON.

Installation

pip install aipdf

sous macOS, vous devrez installer poppler

brew install poppler

Démarrage rapide

 from aipdf import ocr

# Your OpenAI API key   
api_key = 'your_openai_api_key'

file = open ( 'somepdf.pdf' , 'rb' )
markdown_pages = ocr ( file , api_key )

Ollama

Vous pouvez utiliser avec n'importe quel modèle multimodal ollama

 ocr ( pdf_file , api_key = 'ollama' , model = "llama3.2" , base_url = 'http://localhost:11434/v1' , prompt = ...)

N'importe quel système de fichiers

Nous avons choisi que vous transmettiez un objet fichier, car de cette façon, vous pouvez l'utiliser avec n'importe quel type de système de fichiers, s3, fichiers locaux, URL, etc.

À partir de l'URL

 pdf_file = io . BytesIO ( requests . get ( 'https://arxiv.org/pdf/2410.02467' ). content )

# extract
pages = ocr ( pdf_file , api_key , prompt = "extract tables, return each table in json" )

À partir de S3

 s3 = boto3 . client ( 's3' , config = Config ( signature_version = 's3v4' ),
                  aws_access_key_id = access_token ,
                  aws_secret_access_key = '' , # Not needed for token-based auth
                  aws_session_token = access_token )


pdf_file = io . BytesIO ( s3 . get_object ( Bucket = bucket_name , Key = object_key )[ 'Body' ]. read ())
# extract 
pages = ocr ( pdf_file , api_key , prompt = "extract charts data, turn it into tables that represent the variables in the chart" )

Pourquoi AIPDF ?

Simplicité : AIPDF fournit une fonction simple, elle nécessite une installation, des dépendances et une configuration minimales.
Flexibilité : extrayez les données au format Markdown, JSON, HTML, YAML, peu importe... le format de fichier et le schéma.
Puissance de l'IA : exploite des modèles multimodaux de pointe (gpt, lama, ..).
Personnalisable : adaptez le processus d'extraction à vos besoins spécifiques avec des invites personnalisées.
Efficace : utilise le traitement parallèle pour une extraction plus rapide des PDF de plusieurs pages.

Exigences

Python3.7+

Nous garderons cela super propre, seulement 3 bibliothèques requises :

bibliothèque openai pour parler aux points de terminaison
bibliothèque pdf2image (pour la conversion de PDF en image)
Bibliothèque d'oreillers (PIL)

Licence

Ce projet est sous licence MIT - voir le fichier LICENSE pour plus de détails.

Contribuer

Les contributions sont les bienvenues ! N'hésitez pas à soumettre une Pull Request.

Soutien

Si vous rencontrez des problèmes ou avez des questions, veuillez ouvrir un ticket sur le référentiel GitHub.

AIPDF rend l'extraction de données PDF simple, flexible et puissante. Essayez-le et simplifiez votre flux de travail de traitement PDF dès aujourd'hui !

Développer

Informations supplémentaires

Version v0.0.4
Type Code Source AI
Date de mise à jour 2025-01-09
taille 7.89KB
Provenant de Github

Applications connexes

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout