สกรู OCR แบบดั้งเดิมหรือไลบรารี่ขนาดใหญ่เพื่อรับข้อมูลจาก PDF GenAI ทำงานได้ดีกว่า!
AIPDF เป็นไลบรารี Python แบบสแตนด์อโลน เรียบง่าย แต่ทรงพลัง ซึ่งใช้ประโยชน์จากโมเดล AI เจนเนอเรชันหลายรูปแบบ (OpenAI, llama3 หรือทางเลือกอื่นที่เข้ากันได้) เพื่อดึงข้อมูลจาก PDF และแปลงเป็นรูปแบบต่างๆ เช่น Markdown หรือ JSON
pip install aipdf
ใน macOS คุณจะต้องติดตั้ง poppler
brew install poppler
from aipdf import ocr
# Your OpenAI API key
api_key = 'your_openai_api_key'
file = open ( 'somepdf.pdf' , 'rb' )
markdown_pages = ocr ( file , api_key )
คุณสามารถใช้กับ ollama multi-modal รุ่นใดก็ได้
ocr ( pdf_file , api_key = 'ollama' , model = "llama3.2" , base_url = 'http://localhost:11434/v1' , prompt = ...)
เราเลือกที่จะให้คุณส่งออบเจ็กต์ไฟล์ เนื่องจากวิธีดังกล่าวจะมีความยืดหยุ่นสำหรับคุณที่จะใช้สิ่งนี้กับระบบไฟล์ทุกประเภท, s3, ไฟล์ในเครื่อง, URL ฯลฯ
pdf_file = io . BytesIO ( requests . get ( 'https://arxiv.org/pdf/2410.02467' ). content )
# extract
pages = ocr ( pdf_file , api_key , prompt = "extract tables, return each table in json" )
s3 = boto3 . client ( 's3' , config = Config ( signature_version = 's3v4' ),
aws_access_key_id = access_token ,
aws_secret_access_key = '' , # Not needed for token-based auth
aws_session_token = access_token )
pdf_file = io . BytesIO ( s3 . get_object ( Bucket = bucket_name , Key = object_key )[ 'Body' ]. read ())
# extract
pages = ocr ( pdf_file , api_key , prompt = "extract charts data, turn it into tables that represent the variables in the chart" )
เราจะรักษาความสะอาดเป็นพิเศษนี้ โดยมีเพียง 3 ไลบรารีที่จำเป็นเท่านั้น:
โครงการนี้ได้รับอนุญาตภายใต้ใบอนุญาต MIT - ดูรายละเอียดในไฟล์ใบอนุญาต
ยินดีบริจาค! โปรดส่งคำขอดึง
หากคุณพบปัญหาหรือมีคำถามใดๆ โปรดเปิดปัญหาบนพื้นที่เก็บข้อมูล GitHub
AIPDF ทำให้การแยกข้อมูล PDF เป็นเรื่องง่าย ยืดหยุ่น และมีประสิทธิภาพ ลองใช้และทำให้ขั้นตอนการประมวลผล PDF ของคุณง่ายขึ้นวันนี้!