Dieses Repository ist der Backend-Code für ein Tool, mit dem Sie mithilfe visueller LLMs Daten aus Bildern extrahieren können. Den Frontend-Code (mit Streamlit) finden Sie hier: AI-OCR-Frotend.
Um das AI-OCR-Tool zu nutzen, installieren Sie am besten dieses Repository sowohl für das Backend als auch für das Frontend-Repository, folgen Sie also diesen Schritten:
git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr
pip install -r requirements.txt
docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest
git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend
pip install -r requirements.txt
Anschließend können Sie das Backend starten, indem Sie Folgendes ausführen:
python app.py $IP_ADDRESS
Stellen Sie sicher, dass der Docker-Container für die Coachdb ausgeführt wird.
Da das Backend Fastapi verwendet, können Sie es jetzt über die Fastapi-Dokumente ausprobieren, indem Sie zu $IP_ADDRESS:5000/docs
gehen.
Sie können das Frontend aber auch jetzt starten, indem Sie Folgendes ausführen:
chmod +x start_up.sh
./start_up.sh
aus dem geklonten Frontend-Repository.
In Ihrem Browser öffnet sich automatisch ein Streamlight-Fenster. Innerhalb der Webanwendung finden Sie dann in der Seitenleiste zwei Seiten: