AI OCR -Download – AI OCR -Quellcode herunterladen

AI OCR

AI-Quellcode

1.0.0

Herunterladen

AI-Optical-Character-Recognition (AI-OCR): Extrahieren von Daten aus Bildern

Dieses Repository ist der Backend-Code für ein Tool, mit dem Sie mithilfe visueller LLMs Daten aus Bildern extrahieren können. Den Frontend-Code (mit Streamlit) finden Sie hier: AI-OCR-Frotend.

Inhaltsverzeichnis

Installation
Verwendung
Beispiel
Lizenz

Installation

Um das AI-OCR-Tool zu nutzen, installieren Sie am besten dieses Repository sowohl für das Backend als auch für das Frontend-Repository, folgen Sie also diesen Schritten:

Klonen Sie dieses Repository für das Backend

git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr

Installieren Sie die erforderlichen Abhängigkeiten für das Backend:

pip install -r requirements.txt

Rufen Sie die Coachdb-Docker-Datei ab und führen Sie sie mit dem folgenden Befehl aus:

docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest

Klonen Sie das Frontend-Repository

git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend

Installieren Sie die erforderlichen Abhängigkeiten für das Frontend:

pip install -r requirements.txt

Verwendung

Anschließend können Sie das Backend starten, indem Sie Folgendes ausführen:

python app.py $IP_ADDRESS

Stellen Sie sicher, dass der Docker-Container für die Coachdb ausgeführt wird.

Da das Backend Fastapi verwendet, können Sie es jetzt über die Fastapi-Dokumente ausprobieren, indem Sie zu $IP_ADDRESS:5000/docs gehen.

Sie können das Frontend aber auch jetzt starten, indem Sie Folgendes ausführen:

chmod +x start_up.sh
./start_up.sh

aus dem geklonten Frontend-Repository.

In Ihrem Browser öffnet sich automatisch ein Streamlight-Fenster. Innerhalb der Webanwendung finden Sie dann in der Seitenleiste zwei Seiten:

AI-OCR: Webseite zum Ausführen der eigentlichen optischen Zeichenerkennung
Modellkonfigurationen: Unterseite zum Konfigurieren der Modelle (z. B. ChatGPT, Llava, ...)