Dieses Repository enthält ein Projekt, das die Gemini Pro Vision API nutzt, um Rechnungsinformationen aus Bildern zu extrahieren.
Um das Projekt einzurichten, gehen Sie folgendermaßen vor:
Installieren Sie Conda, falls Sie dies noch nicht getan haben. Sie können es von der offiziellen Conda-Website herunterladen.
Öffnen Sie ein Terminal oder eine Eingabeaufforderung.
Erstellen Sie eine neue Conda-Umgebung mit Python 3.10, indem Sie den folgenden Befehl ausführen:
conda create -p venv python==3.10
Aktivieren Sie die neu erstellte Umgebung:
conda activate venv
Installieren Sie die erforderlichen Abhängigkeiten, indem Sie den folgenden Befehl ausführen:
pip install -r requirements.txt
Sie sind bereit! Sie können nun das Projekt ausführen und mit dem Extrahieren von Rechnungsinformationen aus Bildern beginnen.
Um dieses Projekt zu verwenden, befolgen Sie diese Anweisungen:
Laden Sie das Bild Ihrer Quittung in das Projekt hoch.
Stellen Sie Ihre Frage in der Eingabeaufforderung.
Das Projekt wird die Gemini Pro Vision API nutzen, um Rechnungsinformationen aus dem Bild zu extrahieren und die Abfrageergebnisse bereitzustellen.
Überprüfen Sie die extrahierten Rechnungsinformationen und Abfrageergebnisse.
Wiederholen Sie den Vorgang für weitere Belege oder Abfragen.
Haftungsausschluss: Dieses Projekt dient ausschließlich Bildungszwecken. Für die Gemini Pro Vision API können Nutzungsbeschränkungen und Gebühren gelten. Weitere Informationen finden Sie in der API-Dokumentation und den Nutzungsbedingungen.