Este repositorio es el código backend de una herramienta con la que puede extraer datos de imágenes utilizando LLM visuales. El código de interfaz (usando streamlit) se puede encontrar aquí: AI-OCR-Frotend.
Para utilizar la herramienta AI-OCR, lo mejor es instalar este repositorio para el backend, así como el repositorio frontend, es decir, seguir estos pasos:
git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr
pip install -r requirements.txt
docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest
git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend
pip install -r requirements.txt
Luego puedes iniciar el backend ejecutando:
python app.py $IP_ADDRESS
Asegúrese de que el contenedor acoplable para coachdb se esté ejecutando.
Dado que el backend usa fastapi, ahora puede probarlo a través de los documentos de fastapi yendo a $IP_ADDRESS:5000/docs
.
Pero también puedes iniciar la interfaz ahora ejecutando:
chmod +x start_up.sh
./start_up.sh
desde dentro del repositorio frontend clonado.
Se abrirá automáticamente una ventana iluminada en su navegador. Dentro de la aplicación web encontrará dos páginas en la barra lateral: