Este repositório é o código backend de uma ferramenta com a qual você pode extrair dados de imagens usando LLMs visuais. O código frontend (usando streamlit) pode ser encontrado aqui: AI-OCR-Frotend.
Para usar a ferramenta AI-OCR, é melhor instalar este repositório para o backend, bem como o repositório frontend, ou seja, seguir estes passos:
git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr
pip install -r requirements.txt
docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest
git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend
pip install -r requirements.txt
Você pode então iniciar o backend executando:
python app.py $IP_ADDRESS
Certifique-se de que o contêiner docker para o coachdb esteja em execução.
Como o back-end usa fastapi, agora você pode experimentá-lo por meio dos documentos do fastapi acessando $IP_ADDRESS:5000/docs
.
Mas você também pode iniciar o frontend agora executando:
chmod +x start_up.sh
./start_up.sh
de dentro do repositório front-end clonado.
Uma janela iluminada será aberta automaticamente em seu navegador. Dentro do aplicativo da web você encontrará duas páginas na barra lateral: