Download AI OCR - Download do código-fonte AI OCR

AI OCR

Código-Fonte de IA

1.0.0

Baixar

AI-Optical-Character-Recognition (AI-OCR): Extraindo dados de imagens

Este repositório é o código backend de uma ferramenta com a qual você pode extrair dados de imagens usando LLMs visuais. O código frontend (usando streamlit) pode ser encontrado aqui: AI-OCR-Frotend.

Índice

Instalação
Uso
Exemplo
Licença

Instalação

Para usar a ferramenta AI-OCR, é melhor instalar este repositório para o backend, bem como o repositório frontend, ou seja, seguir estes passos:

Clone este repositório para o backend

git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr

Instale as dependências necessárias para o back-end:

pip install -r requirements.txt

Extraia e execute o arquivo docker coachdb com o seguinte comando:

docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest

Clone o repositório front-end

git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend

Instale as dependências necessárias para o frontend:

pip install -r requirements.txt

Uso

Você pode então iniciar o backend executando:

python app.py $IP_ADDRESS

Certifique-se de que o contêiner docker para o coachdb esteja em execução.

Como o back-end usa fastapi, agora você pode experimentá-lo por meio dos documentos do fastapi acessando $IP_ADDRESS:5000/docs .

Mas você também pode iniciar o frontend agora executando:

chmod +x start_up.sh
./start_up.sh

de dentro do repositório front-end clonado.

Uma janela iluminada será aberta automaticamente em seu navegador. Dentro do aplicativo da web você encontrará duas páginas na barra lateral:

AI-OCR: página da Web para executar o reconhecimento óptico de caracteres real
Configurações do modelo: Subpágina para configuração dos modelos (ex. ChatGPT, Llava, ...)