Этот репозиторий представляет собой внутренний код инструмента, с помощью которого вы можете извлекать данные из изображений с помощью визуальных LLM. Код внешнего интерфейса (с использованиемstreamlit) можно найти здесь: AI-OCR-Frotend.
Чтобы использовать инструмент AI-OCR, лучше всего установить этот репозиторий для серверной части, а также для внешнего репозитория, т. е. выполнить следующие шаги:
git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr
pip install -r requirements.txt
docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest
git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend
pip install -r requirements.txt
Затем вы можете запустить бэкэнд, выполнив:
python app.py $IP_ADDRESS
Убедитесь, что Docker-контейнер для базы данных Coachdb запущен.
Поскольку серверная часть использует fastapi, теперь вы можете опробовать его через документацию fastapi, перейдя по адресу $IP_ADDRESS:5000/docs
.
Но вы также можете запустить интерфейс прямо сейчас, выполнив:
chmod +x start_up.sh
./start_up.sh
из клонированного репозитория внешнего интерфейса.
В вашем браузере автоматически откроется окно с потоковой подсветкой. В веб-приложении вы найдете две страницы на боковой панели: