Загрузка AI OCR - Загрузка исходного кода AI OCR

AI OCR

AI Исходный код

1.0.0

Скачать

AI-Optical-Character-Recognition (AI-OCR): извлечение данных из изображений

Этот репозиторий представляет собой внутренний код инструмента, с помощью которого вы можете извлекать данные из изображений с помощью визуальных LLM. Код внешнего интерфейса (с использованиемstreamlit) можно найти здесь: AI-OCR-Frotend.

Установка

Чтобы использовать инструмент AI-OCR, лучше всего установить этот репозиторий для серверной части, а также для внешнего репозитория, т. е. выполнить следующие шаги:

Клонировать этот репозиторий для серверной части

git clone https://github.com/jWinman91/AI-OCR.git
cd ai-ocr

Установите необходимые зависимости для бэкэнда:

pip install -r requirements.txt

Извлеките и запустите файл Docker Coachdb с помощью следующей команды:

docker run -e COUCHDB_USER=admin -e COUCHDB_PASSWORD=JensIsCool -p 5984:5984 -d --name config_db couchdb:latest

Клонировать внешний репозиторий

git clone https://github.com/jWinman91/AI-OCR-Frontend.git
cd ai-ocr-frondend

Установите необходимые зависимости для фронтенда:

pip install -r requirements.txt

Использование

Затем вы можете запустить бэкэнд, выполнив:

python app.py $IP_ADDRESS

Убедитесь, что Docker-контейнер для базы данных Coachdb запущен.

Поскольку серверная часть использует fastapi, теперь вы можете опробовать его через документацию fastapi, перейдя по адресу $IP_ADDRESS:5000/docs .

Но вы также можете запустить интерфейс прямо сейчас, выполнив:

chmod +x start_up.sh
./start_up.sh

из клонированного репозитория внешнего интерфейса.

В вашем браузере автоматически откроется окно с потоковой подсветкой. В веб-приложении вы найдете две страницы на боковой панели:

AI-OCR: веб-страница для запуска фактического оптического распознавания символов.
Конфигурации моделей: дополнительная страница для настройки моделей (например, ChatGPT, Llava,...).