Тансыкинырпроект
Проект цифровой обработки изображений
1. Список функций
- OCR извлекает текстовую информацию из изображений удостоверений личности
- Миграция стилей: «Конфеты», «Звездное небо», «Пикассо», «Муза», «Мозаика», «Большая волна в Канагаве», «Внимание дадаизма», «Крик», «Перо».
- Базовые функции: всего 39. Шум соли и перца, сглаживание по среднему, медианное сглаживание, сглаживание по Гауссу; резкость изображения - оператор Лапласа, повышение резкости изображения - оператор Собеля по горизонтали, повышение резкости изображения - оператор Собеля по вертикали, использовать билинейный. Разверните метод интерполяции, переместите изображение на 30 пикселей в сторону влево, на 50 пикселей вниз, повернуть на 45 градусов, коэффициент масштабирования равен 1, преобразовать в оттенки серого, преобразовать в оттенки серого, а затем бинаризировать - метод глобального порога, Выравнивание гистограммы, гистограмма в оттенках серого, аффинное преобразование, перспективное преобразование, переворот изображения, RGB в HSV, HSV получает H, HSV получает S, HSV получает V, RGB получает B, RGB получает G, RGB получает R, горизонтальное отражение, вертикальное отражение, диагональ зеркальное отображение, операция открытия изображения, операция закрытия изображения, эрозия, расширение, операция «цилиндр», операция «нижний шляпа», HoughLinesP реализует обнаружение линий, обнаружение края Канни, улучшение изображения, Оператор Робертса извлекает края изображения, оператор Превитта извлекает края изображения, оператор Лапласа извлекает края изображения и извлекает края LoG.
2. Стек технологий
2.1 Фронтенд-разработка
- Основные языки разработки: HTML, CSS, JavaScript.
- Фронтенд-фреймворк: Vue.js.
- Поддержка: Vue-CLI
- Пользовательский интерфейс: ЭлементUI
- Редактор кода: IntelliJ IDEA
- Обмен данными: аксиомы
- Интерфейсный менеджер пакетов: npm
- Инструмент сборки внешнего интерфейса: Webpack
2.2 Бэкэнд-разработка
- Основной язык разработки: Python.
- Бэкэнд-фреймворк: Flask
- Редактор кода: IntelliJ IDEA
- Система контроля версий: Git.
- Междоменные инструменты: flask-cors
3. Эксплуатация проекта
3.1 Установка зависимостей
- Во-первых, вам необходимо установить tesseract локально. В проекте используется версия tesseractV4.0 и установочный пакет
tesseract-ocr-setup-4.00.00dev.exe
для его локальной установки. PS D:xxx> tesseract -v
tesseract 4.00.00alpha
...
- Загрузка языкового пакета tesseract.
- Загрузите chi_sim.traineddata. Сохраните файл
chi_sim.traineddata
по /安装路径/Tesseract-OCR/tessdata
.
3.2 Изменение конфигурации
Измените информацию о конфигурации в файле config.py
.
3.3 Фронтальная работа
Сначала войдите в первую папку в терминале и введите следующие команды для запуска.
# install dependency
npm install
# develop
npm run dev
Если запуск не удался, попробуйте удалить папку node_modules
и файл package-lock.json
и снова выполните описанные выше действия. Если все равно не получается: попробуйте понизить локальную версию node.js, я использую v12.17.0
.
3.4 Серверные операции
запустите app.py
в Pycharm или других идеях.
4. Функциональный дисплей
Есть чуть более базовые функции, которые показаны на картинках в проектном документе.
4.1 OCR извлекает текстовую информацию из изображений удостоверений личности
Передача стиля:
конфеты
звездное небо
Пикассо
муза
мозаика
Большая волна у Канагавы
дадаизм
кричать
перо