tansyqinyrproj
Projekt zur digitalen Bildverarbeitung
1. Funktionsliste
- OCR extrahiert Textinformationen aus Ausweisbildern
- Stilmigration: Süßigkeiten, Sternenhimmel, Picasso, Muse, Mosaik, Die große Welle vor Kanagawa, Dada Achtung, Schrei, Feder
- Grundfunktionen: insgesamt 39. Salz- und Pfefferrauschen, mittlere Glättung, mittlere Glättung, Gaußsche Glättung; Bildschärfung – Laplace-Operator, Bildschärfung – horizontale Richtung des Sobel-Operators, Bildschärfung – vertikale Richtung des Sobel-Operators, Verwendung der bilinearen Interpolationsmethode, Verschieben des Bildes um 30 Pixel links, 50 Pixel nach unten, um 45 Grad drehen, der Skalierungsfaktor ist 1, in Graustufen konvertieren, in Graustufen konvertieren und dann binärisieren – globale Schwellenwertmethode, Histogrammausgleich, Graustufenhistogramm, affine Transformation, perspektivische Transformation, Bildspiegelung, RGB zu HSV, HSV bekommt H, HSV bekommt S, HSV bekommt V, RGB bekommt B, RGB bekommt G, RGB bekommt R, horizontale Spiegelung, vertikale Spiegelung, Diagonale Spiegelung, Bildöffnungsoperation, Bildschließungsoperation, Erosion, Erweiterung, Top-Hat-Operation, Bottom-Hat-Operation, HoughLinesP realisiert Linienerkennung, Canny-Edge-Erkennung, Bildverbesserung, Der Roberts-Operator extrahiert Bildkanten, der Prewitt-Operator extrahiert Bildkanten, der Laplace-Operator extrahiert Bildkanten und der LoG-Operator extrahiert Bildkanten.
2. Technologie-Stack
2.1 Front-End-Entwicklung
- Hauptentwicklungssprachen: HTML, CSS, JavaScript
- Front-End-Framework: Vue.js
- Gerüst: Vue-CLI
- Benutzeroberfläche: ElementUI
- Code-Editor: IntelliJ IDEA
- Datenaustausch: Axios
- Front-End-Paketmanager: npm
- Front-End-Build-Tool: Webpack
2.2 Backend-Entwicklung
- Hauptentwicklungssprache: Python
- Backend-Framework: Flask
- Code-Editor: IntelliJ IDEA
- Versionskontrollsystem: Git
- Domänenübergreifende Tools: flask-cors
3. Projektbetrieb
3.1 Abhängigkeiten installieren
- Zuerst müssen Sie Tesseract lokal installieren. Das Projekt verwendet die Version tesseractV4.0 und verwendet
tesseract-ocr-setup-4.00.00dev.exe
um es lokal zu installieren. PS D:xxx> tesseract -v
tesseract 4.00.00alpha
...
- Tesseract-Sprachpaket herunterladen.
- Laden Sie chi_sim.traineddata herunter. Speichern Sie die Datei
chi_sim.traineddata
im /安装路径/Tesseract-OCR/tessdata
.
3.2 Konfiguration ändern
Ändern Sie die Konfigurationsinformationen in der Datei config.py
.
3.3 Front-End-Bedienung
Geben Sie zunächst den Ordner „firstend“ im Terminal ein und geben Sie zum Starten die folgenden Befehle ein.
# install dependency
npm install
# develop
npm run dev
Wenn der Start fehlschlägt, versuchen Sie, den Ordner node_modules
und die Datei package-lock.json
zu löschen und führen Sie die oben genannten Schritte erneut aus. Wenn es immer noch fehlschlägt: Versuchen Sie, die lokale Version von node.js zu verringern. Ich verwende v12.17.0
.
3.4 Backend-Operationen
Führen Sie app.py
in Pycharm oder anderen Ideen aus.
4. Funktionsanzeige
Es gibt etwas grundlegendere Funktionen, die im Projektdokument in Bildern dargestellt sind.
4.1 OCR extrahiert Textinformationen aus Ausweisbildern
Stilübertragung:
Süßigkeiten
Sternenhimmel
Picasso
Muse
Mosaik
Die große Welle vor Kanagawa
Dadaismus
schreien
Feder