tansyqinyrproj
Projet de traitement d'images numériques
1. Liste des fonctions
- L'OCR extrait les informations textuelles des images de cartes d'identité
- Migration de style : Bonbon, Ciel étoilé, Picasso, Muse, Mosaïque, La Grande Vague de Kanagawa, Dada Attention, Cri, Plume
- Fonctions de base : 39 au total. Bruit sel et poivre, lissage moyen, lissage médian, lissage gaussien ; netteté de l'image - opérateur laplacien, netteté de l'image - direction horizontale de l'opérateur Sobel, netteté de l'image - direction verticale de l'opérateur Sobel, utiliser bilinéaire Développez la méthode d'interpolation, déplacez l'image de 30 pixels vers le à gauche, 50 pixels vers le bas, faites pivoter de 45 degrés, le facteur d'échelle est de 1, convertissez en niveaux de gris, convertissez en niveaux de gris puis binarisez - méthode de seuil global, Égalisation de l'histogramme, histogramme en niveaux de gris, transformation affine, transformation de perspective, retournement d'image, RVB vers HSV, HSV obtient H, HSV obtient S, HSV obtient V, RVB obtient B, RVB obtient G, RVB obtient R, retournement horizontal, retournement vertical, diagonale mise en miroir, opération d'ouverture d'image, opération de fermeture d'image, érosion, expansion, opération de chapeau haut de forme, opération de chapeau inférieur, HoughLinesP réalise la détection de ligne, la détection de bord Canny, l'amélioration de l'image, L'opérateur Roberts extrait les bords de l'image, l'opérateur Prewitt extrait les bords de l'image, l'opérateur laplacien extrait les bords de l'image et l'extraction des bords LoG.
2. Pile technologique
2.1 Développement front-end
- Principaux langages de développement : HTML, CSS, JavaScript
- Framework front-end : Vue.js
- Échafaudage : Vue-CLI
- Interface utilisateur : ElementUI
- Editeur de code : IntelliJ IDEA
- Échange de données : axios
- Gestionnaire de packages front-end : npm
- Outil de build front-end : Webpack
2.2 Développement back-end
- Langage de développement principal : Python
- Framework back-end : Flask
- Editeur de code : IntelliJ IDEA
- Système de contrôle de version : Git
- Outils inter-domaines : flask-cors
3. Fonctionnement du projet
3.1 Installer les dépendances
- Tout d'abord, vous devez installer tesseract localement. Le projet utilise la version tesseractV4.0 et utilise
tesseract-ocr-setup-4.00.00dev.exe
pour l'installer localement. PS D:xxx> tesseract -v
tesseract 4.00.00alpha
...
- téléchargement du pack de langue tesseract.
- Téléchargez chi_sim.traineddata. Enregistrez le fichier
chi_sim.traineddata
dans /安装路径/Tesseract-OCR/tessdata
.
3.2 Modifier la configuration
Modifiez les informations de configuration dans le fichier config.py
.
3.3 Fonctionnement frontal
Tout d’abord, entrez le dossier firstend dans le terminal et entrez les commandes suivantes pour démarrer.
# install dependency
npm install
# develop
npm run dev
Si le démarrage échoue, essayez de supprimer le dossier node_modules
et le fichier package-lock.json
et répétez les étapes ci-dessus. Si cela échoue toujours : essayez de réduire la version locale de node.js, j'utilise v12.17.0
.
3.4 Opérations back-end
exécutez app.py
dans Pycharm ou d'autres idées.
4. Affichage des fonctions
Il existe des fonctions légèrement plus basiques, qui sont présentées en images dans le document du projet.
4.1 L'OCR extrait les informations textuelles des images de cartes d'identité
Transfert de styles :
bonbons
ciel étoilé
Picasso
muse
mosaïque
La Grande Vague au large de Kanagawa
Dadaïsme
crier
plume