Chinois • Anglais • Japonais
Logiciel OCR hors ligne gratuit, open source et compatible avec les lots
Applicable à Windows7 x64, Linux x64
Gratuit : Tout le code de ce projet est open source et entièrement gratuit.
Pratique : décompressez et utilisez, exécutez hors ligne, aucun réseau requis.
Efficace : il est livré avec un moteur OCR hors ligne très efficace et des bibliothèques de reconnaissance multilingue intégrées.
Flexible : prend en charge les méthodes d'appel externes telles que la ligne de commande et l'interface HTTP.
Fonctions : Capture d'écran OCR / Batch OCR / Reconnaissance PDF / QR code / Reconnaissance de formule
Reconnaissance de capture d'écran
Analyse de composition - identifiez différents types de types et affichez le texte dans le bon ordre
Identification du lot
Ignorer la zone - exclure le texte du filigrane de la capture d'écran
Le code QR prend en charge la numérisation ou la génération d'images de code QR
La reconnaissance de documents extrait le texte des numérisations PDF ou les convertit en PDF consultables à deux couches
Paramètres globaux
Appel en ligne de commande
Interface HTTP
Construire le projet (Windows, Linux)
Développeurs, assurez-vous de lire les projets de construction.
Les liens de version suivants sont maintenus depuis longtemps et permettent de télécharger des versions stables.
Lanzoul Cloud https://hiroi-sora.lanzoul.com/s/umi-ocr (recommandation domestique, pas d'inscription/vitesse illimitée)
GitHub https://github.com/hiroi-sora/Umi-OCR/releases/latest
Source Forge https://sourceforge.net/projects/umi-ocr
Scoop est un programme d'installation en ligne de commande sous Windows permettant de gérer facilement plusieurs applications. Vous pouvez d'abord installer Scoop, puis utiliser les instructions suivantes pour installer Umi-OCR
:
Ajouter un compartiment d' extras
:
scoop bucket add extras
(Facultatif 1) Installez Umi-OCR (livré avec le moteur Rapid-OCR
, bonne compatibilité) :
scoop install extras/umi-ocr
(Facultatif 2) Installez Umi-OCR (livré avec le moteur Paddle-OCR
, légèrement plus rapide) :
scoop install extras/umi-ocr-paddle
N'installez pas les deux en même temps, les raccourcis pourraient être écrasés. Mais vous pouvez importer des plug-ins supplémentaires et passer à différents moteurs OCR à tout moment.
Le package de version logicielle est téléchargé sous forme .7z
ou de package auto-extractible .7z.exe
. Les packages auto-extractibles peuvent décompresser des fichiers sur des ordinateurs sur lesquels aucun logiciel de compression n'est installé.
Ce logiciel ne nécessite aucune installation. Après décompression, cliquez sur Umi-OCR.exe
pour démarrer le programme.
Si vous rencontrez des problèmes, veuillez soumettre un problème et je ferai de mon mieux pour vous aider.
L'interface prise en charge par Umi-OCR est en plusieurs langues. Lorsque vous ouvrez le logiciel pour la première fois, la langue change automatiquement en fonction des paramètres système de votre ordinateur.
Si vous devez changer de langue manuellement, veuillez vous référer à la figure ci-dessous,全局设置
→语言/Language
.
Umi-OCR v2 se compose d'une série d' onglets flexibles et faciles à utiliser. Vous pouvez ouvrir les onglets requis selon vos préférences.
Vous pouvez faire basculer la fenêtre vers le haut dans le coin supérieur gauche de la barre d'onglets. Le coin supérieur droit peut verrouiller la languette pour éviter de la fermer accidentellement lors d'une utilisation quotidienne.
Capture d'écran OCR : Après avoir ouvert cette page, vous pouvez utiliser les touches de raccourci pour évoquer la capture d'écran et reconnaître le texte dans l'image.
Dans la barre d'aperçu de l'image à gauche, vous pouvez directement sélectionner et copier avec la souris.
Dans la colonne des enregistrements d'identification à droite, le texte peut être modifié et plusieurs enregistrements peuvent être sélectionnés et copiés.
Il prend également en charge la copie d'images ailleurs et leur collage dans Umi-OCR pour les reconnaître.
À propos de la fonction de reconnaissance de formule
À propos du post-traitement du texte OCR - solution d'analyse de composition : La composition et l'ordre des résultats OCR peuvent être organisés pour rendre le texte plus adapté à la lecture et à l'utilisation. Forfait par défaut :
多栏-按自然段换行
: convient à la plupart des scénarios, reconnaît automatiquement la disposition multi-colonnes et retourne à la ligne selon les règles de paragraphe naturel.
多栏-总是换行
: chaque instruction est enveloppée.
多栏-无换行
: force la fusion de toutes les instructions sur la même ligne.
单栏-按自然段换行
/总是换行
/无换行
: similaire à ce qui précède, mais ne fait pas de distinction entre les dispositions à plusieurs colonnes.
单栏-保留缩进
: convient à l'analyse des captures d'écran de code, en conservant l'indentation au début de la ligne et les espaces dans la ligne.
不做处理
: la sortie originale du moteur OCR, avec des sauts de ligne pour chaque instruction par défaut.
Les solutions ci-dessus peuvent gérer automatiquement la composition horizontale et verticale (de droite à gauche). (Le texte vertical nécessite également la prise en charge du moteur OCR lui-même)
Batch OCR : Cette page est utilisée pour importer par lots des images locales pour la reconnaissance.
Formats pris en charge : jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff
.
Formats pris en charge pour enregistrer les résultats de la reconnaissance : txt, jsonl, md, csv(Excel)
.
Comme l'OCR de capture d'écran, il prend en charge la fonction文本后处理
pour organiser la mise en page et l'ordre du texte OCR.
Il n'y a pas de limite supérieure quant au nombre et des centaines d'images peuvent être importées en même temps pour des tâches.
Prend en charge l'arrêt/veille automatique une fois la tâche terminée.
Si vous souhaitez reconnaître des images longues ou grandes avec des pixels surdimensionnés, veuillez ajuster : paramètres de page → reconnaissance de texte → limiter la longueur du côté de l'image → [Augmenter la valeur] .
Possède une fonctionnalité spéciale忽略区域
.
À propos du post-traitement du texte OCR - Ignorer les zones : Une fonction spéciale dans l'OCR par lots, adaptée pour exclure le texte indésirable dans les images.
L'éditeur de zone ignorée peut être saisi dans les paramètres de la colonne de droite de la page d'identification du lot.
Comme dans l'exemple ci-dessus, il y a plusieurs filigranes/LOGO dans les coins supérieur et inférieur droit de l'image. Si de telles images sont reconnues par lots, les filigranes interféreront avec les résultats de la reconnaissance.
Maintenez le bouton droit enfoncé et dessinez plusieurs cases rectangulaires. Le texte dans ces zones sera ignoré dans la mission.
Veuillez essayer de rendre le cadre rectangulaire aussi grand que possible pour couvrir complètement tous les emplacements possibles du filigrane.
Notez que seul le bloc de texte entier dans la zone de région ignorée (et non les caractères individuels) sera ignoré. Comme le montre la figure ci-dessous, le rectangle sombre avec une bordure jaune est une zone ignorée. Alors seul key_mouse
sera ignoré. Les deux blocs de texte pubsub_connector.py
et pubsub_service.py
sont conservés.
Identification des documents :
Formats pris en charge : pdf, xps, epub, mobi, fb2, cbz
.
Effectuez une OCR sur des documents numérisés ou extrayez le texte original. Peut être exporté sous forme de PDF consultable à deux couches .
Prend en charge la définition des zones d'ignorance , qui peuvent être utilisées pour exclure le texte d'en-tête et de pied de page.
Peut être configuré pour s'arrêter/hiberner automatiquement une fois la tâche terminée.
Scanner le code :
Prenez une capture d'écran/collez/faites glisser dans une image locale et lisez le code QR et le code-barres qu'il contient.
Prend en charge plusieurs codes pour une image.
Prend en charge 19 protocoles, comme suit :
Aztec
, Codabar
, Code128
, Code39
, Code93
, DataBar
, DataBarExpanded
, DataMatrix
, EAN13
, EAN8
, ITF
, LinearCodes
, MatrixCodes
, MaxiCode
, MicroQRCode
, PDF417
, QRCode
, UPCA
, UPCE
Générer du code :
Saisissez du texte et générez une image de code QR.
Prend en charge 19 protocoles et niveaux de correction d'erreurs et d'autres paramètres.
Paramètres globaux : Ici vous pouvez ajuster les paramètres globaux du logiciel. Les fonctions couramment utilisées sont les suivantes :
Ajoutez des raccourcis ou définissez le démarrage automatique au démarrage en un seul clic.
Changer la langue de l'interface. Umi prend en charge le chinois traditionnel, l'anglais, le japonais et d'autres langues.
Changer de thème d'interface. Umi a plusieurs thèmes clairs/obscurs.
Ajustez la taille et la police du texte de l'interface .
Changer le plug-in OCR.
Renderer : L'interface du logiciel prend en charge le rendu accéléré par la carte graphique par défaut. Si les captures d'écran scintillent et que l'interface utilisateur est mal alignée sur votre ordinateur, veuillez ajuster界面和外观
→渲染器
, essayez de passer à un schéma de rendu différent ou désactivez l'accélération matérielle.
Manuel de ligne de commande
Manuel de l'interface HTTP
Merci aux traducteurs suivants qui ont contribué au travail de traduction de localisation à Umi-OCR : (listés sans ordre particulier)
traducteur | Langue de contribution |
---|---|
Bob | Anglais, chinois traditionnel, japonais |
Qing Zheng Gao | Anglais, chinois traditionnel |
Weng, Chia-Ling | Anglais, chinois traditionnel |
Linzow | Anglais, chinois traditionnel |
Éric Guo | Anglais |
steven0081 | Anglais |
Marcos Ier | Anglais |
prune7x | Chinois traditionnel |
Hugoalh | Chinois traditionnel |
ドコモ光 | japonais |
Yang Peng | Portugais |
S'il y a des informations incorrectes ou du personnel manquant, veuillez répondre dans cette discussion.
Ce projet utilise la plateforme en ligne Weblate : Umi-OCR pour la collaboration en matière de traduction de localisation. Nous invitons tout utilisateur à participer au travail de traduction, vous pouvez relire, compléter les langues existantes ou ajouter de nouvelles langues.
Entrepôt principal ?
Bibliothèque de plug-ins
Exécution Windows
Exécution Linux
Le suffixe **
indique le contenu contenu dans cet entrepôt (主仓库
).
Umi-OCR ├─ Umi-OCR.exe ├─ umi-ocr.sh └─ UmiOCR-data ├─ main.py ** ├─ version.py ** ├─ qt_res ** │ └─ 项目qt资源,包括图标和qml源码 ├─ py_src ** │ └─ 项目python源码 ├─ plugins │ └─ 插件 └─ i18n ** └─ 翻译文件
Moteurs OCR hors ligne pris en charge :
PaddleOCR-json
RapidOCR-json
Cadre d'environnement d'exécution :
Version personnalisée de PyStand
Veuillez vous référer aux instructions au début du journal des modifications.
Veuillez accéder à l'entrepôt suivant pour terminer le déploiement de l'environnement de développement/exploitation de la plate-forme correspondante.
Fenêtres
Linux
Le projet Umi-OCR est principalement développé et maintenu par l'auteur hiroi-sora pendant son temps libre. Si vous aimez ce logiciel, sponsorisez-le.
Les utilisateurs nationaux peuvent parrainer des auteurs via iPower.
Cadre d'onglet.
Contrôleur API OCR.
Contrôleur de tâches OCR.
Le gestionnaire de thèmes prend en charge le changement de thème clair/sombre.
Implémenter l'OCR par lots .
Implémentez l'OCR de capture d'écran .
Mécanisme de touche de raccourci.
Menu de la barre d'état système.
Post-traitement des blocs de texte (optimisation de la composition).
Nettoyage de la mémoire du moteur.
L'interface du logiciel est disponible en plusieurs langues.
Mode ligne de commande.
Compatible Win7.
Format de sortie Excel (csv).
Esc
interrompt l'opération de capture d'écran
Fichiers de thème externes
Changement de police
chargement de l'animation
Ignorez la zone.
Reconnaissance du code QR.
La fenêtre d'aperçu de l'image de la page de reconnaissance par lots.
Reconnaissance PDF.
Appelez le navigateur d'images local pour ouvrir l'image. #335
Répétez la dernière capture d'écran. #357
Correction de bug : problème de compatibilité de reconnaissance de documents dans le système Windows 7.
L'interface HTTP/ligne de commande ajoute une fonction de reconnaissance/génération de code QR. (#423)
Documentation pour l'interface du code QR.
Portage sur plateforme Linux.
Interface de reconnaissance de documents HTTP.
Ce sont des fonctions attendues. Les interfaces ont été réservées au début du développement et seront progressivement mises en œuvre à long terme.
Cependant, en raison des conditions réelles au cours du développement, la conception fonctionnelle peut être modifiée et des fonctions peuvent être ajoutées ou supprimées.
Refactorisez le mécanisme de plug-in sous-jacent.
Plug-in API OCR en ligne.
Plug-in indépendant de reconnaissance de formules mathématiques.
L'onglet "Formule mathématique" permet une reconnaissance indépendante des formules mathématiques/un rendu Latex.
Vérifiez le mécanisme de mise à jour.
Modules de post-traitement de texte autres que l'analyse de composition (tels que la préservation des nombres, la conversion de caractères demi-chasse, la correction d'erreurs de texte).
Les fonctions clés de l'interface ajoutent des méthodes de déclenchement d'événements.
OCR hors ligne basé sur GPU.
Traduction d'images
Traduction hors ligne.
Reconnaissance de zone fixe.
Reconnaissez les images de tableaux et exportez-les vers Excel.
Système d'enregistrement de l'historique.
Compatible avec MacOS/Ubuntu et autres plateformes.