Téléchargement Umi OCR - Téléchargement du code source Umi OCR

Umi OCR

Autre code source

v2.1.4

Télécharger

Chinois • Anglais • Japonais

QQ浏览器截图20241118145224.png

Outil de reconnaissance de texte Umi-OCR

Mode d'emploi • Adresse de téléchargement • Journal de mise à jour • Signaler un bug

Logiciel OCR hors ligne gratuit, open source et compatible avec les lots
_{Applicable à Windows7 x64, Linux x64}

Gratuit : Tout le code de ce projet est open source et entièrement gratuit.
Pratique : décompressez et utilisez, exécutez hors ligne, aucun réseau requis.
Efficace : il est livré avec un moteur OCR hors ligne très efficace et des bibliothèques de reconnaissance multilingue intégrées.
Flexible : prend en charge les méthodes d'appel externes telles que la ligne de commande et l'interface HTTP.
Fonctions : Capture d'écran OCR / Batch OCR / Reconnaissance PDF / QR code / Reconnaissance de formule

Table des matières

Reconnaissance de capture d'écran

Analyse de composition - identifiez différents types de types et affichez le texte dans le bon ordre

Identification du lot

Ignorer la zone - exclure le texte du filigrane de la capture d'écran

Le code QR prend en charge la numérisation ou la génération d'images de code QR
La reconnaissance de documents extrait le texte des numérisations PDF ou les convertit en PDF consultables à deux couches
Paramètres globaux
Appel en ligne de commande
Interface HTTP
Construire le projet (Windows, Linux)

Utiliser le code source

Développeurs, assurez-vous de lire les projets de construction.

Téléchargez la distribution

Les liens de version suivants sont maintenus depuis longtemps et permettent de télécharger des versions stables.

Lanzoul Cloud https://hiroi-sora.lanzoul.com/s/umi-ocr (recommandation domestique, pas d'inscription/vitesse illimitée)
GitHub https://github.com/hiroi-sora/Umi-OCR/releases/latest
Source Forge https://sourceforge.net/projects/umi-ocr

• Scoop Installer (cliquez pour agrandir)

Scoop est un programme d'installation en ligne de commande sous Windows permettant de gérer facilement plusieurs applications. Vous pouvez d'abord installer Scoop, puis utiliser les instructions suivantes pour installer Umi-OCR :

Ajouter un compartiment d' extras :

scoop bucket add extras

(Facultatif 1) Installez Umi-OCR (livré avec le moteur Rapid-OCR , bonne compatibilité) :

scoop install extras/umi-ocr

(Facultatif 2) Installez Umi-OCR (livré avec le moteur Paddle-OCR , légèrement plus rapide) :

scoop install extras/umi-ocr-paddle

N'installez pas les deux en même temps, les raccourcis pourraient être écrasés. Mais vous pouvez importer des plug-ins supplémentaires et passer à différents moteurs OCR à tout moment.

Commencer

Le package de version logicielle est téléchargé sous forme .7z ou de package auto-extractible .7z.exe . Les packages auto-extractibles peuvent décompresser des fichiers sur des ordinateurs sur lesquels aucun logiciel de compression n'est installé.

Ce logiciel ne nécessite aucune installation. Après décompression, cliquez sur Umi-OCR.exe pour démarrer le programme.

Si vous rencontrez des problèmes, veuillez soumettre un problème et je ferai de mon mieux pour vous aider.

langue de l'interface

L'interface prise en charge par Umi-OCR est en plusieurs langues. Lorsque vous ouvrez le logiciel pour la première fois, la langue change automatiquement en fonction des paramètres système de votre ordinateur.

Si vous devez changer de langue manuellement, veuillez vous référer à la figure ci-dessous,全局设置→语言/Language .

page à onglet

Umi-OCR v2 se compose d'une série d' onglets flexibles et faciles à utiliser. Vous pouvez ouvrir les onglets requis selon vos préférences.

Vous pouvez faire basculer la fenêtre vers le haut dans le coin supérieur gauche de la barre d'onglets. Le coin supérieur droit peut verrouiller la languette pour éviter de la fermer accidentellement lors d'une utilisation quotidienne.

Capture d'écran ROC

Capture d'écran OCR : Après avoir ouvert cette page, vous pouvez utiliser les touches de raccourci pour évoquer la capture d'écran et reconnaître le texte dans l'image.

Dans la barre d'aperçu de l'image à gauche, vous pouvez directement sélectionner et copier avec la souris.
Dans la colonne des enregistrements d'identification à droite, le texte peut être modifié et plusieurs enregistrements peuvent être sélectionnés et copiés.
Il prend également en charge la copie d'images ailleurs et leur collage dans Umi-OCR pour les reconnaître.
À propos de la fonction de reconnaissance de formule

Post-traitement du texte

À propos du post-traitement du texte OCR - solution d'analyse de composition : La composition et l'ordre des résultats OCR peuvent être organisés pour rendre le texte plus adapté à la lecture et à l'utilisation. Forfait par défaut :

多栏-按自然段换行: convient à la plupart des scénarios, reconnaît automatiquement la disposition multi-colonnes et retourne à la ligne selon les règles de paragraphe naturel.
多栏-总是换行: chaque instruction est enveloppée.
多栏-无换行 : force la fusion de toutes les instructions sur la même ligne.
单栏-按自然段换行/总是换行/无换行: similaire à ce qui précède, mais ne fait pas de distinction entre les dispositions à plusieurs colonnes.
单栏-保留缩进: convient à l'analyse des captures d'écran de code, en conservant l'indentation au début de la ligne et les espaces dans la ligne.
不做处理 : la sortie originale du moteur OCR, avec des sauts de ligne pour chaque instruction par défaut.

Les solutions ci-dessus peuvent gérer automatiquement la composition horizontale et verticale (de droite à gauche). (Le texte vertical nécessite également la prise en charge du moteur OCR lui-même)

ROC par lots

Batch OCR : Cette page est utilisée pour importer par lots des images locales pour la reconnaissance.

Formats pris en charge : jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff .
Formats pris en charge pour enregistrer les résultats de la reconnaissance : txt, jsonl, md, csv(Excel) .
Comme l'OCR de capture d'écran, il prend en charge la fonction文本后处理pour organiser la mise en page et l'ordre du texte OCR.
Il n'y a pas de limite supérieure quant au nombre et des centaines d'images peuvent être importées en même temps pour des tâches.
Prend en charge l'arrêt/veille automatique une fois la tâche terminée.
Si vous souhaitez reconnaître des images longues ou grandes avec des pixels surdimensionnés, veuillez ajuster : paramètres de page → reconnaissance de texte → limiter la longueur du côté de l'image → [Augmenter la valeur] .
Possède une fonctionnalité spéciale忽略区域.

ignorer la zone

À propos du post-traitement du texte OCR - Ignorer les zones : Une fonction spéciale dans l'OCR par lots, adaptée pour exclure le texte indésirable dans les images.

L'éditeur de zone ignorée peut être saisi dans les paramètres de la colonne de droite de la page d'identification du lot.
Comme dans l'exemple ci-dessus, il y a plusieurs filigranes/LOGO dans les coins supérieur et inférieur droit de l'image. Si de telles images sont reconnues par lots, les filigranes interféreront avec les résultats de la reconnaissance.
Maintenez le bouton droit enfoncé et dessinez plusieurs cases rectangulaires. Le texte dans ces zones sera ignoré dans la mission.
Veuillez essayer de rendre le cadre rectangulaire aussi grand que possible pour couvrir complètement tous les emplacements possibles du filigrane.
Notez que seul le bloc de texte entier dans la zone de région ignorée (et non les caractères individuels) sera ignoré. Comme le montre la figure ci-dessous, le rectangle sombre avec une bordure jaune est une zone ignorée. Alors seul key_mouse sera ignoré. Les deux blocs de texte pubsub_connector.py et pubsub_service.py sont conservés.

68747470733a2f2f74757069616e2e6c692f696d616765732f323032342f30352f33302f363635383762663033616531352e706e67.png

Reconnaissance de documents

Identification des documents :

Formats pris en charge : pdf, xps, epub, mobi, fb2, cbz .
Effectuez une OCR sur des documents numérisés ou extrayez le texte original. Peut être exporté sous forme de PDF consultable à deux couches .
Prend en charge la définition des zones d'ignorance , qui peuvent être utilisées pour exclure le texte d'en-tête et de pied de page.
Peut être configuré pour s'arrêter/hiberner automatiquement une fois la tâche terminée.

Code QR

Scanner le code :

Prenez une capture d'écran/collez/faites glisser dans une image locale et lisez le code QR et le code-barres qu'il contient.
Prend en charge plusieurs codes pour une image.
Prend en charge 19 protocoles, comme suit :

Aztec , Codabar , Code128 , Code39 , Code93 , DataBar , DataBarExpanded , DataMatrix , EAN13 , EAN8 , ITF , LinearCodes , MatrixCodes , MaxiCode , MicroQRCode , PDF417 , QRCode , UPCA , UPCE

Générer du code :

Saisissez du texte et générez une image de code QR.
Prend en charge 19 protocoles et niveaux de correction d'erreurs et d'autres paramètres.

Paramètres globaux

Paramètres globaux : Ici vous pouvez ajuster les paramètres globaux du logiciel. Les fonctions couramment utilisées sont les suivantes :

Ajoutez des raccourcis ou définissez le démarrage automatique au démarrage en un seul clic.
Changer la langue de l'interface. Umi prend en charge le chinois traditionnel, l'anglais, le japonais et d'autres langues.
Changer de thème d'interface. Umi a plusieurs thèmes clairs/obscurs.
Ajustez la taille et la police du texte de l'interface .
Changer le plug-in OCR.
Renderer : L'interface du logiciel prend en charge le rendu accéléré par la carte graphique par défaut. Si les captures d'écran scintillent et que l'interface utilisateur est mal alignée sur votre ordinateur, veuillez ajuster界面和外观→渲染器, essayez de passer à un schéma de rendu différent ou désactivez l'accélération matérielle.

Interface d'appel :

Manuel de ligne de commande
Manuel de l'interface HTTP

Traduction de localisation de logiciels :

Merci aux traducteurs suivants qui ont contribué au travail de traduction de localisation à Umi-OCR : (listés sans ordre particulier)

traducteur	Langue de contribution
Bob	Anglais, chinois traditionnel, japonais
Qing Zheng Gao	Anglais, chinois traditionnel
Weng, Chia-Ling	Anglais, chinois traditionnel
Linzow	Anglais, chinois traditionnel
Éric Guo	Anglais
steven0081	Anglais
Marcos Ier	Anglais
prune7x	Chinois traditionnel
Hugoalh	Chinois traditionnel
ドコモ光	japonais
Yang Peng	Portugais

S'il y a des informations incorrectes ou du personnel manquant, veuillez répondre dans cette discussion.

Ce projet utilise la plateforme en ligne Weblate : Umi-OCR pour la collaboration en matière de traduction de localisation. Nous invitons tout utilisateur à participer au travail de traduction, vous pouvez relire, compléter les langues existantes ou ajouter de nouvelles langues.

À propos de la structure du projet

Chaque entrepôt :

Entrepôt principal ?
Bibliothèque de plug-ins
Exécution Windows
Exécution Linux

Structure d'ingénierie :

Le suffixe ** indique le contenu contenu dans cet entrepôt (主仓库).

Umi-OCR
├─ Umi-OCR.exe
├─ umi-ocr.sh
└─ UmiOCR-data
   ├─ main.py **
   ├─ version.py **
   ├─ qt_res **
   │  └─ 项目qt资源，包括图标和qml源码
   ├─ py_src **
   │  └─ 项目python源码
   ├─ plugins
   │  └─ 插件
   └─ i18n **
      └─ 翻译文件

Moteurs OCR hors ligne pris en charge :

PaddleOCR-json
RapidOCR-json

Cadre d'environnement d'exécution :

Version personnalisée de PyStand

Construire un projet

Étape 0 : (Facultatif) Forkez ce projet

Étape 1 : Téléchargez le code

Veuillez vous référer aux instructions au début du journal des modifications.

Prochaines étapes :

Veuillez accéder à l'entrepôt suivant pour terminer le déploiement de l'environnement de développement/exploitation de la plate-forme correspondante.

Fenêtres
Linux

parrainer

Le projet Umi-OCR est principalement développé et maintenu par l'auteur hiroi-sora pendant son temps libre. Si vous aimez ce logiciel, sponsorisez-le.

Les utilisateurs nationaux peuvent parrainer des auteurs via iPower.

Histoire des étoiles

Journal des modifications

plan de développement

travail terminé

Cadre d'onglet.
Contrôleur API OCR.
Contrôleur de tâches OCR.
Le gestionnaire de thèmes prend en charge le changement de thème clair/sombre.
Implémenter l'OCR par lots .
Implémentez l'OCR de capture d'écran .
Mécanisme de touche de raccourci.
Menu de la barre d'état système.
Post-traitement des blocs de texte (optimisation de la composition).
Nettoyage de la mémoire du moteur.
L'interface du logiciel est disponible en plusieurs langues.
Mode ligne de commande.
Compatible Win7.
Format de sortie Excel (csv).
Esc interrompt l'opération de capture d'écran
Fichiers de thème externes
Changement de police
chargement de l'animation
Ignorez la zone.
Reconnaissance du code QR.
La fenêtre d'aperçu de l'image de la page de reconnaissance par lots.
Reconnaissance PDF.
Appelez le navigateur d'images local pour ouvrir l'image. #335
Répétez la dernière capture d'écran. #357
Correction de bug : problème de compatibilité de reconnaissance de documents dans le système Windows 7.
L'interface HTTP/ligne de commande ajoute une fonction de reconnaissance/génération de code QR. (#423)
Documentation pour l'interface du code QR.
Portage sur plateforme Linux.
Interface de reconnaissance de documents HTTP.

planification prospective

Développer

Ce sont des fonctions attendues. Les interfaces ont été réservées au début du développement et seront progressivement mises en œuvre à long terme.

Cependant, en raison des conditions réelles au cours du développement, la conception fonctionnelle peut être modifiée et des fonctions peuvent être ajoutées ou supprimées.

Refactorisez le mécanisme de plug-in sous-jacent.
Plug-in API OCR en ligne.
Plug-in indépendant de reconnaissance de formules mathématiques.
L'onglet "Formule mathématique" permet une reconnaissance indépendante des formules mathématiques/un rendu Latex.
Vérifiez le mécanisme de mise à jour.
Modules de post-traitement de texte autres que l'analyse de composition (tels que la préservation des nombres, la conversion de caractères demi-chasse, la correction d'erreurs de texte).
Les fonctions clés de l'interface ajoutent des méthodes de déclenchement d'événements.
OCR hors ligne basé sur GPU.
Traduction d'images
Traduction hors ligne.
Reconnaissance de zone fixe.
Reconnaissez les images de tableaux et exportez-les vers Excel.
Système d'enregistrement de l'historique.
Compatible avec MacOS/Ubuntu et autres plateformes.

Développer

Informations supplémentaires

Version v2.1.4
Type Autre code source
Date de mise à jour 2024-11-21
taille 50MB
Provenant de Github

Applications connexes

Application Scanner OCR

2023-09-03
Application Wesker OCR

2023-07-06
Application d'extraction de texte OCR

2023-06-26
Scanner OCR du roi tout-puissant

2023-04-12
Maître de numérisation OCR

2023-04-12
Scannez l'OCR en un seul clic

2023-04-11

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout