Installation du terminal ouvert git clone https://github.com/KoBruhh/docReader.git
pip install -r requirements.txt
Types de fichiers pris en charge :
.png .jpeg .jpg .pdf .py .rs .c .cpp .js .txt .sh
L'objectif principal est simplement de rechercher des mots dans de gros fichiers dans divers types de fichiers (y compris les fichiers image)
Il y a deux programmes différents dans ce dépôt :
-Python : allez simplement dans le répertoire python avec cd Python
et puis, si vous tapez ls
vous verrez quelques exemples d'images à essayer ainsi que main.py
qui est le code à exécuter
Tapez : python main.py
pour exécuter le programme
faites glisser un dossier vers le terminal ou saisissez-le manuellement
entrez un mot à rechercher
si le programme trouve un mot que vous avez donné, il affichera <Your word> Found!
-Javascript J'ai utilisé Javascript/html/css pour créer un site Web simple afin de rendre les choses un peu plus sophistiquées. Mais il y a un problème: je ne parviens pas à faire communiquer Python et Javascript, donc la version GUI ne fonctionne qu'avec des fichiers texte ! Pour exécuter du code javascript :
allez dans le dossier principal du répertoire et accédez au dossier GUI (JS)
en cd GUI (JS)/
tapez pwd
et copiez le résultat
ouvrez n'importe quel navigateur et collez-le dans le moteur de recherche (en haut) et ajoutez index.html
à la fin
Vous devriez voir quelque chose comme ceci :
Ici, vous devez faire glisser votre fichier dans la zone en pointillés OU cliquer n'importe où dans la zone en pointillés et sélectionner le fichier de votre choix (il doit s'agir d'un fichier texte pour fonctionner !) Tapez un mot à rechercher dans la mini zone de texte (en haut à gauche). de la boîte noire de droite) appuyez sur Entrée pour activer la recherche et vous obtiendrez une réponse via la boîte noire de droite
Inconvénients -C'est assez moche (JS) : je n'ai presque aucune expérience avec HTML et JS, donc le site Web est nul.
-Assez inefficace (PY) : Python est si lent à l'utiliser dans un moteur de recherche, mais en utilisant l'OCR (trucs liés au ML), les choses sont écrites pour Python.
Choses que je n'ai pas pu réaliser :
-Je ne pouvais pas utiliser plusieurs langues ensemble. J'ai donc réalisé différentes versions de Js et Py.