Installation Open Terminal git clone https://github.com/KoBruhh/docReader.git
pip install -r requirements.txt
Unterstützte Dateitypen:
.png .jpeg .jpg .pdf .py .rs .c .cpp .js .txt .sh
Hauptziel ist die einfache Suche nach Wörtern in großen Dateien verschiedener Dateitypen (einschließlich Bilddateien).
In diesem Repo gibt es zwei verschiedene Programme:
-Python: Gehen Sie einfach mit cd Python
in das Python-Verzeichnis
Wenn Sie dann ls
eingeben, werden einige Beispielbilder zum Ausprobieren sowie main.py
angezeigt, bei dem es sich um auszuführenden Code handelt
Geben Sie python main.py
ein, um das Programm auszuführen
Ziehen Sie einen Ordner auf das Terminal oder geben Sie ihn manuell ein
Geben Sie ein Wort zur Suche ein
Wenn das Programm ein von Ihnen eingegebenes Wort findet, wird <Your word> Found!
-Javascript Ich habe Javascript/HTML/CSS verwendet, um eine einfache Website zu erstellen, um die Dinge etwas schicker zu machen. Aber es gibt einen Haken: Ich konnte Python und Javascript nicht miteinander kommunizieren lassen, sodass die GUI-Version nur mit Textdateien funktioniert! So führen Sie Javascript-Code aus:
Gehen Sie zum Hauptordner des Verzeichnisses und gehen Sie mit cd GUI (JS)/
in den GUI (JS)
-Ordner.
Geben Sie pwd
ein und kopieren Sie das Ergebnis
Öffnen Sie einen beliebigen Browser, fügen Sie ihn in die Suchmaschine ein (oben) und fügen Sie am Ende index.html
hinzu
Sie sollten etwa Folgendes sehen:
Hier müssen Sie Ihre Datei in das gestrichelte Feld ziehen ODER irgendwo in das gestrichelte Feld klicken und die gewünschte Datei auswählen (muss eine Textdatei sein, damit sie funktioniert!). Geben Sie ein zu suchendes Wort in das Mini-Textfeld (oben links) ein Drücken Sie die Eingabetaste, um die Suche zu aktivieren. Sie erhalten eine Antwort über das rechte schwarze Feld
Nachteile – Es ist ziemlich hässlich (JS): Ich habe fast keine Erfahrung mit HTML und JS, daher ist die Website scheiße.
-Ziemlich ineffizient (PY): Python ist bei der Verwendung in einer Suchmaschine so langsam, aber die Verwendung von OCR-ähnlichen Dingen (ML-bezogene Dinge) ist für Python geschrieben.
Dinge, die ich nicht erreichen konnte:
-Ich konnte nicht mehrere Sprachen gleichzeitig verwenden. Also habe ich verschiedene Js- und Py-Versionen erstellt.