Instalación abrir terminal git clone https://github.com/KoBruhh/docReader.git
pip install -r requirements.txt
Tipos de archivos admitidos:
.png .jpeg .jpg .pdf .py .rs .c .cpp .js .txt .sh
El objetivo principal es simplemente buscar palabras dentro de archivos grandes en una variedad de tipos de archivos (incluidos archivos de imagen)
Hay dos programas diferentes en este repositorio:
-Python: simplemente ingresa al directorio de Python con cd Python
y luego, si escribe ls
, verá algunas imágenes de ejemplo para probar y también main.py
, que es el código para ejecutar.
Escriba: python main.py
para ejecutar el programa
arrastre una carpeta a la terminal o escríbala manualmente
introduce una palabra para buscar
Si el programa encuentra alguna palabra que usted proporcionó, imprimirá <Your word> Found!
-Javascript Utilicé Javascript/html/css para crear un sitio web sencillo y hacer las cosas un poco más elegantes. Pero hay un problema: no pude hacer que Python y JavaScript se comunicaran, por lo que la versión GUI solo funciona con archivos de texto. Para ejecutar código javascript:
vaya a la carpeta principal del directorio y acceda a la carpeta GUI (JS)
mediante cd GUI (JS)/
escribe pwd
y copia el resultado
abra cualquier navegador y péguelo en el motor de búsqueda (en la parte superior) y agregue index.html
al final
Deberías ver algo como esto:
Aquí debe arrastrar su archivo al cuadro discontinuo O hacer clic en cualquier lugar dentro del cuadro discontinuo y seleccionar el archivo que desee (¡tiene que ser un archivo de texto para funcionar!). Escriba una palabra para buscar dentro del mini cuadro de texto (en el lado superior izquierdo). del cuadro negro derecho) presione Intro para activar la búsqueda y obtendrá una respuesta a través del cuadro negro derecho
Contras -Es bastante feo (JS): casi no tengo experiencia con html y js, por lo que el sitio web apesta.
-Bastante ineficiente (PY): Python es muy lento para usarlo en un motor de búsqueda, pero usando OCR como (cosas relacionadas con ML) las cosas están escritas para Python.
Cosas que no pude lograr:
-No podía usar varios idiomas juntos. Entonces hice diferentes versiones de Js y Py.