Instalação terminal aberto git clone https://github.com/KoBruhh/docReader.git
pip install -r requirements.txt
Tipos de arquivos suportados:
.png .jpeg .jpg .pdf .py .rs .c .cpp .js .txt .sh
O objetivo principal é simplesmente pesquisar palavras dentro de arquivos grandes em vários tipos de arquivos (incluindo arquivos de imagem)
Existem dois programas diferentes neste repositório:
-Python: Basta entrar no diretório python com cd Python
e então, se você digitar ls
você verá alguns exemplos de imagens para testar e também main.py
que é o código para executar
Digite: python main.py
para executar o programa
arraste uma pasta para o terminal ou digite-a manualmente
digite uma palavra para pesquisar
se o programa encontrar alguma palavra que você forneceu, ele imprimirá <Your word> Found!
-Javascript Usei Javascript/html/css para criar um site simples para tornar as coisas um pouco mais sofisticadas. Mas há um problema: não consegui fazer com que python e javascript se comunicassem, então a versão GUI só funciona com arquivos de texto! Para executar o código javascript:
vá para a pasta principal do diretório e entre na pasta GUI (JS)
por cd GUI (JS)/
digite pwd
e copie o resultado
abra qualquer navegador e cole-o no mecanismo de pesquisa (na parte superior) e adicione index.html
ao final dele
Você deverá ver algo assim:
Aqui você deve arrastar seu arquivo para a caixa tracejada OU clicar em qualquer lugar dentro da caixa tracejada e selecionar o arquivo desejado (tem que ser um arquivo de texto para funcionar!) digite uma palavra para pesquisar dentro da mini caixa de texto (no canto superior esquerdo lado da caixa preta direita) pressione Enter para ativar a pesquisa e você receberá uma resposta através da caixa preta direita
Contras -É muito feio (JS): quase não tenho experiência com html e js, então o site é uma merda.
-Muito ineficiente (PY): Python é muito lento para usá-lo em um mecanismo de pesquisa, mas usando OCR (coisas relacionadas a ML) coisas são escritas para python.
Coisas que não consegui alcançar:
-Eu não poderia usar vários idiomas juntos. Então fiz versões diferentes de Js e Py.