安装打开终端git clone https://github.com/KoBruhh/docReader.git
pip install -r requirements.txt
支持的文件类型:
.png .jpeg .jpg .pdf .py .rs .c .cpp .js .txt .sh
主要目标只是在各种文件类型(包括图像文件)的大文件中搜索单词
该存储库中有两个不同的程序:
-Python:只需使用cd Python
进入 python 目录即可
然后,如果你输入ls
你会看到一些示例图像来尝试,还有main.py
这是要执行的代码
输入: python main.py
执行程序
将文件夹拖到终端或手动输入
输入一个词进行搜索
如果程序找到您给出的任何单词,它将打印<Your word> Found!
-Javascript我使用Javascript/html/css 创建了一个简单的网站,使事情变得更奇特。但有一个问题是我无法让 python 和 javascript 进行通信,因此 GUI 版本仅适用于文本文件!要运行 JavaScript 代码:
转到目录的主文件夹并通过cd GUI (JS)/
进入GUI (JS)
文件夹
输入pwd
并复制结果
打开任何浏览器并将其粘贴到搜索引擎(在顶部)并将index.html
添加到其末尾
你应该看到这样的东西:
在这里,您必须将文件拖到虚线框中,或者单击虚线框内的任意位置,然后选择您想要的文件(必须是文本文件才能工作!)在迷你文本框(位于左上角)内键入要搜索的单词右黑框)按 Enter 激活搜索,您将通过右黑框得到响应
缺点- 它非常丑陋(JS):我几乎没有 html 和 js 的经验,所以这个网站很糟糕。
-相当低效(PY):Python 在搜索引擎中使用它的速度非常慢,但使用 OCR 之类(ML 相关的东西)的东西是为 Python 编写的。
我无法实现的事情:
-我无法同时使用多种语言。所以我做了不同的Js和Py版本。