การติดตั้ง เทอร์มินัลเปิด git clone https://github.com/KoBruhh/docReader.git
pip install -r requirements.txt
ประเภทไฟล์ที่รองรับ:
.png .jpeg .jpg .pdf .py .rs .c .cpp .js .txt .sh
เป้าหมายหลักคือเพียงค้นหาคำในไฟล์ขนาดใหญ่ในไฟล์ประเภทต่างๆ (รวมถึงไฟล์รูปภาพ)
มีสองโปรแกรมที่แตกต่างกันใน repo นี้:
-Python: เพียงเข้าไปข้างใน python dir ด้วย cd Python
จากนั้นถ้าคุณพิมพ์ ls
คุณจะเห็นภาพตัวอย่างให้ลองใช้และ main.py
ซึ่งเป็นโค้ดที่ต้องดำเนินการ
ประเภท: python main.py
เพื่อรันโปรแกรม
ลากโฟลเดอร์ไปที่เทอร์มินัลหรือพิมพ์ด้วยตนเอง
ป้อนคำเพื่อค้นหา
หากโปรแกรมพบคำที่คุณให้มา มันจะพิมพ์ <Your word> Found!
-Javascript ฉันใช้ Javascript/html/css เพื่อสร้างเว็บไซต์ง่ายๆ เพื่อทำให้ทุกอย่างดูเพ้อฝันขึ้นเล็กน้อย แต่มีข้อเสียคือฉันไม่สามารถทำให้ python และ javascript สื่อสารได้ดังนั้นเวอร์ชัน GUI จึงใช้งานได้กับไฟล์ข้อความเท่านั้น! ในการรันโค้ดจาวาสคริปต์:
ไปที่โฟลเดอร์หลักของไดเร็กทอรีและเข้าไปข้างในโฟลเดอร์ GUI (JS)
โดย cd GUI (JS)/
พิมพ์ pwd
และคัดลอกผลลัพธ์
เปิดเบราว์เซอร์ใดก็ได้และวางลงในเครื่องมือค้นหา (ด้านบน) และเพิ่ม index.html
ที่ส่วนท้ายของเบราว์เซอร์
คุณควรเห็นสิ่งนี้:
ที่นี่ คุณต้องลากไฟล์ของคุณลงในช่องประ หรือคลิกที่ใดก็ได้ภายในช่องประแล้วเลือกไฟล์ที่คุณต้องการ (ต้องเป็นไฟล์ข้อความจึงจะใช้งานได้!) พิมพ์คำเพื่อค้นหาภายในกล่องข้อความขนาดเล็ก (ทางด้านซ้ายบน) ของกล่องดำด้านขวา) ให้กด Enter เพื่อเปิดใช้งานการค้นหา และคุณจะได้รับคำตอบทางกล่องดำด้านขวา
จุดด้อย -มันค่อนข้างน่าเกลียด (JS): ฉันแทบไม่มีประสบการณ์กับ html และ js เลย ดังนั้นเว็บไซต์จึงห่วย
-ค่อนข้างไม่มีประสิทธิภาพ (PY): Python ช้ามากที่จะใช้มันในเสิร์ชเอ็นจิ้น แต่การใช้ OCR เช่น (สิ่งที่เกี่ยวข้องกับ ML) นั้นเขียนขึ้นสำหรับ python
สิ่งที่ฉันไม่สามารถบรรลุได้:
-ฉันไม่สามารถใช้หลายภาษาร่วมกันได้ ดังนั้นฉันจึงสร้างเวอร์ชัน Js และ Py ที่แตกต่างกัน