AskyourDocuments
1.0.0
Selamat datang di sistem Dokumen QA! Repositori ini berisi kode untuk sistem yang memungkinkan Anda mengajukan pertanyaan tentang dokumen Anda dan mendapatkan jawaban berdasarkan isinya. Ini mendukung berbagai format dokumen, termasuk PDF, Word, Excel, PowerPoint, file teks, dan bahkan gambar!
git clone https://github.com/AiGptCode/AskyourDocuments.git
pip install transformers langchain fitz pillow textract pandas python-pptx opencv-python concurrent-futures
export HUGGINGFACE_API_TOKEN=your-api-key
main.py
dan masukkan jalur ke direktori yang berisi dokumen Anda: python AskyourDocuments.py
Catatan: Jika Anda ingin menyertakan gambar dalam pencarian Anda, pastikan gambar tersebut dalam format yang didukung (misalnya, JPEG, PNG) dan berada di direktori yang sama dengan dokumen Anda yang lain.
Jika Anda ingin berkontribusi pada proyek ini, silakan ikuti langkah-langkah berikut:
git checkout -b my-feature-branch
git commit -am ' Add some feature '
git push origin my-feature-branch
Proyek ini dilisensikan di bawah Lisensi MIT.
langchain
untuk menyediakan utilitas untuk membuat dan bekerja dengan model bahasafitz
untuk menyediakan utilitas untuk bekerja dengan file PDFPillow
untuk menyediakan utilitas untuk bekerja dengan file gambartextract
untuk menyediakan utilitas untuk mengekstraksi teks dari berbagai format filepandas
untuk menyediakan utilitas untuk bekerja dengan data tabular dengan Pythonpython-pptx
untuk menyediakan utilitas untuk bekerja dengan file PowerPointconcurrent-futures
untuk menyediakan antarmuka tingkat tinggi untuk mengeksekusi callable secara asinkronopencv-python
untuk menyediakan utilitas untuk bekerja dengan data gambar dan video (untuk dukungan gambar)