arXivRAG adalah alat komprehensif yang dirancang untuk meningkatkan pengambilan dan pembuatan konten akademis dari database arXiv. Memanfaatkan teknik Retrieval-Augmented Generation (RAG) yang canggih, arXivRAG memberi para peneliti, mahasiswa, dan peminat kemampuan untuk menemukan dan menghasilkan ringkasan, wawasan, dan analisis makalah arXiv secara efisien.
Retrieval-Augmented Generation : Menggabungkan kekuatan sistem pengambilan dengan model generatif untuk meningkatkan akurasi dan relevansi respons.
Integrasi arXiv : Secara langsung menanyakan repositori arXiv untuk mengambil dan meringkas makalah akademis.
Antarmuka yang Ramah Pengguna : Menyediakan antarmuka yang mudah digunakan untuk menanyakan dan memperoleh ringkasan makalah ilmiah.
Dapat Disesuaikan : Memungkinkan pengguna untuk menyesuaikan parameter pengambilan dan pembuatan agar sesuai dengan kebutuhan spesifik mereka.
Pencarian yang Ditingkatkan : Kemampuan pencarian lanjutan untuk menemukan makalah yang relevan dengan cepat.
Peringkasan : Pembuatan ringkasan ringkas secara otomatis untuk makalah arXiv.
Kueri Khusus : Dukungan kueri yang disesuaikan untuk mengambil informasi spesifik dari makalah akademis.
Akses Real-Time : Integrasi mulus dengan arXiv API untuk akses data real-time.
Analisis Kutipan dan Tren : Menganalisis jaringan kutipan, memvisualisasikan dampak makalah, dan mengidentifikasi tren penelitian yang muncul berdasarkan publikasi terkini dan pola kutipan.
Untuk memulai arXivRAG, ikuti langkah-langkah berikut:
Kloning repositori:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
Buat lingkungan virtual (sebaiknya gunakan conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
Instal dependensi yang diperlukan:
pip install -r requirements.txt
Untuk menggunakan arXivRAG, ikuti langkah-langkah berikut:
Jalankan skrip utama:
python main.py
Kueri sistem:
Masukkan pertanyaan Anda terkait dengan makalah ilmiah.
Sistem akan mengambil makalah yang relevan dari arXiv dan menghasilkan ringkasan.
Anda dapat menyesuaikan perilaku arXivRAG dengan memodifikasi file konfigurasi config.yaml
. Parameter utama meliputi:
retrieval_model : Model yang digunakan untuk mengambil makalah yang relevan.
generation_model : Model yang digunakan untuk menghasilkan ringkasan.
num_retrievals : Jumlah kertas yang diambil untuk setiap kueri.
max_summary_length : Panjang maksimum ringkasan yang dihasilkan.
Kami menyambut kontribusi dari komunitas! Jika Anda mempunyai ide untuk fitur baru atau penyempurnaan, jangan ragu untuk membuka masalah atau mengirimkan permintaan penarikan.
Jika Anda ingin mengirimkan permintaan tarik, ikuti langkah-langkah berikut:
Cabangkan repositori.
Buat cabang baru:
git checkout -b feature/your-feature-name
Buat perubahan Anda dan terapkan:
git commit -m "Add your commit message"
Dorong ke cabang:
git push origin feature/your-feature-name
Buat permintaan tarik.
Proyek ini dirilis di bawah lisensi Apache 2.0. Lihat file LISENSI untuk detailnya.
Terima kasih kepada kontributor proyek arXivRAG.
Terima kasih khusus kepada para pengembang model pengambilan dan pembuatan yang digunakan dalam proyek ini.