arXivRAG เป็นเครื่องมือที่ครอบคลุมที่ออกแบบมาเพื่อปรับปรุงการดึงและสร้างเนื้อหาทางวิชาการจากฐานข้อมูล arXiv arXivRAG ใช้ประโยชน์จากเทคนิคการดึงข้อมูล-Augmented Generation (RAG) ขั้นสูง ช่วยให้นักวิจัย นักศึกษา และผู้ที่ชื่นชอบสามารถค้นพบและสร้างบทสรุป ข้อมูลเชิงลึก และการวิเคราะห์เอกสาร arXiv ได้อย่างมีประสิทธิภาพ
Recovery-Augmented Generation : รวมพลังของระบบดึงข้อมูลเข้ากับแบบจำลองกำเนิดเพื่อเพิ่มความแม่นยำและความเกี่ยวข้องของการตอบสนอง
การบูรณาการ arXiv : ค้นหาพื้นที่เก็บข้อมูล arXiv โดยตรงเพื่อดึงและสรุปเอกสารทางวิชาการ
ส่วนต่อประสานที่ใช้งานง่าย : ให้ส่วนต่อประสานที่ใช้งานง่ายสำหรับการสืบค้นและรับบทสรุปของเอกสารทางวิทยาศาสตร์
ปรับแต่งได้ : อนุญาตให้ผู้ใช้ปรับแต่งพารามิเตอร์การดึงข้อมูลและการสร้างเพื่อให้เหมาะกับความต้องการเฉพาะของพวกเขา
การค้นหาขั้นสูง : ความสามารถในการค้นหาขั้นสูงเพื่อค้นหาเอกสารที่เกี่ยวข้องได้อย่างรวดเร็ว
การสรุป : การสร้างบทสรุปที่กระชับโดยอัตโนมัติสำหรับเอกสาร arXiv
ข้อความค้นหาที่กำหนดเอง : การสนับสนุนข้อความค้นหาที่ปรับแต่งเพื่อดึงข้อมูลเฉพาะจากเอกสารทางวิชาการ
การเข้าถึงแบบเรียลไทม์ : บูรณาการอย่างราบรื่นกับ arXiv API สำหรับการเข้าถึงข้อมูลแบบเรียลไทม์
การวิเคราะห์การอ้างอิงและแนวโน้ม : วิเคราะห์เครือข่ายการอ้างอิง แสดงภาพผลกระทบของรายงาน และระบุแนวโน้มการวิจัยที่เกิดขึ้นใหม่โดยอิงตามสิ่งตีพิมพ์ล่าสุดและรูปแบบการอ้างอิง
หากต้องการเริ่มต้นใช้งาน arXivRAG ให้ทำตามขั้นตอนเหล่านี้:
โคลนที่เก็บ:
git clone https://github.com/phitrann/arXivRAG.git cd arXivRAG
สร้างสภาพแวดล้อมเสมือนจริง (เราแนะนำให้ใช้ conda):
conda create -n arxiv-rag python=3.10 conda activate arxiv-rag
ติดตั้งการพึ่งพาที่จำเป็น:
pip install -r requirements.txt
หากต้องการใช้ arXivRAG ให้ทำตามขั้นตอนเหล่านี้:
รันสคริปต์หลัก:
python main.py
สอบถามระบบ:
ป้อนคำถามของคุณที่เกี่ยวข้องกับรายงานทางวิทยาศาสตร์
ระบบจะดึงเอกสารที่เกี่ยวข้องจาก arXiv และสร้างข้อมูลสรุป
คุณสามารถปรับแต่งลักษณะการทำงานของ arXivRAG ได้โดยการแก้ไขไฟล์การกำหนดค่า config.yaml
พารามิเตอร์ที่สำคัญได้แก่:
recovery_model : โมเดลที่ใช้ในการดึงเอกสารที่เกี่ยวข้อง
generation_model : โมเดลที่ใช้สำหรับสร้างสรุป
num_retrievals : จำนวนเอกสารที่จะดึงข้อมูลสำหรับแต่ละแบบสอบถาม
max_summary_length : ความยาวสูงสุดของข้อมูลสรุปที่สร้างขึ้น
เรายินดีรับการสนับสนุนจากชุมชน! หากคุณมีแนวคิดเกี่ยวกับคุณสมบัติหรือการปรับปรุงใหม่ โปรดเปิดประเด็นหรือส่งคำขอดึงข้อมูลได้เลย
ในกรณีที่คุณต้องการส่งคำขอดึง โปรดทำตามขั้นตอนเหล่านี้:
แยกพื้นที่เก็บข้อมูล
สร้างสาขาใหม่:
git checkout -b feature/your-feature-name
ทำการเปลี่ยนแปลงและคอมมิต:
git commit -m "Add your commit message"
ผลักดันไปที่สาขา:
git push origin feature/your-feature-name
สร้างคำขอดึง
โครงการนี้เผยแพร่ภายใต้ลิขสิทธิ์ Apache 2.0 ดูไฟล์ใบอนุญาตสำหรับรายละเอียด
ขอขอบคุณผู้มีส่วนร่วมในโครงการ arXivRAG
ขอขอบคุณเป็นพิเศษสำหรับนักพัฒนาโมเดลการดึงข้อมูลและการสร้างที่ใช้ในโปรเจ็กต์นี้