พื้นที่เก็บข้อมูลนี้ประกอบด้วยโค้ดและทรัพยากรที่เกี่ยวข้องกับการเรียกข้อมูล Augmented Generation (RAG) ซึ่งเป็นเทคนิคที่ออกแบบมาเพื่อแก้ไขปัญหาความใหม่ของข้อมูลใน Large Language Models (LLM) เช่น Llama-2 LLM มักขาดความตระหนักถึงเหตุการณ์ล่าสุดและข้อมูลที่ทันสมัย RAG รวมความรู้ภายนอกจากฐานความรู้เข้ากับการตอบสนองของ LLM ทำให้สามารถตอบกลับได้อย่างถูกต้องและมีเหตุผล
src
: ประกอบด้วยซอร์สโค้ดสำหรับการนำเทคนิค RAG ไปใช้และการโต้ตอบกับฐานความรู้data
: จัดเก็บชุดข้อมูลและทรัพยากรที่เกี่ยวข้องสำหรับการสร้างฐานความรู้db
: เพื่อจัดการและจัดเก็บการฝังโทเค็นหรือการแสดงเวกเตอร์สำหรับการค้นหาฐานความรู้requirements.txt
: แพ็คเกจ Python ที่จำเป็นสำหรับการรันโค้ดในที่เก็บนี้ RAG เป็นแนวทางใหม่ที่ผสมผสานความสามารถของ Large Language Models (LLM) เข้ากับฐานความรู้ภายนอก เพื่อเพิ่มคุณภาพและความใหม่ของการตอบสนองที่สร้างขึ้น โดยจะจัดการกับความท้าทายของข้อมูลที่ล้าสมัยโดยการดึงความรู้ที่เกี่ยวข้องตามบริบทจากแหล่งภายนอกและรวมไว้ในเนื้อหาที่สร้างโดย LLM
Gradio เป็นไลบรารี Python ที่ช่วยให้คุณสร้าง UI สำหรับโมเดล Machine Learning ของคุณได้อย่างรวดเร็ว ช่วยให้คุณสามารถปรับใช้โมเดลได้อย่างรวดเร็ว และทำให้สามารถเข้าถึงได้ผ่านอินเทอร์เฟซที่ใช้งานง่าย โดยไม่ต้องมีการพัฒนาส่วนหน้าอย่างกว้างขวาง
แอป Gradio จะเปิดตัวเมื่อมีการเรียกใช้โค้ด gradio_chatbot.py
ประกอบด้วยองค์ประกอบที่ปรับเปลี่ยนได้ เช่น โมเดลการฝัง โมเดลการสร้าง ข้อความแจ้งของระบบที่แก้ไขได้ และพารามิเตอร์ที่ปรับแต่งได้ของ LLM ที่เลือก
หากต้องการใช้โค้ดในที่เก็บนี้ ให้ทำตามขั้นตอนเหล่านี้:
โคลนพื้นที่เก็บข้อมูลไปยังเครื่องภายในของคุณ
นำทางไปยังไดเร็กทอรีที่เก็บโดยใช้บรรทัดคำสั่ง
ติดตั้งแพ็คเกจที่จำเป็นโดยใช้คำสั่งต่อไปนี้:
pip install -r requirements.txt
เรียกใช้แอปพลิเคชัน chatbot โดยใช้คำสั่ง:
python src/gradio_chatbot.py
เมื่อแอป Gradio เปิดใช้งานแล้ว ให้อัปโหลดเอกสาร (pdf หรือ csv) เลือกโมเดล (การฝังและการสร้าง) ปรับพารามิเตอร์ที่ปรับแต่งได้ เล่นกับพรอมต์ของระบบ และถามสิ่งที่คุณต้องการ!