ในที่เก็บข้อมูลนี้ ฉันเจาะลึกการสร้าง ศูนย์กลางการแบ่งปันความรู้ จากแหล่งข้อมูลของฉันเอง ซึ่งทีมสามารถรับข้อมูลเชิงลึกและคำตอบได้อย่างง่ายดายในการสนทนา โดยใช้เทคนิค RAG Q&A พร้อมศักยภาพในการทำให้วิธีการแบ่งปันข้อมูลภายในทั้งสองอย่างเสร็จสมบูรณ์ องค์กรขนาดเล็กและขนาดใหญ่
กล่าวโดยสรุป RAG Q&A (คำถามและคำตอบของการดึงข้อมูล-Augmented Generation) เป็นกรอบงานที่ผสมผสานแนวทางการสืบค้นและการสร้างตามรุ่น ใช้รีทรีฟเวอร์เพื่อค้นหาข้อมูลที่เกี่ยวข้อง และโดยทั่วไปแล้ว LLM (โมเดลภาษาขนาดใหญ่) เป็นตัวสร้างเพื่อสร้างคำตอบที่มีบริบทครบถ้วน ตามคำจำกัดความ LLM เป็นโมเดล AI ประเภทหนึ่งที่สามารถทำความเข้าใจและสร้างภาษาที่เหมือนมนุษย์ โดยได้รับการฝึกฝนเกี่ยวกับข้อมูลข้อความจำนวนมหาศาลเพื่อเรียนรู้รูปแบบ โครงสร้าง และบริบทของภาษาธรรมชาติ
ฉันสร้างสมุดบันทึกหนึ่งเครื่องโดยใช้โมเดล Llama-2–7b-chat-hf ฟรี (พร้อมกลยุทธ์การวัดปริมาณ 4 บิต) สำหรับ Google Colab ซึ่งอนุญาตให้เรียกใช้ซอฟต์แวร์นี้ได้ฟรี และสมุดบันทึกอีกเครื่องหนึ่งโดยใช้ OpenAI chat-gpt-3.5- รุ่น turbo LLM โดยใช้การสมัครสมาชิก OpenAI โปรดตรวจสอบให้แน่ใจว่าได้ติดตั้งข้อกำหนดหากคุณต้องการใช้เวอร์ชันท้องถิ่น
สำหรับกรณีการใช้งานนี้ ไฟล์เอกสารมาร์กดาวน์ถูกดึงมาจากแหล่งข้อมูลที่แตกต่างกันสามแหล่ง:
เอกสารเหล่านี้ถูกเลือกเนื่องจากเป็นวิธีทั่วไปสำหรับองค์กรในการจัดทำเอกสารและรักษาความรู้ของโครงการ
แชทบอตสุดท้ายดึงความรู้ได้อย่างถูกต้อง ให้คำตอบที่กระชับและเกี่ยวข้อง พร้อมทั้งเชื่อมโยงเอกสารที่ใช้