danGPT
ลองใช้ได้ที่ https://dangpt.vercel.app/
โปรเจ็กต์นี้จัดแสดงวิธีการเขียนบริการ AI และการนำ RAG (Retrieval Augmented Generation) ไปใช้ด้วย Generative AI
ต่อไปนี้คือรายละเอียดเกี่ยวกับวิธีการทำงาน:
- นอกเหนือจากขอบเขตของการซื้อคืนนี้ เราได้คัดลอกข้อมูลจำนวนมหาศาล ในกรณีนี้โพสต์ของแดน
- จากนั้นเราจะเปลี่ยนข้อความทั้งหมดที่เราต้องการค้นหาเป็นเวกเตอร์ (รายการตัวเลข) โดยใช้โมเดลการเรียนรู้ของเครื่องที่จับคู่ความหมายในข้อความกับปริภูมิตัวเลขหลายมิติ "การฝัง" ข้อความในพื้นที่เวกเตอร์โดยใช้ "โมเดลการฝัง" ในกรณีนี้
text-embedding-3-small
ของ OpenAI - จากนั้นเราจะเก็บเวกเตอร์เหล่านั้นไว้ในฐานข้อมูลเวกเตอร์ อาวุธที่เราเลือกที่นี่คือ AstraDB จาก DataStax
จากนั้น เมื่อผู้ใช้ส่งคำถาม เราจะ:
- เปลี่ยนแบบสอบถามให้เป็นเวกเตอร์โดยใช้โมเดลการฝังเดียวกัน
- ค้นหาฐานข้อมูลเวกเตอร์เพื่อหาเวกเตอร์ที่คล้ายกันมากที่สุดกับเวกเตอร์แบบสอบถาม หรือเวกเตอร์ "ใกล้" เวกเตอร์แบบสอบถามในพื้นที่มิติ
- ดึงข้อความต้นฉบับจำนวนมากจากเวกเตอร์ที่คล้ายกันมากที่สุด
- นำข้อความต้นฉบับเหล่านั้นมาป้อนเป็นบริบทในโมเดล AI เชิงสร้างสรรค์ ในกรณีนี้
gpt-3.5-turbo
ของ OpenAI รุ่นเดียวกันกับรุ่นฟรีของ ChatGPT - จากนั้นโมเดล AI ทั่วไปจะสร้างการตอบสนองตามบริบทที่ได้รับ โดยปลอมตัวเป็น Dan
เป็นที่น่าสังเกตว่านี่เป็นเพียงการสาธิตโปรเจ็กต์ไร้สาระและมีแนวโน้มว่าจะผิด เพื่อการศึกษามากกว่าสิ่งอื่นใด