danGPT
Cobalah di https://dangpt.vercel.app/.
Proyek ini menunjukkan cara menyusun layanan AI dan mengimplementasikan RAG (Retrieval Augmented Generation) dengan AI Generatif.
Berikut rincian cara kerjanya:
- Di luar cakupan repo ini, kami telah mengumpulkan sejumlah besar data. Dalam hal ini, postingan Dan.
- Kami kemudian mengubah semua teks yang ingin kami telusuri menjadi vektor (daftar angka) menggunakan model pembelajaran mesin yang memetakan makna dalam teks ke ruang numerik multidimensi. "Menyematkan" teks dalam ruang vektor menggunakan "model penyematan". Dalam hal ini,
text-embedding-3-small
OpenAI. - Kami kemudian menyimpan vektor-vektor tersebut dalam database vektor. Senjata pilihan kami di sini adalah AstraDB dari DataStax.
Lalu, saat pengguna mengirimkan kueri, kami:
- Ubah kueri menjadi vektor menggunakan model penyematan yang sama.
- Telusuri database vektor untuk vektor yang paling mirip dengan vektor kueri, atau vektor "dekat" dengan vektor kueri dalam ruang dimensi.
- Ambil banyak teks asli dari vektor yang paling mirip.
- Ambil teks asli tersebut dan masukkan sebagai konteks ke dalam model AI generatif. Dalam hal ini,
gpt-3.5-turbo
OpenAI. Model yang sama di balik tingkat gratis ChatGPT. - Model AI generatif kemudian menghasilkan respons berdasarkan konteks yang diberikan, berpura-pura menjadi Dan.
Perlu dicatat bahwa ini hanyalah demo proyek sampingan yang konyol dan kemungkinan besar salah. Ini lebih untuk pendidikan daripada hal lainnya.