danGPT
جربه على https://dangpt.vercel.app/.
يعرض هذا المشروع كيفية إنشاء خدمات الذكاء الاصطناعي وتنفيذ RAG (الجيل المعزز للاسترجاع) باستخدام الذكاء الاصطناعي التوليدي.
وفيما يلي تفصيل لكيفية عمله:
- خارج نطاق هذا الريبو، قمنا بجمع كمية هائلة من البيانات. في هذه الحالة، مشاركات دان.
- نقوم بعد ذلك بتحويل كل النص الذي نرغب في البحث عنه إلى متجهات (قوائم أرقام) باستخدام نموذج التعلم الآلي الذي يعين المعنى في النص إلى مساحة رقمية متعددة الأبعاد. "تضمين" النص في مساحة متجهة باستخدام "نموذج التضمين". في هذه الحالة،
text-embedding-3-small
الخاص بـ OpenAI. - نقوم بعد ذلك بتخزين تلك المتجهات في قاعدة بيانات المتجهات. سلاحنا المفضل هنا هو AstraDB من DataStax.
وبعد ذلك، عندما يرسل المستخدم استعلامًا، نقوم بما يلي:
- قم بتحويل الاستعلام إلى متجه باستخدام نفس نموذج التضمين.
- ابحث في قاعدة بيانات المتجهات عن المتجهات الأكثر تشابهًا مع متجه الاستعلام، أو المتجهات "بالقرب" من متجه الاستعلام في مساحة الأبعاد.
- استرجع العديد من النصوص الأصلية من النواقل الأكثر تشابهًا.
- خذ هذه النصوص الأصلية وأدخلها كسياق في نموذج الذكاء الاصطناعي التوليدي. في هذه الحالة،
gpt-3.5-turbo
من OpenAI. نفس النموذج وراء الطبقة المجانية لـ ChatGPT. - يقوم نموذج الذكاء الاصطناعي التوليدي بعد ذلك بإنشاء استجابة بناءً على السياق المقدم له، متظاهرًا بأنه دان.
تجدر الإشارة إلى أن هذا مجرد عرض توضيحي لمشروع جانبي سخيف ومن المحتمل أن يكون خاطئًا. إنه يتعلق بالتعليم أكثر من أي شيء آخر.