ضمان الجودة مع LLM وRAG (الجيل المعزز للاسترجاع)
هذا المشروع عبارة عن تطبيق للإجابة على الأسئلة باستخدام نماذج اللغات الكبيرة (LLMs) وAmazon Aurora Postgresql باستخدام pgvector. يقوم التطبيق الذي يستخدم أسلوب RAG (إنشاء الاسترجاع المعزز) باسترداد المعلومات الأكثر صلة بطلب المستخدم من قاعدة معارف المؤسسة أو المحتوى، ويجمعها كسياق مع طلب المستخدم كمطالبة، ثم يرسلها إلى LLM للحصول على استجابة GenAI.
لدى LLM قيود حول الحد الأقصى لعدد الكلمات لموجه الإدخال، وبالتالي فإن اختيار المقاطع الصحيحة من بين آلاف أو ملايين المستندات في المؤسسة، له تأثير مباشر على دقة LLM.
في هذا المشروع، يتم استخدام Amazon Aurora Postgresql مع pgvector لقاعدة المعرفة.
البنية العامة هي مثل هذا:
سير العمل الشامل
- نشر مكدسات cdk (لمزيد من المعلومات، انظر هنا).
- استوديو SageMaker في VPC خاص.
- نقطة نهاية SageMaker لإنشاء النص.
- نقطة نهاية SageMaker لإنشاء عمليات التضمين.
- مجموعة Amazon Aurora Postgresql لتخزين التضمينات.
- بيانات اعتماد الوصول إلى مجموعة Aurora Postgresql (اسم المستخدم وكلمة المرور) المخزنة في AWS Secrets Mananger كاسم مثل
RAGPgVectorStackAuroraPostg-xxxxxxxxxxxx
.
- افتح SageMaker Studio ثم افتح محطة النظام الجديدة.
- قم بتشغيل الأوامر التالية على الجهاز لاستنساخ مستودع التعليمات البرمجية لهذا المشروع:
git clone --depth=1 https://github.com/ksmin23/rag-with-postgresql-pgvector-and-sagemaker.git
- افتح دفتر
data_ingestion_to_pgvector.ipynb
وقم بتشغيله. (لمزيد من المعلومات، انظر هنا) - قم بتشغيل تطبيق Streamlit. (لمزيد من المعلومات، انظر هنا)
مراجع
- الاستفادة من pgvector وAmazon Aurora PostgreSQL لمعالجة اللغات الطبيعية وChatbots وتحليل المشاعر (2023-07-13)
- تسريع فهرسة HNSW والبحث باستخدام pgvector على الإصدار المتوافق مع Amazon Aurora PostgreSQL وAmazon RDS for PostgreSQL (2023-11-06)
- تحسين تطبيقات الذكاء الاصطناعي التوليدية باستخدام فهرسة pgvector: الغوص العميق في تقنيات IVFFlat وHNSW (2024-03-15)
- تحسين أداء أعباء عمل الذكاء الاصطناعي التوليدية على Amazon Aurora من خلال عمليات القراءة المحسنة وpgvector (2024-02-09)
- إنشاء بحث مدعوم بالذكاء الاصطناعي في PostgreSQL باستخدام Amazon SageMaker وpgvector (2023-05-03)
- إنشاء تطبيقات Streamlit في Amazon SageMaker Studio (11-04-2023)
- إنشاء تطبيقات الذكاء الاصطناعي التوليدي عالية الدقة بسرعة على بيانات المؤسسة باستخدام Amazon Kendra وLangChain ونماذج اللغات الكبيرة (2023-05-03)
- (جيثب) عينات أمازون كندرا ريتريفر
- الإجابة على الأسئلة باستخدام الجيل المعزز للاسترجاع مع النماذج الأساسية في Amazon SageMaker JumpStart (2023-05-02)
- استخدم نماذج الأساس الخاصة من Amazon SageMaker JumpStart في Amazon SageMaker Studio (2023-06-27)
- LangChain - إطار عمل لتطوير التطبيقات المدعومة بنماذج اللغة.
- Streamlit - طريقة أسرع لإنشاء تطبيقات البيانات ومشاركتها
- rag-with-amazon-kendra-and-sagemaker - تطبيق للإجابة على الأسئلة باستخدام نماذج اللغات الكبيرة (LLMs) وAmazon Kendra
- rag-with-amazon-opensearch-and-sagemaker - تطبيق للإجابة على الأسئلة باستخدام نماذج اللغات الكبيرة (LLMs) وخدمة Amazon OpenSearch Service
- rag-with-amazon-opensearch-serverless - تطبيق للإجابة على الأسئلة باستخدام نماذج اللغات الكبيرة (LLMs) وخدمة Amazon OpenSearch Serverless Service
- سجل التغيير Pgvector
تمت زيادة الأبعاد القصوى للمتجه من 1024 إلى 16000
زيادة الأبعاد القصوى للمؤشر من 1024 إلى 2000