تواصل معي على LinkedIn إذا كان لديك مشروع intersting/اهتمامات مشتركة. https://www.linkedin.com/in/mayankladdha31/
كيف يمكن أن تعزز التعديلات البسيطة في المعالجة المسبقة للاستعلام وتحسين الفوريت النتائج النهائية والنهائية: تعتبر MultiHop-RAG مجموعة بيانات QA لتقييم الاسترجاع والتفكير عبر المستندات مع البيانات الوصفية في خطوط الأنابيب #RAG. أنه يحتوي على استفسارات ، مع دليل على كل استعلام موزعة عبر 2 إلى 4 وثائق. حاولت أولاً استرجاعًا بسيطًا. بالنسبة إلى نوع الاستدلال _query ، لم تكن النتائج بهذا السوء. ولكن بالنسبة لأنواع الاستعلام الأخرى (المقارنة والزمان) ، كانت النتائج سيئة للغاية. بعد ذلك ، حاولت معرفة ما إذا كان بإمكاننا تحسين أنواع الاستعلام الأخرى عن طريق المعالجة المسبقة للاستعلام (في محاولة للحصول على قطع أكثر صلة من خلال تقسيم الاستعلام إلى عبارات ذات صلة) ومن خلال تعديل المطالبة قليلاً.
لاحظت تحسنا ملحوظا. في حين أن بعض الردود كانت غير صحيحة ، إلا أن التحسن العام من الإصدار السابق كان كبيرًا. يمكننا محاولة تعديل المطالبة ، واستخدام نموذج أفضل (GPT4) ، وتجربة استراتيجيات مختلفة (الاستفادة بشكل أفضل من البيانات الوصفية ، وتجرب طرق التقطيع المختلفة) ، قد يكون إنشاء رسم بياني للمعرفة. لم يكن هدفي هو الحصول على أفضل دقة ولكن لمعرفة ما إذا كانت التعديلات البسيطة في المعالجة المسبقة للاستعلام والتحسين السريع يمكن أن تعزز النتائج النهائية. وهو يفعل.