حقق مجال معالجة اللغات الطبيعية (NLP) تقدمًا كبيرًا، خاصة في مجال معالجة اللغة الطبيعية إلى تقنية SQL (NL2SQL). هناك مفاضلة بين الدقة والقدرة على التكيف في طريقة NL2SQL التقليدية، ومن الصعب تلبية احتياجات قواعد البيانات المختلفة والاستعلامات المعقدة. ستقدم هذه المقالة إطار عمل XiYan-SQL الذي أطلقه فريق البحث على Alibaba، وكيف يحل هذا الإطار هذه التحديات من خلال أساليب مبتكرة ويحسن أداء NL2SQL بشكل كبير.
تتطور تقنية تحويل اللغة الطبيعية إلى SQL (NL2SQL) بسرعة وأصبحت ابتكارًا مهمًا في مجال معالجة اللغة الطبيعية (NLP). تتيح هذه التقنية للمستخدمين تحويل استعلامات اللغة الطبيعية إلى عبارات لغة الاستعلام الهيكلية (SQL) ويسهل هذا التقدم بشكل كبير التفاعل بين المستخدمين الذين يفتقرون إلى الخلفية التقنية وقواعد البيانات المعقدة للحصول على معلومات قيمة. لا تفتح تقنية NL2SQL أبوابًا جديدة لاستكشاف قواعد البيانات الكبيرة في مختلف الصناعات فحسب، بل تعمل أيضًا على تحسين كفاءة العمل وقدرات اتخاذ القرار.
ومع ذلك، هناك مفاضلة معينة بين دقة الاستعلام والقدرة على التكيف أثناء تنفيذ NL2SQL. لا يمكن لبعض الأساليب ضمان الدقة عند إنشاء استعلامات SQL، ومن الصعب التكيف مع أنواع مختلفة من قواعد البيانات. تعتمد بعض الحلول الحالية على نماذج اللغة الكبيرة (LLMs) لإنشاء مخرجات متعددة واختيار أفضل استعلام من خلال الهندسة السريعة، ولكن هذا النهج يزيد العبء الحسابي وغير مناسب للتطبيقات في الوقت الفعلي. في الوقت نفسه، على الرغم من أن الضبط الدقيق الخاضع للإشراف (SFT) يمكنه تحقيق إنشاء SQL مستهدف، إلا أنه يواجه صعوبات في التطبيقات عبر النطاقات وعمليات قواعد البيانات المعقدة، لذلك هناك حاجة ماسة إلى أطر عمل مبتكرة.
أطلق فريق البحث التابع لـ Alibaba XiYan-SQL، وهو إطار عمل NL2SQL متطور. إنها تتضمن إستراتيجية مجموعة متعددة المولدات تجمع بين مزايا الهندسة السريعة وSFT. أحد الابتكارات الرئيسية لـ XiYan-SQL هو تقديم M-Schema، وهي طريقة تمثيل مخطط شبه منظمة يمكنها تعزيز فهم النظام للتسلسل الهرمي لقاعدة البيانات، بما في ذلك أنواع البيانات والمفاتيح الأساسية وقيم العينات، وبالتالي تحسين الدقة والقدرة لتناسب سياق استعلامات SQL.
يستخدم XiYan-SQL عملية من ثلاث مراحل لإنشاء استعلامات SQL وتحسينها.
أولاً، يحدد النظام عناصر قاعدة البيانات ذات الصلة من خلال الروابط الهيكلية، وبالتالي تقليل المعلومات الزائدة عن الحاجة والتركيز على الهياكل الرئيسية. بعد ذلك، يتم إنشاء مرشحات SQL باستخدام المولدات القائمة على التعلم النموذجي (ICL) وSFT. وأخيرًا، يستخدم النظام نماذج تصحيح الأخطاء ونماذج التحديد لتحسين وتصفية SQL التي تم إنشاؤها لضمان اختيار أفضل استعلام. يقوم XiYan-SQL بدمج هذه الخطوات في مسار فعال يتجاوز الأساليب التقليدية.
بعد اختبار قياس صارم، كان أداء XiYan-SQL جيدًا في مجموعات اختبار قياسية متعددة، على سبيل المثال، حقق دقة تنفيذ تبلغ 89.65% في مجموعة اختبار Spider، متفوقًا بشكل كبير على النماذج العليا السابقة.
بالإضافة إلى ذلك، حققت XiYan-SQL أيضًا نتائج ممتازة من حيث القدرة على التكيف مع مجموعات البيانات غير العلائقية، حيث وصلت إلى دقة 41.20% في مجموعة اختبار NL2GQL. توضح هذه النتائج أن XiYan-SQL يتمتع بمرونة ودقة ممتازتين في مجموعة متنوعة من السيناريوهات.
جيثب: https://github.com/XGenerationLab/XiYan-SQL
تسليط الضوء على:
تمثيل معماري مبتكر: يعمل M-Schema على تحسين فهم التسلسل الهرمي لقاعدة البيانات وتحسين دقة الاستعلام.
إنشاء مرشح متقدم: يستخدم XiYan-SQL مولدات متعددة لإنشاء مرشحات SQL متنوعة، مما يحسن جودة الاستعلام.
قدرة فائقة على التكيف: من خلال الاختبارات المعيارية، أثبتت XiYan-SQL أدائها الممتاز في مجموعة متنوعة من قواعد البيانات، ووضع معيار إطار عمل NL2SQL جديد.
بشكل عام، حقق XiYan-SQL، باعتباره إطار عمل NL2SQL متقدم، اختراقات كبيرة في الدقة والقدرة على التكيف من خلال تمثيل مخطط M-Schema المبتكر، واستراتيجية التكامل متعدد المولدات، وعملية التحسين الفعالة، مما يوفر أساسًا لتحسين قواعد البيانات أدوات قوية لتحقيق الكفاءة التفاعلية وعمليات المستخدم المبسطة. يسهل رابط GitHub الخاص به للمطورين فهم إطار العمل واستخدامه بشكل أكبر.