تهدف تقنية تحويل النص إلى SQL إلى تبسيط استعلامات قاعدة البيانات بحيث يمكن للمستخدمين العاديين الحصول على البيانات بسهولة دون تعلم لغة SQL. ومع ذلك، في مواجهة هياكل قواعد البيانات المعقدة بشكل متزايد، لا يزال تحويل اللغة الطبيعية بدقة إلى أوامر SQL يمثل تحديًا. اقترحت فرق البحث من جامعة جنوب الصين للتكنولوجيا وجامعة تسينغهوا حلاً مبتكرًا - MAG-SQL، والذي يعمل على تحسين دقة وكفاءة تحويل النص إلى SQL بشكل كبير من خلال التعاون متعدد الوكلاء.
في مجال اللغة الطبيعية (NLP)، تتطور تقنية تحويل النص إلى SQL (Text-to-SQL) بشكل سريع، وتتيح هذه التقنية للمستخدمين العاديين إمكانية الاستعلام عن قواعد البيانات بسهولة باستخدام اللغة اليابانية دون الحاجة إلى إتقان لغات البرمجة الاحترافية مثل SQL. ومع ذلك، مع تزايد تعقيد بنية قاعدة البيانات، أصبحت كيفية تحويل اللغة الطبيعية بدقة إلى أوامر SQL تحديًا كبيرًا.
اقترحت فرق البحث من جامعة جنوب الصين للتكنولوجيا وجامعة تسينغهوا مؤخرًا حلاً جديدًا - MAG-SQL (نموذج توليد الذكاء المتعدد)، يهدف إلى تحسين تأثير تحويل النص إلى SQL. تستخدم هذه الطريقة تعاون العديد من الوكلاء وتسعى جاهدة لتحسين دقة إنشاء SQL.
الطريقة التي يعمل بها MAG-SQL ذكية للغاية. تتضمن المكونات الأساسية "رابط الوضع الناعم" و"المحلل الشرطي المستهدف" و"مولد SQL الفرعي" و"معدل Sub-SQL". أولاً، سيقوم رابط الوضع الناعم بتصفية أعمدة قاعدة البيانات الأكثر صلة بالاستعلام، وبالتالي تقليل تداخل المعلومات غير الضروري وتحسين دقة إنشاء أوامر SQL. بعد ذلك، يقوم المحلل الشرطي بالهدف بتقسيم الاستعلام المعقد إلى استعلامات فرعية أصغر لتسهيل المعالجة.
يقوم منشئ SQL الفرعي بعد ذلك بإنشاء استعلامات SQL فرعية بناءً على النتائج السابقة، مما يضمن إمكانية تحسين أوامر SQL تدريجيًا. وأخيرًا، يكون مصحح SQL الفرعي مسؤولاً عن تصحيح أخطاء SQL التي تم إنشاؤها، مما يزيد من تحسين الدقة الإجمالية. تجعل طريقة المعالجة متعددة الخطوات هذه أداء MAG-SQL جيدًا في قواعد البيانات المعقدة.
في الاختبارات الأخيرة، كان أداء MAG-SQL جيدًا للغاية في مجموعة بيانات BIRD. عند استخدام نموذج GPT-4، حقق النظام دقة تنفيذ بلغت 61.08%، والتي تم تحسينها بشكل ملحوظ مقارنة بنسبة 46.35% لـ GPT-4 التقليدي. وحتى عند استخدام GPT-3.5، تصل دقة MAG-SQL إلى 57.62%، متجاوزة طريقة MAC-SQL السابقة. بالإضافة إلى ذلك، أداء MAG-SQL جيد بنفس القدر في مجموعة بيانات معقدة أخرى، وهي Spider، مما يدل على تنوعها الجيد.
لا يؤدي تقديم MAG-SQL إلى تحسين دقة تحويل النص إلى SQL فحسب، بل يوفر أيضًا أفكارًا جديدة لحل الاستعلامات المعقدة. هذا الإطار متعدد الوكلاء، من خلال التحسين المتكرر والمتكرر، عزز بشكل كبير قدرة نماذج اللغة الكبيرة في التطبيقات العملية، خاصة عند التعامل مع قواعد البيانات المعقدة والاستعلامات الصعبة.
المدخل الورقي: https://arxiv.org/pdf/2408.07930
تسليط الضوء على:
** تحسين الدقة **: حققت MAG-SQL دقة تنفيذ تبلغ 61.08% على مجموعة بيانات BIRD، وهو ما يتجاوز بكثير 46.35% من GPT-4 التقليدي.
**التعاون متعدد الوكلاء**: تستخدم هذه الطريقة وكلاء متعددين لتقسيم العمل والتعاون، مما يجعل عملية إنشاء SQL أكثر كفاءة ودقة.
**آفاق التطبيق على نطاق واسع**: أداء MAG-SQL جيد أيضًا في مجموعات البيانات الأخرى (مثل Spider)، مما يدل على سهولة استخدامه وإمكانية تطبيقه.
لقد أدى إطار عمل MAG-SQL متعدد الوكلاء إلى تحسينات كبيرة في أداء تقنية تحويل النص إلى SQL. ويشير أدائها الممتاز في مجموعات البيانات المعقدة إلى الإمكانات الهائلة لهذه التكنولوجيا في التطبيقات العملية، وسوف يمهد الطريق للابتكارات المستقبلية في أساليب الاستعلام عن قاعدة البيانات. يقدم اتجاهات جديدة.