Teknologi Text-to-SQL bertujuan untuk menyederhanakan query database sehingga pengguna biasa dapat dengan mudah memperoleh data tanpa mempelajari bahasa SQL. Namun, dalam menghadapi struktur database yang semakin kompleks, mengubah bahasa alami menjadi perintah SQL secara akurat masih merupakan tantangan. Tim peneliti dari South China University of Technology dan Tsinghua University telah mengusulkan solusi inovatif - MAG-SQL, yang secara signifikan meningkatkan akurasi dan efisiensi konversi teks-ke-SQL melalui kolaborasi multi-agen.
Di bidang bahasa alami (NLP), teknologi text-to-SQL (Text-to-SQL) berkembang pesat. Teknologi ini memungkinkan pengguna awam dengan mudah melakukan query database menggunakan bahasa Jepang tanpa perlu menguasai bahasa pemrograman profesional seperti SQL. Namun, seiring dengan semakin kompleksnya struktur database, cara mengubah bahasa alami menjadi perintah SQL secara akurat telah menjadi tantangan besar.
Tim peneliti dari South China University of Technology dan Tsinghua University baru-baru ini mengusulkan solusi baru - MAG-SQL (Multiple Intelligence Generating Model), yang bertujuan untuk meningkatkan efek konversi teks ke SQL. Metode ini memanfaatkan kerja sama beberapa agen dan berupaya meningkatkan akurasi pembuatan SQL.
Cara kerja MAG-SQL cukup pintar. Komponen inti termasuk "Soft Mode Linker", "Target-Conditional Resolver", "Sub-SQL Generator" dan "Sub-SQL Modifier". Pertama, soft mode linker akan memfilter kolom database yang paling relevan dengan kueri, sehingga mengurangi gangguan informasi yang tidak perlu dan meningkatkan akurasi pembuatan perintah SQL. Selanjutnya, dekomposer bersyarat tujuan memecah kueri kompleks menjadi subkueri yang lebih kecil untuk memudahkan pemrosesan.
Generator sub-SQL kemudian menghasilkan kueri sub-SQL berdasarkan hasil sebelumnya, memastikan bahwa perintah SQL dapat disempurnakan secara bertahap. Terakhir, korektor sub-SQL bertanggung jawab untuk memperbaiki kesalahan SQL yang dihasilkan, sehingga semakin meningkatkan akurasi secara keseluruhan. Metode pemrosesan multi-langkah ini membuat MAG-SQL bekerja dengan baik dalam database yang kompleks.
Dalam pengujian terbaru, MAG-SQL berkinerja sangat baik pada kumpulan data BIRD. Saat menggunakan model GPT-4, sistem mencapai akurasi eksekusi sebesar 61,08%, yang meningkat secara signifikan dibandingkan dengan GPT-4 tradisional sebesar 46,35%. Bahkan ketika menggunakan GPT-3.5, akurasi MAG-SQL mencapai 57,62%, melampaui metode MAC-SQL sebelumnya. Selain itu, MAG-SQL memiliki kinerja yang sama baiknya pada kumpulan data kompleks lainnya, Spider, dan menunjukkan keserbagunaannya yang baik.
Pengenalan MAG-SQL tidak hanya meningkatkan keakuratan konversi teks ke SQL, tetapi juga memberikan ide-ide baru untuk memecahkan pertanyaan yang kompleks. Kerangka kerja multi-agen ini, melalui penyempurnaan yang berulang dan berulang, telah sangat meningkatkan kemampuan model bahasa besar dalam aplikasi praktis, terutama ketika menangani database yang kompleks dan kueri yang sulit.
Pintu masuk makalah: https://arxiv.org/pdf/2408.07930
Menyorot:
? ** Peningkatan akurasi **: MAG-SQL mencapai akurasi eksekusi sebesar 61,08% pada kumpulan data BIRD, jauh melebihi 46,35% GPT-4 tradisional.
**Kolaborasi multi-agen**: Metode ini menggunakan banyak agen untuk membagi tenaga kerja dan bekerja sama, menjadikan proses pembuatan SQL lebih efisien dan akurat.
**Prospek aplikasi yang luas**: MAG-SQL juga berkinerja baik pada kumpulan data lain (seperti Spider), menunjukkan kegunaan dan penerapannya yang baik.
Kerangka kerja multi-agen MAG-SQL telah membawa peningkatan kinerja yang signifikan pada teknologi text-to-SQL. Kinerjanya yang luar biasa pada kumpulan data yang kompleks menunjukkan potensi besar teknologi ini dalam aplikasi praktis, dan akan membuka jalan bagi inovasi masa depan dalam metode kueri basis data. . Memberikan arahan baru.