A tecnologia Text-to-SQL visa simplificar as consultas ao banco de dados para que usuários comuns possam obter dados facilmente sem aprender a linguagem SQL. No entanto, diante de estruturas de banco de dados cada vez mais complexas, a conversão precisa da linguagem natural em comandos SQL ainda é um desafio. Equipes de pesquisa da Universidade de Tecnologia do Sul da China e da Universidade de Tsinghua propuseram uma solução inovadora - MAG-SQL, que melhora significativamente a precisão e a eficiência da conversão de texto em SQL por meio da colaboração multiagente.
No campo da linguagem natural (PNL), a tecnologia text-to-SQL (Text-to-SQL) está se desenvolvendo rapidamente. Essa tecnologia permite que usuários comuns consultem facilmente bancos de dados usando o idioma japonês, sem a necessidade de dominar linguagens de programação profissionais. como SQL. No entanto, à medida que a estrutura do banco de dados se torna cada vez mais complexa, como converter com precisão a linguagem natural em comandos SQL tornou-se um grande desafio.
Equipes de pesquisa da Universidade de Tecnologia do Sul da China e da Universidade de Tsinghua propuseram recentemente uma nova solução - MAG-SQL (Modelo de Geração de Inteligência Múltipla), com o objetivo de melhorar o efeito da conversão de texto em SQL. Este método utiliza a cooperação de vários agentes e se esforça para melhorar a precisão da geração de SQL.
A forma como o MAG-SQL funciona é bastante inteligente. Os componentes principais incluem o "Soft Mode Linker", "Target-Conditional Resolver", "Sub-SQL Generator" e "Sub-SQL Modifier". Primeiro, o vinculador de modo suave filtrará as colunas do banco de dados mais relevantes para a consulta, reduzindo assim a interferência desnecessária de informações e melhorando a precisão da geração de comandos SQL. Em seguida, o decompositor condicional de meta divide a consulta complexa em subconsultas menores para facilitar o processamento.
O gerador sub-SQL gera então consultas sub-SQL com base nos resultados anteriores, garantindo que os comandos SQL possam ser refinados gradualmente. Finalmente, o corretor sub-SQL é responsável por corrigir os erros SQL gerados, melhorando ainda mais a precisão geral. Este método de processamento em várias etapas faz com que o MAG-SQL tenha um bom desempenho em bancos de dados complexos.
Em testes recentes, o MAG-SQL teve um desempenho muito bom no conjunto de dados BIRD. Ao utilizar o modelo GPT-4, o sistema alcançou uma precisão de execução de 61,08%, o que foi significativamente melhorado em comparação com os 46,35% do GPT-4 tradicional. Mesmo quando utilizado o GPT-3.5, a precisão do MAG-SQL chega a 57,62%, superando o método MAC-SQL anterior. Além disso, o MAG-SQL funciona igualmente bem em outro conjunto de dados complexo, o Spider, mostrando sua boa versatilidade.
A introdução do MAG-SQL não apenas melhora a precisão da conversão de texto em SQL, mas também fornece novas ideias para resolver consultas complexas. Esta estrutura multiagente, através de refinamentos repetidos e iterativos, melhorou enormemente a capacidade de grandes modelos de linguagem em aplicações práticas, especialmente ao lidar com bancos de dados complexos e consultas difíceis.
Entrada de papel: https://arxiv.org/pdf/2408.07930
Destaque:
? ** Precisão aprimorada **: MAG-SQL alcançou uma precisão de execução de 61,08% no conjunto de dados BIRD, excedendo em muito os 46,35% do GPT-4 tradicional.
**Colaboração multiagente**: esse método usa vários agentes para dividir o trabalho e cooperar, tornando o processo de geração de SQL mais eficiente e preciso.
**Amplas perspectivas de aplicação**: MAG-SQL também tem bom desempenho em outros conjuntos de dados (como Spider), demonstrando sua boa usabilidade e aplicabilidade.
A estrutura multiagente do MAG-SQL trouxe melhorias significativas de desempenho para a tecnologia de texto para SQL. Seu excelente desempenho em conjuntos de dados complexos indica o enorme potencial desta tecnologia em aplicações práticas e abrirá caminho para futuras inovações em métodos de consulta de banco de dados. . Fornece novas direções.