Progresso significativo foi feito no campo do tratamento de linguagem natural (PNL), especialmente em termos de linguagem natural à tecnologia SQL (NL2SQL). O método tradicional NL2SQL possui um equilíbrio entre precisão e adaptabilidade, e é difícil atender às necessidades de diferentes bancos de dados e consultas complexas. Este artigo apresentará a estrutura XIYAN-SQL lançada pela equipe de pesquisa do Alibaba.
A linguagem natural da tecnologia SQL (NL2SQL) está se desenvolvendo rapidamente, tornando -se uma inovação importante no campo do processamento de linguagem natural (PNL). Essa tecnologia permite que os usuários transformem a consulta de linguagem natural em instruções de linguagem de consulta estruturada (SQL). A tecnologia NL2SQL não apenas abriu uma nova porta para a exploração de grandes bancos de dados em vários setores, mas também melhorou a eficiência do trabalho e a capacidade de tomada de decisão.
No entanto, durante a implementação do NL2SQL, há uma certa quantidade de equilíbrio entre a precisão da consulta e a adaptabilidade. Em alguns métodos, ao gerar consultas SQL, elas não são precisas nem se adaptam a diferentes tipos de bancos de dados. Algumas das soluções existentes dependem de grandes modelos de linguagem (LLMS). Ao mesmo tempo, embora a supervisão e a fina (SFT) possam atingir a geração SQL direcionada, está enfrentando dificuldades em aplicações cruzadas e operações complexas de banco de dados.
A equipe de pesquisa da Alibaba lançou o XIYAN-SQL, uma estrutura de NL2SQL inovadora. Ele integra a estratégia de integração multi -geradora para combinar as vantagens do projeto rápido e da SFT. Uma inovação importante do XIYAN-SQL é introduzir m-schema, que é um método de representação de arquitetura semiestruturado que pode aprimorar o entendimento do sistema sobre estruturas hierárquicas do banco de dados, incluindo tipos de dados, chaves primárias e valores de exemplo, melhorando a precisão e geração precisa e a capacidade da consulta SQL de acordo com o contexto.
O XIYAN-SQL usa uma consulta SQL de geração e otimização de processos em três estágios.
Primeiro, o sistema identifica elementos de banco de dados relacionados através do link de arquitetura, reduzindo assim informações redundantes e focando na estrutura principal. Em seguida, use o gerador com base no exemplo de aprendizado (ICL) e SFT para gerar candidatos ao SQL. Por fim, o sistema otimiza e rastreia o SQL gerado usando modelos de correção de erros e selecione modelos para garantir que a melhor consulta seja selecionada. O XIYAN-SQL integra essas etapas em um pipeline eficiente, superando os métodos tradicionais.
Após um benchmarking rigoroso, o XIYAN-SQL teve um bom desempenho em vários testes padrão.
Além disso, o XIYAN-SQL também alcançou excelentes resultados em termos de adaptabilidade dos conjuntos de dados não relacionais, atingindo uma precisão de 41,20% na concentração de teste NL2GQL. Esses resultados mostram que o XIYAN-SQL tem excelente flexibilidade e precisão em vários cenários.
Github: https: //github.com/xgenlantlab/xiyan-sql
Pontos:
A arquitetura inovadora indica que o m-schema aprimora a compreensão da hierarquia do banco de dados e melhora a precisão da consulta.
Geração sênior de candidatos: Xiyan-SQL usa uma variedade de geradores para produzir uma variedade de candidatos ao SQL para melhorar a qualidade da consulta.
Excelente adaptabilidade: através do teste de referência, o XIYAN-SQL mostra seu excelente desempenho em uma variedade de bancos de dados, definindo um novo padrão de estrutura NL2SQL.
Em suma, o XIYAN-SQL, como uma estrutura avançada de NL2SQL, é expressa por sua inovadora arquitetura de m-schema, estratégia de integração multi-geradora e processo de otimização eficiente Simplifique as operações do usuário fornecem ferramentas fortes. O link do GitHub é conveniente para os desenvolvedores entenderem e usarem a estrutura.