Natural Language to SQL (NL2SQL) テクノロジーは急速に発展しており、自然言語処理の分野における重要な進歩となっています。これにより、ユーザーは自然言語を使用してデータベースにクエリを実行できるようになり、データ アクセスが大幅に簡素化され、効率が向上します。ただし、既存の方法には、特に複雑なデータベースやクロスドメイン アプリケーションを扱う場合、精度と適応性の点で課題があります。 Downcodes の編集者は、Alibaba チームが提案した XiYan-SQL フレームワークと、このフレームワークがこれらの問題をどのように効果的に解決できるかを紹介します。
ただし、NL2SQL の実装中、クエリの精度と適応性の間には一定のトレードオフがあります。一部のメソッドは、SQL クエリを生成する際の精度を保証できず、さまざまな種類のデータベースに適応することが困難です。既存のソリューションの中には、大規模言語モデル (LLM) に依存して複数の出力を生成し、迅速なエンジニアリングを通じて最適なクエリを選択するものもありますが、このアプローチは計算負荷が増大するため、リアルタイム アプリケーションには適していません。同時に、教師ありファインチューニング (SFT) は目的の SQL 生成を実現できますが、クロスドメイン アプリケーションや複雑なデータベース操作では困難に直面しているため、革新的なフレームワークが緊急に必要とされています。
Alibaba の研究チームは、画期的な NL2SQL フレームワークである XiYan-SQL を立ち上げました。これには、プロンプト エンジニアリングと SFT の利点を組み合わせたマルチジェネレーター アンサンブル戦略が組み込まれています。 XiYan-SQL の主要な革新は、データ型、主キー、サンプル値を含むデータベース階層のシステムの理解を強化できる半構造化スキーマ表現方法である M-Schema の導入であり、それによって精度と能力が向上します。コンテキストに応じて SQL クエリに適合します。
XiYan-SQL は 3 段階のプロセスを使用して SQL クエリを生成および最適化します。
まず、システムはアーキテクチャ上のリンクを通じて関連するデータベース要素を識別し、それによって冗長な情報を削減し、主要な構造に焦点を当てます。次に、例学習 (ICL) と SFT に基づくジェネレーターを使用して SQL 候補を生成します。最後に、システムはエラー修正モデルと選択モデルを使用して、生成された SQL を最適化およびフィルタリングして、最適なクエリが選択されるようにします。 XiYan-SQL は、これらのステップを従来の方法を超えた効率的なパイプラインに統合します。
厳格なベンチマーク テストの後、XiYan-SQL は複数の標準テスト セットで良好なパフォーマンスを示し、たとえば Spider テスト セットでは 89.65% の実行精度を達成し、以前のトップ モデルを大幅に上回りました。
さらに、XiYan-SQL は非リレーショナル データ セットへの適応性の点でも優れた結果を達成し、NL2GQL テスト セットで 41.20% の精度に達しました。これらの結果は、XiYan-SQL がさまざまなシナリオにおいて優れた柔軟性と精度を備えていることを示しています。
github:https://github.com/XGenerationLab/XiYan-SQL
全体として、XiYan-SQL フレームワークは、革新的な M スキーマとマルチジェネレーター統合戦略により NL2SQL の分野で大きな進歩を遂げ、効率的かつ正確な自然言語データベース クエリのための新しいソリューションを提供します。複数のテストセットにおける優れたパフォーマンスは、その強力な実用性と幅広い応用の可能性を証明しています。興味のある読者は、GitHub リンクにアクセスして詳細を確認してください。