Text-to-SQL 기술은 일반 사용자가 SQL 언어를 배우지 않고도 쉽게 데이터를 얻을 수 있도록 데이터베이스 쿼리를 단순화하는 것을 목표로 합니다. 그러나 점점 더 복잡해지는 데이터베이스 구조에 직면하여 자연어를 SQL 명령으로 정확하게 변환하는 것은 여전히 어려운 일입니다. 남중국공과대학교와 칭화대학교 연구팀은 다중 에이전트 협업을 통해 텍스트-SQL 변환의 정확성과 효율성을 크게 향상시키는 혁신적인 솔루션인 MAG-SQL을 제안했습니다.
자연어(NLP) 분야에서는 Text-to-SQL(Text-to-SQL) 기술이 빠르게 발전하고 있는데, 이 기술을 통해 일반 사용자도 전문적인 프로그래밍 언어를 익히지 않고도 일본어를 사용하여 데이터베이스에 쉽게 쿼리할 수 있습니다. SQL과 같은. 그러나 데이터베이스 구조가 점점 복잡해지면서 자연어를 SQL 명령으로 정확하게 변환하는 방법이 큰 과제가 되었습니다.
남중국공과대학교와 칭화대학교 연구팀은 최근 텍스트를 SQL로 변환하는 효과를 향상시키는 것을 목표로 하는 새로운 솔루션인 MAG-SQL(다중 지능 생성 모델)을 제안했습니다. 이 방법은 여러 Agent의 협력을 활용하여 SQL 생성의 정확성을 높이기 위해 노력합니다.
MAG-SQL의 작동 방식은 매우 영리합니다. 의 핵심 구성 요소에는 "소프트 모드 링커", "대상 조건 분석기", "하위 SQL 생성기" 및 "하위 SQL 수정자"가 포함됩니다. 첫째, 소프트 모드 링커는 쿼리와 가장 관련성이 높은 데이터베이스 열을 필터링하여 불필요한 정보 간섭을 줄이고 SQL 명령 생성의 정확성을 향상시킵니다. 다음으로, 목표 조건 분해기는 더 쉬운 처리를 위해 복잡한 쿼리를 더 작은 하위 쿼리로 나눕니다.
그런 다음 하위 SQL 생성기는 이전 결과를 기반으로 하위 SQL 쿼리를 생성하여 SQL 명령이 점진적으로 구체화될 수 있도록 합니다. 마지막으로 하위 SQL 수정자는 생성된 SQL 오류를 수정하여 전반적인 정확성을 더욱 향상시키는 역할을 합니다. 이 다단계 처리 방법을 사용하면 MAG-SQL이 복잡한 데이터베이스에서 잘 작동합니다.
최근 테스트에서 MAG-SQL은 BIRD 데이터 세트에서 매우 좋은 성능을 보였습니다. GPT-4 모델을 사용할 때 시스템은 61.08%의 실행 정확도를 달성했으며 이는 기존 GPT-4의 46.35%에 비해 크게 향상되었습니다. GPT-3.5를 사용해도 MAG-SQL의 정확도는 57.62%에 달해 기존 MAC-SQL 방식을 능가한다. 또한 MAG-SQL은 또 다른 복잡한 데이터 세트인 Spider에서도 똑같이 좋은 성능을 발휘하여 뛰어난 다양성을 보여줍니다.
MAG-SQL의 도입으로 텍스트를 SQL로 변환하는 정확도가 향상될 뿐만 아니라 복잡한 쿼리를 해결하기 위한 새로운 아이디어도 제공됩니다. 반복적이고 반복적인 개선을 통해 이 다중 에이전트 프레임워크는 특히 복잡한 데이터베이스와 어려운 쿼리를 처리할 때 실제 응용 프로그램에서 대규모 언어 모델의 기능을 크게 향상시켰습니다.
논문 입구: https://arxiv.org/pdf/2408.07930
가장 밝은 부분:
? ** 향상된 정확도 **: MAG-SQL은 BIRD 데이터 세트에서 61.08%의 실행 정확도를 달성했으며 이는 기존 GPT-4의 46.35%를 훨씬 초과합니다.
**다중 에이전트 협업**: 이 방법은 여러 에이전트를 사용하여 작업을 분담하고 협력하므로 SQL 생성 프로세스가 더욱 효율적이고 정확해집니다.
**넓은 애플리케이션 전망**: MAG-SQL은 다른 데이터 세트(예: Spider)에서도 잘 작동하여 우수한 유용성과 적용성을 입증합니다.
MAG-SQL의 다중 에이전트 프레임워크는 text-to-SQL 기술의 성능을 크게 향상시켰습니다. 복잡한 데이터 세트에 대한 뛰어난 성능은 실제 응용 프로그램에서 이 기술의 엄청난 잠재력을 나타내며 데이터베이스 쿼리 방법의 미래 혁신을 위한 길을 열어줄 것입니다. . 새로운 방향을 제시합니다.