Google DeepMind의 최신 AI 시스템 인 Alphageometry2는 국제 수학 올림픽 (IMO) 경쟁에서 평균 금메달리스트를 능가하는 기하학적 문제 해결에 중대한 진전을 보였습니다. 이 획기적인 성취는 수학 분야에서 AI의 잠재력을 보여줄뿐만 아니라 AI 일반 개발을위한 새로운 방향을 제공합니다.
Google Deepmind Research Lab에서 시작한 최신 AI 시스템 인 Alphageometry2는 국제 수학 올림픽 (IMO) 경쟁에서 평균 금메달리스트를 능가하는 기하학적 문제 해결에 뛰어났습니다. 이 시스템은 개선 된 버전의 알파 지오 계측기로 간주되며, 연구원들은 알파 지오 메 트리 2가 지난 25 년 동안 IMO에서 기하학적 문제의 84%를 해결할 수 있다고 말합니다.
Deepmind는 왜 그러한 고등학교 수학 대회에 중점을 둡니다. 그들은 복잡한 기하학적 문제, 특히 유클리드 기하학을 해결하는 것이 AI 기능을 향상시키는 열쇠라고 생각합니까? 수학적 이론이나 설명 정리 (피타고라스 정리)가 보유한 이유를 증명하려면 논리적 추론과 여러 가지 가능한 단계를 선택할 수있는 능력이 필요합니다. DeepMind의 이론이 사실이라면, 이러한 문제 해결 기능은 향후 일반 AI 모델에 매우 중요합니다.
올 여름 DeepMind는 알파시 메트로2를 수학적 추론 AI 모델 알파 루프와 결합한 시스템을 시연했으며, 이는 2024 IMO의 6 가지 문제 중 4 가지를 해결했습니다. 기하학적 문제 외에도이 접근법은 복잡한 엔지니어링 계산과 같은 다른 수학 및 과학 분야로 확장 될 수 있습니다.
Alhageometry2의 핵심 구성 요소에는 Google Gemini 시리즈의 언어 모델과 "Symbol Engine"이 포함됩니다. Gemini 모델은 기호 엔진이 수학 규칙을 통해 문제에 대한 실현 가능한 솔루션을 추론하는 데 도움이됩니다. IMO의 기하학적 문제는 일반적으로 포인트, 선 또는 원과 같은 "구성"과 함께 추가 해야하는 그림을 기반으로합니다. Alphageometry2의 Gemini 모델은 문제 해결에 도움이 될 수있는 구조물을 예측할 수 있습니다.
IMO 문제를 해결할 때 Alphageometry2는 3 억 개 이상의 이론을 사용하고 Deepmind 자체가 훈련을 위해 생성 된 합성 데이터를 증명합니다. 연구팀은 지난 25 년 동안 IMO에 대한 45 개의 기하학적 문제를 선택하여 50 가지 문제를 형성하도록 확장했습니다. Alphageometry2는 금메달리스트의 평균 점수를 능가하여 42 개를 성공적으로 해결했습니다.
그러나 Alphageometry2에는 가변 번호 포인트, 비선형 방정식 및 불평등의 문제를 해결할 수없는 것과 같은 몇 가지 제한 사항이 있습니다. 그럼에도 불구하고,이 연구는 AI 시스템이 상징적 운영 또는 신경망을 기반으로 해야하는지에 대한 논의를 촉발시켰다. Alphageometry2는 신경망과 규칙 기반 기호 엔진을 결합한 하이브리드 접근법을 채택합니다.
Alhageometry2의 성공은 일반 목적 AI의 미래 개발을위한 새로운 방향을 제공합니다. 아직 자급 자족은 아니지만 DeepMind 팀의 연구에 따르면 향후 더 자급 자족 한 AI 모델을 사용할 수 있습니다.
종이 입구 : https://arxiv.org/pdf/2502.03544
핵심 사항 :
Alphageometry2는 지난 25 년 동안 IMO에서 기하학적 문제의 84%를 해결하여 금메달 메달리스트의 평균 점수를 능가 할 수 있습니다.
이 시스템은 신경망과 기호 엔진을 결합하여 하이브리드 접근법을 사용하여 복잡한 수학적 문제를 해결합니다.
Deepmind는 기하학적 문제를 해결함으로써보다 강력한 일반 AI에 대한 연구 진전을 촉진하기를 희망합니다.
알파 지오 메 트리의 성공은 수학 분야에서 AI의 잠재력을 보여줄뿐만 아니라 AI 일반 개발을위한 새로운 방향을 제공합니다. 앞으로 기술의 지속적인 발전으로 AI는 더 많은 분야에서 강력한 기능을 보여줄 것입니다.