Последняя система AI Google DeepMind, Alphageometry2, добилась значительного прогресса в решении геометрических проблем, превзойдя средний золотой медалист в конкурсе международной математической олимпийских игр (IMO). Это прорывное достижение не только демонстрирует потенциал ИИ в области математики, но также обеспечивает новое направление для развития общего ИИ.
Alphageometry2, последняя система искусственного интеллекта, запущенная Google DeepMind Research Lab, преуспела в решении геометрических проблем, превзойдя средний золотой призер в конкурсе международной математической олимпийской игры (IMO). Система считается улучшенной версией альфаггеометрии, и исследователи говорят, что Alphageometry2 может решить 84% геометрических проблем в IMO за последние 25 лет.
Почему DeepMind фокусируется на таких соревнованиях по математике в старшей школе? Доказательство того, почему математические теоремы или теоремы объяснения (такие как пифагорская теорема), требуется логическое рассуждение и возможность выбрать несколько возможных шагов. Если теория DeepMind верна, эти возможности решения проблем будут очень важны для будущих общих моделей ИИ.
Этим летом DeepMind продемонстрировала систему, которая объединяет альфагейпейтрию2 с математическим рассуждением AI модель AI Alphaproof, которая решила четыре из шести проблем IMO 2024 года. В дополнение к геометрическим проблемам этот подход может быть распространен на другие математические и научные области, такие как сложные инженерные расчеты.
Основные компоненты Alphageometry2 включают языковую модель из серии Google Gemini и «Двигатель символов». Модель Близнецов помогает символическому двигателю сделать возможные решения проблем по математическим правилам. Геометрические проблемы с IMO, как правило, основаны на цифрах, которые необходимо добавить с помощью «построенных», таких как точки, линии или круги. Модель Близнецов Alphageometry2 может предсказать, какие конструкции могут быть полезны при решении задач.
Стоит отметить, что при решении проблемы IMO Alphageometry2 использует более 300 миллионов теорем и синтетические данные, полученные DeepMind для обучения. За последние 25 лет исследовательская группа выбрала 45 геометрических проблем для IMO и расширила их, чтобы сформировать набор из 50 проблем. Alphageometry2 успешно решил 42 из них, превзойдя средний балл золотого призера.
Тем не менее, Alphageometry2 по -прежнему имеет некоторые ограничения, например, он не может решить проблемы с точками переменных чисел, нелинейными уравнениями и неравенством. Тем не менее, это исследование вызвало дискуссию о том, должны ли системы искусственного интеллекта основываться на символических операциях или нейронных сетях. Alphageometry2 использует гибридный подход, который объединяет нейронные сети и символические двигатели, основанные на правилах.
Успех Alphageometry2 обеспечивает новое направление для будущего развития AI общего назначения. Несмотря на то, что исследование команды DeepMind еще не полностью самодостаточна, показывает, что в будущем могут быть доступны более самодостаточные модели ИИ.
Бумажный вход: https://arxiv.org/pdf/2502.03544
Ключевые моменты:
Alphageometry2 может решить 84% геометрических проблем в IMO за последние 25 лет, превосходя среднюю оценку золотых медалистов.
Система объединяет нейронные сети и двигатели символов для решения сложных математических задач с использованием гибридного подхода.
DeepMind надеется способствовать прогрессу в исследованиях более мощного общего искусственного интеллекта путем решения геометрических проблем.
Успех Alphageometry2 не только демонстрирует потенциал ИИ в области математики, но также обеспечивает новое направление для развития общего ИИ. В будущем, с постоянным развитием технологий, ИИ будет демонстрировать сильные возможности в большем количестве областей.