Применение искусственного интеллекта в области математики сделало еще один прорыв. Это достижение не только демонстрирует потенциал ИИ в решении сложных геометрических проблем, но также предоставляет новые идеи для будущего разработки общих моделей ИИ.
Недавно система ИИ, разработанная Google DeepMind, Alphageometry2, успешно превзошла средний уровень золотых призеров по олимпиадам международной математики (IMO) и хорошо выступила по вопросам геометрии. Alphageometry2 - это обновленная версия системы Alphageometry, выпущенной DeepMind в прошлом году.
Так зачем DeepMind сосредоточиться на таком конкурсе по математике в старшей школе? Доказательство математических теоремы требуют навыков рассуждений и способности выбирать соответствующие решения, и DeepMind считает, что эти способности к решению проблем могут иметь решающее значение для будущего развития общих моделей ИИ.
Этим летом DeepMind также показала систему, которая объединяет альфагейметрию2 с Alphaproof, моделью искусственного интеллекта для формальных математических рассуждений, которая решила четыре из шести вопросов в квалификации IMO 2024 года. Помимо геометрических проблем, этот подход может также распространяться на другие области математики и науки и может даже помочь со сложными инженерными расчетами.
Ядро Alphageometry2 включает в себя языковую модель из семейства Google Gemini и «символ -двигатель». Модель Близнецов помогает символическому двигателю вывести решения проблемы с использованием математических правил. Рабочий процесс: модель Близнецов предсказывает, какие конструкции (такие как точки, линии, круги) могут быть полезны в решении проблем, а затем символический двигатель выполняет логические рассуждения на основе этих конструкций. После серии сложных поисков Alphageometry2 смог объединить предложения модели Близнецов с известными принципами для рисования доказательств.
Хотя Alphageometry2 успешно ответил на 42 из 50 проблем IMO, превосходя среднюю оценку игроков золотой медали, все еще существует некоторые ограничения, такие как неспособность решить неопределенное количество переменных, нелинейные уравнения и неравенство. Кроме того, по некоторым более сложным вопросам производительность Alphageometry2 не была идеальной, и только 20 из 29 вопросов были решены.
Это исследование еще раз вызвало дискуссии о том, должны ли системы искусственного интеллекта основываться на символических операциях или более похожих на мозговые нейронные сети. Alphageometry2 использует гибридный подход, который объединяет нейронные сети и символические двигатели, основанные на правилах. Команда DeepMind отмечает, что, хотя крупные языковые модели могут генерировать частичные решения без внешних инструментов, символические двигатели по -прежнему являются важными инструментами в математических приложениях в текущей ситуации.
Успех Alphageometry2 отмечает дальнейший прорыв в ИИ в области математики и может играть роль в более сложных проблемах в будущем.