Редактор Downcodes узнал, что в последних исследованиях DeepMind используется сверхкрупномасштабная модель Трансформера для достижения прорывного прогресса в области шахмат. Исследователи создали набор данных ChessBench, содержащий десятки миллионов записей игр людей, и обучили модель Transformer с 270 миллионами параметров, стремясь изучить ее возможности в решении сложных задач планирования. Этот результат исследования привлек широкое внимание сообщества ИИ и обеспечил новое направление и ориентир для исследований возможностей планирования ИИ.
Недавно статья DeepMind о применении сверхкрупномасштабного Трансформера в области шахмат вызвала широкие дискуссии в сообществе искусственного интеллекта. Исследователи использовали новый набор данных под названием ChessBench для обучения модели Transformer с 270 миллионами параметров и изучения ее возможностей в решении сложных задач планирования, таких как шахматы.
Набор данных ChessBench содержит 10 миллионов записей человеческих игр, собранных с платформы Lichess, а шахматные партии аннотируются с помощью ведущего шахматного движка Stockfish16, предоставляющего до 15 миллиардов точек данных, включая коэффициент выигрыша и лучший ход для каждого состояния шахматной игры. и оценка всех законных действий.
Исследователи использовали методы обучения с учителем, чтобы обучить модель Transformer прогнозировать ценность каждого допустимого хода в данном игровом состоянии. Результаты экспериментов показывают, что даже без использования какого-либо явного алгоритма поиска самая большая модель может делать довольно точные прогнозы в новых состояниях шахматной игры, демонстрируя сильные возможности обобщения.
Удивительно, но когда модель играла в быстрые шахматы против игроков-людей на платформе Lichess, она достигла рейтинга Эло 2895, достигнув уровня мастера шахмат.
Исследователи также сравнили модель с шахматными движками, обученными на обучении с подкреплением и самостоятельной игре, такими как Leela Chess Zero и AlphaZero. Результаты показывают, что, хотя приблизительная версия алгоритма поиска Stockfish может быть преобразована в модель Transformer посредством контролируемого обучения, все еще существуют проблемы с достижением идеального уточнения.
Это исследование показывает, что сверхкрупномасштабная модель Трансформера имеет большой потенциал в решении сложных задач планирования, а также предоставляет новые идеи для разработки будущих алгоритмов искусственного интеллекта. Выпуск набора данных ChessBench также предоставит исследователям новую тестовую платформу для изучения возможностей планирования ИИ.
Результаты исследований DeepMind не только демонстрируют мощь модели Transformer в области шахмат, но и предоставляют важную справочную информацию для будущих приложений ИИ в более сложных областях. Это знаменует собой еще один большой шаг вперед для ИИ в области сложных стратегических игр и заслуживает постоянного внимания.