Недавно Openai опубликовала исследовательский отчет о своей последней модели вывода O3, показывающий значительный прогресс моделей крупных языков (LLMS) в области программирования. Модель O3 достигла высокого балла 2724 по знаменитой кодовой платформе программирования, ранжируя в лучших 99,8% мира и работала очень хорошо. Кроме того, модель выиграла уровень золотой медали на Международной Олимпиаде информатики (IOI) в 2024 году, отмечая его выдающиеся способности в конкурсе программирования.
Примечания источника изображения: изображение генерируется ИИ, а изображение авторизованное поставщик услуг Midjourney
Исследования показывают, что модель O3 работает на соревнованиях IOI за пределами модели O1-IOI, специально настраиваемой для этого события. Этот результат выявляет огромный потенциал обучения подкреплению в области программирования, что позволяет предположить, что общие модели, обученные с помощью обучения подкреплению, могут выходить за рамки специфичных для домена решений для ручного дизайна. В событии IOI 2024 O3 успешно пересек порог золотой медали в стандартных условиях и в то же время занял среди 200 лучших программистов в мире на платформе Codeforces, демонстрируя свою силу, чтобы конкурировать с лучшими программистами -человеком.
Этан Моллик, адъюнкт-профессор Wharton, сказал: «Универсальные возможности рассуждения, разработанные благодаря обучению подкреплению, вышли за рамки хорошо разработанных решений для конкретных доменов. Возможности позволяют крупным общим моделям достигать лучших результатов.
Это исследование является частью оценки производительности ее модели в конкурентном программировании и более широкой области разработки программного обеспечения. Между тем, еще одна компания по искусственному искусству, Anpropic, также опубликовала отчет о влиянии ИИ на рабочее место в этот понедельник. В отчете отмечается, что около 36% профессий используют ИИ, по крайней мере, в 25% рабочих задач, в то время как 57% приложений искусственного интеллекта улучшают возможности для людей и 43% сосредоточены на автоматизации. Тем не менее, только 4% профессий, ИИ используется как минимум для 75% рабочих задач, что указывает на то, что на рабочем месте все еще много места для разработки для применения ИИ.
В отчете также указывается, что разработка программного обеспечения и техническое письмо являются основными областями приложений ИИ, и что ИИ играет относительно небольшую роль в задачах, связанных с физическим взаимодействием с окружающей средой. Это открытие раскрывает различия в применении ИИ в разных областях, а также обеспечивает направление для будущего технологического развития.
Таким образом, превосходная производительность модели O3 в Codeforces и IOI демонстрирует сильный потенциал обучения подкреплению в области программирования. В то же время широко распространенное использование ИИ на рабочем месте, особенно его выдающаяся эффективность в области разработки программного обеспечения и технического письма, указывает на то, что технология ИИ будет продолжать способствовать изменениям во всех сферах жизни в будущем.