В последние годы технология генеративного искусственного интеллекта быстро развивалась, но традиционный метод, основанный на увеличении объема данных и вычислительной мощности для повышения производительности искусственного интеллекта, достиг узкого места. Редактор Downcodes узнал, что многие ведущие ученые в области ИИ отмечают, что область ИИ переходит от эпохи масштабного расширения к новому этапу, ориентированному на прорывные инновации. Это изменение означает, что при разработке ИИ будет уделяться больше внимания улучшению качества модели, а не простому расширению масштаба. Новые технические пути и методы исследуются и применяются, что открывает новые возможности и проблемы для будущего развития области искусственного интеллекта.
С быстрым развитием генеративного искусственного интеллекта традиционное понимание отрасли, что чем больше, тем лучше, меняется. Многие ведущие ученые в области ИИ недавно заявили, что метод улучшения производительности ИИ просто за счет увеличения объема данных и вычислительной мощности приближается к узкому месту, и появляются новые технологические прорывные направления.
Илья Суцкевер, соучредитель Safe Superintelligence и OpenAI, недавно выразил мнение, что традиционные методы предварительной подготовки вышли на плато производительности. Это утверждение особенно поразительно, поскольку именно его ранняя пропаганда широкомасштабных методов предварительного обучения привела к появлению ChatGPT. Сегодня он заявил, что сфера искусственного интеллекта перешла из эпохи масштабного расширения в эпоху чудес и открытий.
В настоящее время обучение больших моделей сталкивается с множеством проблем: затраты на обучение в десятки миллионов долларов, риск сбоя оборудования, вызванный сложностью системы, длительными циклами тестирования и ограничениями ресурсов данных и энергоснабжения. Эти проблемы побудили исследователей искать новые технологические пути.
Среди них широкое внимание получила технология вычислений во время тестирования. Такой подход позволяет модели ИИ генерировать и оценивать несколько вариантов в режиме реального времени во время использования, а не напрямую давать один ответ. Исследователь OpenAI Ноам Браун провел яркую аналогию: попросить ИИ подумать об игре в покер в течение 20 секунд так же эффективно, как увеличить размер модели и время обучения в 100 000 раз.
В настоящее время многие ведущие лаборатории искусственного интеллекта, включая OpenAI, Anthropic, xAI и DeepMind, активно разрабатывают собственные технические версии. OpenAI применила эту технологию в своей последней модели o1, и директор по продукту Кевин Вейл сказал, что благодаря этим инновационным методам они видят множество возможностей для улучшения производительности модели.
Эксперты отрасли полагают, что такое изменение технологического маршрута может изменить конкурентную среду всей индустрии искусственного интеллекта и фундаментально изменить структуру спроса компаний, занимающихся искусственным интеллектом, на различные ресурсы. Это означает, что развитие искусственного интеллекта выходит на новый этап, на котором больше внимания уделяется повышению качества, а не простому расширению масштабов.
Новые технологические прорывы открыли новые возможности для развития индустрии искусственного интеллекта, а также предложили новое мышление о будущем направлении развития искусственного интеллекта. Редактор Downcodes считает, что в будущем в области искусственного интеллекта будут продолжать появляться все более инновационные технологии, способствующие развитию технологий искусственного интеллекта на более глубоком уровне и, в конечном итоге, приносящие пользу человеческому обществу.