ByteDance выпустила новую модель погремушки 1.5Pro, превзошедшую GPT-4o и Claude3.5Sonnet в нескольких тестах производительности, что свидетельствует о ее значительном прогрессе в области искусственного интеллекта. В этой модели используется инновационная разреженная архитектура MoE для достижения производительности, эквивалентной модели с 7-кратной плотностью параметров, с меньшим количеством параметров активации, а эффективность увеличивается примерно в 3 раза. В дополнение к обновлению базовой модели одновременно были выпущены модель визуального понимания Doubao и модель речи в реальном времени, что еще больше расширило возможности мультимодальной обработки и возможности голосового взаимодействия.
Компания ByteDance официально представила свою последнюю модель Doubao 1.5Pro (Doubao-1.5-pro). Эта новая модель хорошо работает во многих областях, успешно превосходя известные в отрасли GPT-4o и Claude3.5Sonnet. Выпуск этой модели знаменует собой еще один важный шаг вперед для ByteDance в области искусственного интеллекта.
Doubao 1.5Pro использует новую разреженную архитектуру MoE (Mixed Expert) и использует меньшие параметры активации для предварительного обучения. Инновация этой конструкции заключается в том, что она может обеспечить производительность модели Dense, эквивалентную семикратному увеличению параметров активации, что делает ее намного более эффективной, чем традиционная в отрасли архитектура MoE, что приводит к повышению эффективности в 3 раза. Такая конструкция делает модель Дубао еще более эффективной по нескольким критериям оценки, таким как знания, код, рассуждения и китайский язык.
Помимо обновления основной модели, ByteDance также выпустила модель визуального понимания Doubao Doubao-1.5-vision-pro и модель голоса Doubao в реальном времени Doubao-1.5-realtime-voice-pro. Новая модель визуального понимания претерпела комплексные технические обновления в области мультимодальной обработки данных, динамического разрешения и детального понимания информации, что еще больше улучшило ее возможности в области визуального мышления и понимания текста. В то же время запуск модели речи в реальном времени позволяет приложению Doubao добиться более плавного голосового разговора с низкой задержкой и возможностью прерывания в любой момент во время разговора.
ByteDance официально заявила, что модель Дубао не использовала в процессе обучения никаких данных, сгенерированных внешними моделями, что обеспечивает независимость и надежность модели. Кроме того, цены на все новые продукты останутся неизменными, и пользователи смогут напрямую испытать новые функции в приложении Doubao.
Эта конференция не только продемонстрировала непрерывные инновационные возможности ByteDance в области искусственного интеллекта, но также предоставила разработчикам мощную поддержку API, что еще больше способствовало популяризации и применению технологий искусственного интеллекта.
Запуск большой модели Doubao 1.5Pro, а также вспомогательных визуальных и голосовых моделей демонстрирует сильные стороны ByteDance и технологические инновации в области искусственного интеллекта. Его высокая эффективность, высокая производительность и акцент на пользовательском опыте указывают на то, что приложения искусственного интеллекта в будущем станут более удобными и мощными.