Большая модель Doubao от ByteDance добилась значительных успехов всего за семь месяцев. Ее последняя версия Doubao-pro-1215 полностью соответствует GPT-4 по общей производительности и превосходит последнюю в некоторых профессиональных областях. Этот шаг знаменует собой то, что китайская технология больших моделей официально вышла на первый эшелон в мире, придав мощный импульс развитию китайской индустрии искусственного интеллекта. Большая модель кресла-мешка не только обеспечивает прорыв в технологии, но также имеет значительные экономически эффективные преимущества, что, как ожидается, ускорит популяризацию и применение технологии больших моделей и будет способствовать широкому применению технологий искусственного интеллекта во всех сферах жизни.
Doubao Big Model, дочерняя компания ByteDance, сегодня опубликовала свой ежегодный отчет о технологическом прогрессе за 2024 год, в котором сообщается, что ее последняя версия, Doubao-pro-1215, достигла полного соответствия GPT-4 с точки зрения общей производительности и продемонстрировала более высокие возможности в некоторые профессиональные области. Этот прогресс означает, что китайская технология больших моделей официально вышла на первый эшелон в мире.
С момента своего дебюта в мае этого года большая модель кресла-мешка увеличила производительность на 32% всего за 7 месяцев. Согласно официальному представлению, Дубао добился значительного прогресса в понимании точности и качества генерации за счет оптимизации массовой обработки данных и инновационной архитектуры моделей, включая улучшение разреженности моделей и внедрение обучения с подкреплением и других технических средств. Особенно в сложных сценариях, таких как математика и профессиональные знания, его производительность даже превосходит GPT-4, а цена услуги составляет лишь одну восьмую от последней.
Стоит отметить, что Doubao впервые раскрыла свою сверхдлинную способность обработки текста в 3 миллиона слов, что означает, что он может одновременно обрабатывать контент, эквивалентный «сотням» академических отчетов. Используя алгоритмы контекстных данных, такие как STRING, а также оптимизированные решения по разрежению и распределению, Doubao контролирует задержку обработки миллионов токенов в течение 15 секунд, значительно повышая эффективность обработки модели для массивных внешних знаний.
Этот технологический прорыв не только демонстрирует быстрое развитие технологии искусственного интеллекта в Китае, но также указывает на то, что популяризация приложений для больших моделей может быть ускорена за счет более эффективных затрат.
Быстрая итерация и отличная производительность большой модели Дубао не только свидетельствуют о развитии технологии искусственного интеллекта в Китае, но также указывают на то, что в будущем технология больших моделей будет служить обществу с меньшими затратами и с более высокой эффективностью, способствуя развитию искусственного интеллекта. Глубокое применение технологий в различных областях открывает больше возможностей для социального развития.