Шанхайская лаборатория искусственного интеллекта: обновление большой модели ученого Пую - статья об искусственном интеллекте

Автор：Eve Cole Время обновления：2025-01-28 18:32:01

Шанхайская лаборатория искусственного интеллекта недавно объявила, что ее самостоятельно разработанная модель ученого получила серьезное обновление и выпустила новую версию Scholar Puyu 3.0 (InternLM3). В этой версии достигнут значительный прорыв в эффективности использования данных и производительности модели, достигнута более высокая производительность при меньших затратах, а также впервые интегрированы возможности регулярного диалога и углубленного мышления, что значительно повышает производительность модели в реальных сценариях применения. Эта модернизация не только обеспечивает технологический прорыв, но также отражает решимость и силу Китая продолжать инновации в области искусственного интеллекта.

Шанхайская лаборатория искусственного интеллекта объявила, что ее модель ученого получила важное обновление версии, и выпустила Scholar Puyu 3.0 (InternLM3). По данным лаборатории, новая версия значительно повысила эффективность использования данных за счет усовершенствованной структуры данных, что позволило добиться увеличения плотности мышления.

Модернизированная модель InternLM3-8B-Instruct использует для обучения только 4 Т данных. Официальные лица утверждают, что ее комплексная производительность превышает производительность моделей с открытым исходным кодом того же размера, а затраты на обучение экономятся более чем на 75%. Стоит отметить, что в этой версии впервые реализована интеграция регулярного диалога и возможностей глубокого мышления в общую модель, которая лучше справляется с различными сценариями использования в реальной жизни.

Что касается оценки модели, исследовательская группа приняла единый и воспроизводимый метод оценки, основанный на системе оценки с открытым исходным кодом Sinan OpenCompass. Содержание оценки включает более десяти авторитетных наборов оценок, таких как CMMLU и GPQA, охватывающих множество измерений, таких как рассуждение, математика, программирование, выполнение инструкций, генерация длинных текстов, диалог и всесторонняя производительность. Результаты оценки показывают, что Shusheng Puyu 3.0 лидирует в большинстве оценочных наборов, а его общая производительность очень близка к GPT-4o-mini.

Шанхайская лаборатория искусственного интеллекта также заявила, что эта новая версия модели стала первой универсальной диалоговой моделью в сообществе с открытым исходным кодом, которая поддерживает использование браузера и может поддерживать переходы по веб-страницам на более чем 20 шагов, тем самым позволяя анализировать более глубокие данные. информация.

Страница опыта: https://internlm-chat.intern-ai.org.cn.

Выделять:

Модель Shusheng Puyu 3.0 обучается с использованием данных 4T, а ее комплексная производительность превышает показатели моделей с открытым исходным кодом того же масштаба, что позволяет сэкономить более 75% затрат на обучение.

Модель занимает лидирующие позиции в нескольких авторитетных наборах оценок, а интеграция возможностей мышления и диалога была значительно улучшена.

Новая модель поддерживает использование браузера и может проводить углубленный анализ информации, став одним из самых ярких моментов сообщества открытого исходного кода.

В целом, обновление Shusheng Puyu 3.0 демонстрирует значительный прогресс Китая в области крупномасштабных языковых моделей. Ожидается, что его эффективные методы обучения и высокая производительность будут способствовать применению технологий искусственного интеллекта в большем количестве областей, и на это стоит обратить внимание. вперед к своему дальнейшему развитию.