Шанхайская лаборатория искусственного интеллекта недавно объявила, что ее самостоятельно разработанная модель ученого получила серьезное обновление и выпустила новую версию Scholar Puyu 3.0 (InternLM3). В этой версии достигнут значительный прорыв в эффективности использования данных и производительности модели, достигнута более высокая производительность при меньших затратах, а также впервые интегрированы возможности регулярного диалога и углубленного мышления, что значительно повышает производительность модели в реальных сценариях применения. Эта модернизация не только обеспечивает технологический прорыв, но также отражает решимость и силу Китая продолжать инновации в области искусственного интеллекта.
Шанхайская лаборатория искусственного интеллекта объявила, что ее модель ученого получила важное обновление версии, и выпустила Scholar Puyu 3.0 (InternLM3). По данным лаборатории, новая версия значительно повысила эффективность использования данных за счет усовершенствованной структуры данных, что позволило добиться увеличения плотности мышления.
Модернизированная модель InternLM3-8B-Instruct использует для обучения только 4 Т данных. Официальные лица утверждают, что ее комплексная производительность превышает производительность моделей с открытым исходным кодом того же размера, а затраты на обучение экономятся более чем на 75%. Стоит отметить, что в этой версии впервые реализована интеграция регулярного диалога и возможностей глубокого мышления в общую модель, которая лучше справляется с различными сценариями использования в реальной жизни.
Что касается оценки модели, исследовательская группа приняла единый и воспроизводимый метод оценки, основанный на системе оценки с открытым исходным кодом Sinan OpenCompass. Содержание оценки включает более десяти авторитетных наборов оценок, таких как CMMLU и GPQA, охватывающих множество измерений, таких как рассуждение, математика, программирование, выполнение инструкций, генерация длинных текстов, диалог и всесторонняя производительность. Результаты оценки показывают, что Shusheng Puyu 3.0 лидирует в большинстве оценочных наборов, а его общая производительность очень близка к GPT-4o-mini.
Шанхайская лаборатория искусственного интеллекта также заявила, что эта новая версия модели стала первой универсальной диалоговой моделью в сообществе с открытым исходным кодом, которая поддерживает использование браузера и может поддерживать переходы по веб-страницам на более чем 20 шагов, тем самым позволяя анализировать более глубокие данные. информация.
Страница опыта: https://internlm-chat.intern-ai.org.cn.
Выделять:
Модель Shusheng Puyu 3.0 обучается с использованием данных 4T, а ее комплексная производительность превышает показатели моделей с открытым исходным кодом того же масштаба, что позволяет сэкономить более 75% затрат на обучение.
Модель занимает лидирующие позиции в нескольких авторитетных наборах оценок, а интеграция возможностей мышления и диалога была значительно улучшена.
Новая модель поддерживает использование браузера и может проводить углубленный анализ информации, став одним из самых ярких моментов сообщества открытого исходного кода.
В целом, обновление Shusheng Puyu 3.0 демонстрирует значительный прогресс Китая в области крупномасштабных языковых моделей. Ожидается, что его эффективные методы обучения и высокая производительность будут способствовать применению технологий искусственного интеллекта в большем количестве областей, и на это стоит обратить внимание. вперед к своему дальнейшему развитию.