Microsoft недавно выпустила три мощные модели ИИ Phi-3.5, а именно Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct и Phi-3.5-vision-instruct, предназначенные для облегченных рассуждений и гибридных моделей экспертов и мультимодальных задач соответственно. оптимизированы. Это знаменует собой значительный прогресс Microsoft в области многоязычного и мультимодального искусственного интеллекта, что еще больше укрепляет ее лидирующие позиции в этой области. Все три модели выпускаются под лицензией с открытым исходным кодом MIT, предоставляющей разработчикам широкий спектр возможностей применения.
Microsoft объявила о выпуске трех новых моделей Phi-3.5, еще больше укрепив свои лидирующие позиции в разработке многоязычного и мультимодального искусственного интеллекта. Три новые модели: Phi-3.5-mini-instruct, -3.5-MoE-instruct и Phi-3.5-vision-instruct, каждая из которых предназначена для различных сценариев применения.
Модель Phi-3.5Mini Instruct — это легкая модель искусственного интеллекта с 380 миллионами параметров, которая очень подходит для сред с ограниченной вычислительной мощностью. Он поддерживает длину контекста 128 КБ и специально оптимизирован для возможностей выполнения инструкций, что делает его пригодным для таких задач, как генерация кода, решение математических задач и логические рассуждения. Несмотря на свои небольшие размеры, эта модель показывает впечатляющую конкурентоспособность в задачах многоязычного и многооборотного диалога, превосходя другие модели своего класса.
Вход: https://huggingface.co/microsoft/Phi-3.5-mini-instruct.
Модель Phi-3.5MoE, «экспертный гибрид», сочетает в себе несколько различных типов моделей, каждая из которых ориентирована на конкретную задачу. Он имеет 41,9 миллиарда параметров и поддерживает длину контекста 128 тыс., что может демонстрировать высокую производительность в различных задачах рассуждения. Эта модель очень хорошо справляется с кодом, математикой и многоязычным пониманием, даже превосходя более крупные модели в некоторых тестах, например, превосходя OpenAI GPT-4o в MMLU (Massive Multi-Task Language понимание) mini.
Вход: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct.
Модель Phi-3.5Vision Instruct — это усовершенствованная мультимодальная модель искусственного интеллекта, которая объединяет возможности обработки текста и изображений и подходит для таких задач, как понимание изображений, оптическое распознавание символов, анализ диаграмм и таблиц, а также обобщение видео. Эта модель также поддерживает длину контекста 128 КБ и может выполнять сложные задачи многокадрового машинного зрения.
Вход: https://huggingface.co/microsoft/Phi-3.5-vision-instruct.
Чтобы обучить эти три модели, Microsoft провела крупномасштабную обработку данных. Модель Mini Instruct использовала 3,4 триллиона маркеров и обучалась на 512 графических процессорах H100-80G в течение 10 дней; модель Vision Instruct использовала 500 миллиардов маркеров и обучалась 6 дней; модель MoE использовалась за 23 дня, было использовано 4,9 триллиона маркеров; для обучения.
Стоит отметить, что все эти три модели Phi-3.5 выпущены под лицензией с открытым исходным кодом MIT, и разработчики могут свободно использовать, модифицировать и распространять это программное обеспечение. Это не только отражает поддержку Microsoft сообщества открытого исходного кода, но и позволяет большему количеству разработчиков интегрировать передовые возможности искусственного интеллекта в свои приложения.
Выделять:
Microsoft запустила три новые модели искусственного интеллекта, ориентированные на облегченные рассуждения, гибридные экспертные и мультимодальные задачи.
«Phi-3.5MoE превосходит GPT-4o mini в тестах производительности и работает хорошо.
? Все три модели лицензируются по лицензии MIT с открытым исходным кодом, и разработчики могут свободно использовать и модифицировать их.
В целом, три модели Phi-3.5, выпущенные Microsoft, с их высокой производительностью, широким спектром сценариев применения и открытыми лицензиями, несомненно, окажут глубокое влияние на область искусственного интеллекта и предоставят разработчикам и исследователям мощные инструменты. также предвещают новое направление будущего развития технологий искусственного интеллекта.