Французский AI-стартап Les Ministraux выпускает новую легкую модель, производительность которой превосходит Llama 3!

Автор：Eve Cole Время обновления：2024-12-09 16:48:01

Французский AI-стартап Les Ministraux выпустил две облегченные модели искусственного интеллекта, Ministral3B и Ministral8B, с параметрами 3 миллиарда и 8 миллиардов соответственно, предназначенные для периферийных устройств. Эти две модели показали выдающиеся результаты в тесте на выполнение инструкций, особенно превосходя модели того же уровня с точки зрения знаний, здравого смысла, рассуждения и эффективности. В некоторых аспектах они даже превзошли модели с более высокими параметрами, установив новый стандарт для низкоуровневых моделей. модели параметров. Редактор Downcodes предоставит подробное объяснение производительности, функций и компаний, стоящих за этими двумя моделями.

Французский AI-стартап Les Ministraux представил две новые легкие модели — Ministral3B и Ministral8B, специально разработанные для периферийных устройств, с параметрами 3 миллиарда и 8 миллиардов соответственно. Обе модели показали хорошие результаты в тесте, соответствующем инструкции: Ministral3B превзошел Llama38B и Mistral7B, а Ministral8B превзошел эти две модели во всех аспектах, кроме возможностей кода.

Результаты испытаний показывают, что производительность Minitral3B и Minitral8B сопоставима с моделями с открытым исходным кодом, такими как Gemma2 и Llama3.1. Обе модели поддерживают до 128 тысяч контекстов и устанавливают новые стандарты для моделей с параметрами менее 10 миллиардов с точки зрения знаний, здравого смысла, рассуждений, вызовов функций и эффективности. Ministral8B также оснащен механизмом скользящего окна для более быстрого и эффективного вывода в памяти. Их можно настроить для различных вариантов использования, например для управления сложными рабочими процессами агентов ИИ или создания специализированных помощников по задачам.

Исследователи провели несколько эталонных тестов модели Les Ministraux, охватывающих такие аспекты, как знания и здравый смысл, программирование, математика и многоязычие. На этапе предварительного обучения модели Minitral3B показал лучшие результаты по сравнению с Gema22B и Llama3.23B. По сравнению с Llama3.18B и Mistral7B, Mistral8B показал лучшие результаты во всех аспектах, кроме возможностей кодирования. На этапе модели инструкций после тонкой настройки Minitral3B показал лучшие результаты в различных тестах производительности, а Minitral8B лишь немного уступал Gema29B на стенде Wild.

Запуск модели Les Ministraux предоставляет пользователям высокоэффективное в вычислительном отношении решение с малой задержкой, отвечающее потребностям растущего числа пользователей в локальном логическом выводе для критически важных приложений. Пользователи могут применять эти модели к таким сценариям, как перевод на устройстве, умные помощники, не требующие подключения к Интернету, и автономные роботы. Входная и выходная цена Ministral8B составляет 0,1 доллара США за миллион токенов, а цена Ministral3B — 0,04 доллара США за миллион токенов.

Стоит отметить, что Mistral ранее открывал исходный код нескольких моделей через магнитные ссылки и был признан сообществом искусственного интеллекта. Однако в этом году компания оказалась втянутой в противоречие, поскольку она уже не так открыта, как раньше. Есть новость, что Microsoft приобретет часть акций Mistral и инвестирует в нее, а это значит, что модели Mistral будут размещаться на Azure AI. Пользователи сети Reddit обнаружили, что Mistral удалила со своего официального сайта свою приверженность открытому исходному коду. Некоторые модели компании также начали заряжаться, в том числе выпущенные на этот раз Ministral3B и Ministral8B.

Подробности: https://mistral.ai/news/ministraux/

В целом, появление Minitral3B и Minitral8B обеспечивает хороший выбор для приложений ИИ на периферийных вычислениях, а их эффективная производительность и низкая цена дают им значительные конкурентные преимущества. Но изменение стратегии Mistral также заставило отрасль задуматься о балансе между моделями с открытым исходным кодом и коммерциализацией. В будущем мы продолжим уделять внимание применению и развитию модели Les Ministraux.