La startup francesa de IA Les Ministraux ha lanzado dos modelos ligeros de IA, Ministral3B y Ministral8B, con parámetros de 3 mil millones y 8 mil millones respectivamente, diseñados para dispositivos de vanguardia. Estos dos modelos tuvieron un desempeño sobresaliente en la instrucción después de la prueba comparativa, superando especialmente a los modelos del mismo nivel en términos de conocimiento, sentido común, razonamiento y eficiencia. Incluso superaron a los modelos con parámetros más grandes en algunos aspectos, estableciendo un nuevo punto de referencia para los de bajo nivel. Modelos de parámetros. El editor de Downcodes brindará una explicación detallada del rendimiento, características y empresas detrás de estos dos modelos.
La startup francesa de IA Les Ministraux ha lanzado dos nuevos modelos ligeros, Ministral3B y Ministral8B, especialmente diseñados para dispositivos de vanguardia, con parámetros de 3 mil millones y 8 mil millones respectivamente. Los dos modelos obtuvieron buenos resultados en el punto de referencia de seguimiento de instrucciones, con Ministral3B superando a Llama38B y Mistral7B, mientras que Ministral8B superó a estos dos modelos en todos los aspectos excepto en las capacidades de código.
Los resultados de las pruebas muestran que el rendimiento de Minitral3B y Minitral8B es comparable al de modelos de código abierto como Gemma2 y Llama3.1. Ambos modelos admiten contextos de hasta 128k y establecen nuevos puntos de referencia para modelos de parámetros inferiores a 10B en términos de conocimiento, sentido común, razonamiento, llamadas a funciones y eficiencia. Ministral8B también está equipado con un mecanismo de atención de ventana deslizante para una inferencia en memoria más rápida y eficiente. Se pueden ajustar a una variedad de casos de uso, como la gestión de flujos de trabajo complejos de agentes de IA o la creación de asistentes de tareas especializados.
Los investigadores realizaron múltiples pruebas de referencia sobre el modelo Les Ministraux, que abarcaron aspectos como el conocimiento y el sentido común, la codificación, las matemáticas y el multilingüismo. En la etapa de preentrenamiento del modelo, Minitral3B logró los mejores resultados en comparación con Gema22B y Llama3.23B. En comparación con Llama3.18B y Mistral7B, Mistral8B tuvo el mejor desempeño en todos los aspectos excepto en las capacidades de codificación. En la etapa del modelo de instrucción después del ajuste fino, Minitral3B logró los mejores resultados en diferentes pruebas comparativas, y Minitral8B fue solo ligeramente inferior a Gema29B en el banco Wild.
El lanzamiento del modelo Les Ministraux proporciona a los usuarios una solución de baja latencia y alta eficiencia computacional que satisface las necesidades de un número cada vez mayor de usuarios de inferencia local para aplicaciones críticas. Los usuarios pueden aplicar estos modelos a escenarios como traducción en dispositivos, asistentes inteligentes que no requieren conexión a Internet y robots autónomos. El precio de entrada y salida de Ministral8B es de 0,1 dólares estadounidenses por millón de tokens, y el de Ministral3B es de 0,04 dólares estadounidenses por millón de tokens.
Vale la pena señalar que Mistral ha abierto previamente múltiples modelos a través de enlaces magnéticos y ha sido reconocido por la comunidad de IA. Sin embargo, la empresa se ha visto envuelta en una controversia este año porque ya no es tan abierta como antes. Hay noticias de que Microsoft adquirirá parte de las acciones de Mistral e invertirá en ellas, lo que significa que los modelos de Mistral estarán alojados en Azure AI. Los internautas de Reddit descubrieron que Mistral había eliminado su compromiso con el código abierto de su sitio web oficial. Algunos de los modelos de la compañía también han comenzado a cobrar, incluidos el Ministral3B y el Ministral8B lanzados esta vez.
Detalles: https://mistral.ai/news/ministraux/
Con todo, la aparición de Minitral3B y Minitral8B ofrece una sólida opción para aplicaciones de IA de computación de vanguardia, y su rendimiento eficiente y bajo precio les otorgan importantes ventajas competitivas. Pero el cambio en la estrategia de Mistral también ha desencadenado el pensamiento de la industria sobre el equilibrio entre los modelos de código abierto y la comercialización. En el futuro seguiremos prestando atención a la aplicación y desarrollo del modelo Les Ministraux.