El editor de Downcodes se enteró de que el equipo de Mistral AI lanzó un modelo matemático 7B llamado MathΣtral, que tiene una ventana de contexto de 32k, puede manejar problemas matemáticos más largos y complejos y es de código abierto bajo la licencia Apache2.0. MathΣtral logró un 56,6% en el punto de referencia MATH y un 63,47% en el punto de referencia MMLU. A través de modelos de recompensa y votación mayoritaria, las puntuaciones alcanzaron el 68,37% y el 74,59%. Este no es solo un homenaje al 2311 aniversario de Arquímedes, sino también un gran avance en los campos del razonamiento matemático y el descubrimiento científico, lo que demuestra los esfuerzos de Mistral AI para apoyar proyectos académicos.
El equipo de Mistral AI contribuye con MathΣtral a la comunidad científica, con la esperanza de fortalecer la investigación sobre problemas matemáticos avanzados que requieren un razonamiento lógico complejo y de varios pasos. La experiencia profesional del modelo en el campo STEM ha logrado la misma categoría de capacidades de razonamiento avanzado en varias pruebas de referencia estándar de la industria. En particular, logró un 56,6% en el punto de referencia MATH y un 63,47% en el punto de referencia MMLU. Lo más sorprendente de MathΣtral son sus capacidades de razonamiento. Este modelo demuestra que se pueden lograr resultados significativamente mejores con más cálculos del tiempo de inferencia. En el punto de referencia MATH, MathΣtral7B logró una puntuación del 68,37 % mediante votación mayoritaria, y una puntuación aún más alta del 74,59 % entre 64 candidatos mediante un potente modelo de recompensa. Este movimiento del equipo de Mistral AI es parte de los esfuerzos más amplios de la compañía para apoyar proyectos académicos. El lanzamiento de MathΣtral se produjo en el contexto de la cooperación con el Proyecto Numina y refleja el énfasis y el apoyo de Mistral AI a la investigación académica. MathΣtral es un modelo guiado que se puede utilizar o ajustar según la documentación de Mistral AI. Los pesos de los modelos están alojados en HuggingFace y ahora los usuarios pueden probar MathΣtral usando mistral-inference y adaptarlo para satisfacer necesidades específicas usando misstral-finetune. El modelo MathΣtral de Mistral AI no es solo un salto tecnológico, sino también una profunda contribución a la investigación en los campos de las matemáticas y la ciencia. Con el desarrollo continuo de la tecnología de IA, tenemos motivos para creer que MathΣtral traerá más posibilidades y avances al razonamiento matemático y al descubrimiento científico.
Dirección del sitio web oficial: https://mistral.ai/news/mathstral/
El código abierto y las potentes capacidades de razonamiento del modelo MathΣtral han aportado nuevas herramientas y posibilidades a las matemáticas y la investigación científica, que son dignas de atención y anticipación. El editor de Downcodes seguirá prestando atención a los nuevos desarrollos en el campo de la IA y ofrecerá contenido más interesante a los lectores.