L'éditeur de Downcodes a appris que l'équipe Mistral AI a publié un modèle mathématique 7B appelé MathΣtral, qui possède une fenêtre contextuelle de 32 Ko, peut gérer des problèmes mathématiques plus longs et plus complexes et est open source sous la licence Apache2.0. MathΣtral a obtenu 56,6 % sur le benchmark MATH et 63,47 % sur le benchmark MMLU Grâce à des modèles de vote majoritaire et de récompense, les scores ont atteint 68,37 % et 74,59 %. Il s'agit non seulement d'un hommage au 2311ème anniversaire d'Archimède, mais aussi d'une avancée majeure dans les domaines du raisonnement mathématique et de la découverte scientifique, démontrant les efforts de Mistral AI pour soutenir des projets académiques.
L'équipe Mistral AI apporte MathΣtral à la communauté scientifique, dans l'espoir de renforcer la recherche sur des problèmes mathématiques avancés qui nécessitent un raisonnement logique complexe en plusieurs étapes. L'expertise professionnelle du modèle dans le domaine STEM a atteint la même catégorie de capacités de raisonnement avancées dans divers tests de référence standard de l'industrie. Il a notamment réalisé 56,6% sur le benchmark MATH et 63,47% sur le benchmark MMLU. Ce qui frappe le plus chez MathΣtral, ce sont ses capacités de raisonnement. Ce modèle démontre que des résultats nettement meilleurs peuvent être obtenus avec davantage de calculs de temps d'inférence. Dans le benchmark MATH, MathΣtral7B a obtenu un score de 68,37 % grâce au vote majoritaire, et un score encore plus élevé de 74,59 % parmi 64 candidats grâce à un puissant modèle de récompense. Cette décision de l’équipe Mistral AI s’inscrit dans le cadre des efforts plus larges de l’entreprise pour soutenir des projets académiques. La sortie de MathΣtral a été réalisée dans le contexte de la coopération avec le projet Numina et reflète l'accent mis par Mistral AI sur la recherche universitaire et son soutien à celle-ci. MathΣtral est un modèle guidé qui peut être utilisé ou affiné selon la documentation de Mistral AI. Les poids des modèles sont hébergés sur HuggingFace, et les utilisateurs peuvent désormais essayer MathΣtral en utilisant l'inférence misstrale et l'adapter pour répondre à des besoins spécifiques en utilisant misstral-finetune. Le modèle MathΣtral de Mistral AI constitue non seulement un saut technologique, mais également une profonde contribution à la recherche dans les domaines des mathématiques et des sciences. Avec le développement continu de la technologie de l’IA, nous avons des raisons de croire que MathΣtral apportera davantage de possibilités et d’avancées au raisonnement mathématique et à la découverte scientifique.
Adresse du site officiel : https://mistral.ai/news/mathstral/
L'open source et les puissantes capacités de raisonnement du modèle MathΣtral ont apporté de nouveaux outils et possibilités aux mathématiques et à la recherche scientifique, qui méritent attention et anticipation. L'éditeur de Downcodes continuera à prêter attention aux nouveaux développements dans le domaine de l'IA et à proposer un contenu plus passionnant aux lecteurs.