O editor do Downcodes aprendeu que a equipe Mistral AI lançou um modelo matemático 7B chamado MathΣtral, que tem uma janela de contexto de 32k, pode lidar com problemas matemáticos mais longos e complexos e é de código aberto sob a licença Apache2.0. MathΣtral alcançou 56,6% no benchmark MATH e 63,47% no benchmark MMLU. Por meio de votação majoritária e modelos de recompensa, as pontuações chegaram a 68,37% e 74,59%. Isto não é apenas uma homenagem ao 2.311º aniversário de Arquimedes, mas também um grande avanço nos campos do raciocínio matemático e da descoberta científica, demonstrando os esforços da Mistral AI no apoio a projetos académicos.
A equipe Mistral AI contribui com MathΣtral para a comunidade científica, na esperança de fortalecer a pesquisa em problemas matemáticos avançados que exigem raciocínio lógico complexo e em várias etapas. A experiência profissional do modelo na área STEM alcançou a mesma categoria de capacidades de raciocínio avançadas em vários testes de benchmark padrão da indústria. Em particular, alcançou 56,6% no benchmark MATH e 63,47% no benchmark MMLU. O que mais chama a atenção no MathΣtral são suas capacidades de raciocínio. Este modelo demonstra que resultados significativamente melhores podem ser alcançados com mais cálculos de tempo de inferência. No benchmark MATH, MathΣtral7B alcançou uma pontuação de 68,37% através da votação majoritária, e uma pontuação ainda maior de 74,59% entre 64 candidatos através de um poderoso modelo de recompensa. Esta mudança da equipe Mistral AI faz parte dos esforços mais amplos da empresa para apoiar projetos acadêmicos. O lançamento do MathΣtral foi produzido no contexto da cooperação com o Projeto Numina e reflete a ênfase e o apoio da Mistral AI à pesquisa acadêmica. MathΣtral é um modelo guiado que pode ser usado ou ajustado de acordo com a documentação da Mistral AI. Os pesos dos modelos são hospedados no HuggingFace e agora os usuários podem experimentar o MathΣtral usando inferência missstral e adaptá-lo para atender a necessidades específicas usando missstral-finetune. O modelo MathΣtral da Mistral AI não é apenas um salto em tecnologia, mas também uma profunda contribuição para a pesquisa nas áreas de matemática e ciências. Com o desenvolvimento contínuo da tecnologia de IA, temos motivos para acreditar que o MathΣtral trará mais possibilidades e avanços ao raciocínio matemático e à descoberta científica.
Endereço do site oficial: https://mistral.ai/news/mathstral/
O código aberto e as poderosas capacidades de raciocínio do modelo MathΣtral trouxeram novas ferramentas e possibilidades para a matemática e a pesquisa científica, que merecem atenção e antecipação. O editor do Downcodes continuará atento aos novos desenvolvimentos no campo da IA e trará conteúdos mais interessantes aos leitores.