Downcodes小編獲悉,Mistral AI團隊發布了一款名為MathΣtral的7B數學模型,該模型擁有32k的上下文窗口,能夠處理更長更複雜的數學問題,並在Apache2.0許可下開源。 MathΣtral在MATH基準測試中達到了56.6%,在MMLU基準測試中達到了63.47%,透過多數投票和獎勵模型,得分更是高達68.37%和74.59%。這不僅是對阿基米德2311週年的致敬,也是數學推理和科學發現領域的一大突破,展現了Mistral AI在支持學術計畫方面的努力。
Mistral AI團隊將MathΣtral貢獻給科學界,希望加強在需要複雜、多步驟邏輯推理的高階數學問題上的研究。模型在STEM領域的專業特長,在各種行業標準基準測試中達到了同類別的先進推理能力。特別是在MATH基準測試中達到了56.6%,在MMLU基準測試中達到了63.47%。 MathΣtral最引人注目的是其推理能力。這個模型證明了,透過更多的推理時間計算,可以達到明顯更好的結果。在MATH基準測試中,透過多數投票,MathΣtral7B的得分高達68.37%,而在64名候選人中,透過強大的獎勵模型,得分更是達到了74.59%。 Mistral AI團隊的這項舉措,是公司支持學術計畫的更廣泛努力的一部分。 MathΣtral的發布,是在與Project Numina合作的背景下產生的,體現了Mistral AI對學術研究的重視和支持。 MathΣtral是一個指導性模型,可以根據Mistral AI的文檔進行使用或微調。模型權重託管在HuggingFace上,現在,使用者可以使用misstral-inference嘗試MathΣtral,並使用misstral-finetune進行適配,以滿足特定需求。 Mistral AI的MathΣtral模型,不僅是技術上的飛躍,更是對數學和科學領域研究的一次深刻貢獻。隨著AI技術的不斷發展,我們有理由相信,MathΣtral將為數學推理和科學發現帶來更多的可能性和突破。
官網網址:https://mistral.ai/news/mathstral/
MathΣtral模型的開源和強大的推理能力,為數學和科學研究帶來了新的工具和可能性,值得關注和期待。 Downcodes小編將持續關注AI領域的新進展,為讀者帶來更多精彩內容。