法國AI新創公司Les Ministraux發表了兩款輕量級AI模型Ministral3B和Ministral8B,參數分別為30億和80億,專為邊緣設備設計。這兩款模型在指令跟隨基準測試中表現突出,尤其是在知識、常識、推理和效率方面超越了同級模型,甚至在某些方面優於參數更大的模型,為低參數模型樹立了新標竿。 Downcodes小編將對這兩款模型的性能、特點以及背後的公司進行詳細解讀。
法國AI新創公司Les Ministraux 推出兩款全新輕量級車型Ministral3B和Ministral8B,專為邊緣設備設計,參數分別為30億和80億。這兩款模型在指令跟隨基準測試中表現出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B則在除程式碼能力外其他方面均優於這兩個模型。
測試結果顯示,Ministral3B和Ministral8B的效能可媲美Gemma2和Llama3.1等開源模型。 這兩款模型都支援高達128k的上下文,並在知識、常識、推理、函數呼叫和效率方面為低於10B參數的模型樹立了新的標竿。 Ministral8B還配備了滑動視窗注意機制,以實現更快、更有效率的記憶體推理。 它們可以被微調到各種用例中,例如管理複雜的AI智能體工作流程或創建專門的任務助理。
研究人員對Les Ministraux模型進行了多項基準測試,涵蓋知識與常識、程式碼、數學和多語言等面向。 在預訓練模型階段,Ministral3B在與Gema22B、Llama3.23B的比較中取得了最佳成績。 Ministral8B在與Llama3.18B、Mistral7B的比較中,除程式碼能力外其他方面均表現最佳。 在微調後的指令模型階段,Ministral3B在不同基準測試中均取得最佳成績,Ministral8B僅在Wild bench上略遜於Gema29B。
Les Ministraux模型的推出為用戶提供了高運算效率、低延遲的解決方案,滿足了越來越多用戶對關鍵應用程式本地優先推理的需求。 使用者可以將這些模型應用於設備上翻譯、無需連網的智慧助理以及自動機器人等場景。 Ministral8B的輸入輸出價格為每百萬token0.1美元,Ministral3B則為每百萬token0.04美元。
值得注意的是,Mistral 公司先前曾以磁力連結方式開源多款模型,並獲得AI社群的認可。 然而,該公司今年陷入爭議,因為它不再像以前那樣開放。 有消息指出微軟將收購Mistral的部分股份並對其進行投資,這意味著Mistral的模型將在Azure AI上託管。 Reddit網友發現Mistral已從官方網站刪除了關於開源的承諾。 該公司的一些模型也開始收費,包括此次發布的Ministral3B和Ministral8B。
詳情:https://mistral.ai/news/ministraux/
總而言之,Ministral3B和Ministral8B的出現為邊緣運算AI應用提供了強有力的選擇,其高效的效能和低廉的價格使其具有顯著的競爭優勢。 但Mistral公司策略的轉變也引發了業界對於開源模式和商業化之間的平衡的思考。 未來,我們將持續關注Les Ministraux模型的應用與發展。