繼Meta發表Llama 3.1後,Mistral AI緊接著推出旗艦機型Mistral Large 2,參數量達1,230億,上下文視窗更是驚人的128k,效能堪比Llama 3.1。該模型支援多種語言和程式語言,專為單節點推理設計,高效且成本友好。本文將深入探討Mistral Large 2的各項效能指標、使用方法以及在多語言處理、程式碼理解和指令遵循方面的卓越表現,並分析其在商業應用和研究領域的潛力。
繼昨天Meta宣布發布最強開源模型Llama3.1之後,Mistral AI在今天凌晨隆重推出了其旗艦模型Mistral Large2,這一新產品有1230億個參數,擁有超大的128k 上下文窗口,與從這方面來看可以媲美Llama3.1。
Mistral Large2模型詳情
Mistral Large2具有128k 上下文窗口,支援法語、德語、西班牙語、義大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語等數十種語言,以及Python、Java、C、C++、 JavaScript 和Bash 等80多種編碼語言。
Mistral Large2專為單節點推理而設計,主要針對長上下文應用- 其1230億個參數的大小使其能夠在單一節點上以大吞吐量運行。 Mistral Large2根據Mistral 研究許可證發布,旨在用於研究和非商業用途;若有商業需求,用戶需要聯繫以獲取商業許可證。
整體表現:
在性能方面,Mistral Large2在評估指標上建立了新的標桿,尤其是在MMLU 基準測試中實現了84.0% 的準確率,展現出強大的性能與服務成本的平衡。
代碼與推理
透過對Codestral22B 和Codestral Mamba 的訓練經驗,Mistral Large2在程式碼處理上表現優異,甚至與GPT-4o、Claude3Opus 和Llama3405B 等頂尖模型相媲美。
指令遵循與對齊
Mistral Large2在指令遵循和對話能力上也取得了顯著進展,尤其是在處理複雜、多輪的對話時更加靈活。在某些基準測試中,產生較長的回應往往會提高分數。然而,在許多商業應用中,簡潔性至關重要——較短的模型生成有助於加快互動速度,並且推理更具成本效益。
語言多樣性
新的Mistral Large2是在大量多語言資料上進行訓練的,特別是在英語、法語、德語、西班牙語、義大利語、葡萄牙語、荷蘭語、俄語、中文、日語、韓語、阿拉伯語和印地語方面表現出色。以下是Mistral Large2在多語言MMLU 基準上的效能結果,與先前的Mistral Large、Llama3.1模型以及Cohere 的Command R+ 進行了比較。
工具使用和函數調用
Mistral Large2配備了增強的函數調用和檢索技能,並經過訓練,可以熟練地執行並行和順序函數調用,使其能夠作為複雜業務應用程序的動力引擎。
使用方法:
目前,使用者可以在la Plateforme(https://console.mistral.ai/)使用Mistral Large2,名稱為mistral-large-2407
,並在le Chat 上進行測試。它可在版本24.07(我們應用於所有模型的YY.MM 版本控制系統)和API 名稱下使用mistral-large-2407
。 instruct 模型的權重可用,並且也託管在HuggingFace上(https://huggingface.co/mistralai/Mistral-Large-Instruct-2407)。
La Plateforme 上的產品,包括兩個通用模型Mistral Nemo 和Mistral Large,以及兩個專業模型Codestral 和Embed。隨著我們逐步棄用La Plateforme 上的舊模型,所有Apache 模型(Mistral7B、Mixtral8x7B 和8x22B、Codestral Mamba、Mathstral)仍可使用SDK mistral-inference 和mistral-finetune 進行部署和微調。
從今天開始,產品將擴展la Plateforme 上的微調功能:這些功能現在可用於Mistral Large、Mistral Nemo 和Codestral。
Mistral AI 也與多家領先的雲端服務供應商合作,讓Mistral Large2在全球範圍內可用,尤其是在Google Cloud Platform 的Vertex AI 中也能找到它的身影。
** 劃重點:**
Mistral Large2具備128k 上下文窗口,支援多達十種語言及80多種程式語言。
在MMLU 基準測試中實現84.0% 的準確率,效能與成本表現卓越。
? 使用者可透過La Plateforme 存取新模型,並在雲端服務平台上廣泛應用。
總而言之,Mistral Large 2憑藉其強大的性能、廣泛的語言支援和便利的使用方式,在大型語言模型領域展現出強大的競爭力,為研究和商業應用提供了新的可能性。 其開源特性也進一步推動了AI領域的創新發展。