對標GPT-4o！開源大模型Moshi震撼登場：無區域限制，手機兼容- AI文章

作者：Eve Cole 更新時間：2025-02-21 18:25:02

法國開源AI研究實驗室Kyutai近日推出了一款名為Moshi的多模態大模型，這一創新成果不僅標誌著技術上的重大突破，更是對當前人工智能領域的一次大膽探索。 Moshi的發布，展示了AI技術在語音交互和實時推理方面的巨大潛力，為全球AI愛好者帶來了全新的體驗。

7月4日凌晨，Kyutai通過其官網正式宣布了Moshi的誕生。這款模型的功能與OpenAI的GPT-4o相當，能夠通過語音進行實時問答。然而，與GPT-4o的語音模式需要等到秋季才能全面開放不同，Moshi已經向公眾開放使用，這使得它在市場上佔據了先機。

Moshi的主要特點包括其多模態能力，即能夠聽取用戶的語音提問並進行實時推理回答。此外，Moshi的語音模式已經全面開放，相比GPT-4o的秋季上線計劃，Moshi為用戶提供了更快的體驗。更重要的是，Moshi無區域限制，全球用戶均可使用，且支持手機移動端，儘管對普通話的支持尚不完善，但英語提問完全無障礙。

QQ截图20240704095539.jpg

Kyutai還計劃將Moshi開源，屆時將公佈代碼、模型權重和論文，這一舉措不僅體現了Kyutai對開源精神的堅持，也為全球開發者和研究者提供了參與Moshi開發和優化的機會。

Moshi的發布無疑是對AI技術的一次大膽嘗試。它不僅具備聽、說的能力，未來還可能展示出看的能力，這讓我們對AI的未來充滿了期待。使用Moshi的過程非常簡單，只需登錄官網，填寫郵箱地址，點擊加入，就能開始與Moshi進行對話。

值得一提的是，Moshi對普通話的支持還有待提高，使用英語提問會得到更好的體驗。此外，Moshi不鎖區，無論身在何處，都能直接使用，這無疑為全球的AI愛好者提供了極大的便利。

Kyutai實驗室的這一舉措，也顯示出了他們對開源精神的堅持。他們計劃很快開源Moshi，公佈代碼、模型權重和論文，讓全球的開發者和研究者都能參與到Moshi的開發和優化中來。

在使用感受方面，Moshi的響應速度極快，即使在國區線路上使用，也能幾乎無延遲地響應提問。目前Moshi主要支持英語和法語，中文普通話支持有待提高。註冊流程簡單，只需提交郵箱即可。 Moshi展示了聽和說的能力，未來可能還會增加看的能力。 Moshi的擬人化語氣是其一大特點，機器味很少，這讓對話體驗更加自然流暢。

當然，Moshi目前的回答內容還比較有限，只能提供大致的輪廓和概要。但隨著產品的不斷迭代和優化，我們相信Moshi的回答將變得更加詳盡和準確。

此外，Moshi的發布對教育行業也將產生深遠的影響。例如，AI可以為學生提供循環講解，這對於教育幫助是巨大的。我們期待未來能有更多類似的產品出現，支持更多地方語言，讓AI技術更加貼近人們的生活。