In den letzten Jahren waren die Kosten großer Sprachmodelle (LLMs) ein wesentlicher Faktor, der ihre breite Anwendung behinderte. In jüngster Zeit haben Mistral und Microsoft den Trend zu „kleinen Sprachmodellen“ angeführt, der neue Hoffnungen auf eine Senkung der Kosten von KI-Anwendungen und eine Erweiterung des Anwendungsbereichs der generativen KI-Technologie geweckt hat. Das Mistral-Medium-Modell übertrifft GPT-4 in Bezug auf die Codefähigkeiten sogar und die Kosten werden um zwei Drittel gesenkt, was zweifellos ein Meilenstein ist. Die Veröffentlichung des Modells Mixtral8x7B und des kleinen Modells Phi-2 hat diesen Trend weiter gefördert.
Mistral und Microsoft führen den Trend zum „kleinen Sprachmodell“ an. Die Codefähigkeiten von Mistral-Medium übertreffen GPT-4 und die Kosten werden um 2/3 reduziert. Die Veröffentlichung des Mixtral8x7B-Modells und des kleinen Phi-2-Modells hat den Trend zu kleinen Modellen immer beliebter gemacht, die Kosten für groß angelegte KI-Anwendungen gesenkt und den Anwendungsbereich der generativen KI-Technologie erweitert. Interne Testergebnisse von Mistral-Medium zeigen, dass die Qualität und die Kosten der Codegenerierung besser sind als bei GPT-4, was Entwicklern eine effizientere Wahl bietet.Der Aufstieg kleiner Sprachmodelle bietet wirtschaftlichere und effizientere Lösungen für die Popularisierung und Anwendung der KI-Technologie und kündigt auch eine neue Richtung für die zukünftige Entwicklung der KI an. Der erfolgreiche Fall von Mistral-Medium wird zweifellos mehr Unternehmen und Forschungseinrichtungen dazu ermutigen, in die Forschung, Entwicklung und Anwendung kleiner Modelle zu investieren und so die Technologie der künstlichen Intelligenz zu fördern, die der menschlichen Gesellschaft schneller und besser zugute kommt. In der Zukunft können wir uns auf das Aufkommen weiterer und besserer kleiner Sprachmodelle freuen, die einen transformativen Einfluss auf alle Lebensbereiche haben werden.