Ein kürzlich veröffentlichter Forschungsbericht der Carnegie Mellon University (CMU) führte eine eingehende vergleichende Analyse von Google Gemini Pro und OpenAI GPT-3.5 durch. Die Forschung deckt mehrere Bereiche wie die Beantwortung von Wissensfragen und allgemeines Denken ab und bewertet den Leistungsunterschied zwischen den beiden Modellen durch Multitasking-Tests. Die Berichtsergebnisse zeigen, dass Gemini Pro als multimodales Modell zwar in einigen Aspekten Vorteile bietet, GPT-3.5 jedoch in den meisten Tests immer noch eine stärkere Leistung zeigt, insbesondere bei Wissensfragen und -antworten sowie beim allgemeinen Denken.
Webmaster Home berichtete, dass CMU-Untersuchungen gezeigt haben, dass es keinen großen Unterschied zwischen Gemini Pro und GPT-3.5 gibt, dieser jedoch bei Multitasking-Tests etwas unzureichend ist. Die Forschung deckt viele Bereiche ab, und GPT-3.5 ist führend bei der Beantwortung von Wissensfragen und beim allgemeinen Denken. Obwohl es sich bei Gemini Pro um ein multimodales Modell handelt, weist GPT-3.5 in den meisten Tests eine hervorragende Leistung auf.
Alles in allem stellt diese Forschung der CMU eine wertvolle Referenz für uns dar, um ein tiefgreifendes Verständnis der Leistungsunterschiede zwischen Gemini Pro und GPT-3.5 zu erlangen, und liefert auch neue Inspiration für die Entwicklungsrichtung großer Sprachmodelle in der Zukunft. Obwohl Gemini Pro einige Versuche im Bereich Multimodalität unternommen hat, bietet GPT-3.5 immer noch offensichtliche Vorteile bei den Kernfunktionen. Nachfolgende Forschungen könnten sich auf die Frage konzentrieren, wie sich multimodale Fähigkeiten besser mit leistungsfähigen Denkfähigkeiten kombinieren lassen.