In letzter Zeit standen Google und OpenAI, die Giganten im KI-Bereich, in einem harten Wettbewerb, und die Geschwindigkeit der von beiden Parteien veröffentlichten neuen Modelle ist atemberaubend. Dieser Wettbewerb spiegelt sich nicht nur im Wettbewerb um die Modellleistung wider, sondern spiegelt auch die schnelle Entwicklung der KI-Technologie-Iterationen und die Fähigkeit wider, schnell auf den Markt zu reagieren. Die Investitionen und Innovationen von Google und OpenAI in der Technologieforschung und -entwicklung werden den Fortschritt im Bereich der künstlichen Intelligenz weiterhin vorantreiben und den Nutzern komfortablere und intelligentere Dienste bieten.
In letzter Zeit hat sich der Wettbewerb zwischen Google und OpenAI erneut verschärft. Nur einen Tag nachdem die neue Version von GPT-4o die KI-Wettbewerbsliste anführte, brachte Google das neueste experimentelle Modell Gemini-Exp-1121 auf den Markt und eroberte sich schnell die Meisterschaft zurück. Erst vor einer Woche veröffentlichte Google Gemini-Exp-1114, was darauf hindeutet, dass Google sehr schnell auf die Dynamik von OpenAI reagiert hat.
Jack Rae, Chefwissenschaftler von Google DeepMind, sagte, dies sei ein „Blitz“, was bedeutet, dass die Iterationsgeschwindigkeit nach dem Training schneller sei als vor dem Training.
Nach offiziellen Angaben wurde Gemini-Exp-1121 in vielen Aspekten deutlich verbessert, was sich vor allem in der Verbesserung der Codierungs-, Argumentations- und visuellen Verständnisfähigkeiten widerspiegelt. Darüber hinaus hat dieses Modell bei der Stilkontrolle komplexer Aufforderungswörter ein Niveau erreicht, das mit dem aktuellen Top-O1-Preview und New Sonnet3.5 vergleichbar ist.
In tatsächlichen Tests schnitt Gemini-Exp-1121 auch beim Verstehen von Comics besser ab als die neue Version von GPT-4o. Die Antworten waren umfassender und es konnten eindeutig Untertitel und fette Hervorhebungen zur Darstellung von Informationen verwendet werden. Bei der klassischen Frage zum logischen Denken von Animal Crossing River war die Antwort von Gemini-Exp-1121 völlig richtig und zeigte eine stärkere Fähigkeit zum logischen Denken. Andererseits machte die neue Version von GPT-4o einige Fehler.
Gleichzeitig entwickelt OpenAI auch aktiv neue Funktionen. Kürzlich wurde der Code für die „Live-Kamera“-Videofunktion in der neuesten Version von ChatGPT entdeckt, was seine Fortschritte bei der Sprach- und visuellen Erkennung markiert. OpenAI-Benutzer werden diese Funktion auch zum ersten Mal erleben, wenn sie den erweiterten Sprachmodus verwenden, was die Absicht zeigt, die Verwendung dieser Funktion in Zukunft auszuweiten.
Es ist absehbar, dass sich die Hauptkommunikationsmethode mit Chatbot im nächsten Jahr schrittweise vom traditionellen Textdialog auf Sprach- und intelligentere Agentendienste verlagern wird. Diese Änderung könnte durch die Einführung der „Live-Kamera“-Funktion vorangetrieben werden.
Highlight:
Googles neues Modell Gemini-Exp-1121 überholte GPT-4o nach Erreichen der Spitze schnell und kehrte an die Spitze der KI-Konkurrenz zurück.
Gemini-Exp-1121 hat seine Kodierungs-, Argumentations- und visuellen Verständnisfähigkeiten verbessert und gute Leistungen erbracht.
OpenAI entwickelt eine „Echtzeitkamera“-Funktion, die in Zukunft die Art der Kommunikation mit KI verändern könnte.
Insgesamt hat der Wettbewerb zwischen Google und OpenAI die rasante Entwicklung der KI-Technologie vorangetrieben. Die Art und Weise, wie KI mit Menschen interagiert, wird in Zukunft vielfältiger und intelligenter sein, worauf es sich zu freuen lohnt.