Nach einer 12-tägigen Live-Übertragung zum Technologieaustausch veröffentlichte OpenAI das Inferenzmodell o3 der nächsten Generation sowie eine optimierte Version von o3-mini, die für bestimmte Aufgaben optimiert wurde. o3 hat in mehreren Benchmark-Tests bahnbrechende Fortschritte erzielt, seine Leistung übertrifft das Modell o1 der Vorgängergeneration deutlich und nähert sich in einigen Aspekten sogar dem Niveau der künstlichen allgemeinen Intelligenz (AGI). Diese Veröffentlichung hat in der Branche große Aufmerksamkeit erregt und wird voraussichtlich tiefgreifende Auswirkungen auf zukünftige Programmiermethoden und Arbeitsmodelle von Programmierern haben.
Nach 12 Tagen Technologieaustausch in Live-Übertragungen veröffentlichte OpenAI am letzten Tag sein Inferenzmodell o3 der nächsten Generation, eine aktualisierte Version des zuvor veröffentlichten Inferenzmodells o1. Die o3-Modellreihe umfasst zwei Versionen: o3 und o3-mini, wobei o3-mini ein kleineres, stromlinienförmiges Modell ist, das speziell auf bestimmte Aufgaben abgestimmt ist. OpenAI gab an, dass das o3-Modell unter bestimmten Bedingungen der allgemeinen künstlichen Intelligenz (AGI) nahe kommen kann, also einer künstlichen Intelligenz, die jede Aufgabe erledigen kann, die Menschen erledigen können.
Im grafischen logischen Inferenz-Benchmark von ARC-AGI erreichte das o3-Modell rekordverdächtige Ergebnisse und erzielte im Low-Computing-Szenario 75,7 %, während es im High-Computing-Test 87,5 % erreichte und damit den Benchmark übertraf, der das Erreichen menschlichen Niveaus markiert. Schwelle 85 %. Im Vergleich dazu schneidet das o1-Modell nur zwischen 25 % und 32 % ab, und o3 schneidet fast dreimal besser ab als o1. Auf der weltberühmten Coding-Wettbewerbsplattform Codeforces erreichte o3 eine Punktzahl von 2727, während o1 nur 1891 erreichte.
Fu Sheng, Vorsitzender von Cheetah Mobile oder Orion Star, sagte, dass die Veröffentlichung von OpenAI o3 den Beginn einer Ära ankündigt, in der Benutzer nicht unbedingt Python oder C beherrschen müssen, um Programme zu schreiben Stellen Sie Anforderungen vor und das große Vorhersagemodell kann dabei helfen, die Programmierarbeit abzuschließen. Fu Sheng glaubt, dass die Veröffentlichung von o3 zeigt, dass die Programmierfähigkeiten großer Sprachmodelle 99,9 % der Programmierer übertreffen. Im Codeforces-Weltklasse-Programmierwettbewerb erreichte o3 das Spitzenergebnis von Platz 175, während o1 nur mehr als 90 % besiegte Programmierer, GPT-4o besiegte zuvor nur 11 % der Programmierer.
OpenAI plant, das o3-Modell Ende Januar nächsten Jahres offiziell zu veröffentlichen. Fu Sheng wies darauf hin, dass Programmierer zwar nicht vollständig verschwinden werden, ihre Arbeit sich jedoch mehr auf das Verständnis der Benutzerbedürfnisse und den Aufbau umfassender Logik verlagern wird und die Arbeit der Umwandlung von Bedürfnissen in Code größtenteils durch KI erledigt wird. Diese Veröffentlichung läutet die breitere Anwendung von KI im Bereich der Programmierung ein und könnte auch die Arbeitsweise von Programmierern verändern.
Die Veröffentlichung des o3-Modells stellt einen bedeutenden Fortschritt in der Technologie der künstlichen Intelligenz dar, und seine leistungsstarken Argumentations- und Programmierfähigkeiten werden tiefgreifende Auswirkungen auf verschiedene Bereiche haben. Mit der kontinuierlichen Weiterentwicklung und Verbesserung der Technologie können wir davon ausgehen, dass künstliche Intelligenz in Zukunft in immer mehr Bereichen eine größere Rolle spielen und der menschlichen Gesellschaft mehr Komfort bieten wird.