OpenAI在為期12天的技術分享直播活動後,重磅發布了下一代推理模型o3,以及針對特定任務優化的精簡版o3-mini。 o3在多個基準測試中取得了突破性進展,其性能大幅超越前代模型o1,甚至在某些方面接近通用人工智慧(AGI)的水平。這項發布引發了業界廣泛關注,被認為將深刻影響未來的程式設計方式和程式設計師的工作模式。
OpenAI在經過12天的技術分享直播活動後,於最後一天發布了其下一代推理模型o3,這是繼早前發布的o1推理模型之後的升級版本。 o3模型系列包括o3和o3-mini兩個版本,其中o3-mini是針對特定任務進行微調的更小的精簡版模型。 OpenAI表示,o3模型在某些條件下可以接近實現通用人工智慧(AGI),即能完成人類所能完成的任何任務的人工智慧。
在ARC-AGI圖形邏輯推理基準測試中,o3模型取得了破紀錄的分數,低計算場景下得分為75.7%,而在高計算測試中,它達到了87.5%,超過了標誌著達到人類水平的門檻85%。相較之下,o1模型的得分僅在25%到32%之間,o3的表現幾乎是o1的三倍。在全球著名的編碼競賽平台Codeforces上,o3取得了2727的評分,而o1評分僅為1891。
獵豹移動獵戶星空董事長傅盛表示,OpenAI o3的發布預示著人人都是程式設計師的時代即將到來,用戶無需精通Python或C語言也能編寫程序,只需提出需求,大預言模型即可幫助完成程式設計工作。傅盛認為,o3的發布標誌著大語言模型的程式設計能力超越了99.9%的程式設計師,在Codeforces世界級程式設計比賽中,o3取得了175名的頂尖成績,而o1大概只戰勝了90%多的程式設計師,之前GPT-4o只戰勝了11%的程式設計師。
OpenAI計劃在明年1月底正式發表o3模型。傅盛指出,雖然程式設計師不會完全消失,但他們的工作將更多地轉向理解用戶需求和建立大邏輯,而將需求轉化為程式碼的工作將大幅度地由AI完成。這項發布預示著AI在程式設計領域的應用將更加廣泛,同時也可能改變程式設計師的工作方式。
o3模型的發布標誌著人工智慧技術取得了顯著進展,其強大的推理能力和程式設計能力將對各個領域產生深遠的影響。未來,隨著科技的不斷發展與完善,我們可以期待人工智慧在更多領域發揮更大的作用,為人類社會帶來更大的便利。