OpenAI最新發布的o3AI模型,以其強大的效能和高昂的運行成本引發業界關注。該模型在ARC-AGI基準測試中取得了令人矚目的成績,但每次任務的費用卻超過1000美元,遠超過其前代產品。這凸顯了人工智慧模型在效能提升與成本控制之間的矛盾,也引發了「擴展」方式收益遞減的討論。本文將深入分析o3AI模型的效能、成本以及未來發展。
OpenAI 最近推出的o3AI 模型被認為是其最強大的人工智慧產品,但其運行成本卻令人咋舌,單次任務費用超過1000美元。
根據TechCrunch 的報導,這款新模型在處理複雜問題時採用了一種稱為「測試時計算」 的技術,這意味著它在得出答案之前會花費更多時間進行思考和探索多種可能性。因此,OpenAI 工程師希望o3能夠在複雜提示下產生更優質的回應。
根據ARC-AGI 基準測試的創始人François Chollet 的說法,o3在其強大的「高計算模式」 下,得分達到了87.5%,幾乎是前一代o1模型得分32% 的三倍。這顯示o3在性能上的提升是顯著的。然而,這種精細的計算過程伴隨著巨大的開銷。為了達到這一高分,o3的計算成本超過了每個任務1000美元,使用的運算能力比低功耗版o3多出了170倍,遠高於其前身,每個任務的成本不足4美元。
這一情況使得業界對o3模型的表現和其運作成本之間的矛盾產生了關注。一方面,o3的得分大幅提升似乎證明了人工智慧模型透過「擴展」 方式,即增加處理能力和訓練數據,仍然可以獲得進步。但另一方面,關於擴展所帶來的收益遞減的批評聲音也在增加。雖然o3的提升主要得益於改進其「推理」 方式而非單純的擴展,但其高昂的運行成本無疑讓人心生憂慮。
即使是低計算版本的o3,其在基準測試中得分達到了76%,但每個任務的成本也達到了約20美元,雖然相對而言仍算是個相對便宜的選擇,但與其前代產品相比仍然貴了好幾倍。而且,考慮到ChatGPT Plus 每月收費僅25美元,這使得OpenAI 在提升用戶使用的智慧化程度時面臨著巨大的成本壓力。
在一篇關於基準測試結果的部落格中,Chollet 指出,雖然o3在接近人類的表現水平,但「成本仍然很高,尚不具備經濟性」。他表示,解決ARC-AGI 任務的人力成本約為每個任務5美元,而能耗則只是幾美分。然而,他樂觀地認為,「成本效益在未來幾個月和幾年內有可能會顯著改善。」目前,o3尚未向公眾發布,預計其「迷你版」 將於明年1月推出。
劃重點:
o3AI 模型的單次查詢成本超過1000美元,顯示出其運行的高昂費用。
在ARC-AGI 基準測試中,o3得分達到87.5%,幾乎是前一代o1模型的三倍。
目前o3尚未對外發布,預計「迷你版」 將於明年1月推出。
總而言之,o3AI模型展現了人工智慧技術強大的發展潛力,但也暴露出高成本帶來的挑戰。未來,如何平衡效能提升與成本控制將成為人工智慧領域的關鍵問題,而o3AI模型的「迷你版」也備受期待,其能否在降低成本的同時保持出色性能,值得我們持續關注。