奧特曼在OpenAI倫敦開發者日上的最新採訪,終於完整釋出!
40分鐘的訪談過程中,奧特曼除了聊OpenAI未來模型發展方向、Agent、和最尊敬的競爭對手 (就是此前碎片式走漏風聲的幾個問題)外,還就Scaling Law、半導體供應鏈、基礎模型競爭成本、該僱用什麼年齡層的員工等十多個問題進行了快問快答。
當被問及站在OpenAI CEO這個位置上,有什麼是他過去和現在都缺乏充分準備的。
奧特曼毫不避諱地表示:產品!
整體來說,我的弱點在產品方面。
現在公司需要我在這方面有更強大、更清晰的願景。
有趣的是,如果讓現年39歲的奧特曼回到23、24歲,他會考慮在垂直方向做一些AI相關的東西。
例如輔導人類學習的AI Tutors,或是AI律師、AI CAD工程師什麼的。
以下附上這場精彩訪談的訪談全文,部分段落在不更改其原意的基礎上有所刪改。
最後還有11個快問快答彩蛋~
內容速覽
OpenAI倫敦開發者日奧特曼採訪實錄
Q1:當我們展望未來,未來OpenAI更多的是o1這樣的模型,還是說可以期待參數更大的模型?
A:我們當然希望全面推進,但推理模型這個方向對我們來說特別重要。我們寄望於用推理來解決許多多年來我們期待完成的事。
例如,推理模型能夠為新的科學做出貢獻,幫助編寫難度係數很高的程式碼——我認為這在很大程度上能推動世界向前發展。
所以可以期待一下o系列模型的快速改進,這的意義將會非常重大。
Q2:也是從OpenAI的未來計畫出發,您怎麼看待身為非技術創辦人透過開發無程式碼工具來建構、拓展ai應用程式?
A:一定會有那一天的。
我們的第一步是讓那些懂得寫程式碼的人具備更高的生產力;但落到最後,還是希望提供真正高品質的無程式碼工具。
目前已經有一些有意義的 (無程式碼)工具,但如果想完全用無程式碼的方式來創建一家新創公司,還需假以時日。
Q3:有一位創辦人提問說,當下,OpenAI顯然處於技術棧中的某個位置,OpenAI將會走多遠?如果花費大量時間來調整RAG系統,是不是一種浪費時間的行為——因為OpenAI終將在應用程式中涵蓋這一部分?
A:我們通常會回答說,OpenAI將盡最大努力,並且堅信我們一定會讓推出的模型變得越來越好。
如果你創建的是一家以「給小漏洞打補丁」為生的公司,不管OpenAI是否順利、正確地推進工作,對你的影響都不是那麼大。
換個角度來說,如果你的公司會因為「OpenAI的模型越來越好」而更加成功,你肯定會為此感到高興的。
就比方說甲骨文公司偷偷跟你說,OpenAI的o4會強得突破你的想像,你絕對樂開花了。
當然了,如果你非要挑一個o1-preview表現得不好的 領域去深耕,勉強以此為基礎,那你肯定會覺得我們的下一代模型不會像想像中表現得那麼好。
——這就是我想告訴新創公司的。
我們相信,OpenAI身處的改進軌道相當陡峭,現在模型的缺陷將會被後來者解決和彌補。
Q4:從一個創辦人的角度來看,OpenAI可能會在哪些地方(而不是其他地方)取得成功?相信投資人也很想了解這個問題,大家都不想投資虧錢。
A: OpenAI將創造出數萬億美元的市值,具體來說,是透過使用AI來建立以前覺得不可能或不切實際的產品與服務,來創造出市值新高。
我們希望推出的模型非常棒,讓使用者無後顧之憂,只需要用它做想做的事情就是了。
在GPT-3.5的時代,95%的新創公司啊、人啊,都在打賭模型不會變得更好。
其實他們做的事情,我們早就預見GPT-4可以搞定,可以做得更好,不會再出現3.5時代模型會出的錯了。如果創業者/開發者們做的事只是補 全某一代模型的某個缺點,你會發現這個缺點越來越無足輕重。
難道大家已經忘了幾年前的模型表現多糟糕嗎?其實才過去沒幾年。
但是機會遍地都是,所以乍看之下給現有模型打補丁是不錯的機會 (所以就不去搞AI助教或AI醫療顧問什麼的)。
所以我才說,一開始的時候,95%的人一定認為模型不會再改進,只有5%的人打賭模型會發展得越來越好。
不過我覺得現在的狀況已經不是這樣了。
大家現在反而覺得GPT-3.5進化到GPT-4的速度會是一種常態,但事實並非如此。還好我們內部員工都非常勤奮,我們知道會發生什麼事。
Q5:軟銀孫正義說,AI每年都會創造9兆美元的價值,這將抵銷他所認為的每年9兆美元的支出。看到這個說法的時候,怎麼想?
A:從數量級上來說,現在已經差不多了。 AI顯然會導致大量資金支出,同時創造大量的價值。
這種情況發生在每一次大型科技革命的過程中,AI顯然是其中之一。
明年將是OpenAI向下一代系統大力推進的一年。
剛才咱們談到什麼時候會出現無程式碼軟體Agent,我無法給定一個準確的時間,但可以暢想一下,如果任何人都可以描述他們想要的整個公司的軟體,這將為世界帶來多少經濟價值。
同樣的價值下,更廣泛、更容易獲得、更便宜,那將非常強大。
還有一些其他的例子,像是我之前提到的醫療保健和教育,這兩個領域對世界而言價值數兆美元。
如果AI能真正以不同於以往的方式實現這一點,我認為它帶來的經濟價值的具體數字根本不是重點,更別提導論到底是9兆還是1兆了。
但可以肯定,AI創造的價值確實令人難以置信。
Q6:開源是一種非常重要的方法。您如何看待開源在人工智慧未來中的作用? OpenAI內部討論過「我們應該開源所有模型或其中某些模型」嗎?
A:毋庸置疑,開源模型在生態中非常重要,而且現在市面上也有非常好的開源模型。
但我認為提供良好的服務和API也是有意義的——這很合理,人們會選擇適合自己的方式。
Q7:您如何看待當今Agent的定義?對你來說,Agent是什麼?
A:我沒有充分考慮過這個問題,但我可以給Agent一個長期任務,並且盡可能少地去監督它的執行過程。
Q7':您認為人們對Agent的看法其實是錯的嗎?
A:可能我們都沒有一個準確的了解,但我們都知道一些重要的指標。
例如人們在談論代表他們行事的ai agent時,常常舉的例子是讓Agent去預定餐廳。 Agent可能在線預訂 ,或打電話給餐廳訂座。
確實,Agent可以幫忙做一些事情來節省時間。不過我認為真正有趣的事,應該是讓Agent做一些人類不會或不能做的事。
打個比方,Agent不是打電話給具體某家餐廳訂座,而是聯絡300家餐廳,找出哪一家最適合我。如果打過去的電話都是Agent接的,那就更酷了!因為人類無法大規模並行推進這種事情。
再舉個更有趣的例子。
Agent可能更像一個非常聰明的同事,你和它合作一個需要耗時2天或2週項目,Agent可以自己執行,還做得很好,在必要的時候它會跟你溝通,最後交出一份出色的成果。
Q7」:這是否從根本上改變了SaaS的定價方式?SaaS通常按用戶數量定價(席位收費) ,但現在AI實際上在替代勞動力。你如何看待未來的定價方式?
A:我只能猜測一下,我真的不知道。
我可以想像一個世界,你可以要求說“我想要1/10/100個GPU不斷地為我工作”,這就不會按席位收費,而是根據持續處理這個問題的計算量來定價。
Q7”':我們是否需要為Aengts的使用場景建立特定的模型?
A:它當然需要大量的基礎設施,但我覺得o1模型指出 了通往能夠出色完成Agent任務的模型的道路。
Q8:每個人都說模型是貶值的資產,模型的商品化非常普遍。您對此有何回應和思考?當你考慮到訓練模式所需的資本密集度不斷增加時,我們是否會發現「這個領域需要大量的資金,但實際上只有很少人能做到」會逆轉?
A:模型確實是貶值的資產,但這並不意味著它們不值訓練投入的成本。更別提你訓練模型的時候會產生正向的複合效應,讓你能更好地訓練下一個模型。
我們從模型中獲得的實際收入證明了這項投資的合理性——當然,並非所有人都能做到這一點,而且有很多人在訓練模型這件事上重複造輪子。
如果你訓練的模型落後,或者沒有一個有黏性和價值的產品,那麼的確可能很難獲得投資回報。
OpenAI非常幸運地擁有ChatGPT,並且擁有數億使用我們模型的用戶。
所以即便成本很高,我們也可以把這個天文數字分攤到大量用戶身上攤薄它。
Q9:隨著時間推移,OpenAI模型如何繼續保持差異化?你最想專注於擴展這種差異化的領域是什麼?
A:推理是我們當前最重要的關注領域,我認為這將解鎖下一次在創造價值方面的巨大飛躍。
因此,我們將在各個方面改進模型,我們將進行多模態工作,並添加其他功能,我們認為這些功能對人們希望使用這些模型的方式非常重要。
Q9':你如何看待推理和多模態工作,包括挑戰和你想要實現的目標?
A:我希望它能順利實現。這顯然需要一些努力才能完成。
但是人類的嬰兒和幼兒時期,也就是擅長語言之前,仍然可以進行相當複雜的視覺推理。
Q9」:視覺能力將如何隨著o1的新推理範式而擴展?
A:在不劇透的情況下,我預期基於影像的模型將會快速發展。
你可以期待在影像模型方面的快速進展。
Q10:OpenAI如何在核心推理上取得突破?除了Transformer之外,是否需要開始推動強化學習作為一種途徑或其他新技術?
A:這是兩個問題:我們如何做到,Transformer之後是什麼。
首先,我們如何做到是我們的秘訣。
複製已知有效的東西真的很容易,原因之一是你有信心知道什麼是可能的。在研究人員做了一些事情之後,即使你不知道他們是如何做到的,你也可以去復刻它。這一點可以在GPT-4和o1的複製版中得到驗證。
真正困難的事情,也是我對OpenAI最自豪的事情,是我們反覆去做一些新的、完全未經驗證的事情。
很多機構、組織聲稱有能力做這樣的事,但實際上很少有真正做到的,包括AI領域之外。
從某種意義上說,我認為這是人類進步最重要的投入之一。
我期待在退休後想寫一本書,一本介紹我學到了些什麼的書,分享我如何建立一個能夠做到這一點的組織和公司文化的經驗(而不是一個單純複製他人成果的組織) 。
我認為世界需要更多這樣的組織,雖然它的數量會被人類才智所限。
但現實情況是有大量人才被浪費了,因為這個世界不擅長建立這樣的組織。但我還是希望有更多這樣的組織。
Q11:人才是如何被浪費的?
A:世界上有很多有才的人,但因為他們在糟糕的公司工作,或者一些原因吧,沒辦法充分發揮他們的潛力。
我對AI最興奮的一個點,就是我希望它能讓我們更能幫助每個人發揮最大潛力。
這個目標遠遠沒有達成。
我敢肯定,如果世界上很多人的人生軌跡稍有不同,他們都會是優秀的AI研究人員。
Q12:在過去的幾年裡,你有一段令人難以置信的經歷, (帶領出)令人難以置信的高速增長。你提到退休時會寫回憶錄,那麼當你回顧過去10年,你的領導方式有了什麼樣的顯著變化?
A:對我而言,這幾年最不尋常的就是事情變化的速度。
在常規的公司,你有充足的時間去實現從0到1億美元的營收,再從1億到10億,一直到100億。你無需在兩年內達成這個過程。我們確實並非傳統意義上的矽谷新創公司,
我們不得不如此迅速地達成這一目標,有很多東西我本該花費更多時間去學習 (但沒有去學習)。
Q12':有什麼東西是你不知道,而且本希望花更多時間去學習的?
A:我說一個吧,就是“讓公司專注於如何成長下一個10倍”,而不是成長10%。
這需要付出多大的努力?這件事有多困難?
如果是成長下一個10%,之前的有效的東西會仍然有效。但要讓一家營收10億美元的公司成長到營收100億美元,那就不能簡單重複之前所做的事,而是需要大量的改變。
在一個人們甚至沒有時間掌握基礎知識的世界中,因為增長太快,我嚴重低估了馬不停蹄向前衝刺到下一步所需付出的努力,同時又沒有忽視我們必須做的其它一切。
Q13:Keith Rabois (矽谷投資人,Paypal前副總裁)說你應該僱用非常年輕的、30 歲以下的人,這是彼得·蒂爾(Peter Thiel,Paypal創始人)教給他的建立偉大公司的秘訣。我很好奇,你如何看待這種觀點?你如何平衡僱用年輕的有活力但缺乏經驗的人,與那些更有經驗的人?
A:我們創辦OpenAI的時候,我就30歲左右,並不是特別特別年輕。
但目前為止,OpenAI的進展似乎還不錯~
Q13':你如何看待僱用30歲以下的人來工作?他們年輕、精力充沛、雄心勃勃,但經驗較少(有的可能也很豐富) ?
A:顯而易見,答案是你可以透過僱用兩類人來取得成功。
我們的團隊最近僱用了一個年輕人,他的工作令人驚嘆。我都不懂這些人怎麼能在如此年輕的時候把工作做得這麼漂亮? !但這就是事實。
如果你能找到這樣的人,他們會帶來令人驚嘆的新視角、能量等等。
另一方面,當設計一些人類有史以來最複雜、最昂貴的電腦系統時,我可不願意押注於一個剛起步的人。
所以需要兩者兼具。
我認為你真正想要的是一個由任何年齡層的人組成的極高人才標準,以及一個策略,即我只會僱用年輕人,或者我只會僱用年長的人。
我對Y Combinator最感激的事情之一是「缺乏經驗並不意味著沒有價值」。
有一些非常有潛力的人在職業生涯的初期就可以創造巨大的價值,我們應該把賭注押在這些人身上,這是一件偉大的事情。
Q15:有人跟我說,有時候Anthropic的模型比較適合程式設計任務,這是為什麼?你認為這種評價公正嗎?開發者該在什麼時候選擇OpenAI而不是其他模型廠商呢?
A:沒錯,Anthropic有一個非常擅長寫程式碼的模型,令人印象深刻。
我認為開發者大多數時候都會使用好幾個模型,而且隨著Agent的作用越來越大,我不知道未來會如何發展。
我認為AI將無處不在,而我們目前談論或思考它的方式感覺不太對。如果我必須描述清楚,我們會從討論模型轉向討論系統,但這需要一些時間。
Q16:當我們考慮scale模型時,你認為在多少次模型迭代內,Scaling Law (縮放定律)仍將適用?人們普遍認為它不會持續太久,但它似乎持續的時間比人們想像的要長。
A:我理解這個問題的核心是“模型能力的改進是否會像過去那樣?”
我相信答案是肯定的,並且會持續很長時間。
Q16':你懷疑過這件事嗎?
A:完全沒有。
Q16」:為什麼?
A:我們遇到過我們不理解的行為,例如失敗的訓練運行,或其它各種各樣的事情。
當我們接近一個範式的結束時,我們不得不想出下一個範式。
Q16”':哪一個是最難駕馭的?
A:當時研究GPT-4的時候,有一個問題非常棘手,我們真不知道該怎麼解決它。
雖然最後找到了解決辦法, 但很長一段時間我們都不知道該如何推進這個專案。
後來我們轉向我們長期以來感興趣的方向,就是o1和推理模型,但在此之前經歷了一條漫長而曲折的研究之路。
Q17:訓練和運作都可能失敗,保持士氣是不是一件困難的事?你會如何保持/提振士氣?
A:像你知道的那樣,我們很多員工都對建構agi這事兒是非興奮,這是非常直接的動力。
沒有人期望通往成功的這條路是輕鬆的、直線的。
有句話說得好,大概是說「我從不祈禱上帝站在我這邊,我從來都是祈禱並希望自己站到上帝那邊」。
在某種程度上,押注深度學習感覺就像站在了天使那側,儘管你沿途會遇到一些大的絆腳石,但最終會發現它似乎總是會奏效。
因此,對此有深刻的信念對團隊保持士氣十分有利。
Q18:我可以問一個很奇怪的問題嗎?最近聽到一句很棒的話,「生活中最沉重的東西不是鐵或金,而是未做出的決定」。哪一個未做出的決定最讓你煩惱?
A:我每天做 (及沒做)的決定都不太一樣,但沒有一個是「大」的決定。
有一些重大的事情,例如是否會押注於下一個產品,或者我們是否會喜歡以這種或那種方式構建我們的下一台計算機——這些都有點像高風險的單向傳送門,我會像其他人一樣拖延很久。
但大多數情況下,困難的是每天都有些事情在投票比例為51:49的情況下讓我最終拍板。這些事可能本身就是51:49的,而且我不覺得我能比其他人做得更好,但我又必須做最終決定。
Q18':當你要對這些51:49的事做決策時,你通常會打電話給誰?
A:沒具體的誰。
如果做一切事都要依靠一個人,我覺得是錯的。對我來說,正確的做法是有15或20個人為我建議,他們中每一個都在特定的領域有良好的直覺或背景。
你可以打電話給 (某個領域)最好的專家諮詢,而不是在各方面都只依賴一個人。
Q19:接下來我想談談半導體供應鏈。你對半導體供應鏈有多擔心?
A:我不知道如何量化這個擔憂。
不可否認對它是擔心的,但這不是我的首要擔憂,但它在所有擔憂的前10%之內。
我們已經陷入了太多的麻煩,已經超越了為此擔心的階段。
在某種程度上,我認為這一切都會順利進行,但現在感覺有一個非常複雜的系統,每個層面都各自運作。在OpenAI內部也是如此,在任何一個團隊內部都是如此。
舉個半導體的例子,你必須平衡電源可用性與正確的網路決策,以及能夠及時獲得足夠的晶片,以及研究可能存在的任何風險並備好與之相交,這樣你就不會被完全措手不及,或者手裡面拿著一個無法利用的系統。
「供應鏈」聽起來太像一個pipeline了,但每個層次上的、整體生態系統的複雜性,是我在任何行業中前所未見的。
怎麼說呢,這可能是我最大的擔憂。
Q20:很多人把這波AI浪潮與網路比較,尤其是在興奮和熱情方面。我覺得兩者所耗費的金額還是有些不同。拉里·艾里森(甲骨文公司創辦人)說進入基礎模型競賽的起點將花費1000億美元,你同意這個說法嗎?這是合理的嗎?
A:不,我認為會花費更少。
在基礎模型領域競爭的成本將不到1000億美元。
一個有趣的現像是,每個人都喜歡用先前的科技革命作為例子,來談論新的科技。我認為這是一個不好的習慣,但我理解人們為什麼要這樣做。
在我眼中,人們用來類比AI的例子特別糟糕,顯而易見的,網路和AI非常不同。
你提到一個關於成本的事情,以及是否需要花費1000億美元來競爭,但互聯網革命的特徵是那時候起步真的很容易,而且對不少公司來說,這一波浪潮只是互聯網的延續。
就像有人製造了這些AI模型,你可以使用它們來建造各種偉大的東西;但如果你試圖建造AI本身,那就完全不同了。
人們常用來類比AI的另一個例子是電力。基於很多原因,我覺得這也不合理。
我最喜歡用來類比的例子是晶體管。
這是一項新的物理發現,它具有令人難以置信的縮放特性,很快就滲透到了各個地方。
我們現在可以想像到摩爾定律之類的東西,就像人工智慧的一系列定律告訴我們它會以多快的速度變得更好。
每個人都受益於它,整個科技業都受益於它。產品和服務中有很多晶體管,但你並不真正將它們視為晶體管公司。
這是一個非常複雜、非常昂貴的工業過程,具有龐大的供應鏈。
基於這個非常簡單的物理發現,帶來了長期的巨大經濟成長——儘管大多數時候你並沒有考慮它。
你不會說“這是一個晶體管產品”,只會覺得“OK,這東西可以為我處理資訊”。
你甚至會理所當然地忽略電晶體的存在。
快問快答彩蛋
Q1:如果你現在20歲出頭,使用我們今天的基礎設施,你會選擇做什麼?
A:某個AI支援的垂直領域,我會選擇AI助教,或是我能想像到的最好的AI律師、AI醫療顧問,任何類似的東西。
Q2:如果你要寫一本書,你會給它取什麼名字?
A:我還沒準備好標題,除了部分我想寫的東西,我還沒有完整構想過這本書。
不過我認為它會與人類潛能有關。
Q3:在AI領域,有什麼是沒受到足夠的關注,但每個人都應該花更多時間在上面?
A:某種能夠理解你整個生活的AI,我希望看到有很多不同的方法可以解決這個問題。
不一定需要真的有無限的上下文,但以某種方式,你可以擁有一個知道關於你的所有事情、可以存取你的所有資料的AI Agent。
Q4:上個月有什麼事情讓你感到驚訝,Sam?
A:一個我不能說的研究成果,但它好得令人震驚。
Q5:你最尊敬哪位競爭對手?為什麼是他們?
A:我想說,我尊敬目前這個領域的每個人。
我認為整個領域充滿了才華橫溢、非常努力的人。
我並不是迴避問題,我可以指出每個地方都有超級有才華的人,做著超級出色的工作。
Q6:告訴我,你最喜歡的OpenAI API是什麼?
A:我認為新的即時API非常棒,我們現在有一個龐大的API 業務,裡面有很多好東西。
Q7:你今天最尊敬AI領域的誰?
A:讓我向Cursor團隊致敬。
有很多人在AI方面做著令人難以置信的工作,但在使用AI、讓AI提供真正神奇的體驗、創造大量價值的方面,Cursor以人們之前沒有想到的方式將這些部分拼湊在一起,我認為這是非常了不起的。
這個答案排除了OpenAI裡的人,不然我得說出一長串名字。
Q8:你如何看待延遲和準確性之間的權衡?
A:需要一個在延遲和準確性之間的刻度標準。我們正在做快問快答,我沒有刻意加快速度,但也盡量不想太久。
在這種情況下,你想要的是 (降低)延遲。如果換成想在物理學上做出新的重要發現,就願意多等幾年。
答案是,應該由使用者來控制這個權衡。
Q9:我相信每個人都會對自己的領導力感到不安,在這種情況下,以及您希望改進自己的領導領域時,作為OpenAI的領導者、CEO,您最希望改進哪些方面?
A:這是一個很長的清單……我試著釐清排名第一的是哪一個。
這週最困擾我的事情是,我對我們產品策略的細節比過去還要不確定。
我認為該產品總體上是我的弱點,現在公司需要我在這方面有更強大、更清晰的願景。
我們有一位出色的產品主管和一支出色的產品團隊,但我希望在這個領域我能更強大。
Q10:你僱用了Kevin Weil (來擔任CPO) ,我認識Kevin很多年了,他非常出色。是什麼讓你覺得Kevin是世界級的產品領導者?
A: 「紀律」是我想到的第一個字。
我們將專注於我們要說「不」的事情,真正試圖代表使用者說為什麼我們要做或不做某事,真正努力不抱持幻想。
Q11:Sam,你接受了很多訪問。
最後我想談談,我們對OpenAI有五年的展望和十年的展望。
A:如果我們是對的,我們可以輕鬆地在接下來兩年內開始製造系統,幫助科學進步。
五年後,OpenAI的技術進步速度會快到令人難以置信,完全可以用瘋狂來形容。
第二點是,社會本身的變化其實很小。
就像五年前問大家電腦是否會通過圖靈測試,大家都會搖頭。
如果你說一個神諭告訴你會怎麼樣,他們會說:oh,這將會是一個瘋狂的、驚人的社會變化。
而現在,我們確實通過了圖靈測試,社會並沒有太大的改變。
一切只是呼嘯而過。
我期望不斷發生的事情就是進步,科學進步,不斷前進,以一種我認為良好和健康的方式超越所有期望,同時社會變化並沒有那麼大。