OpenAI的成長(zhǎng)歷程和競(jìng)爭(zhēng)策略。
導(dǎo)語(yǔ):雖然ChatGPT已在全球掀起顛覆性的AI革命,然而很少有人了解ChatGPT背后誕生的秘辛。近期,湛廬文化推出“ChatGPT之父”山姆奧爾特曼的全新傳記《奧爾特曼傳》。本書(shū)作者周恒星基于與奧爾特曼近10年的交流,首次全方位、近距離地揭秘了這位科技巨頭的Ai帝國(guó)、權(quán)力之路和未來(lái)藍(lán)圖。
在ChatGPT發(fā)布2周年之際,讓我們共同走進(jìn)書(shū)中的世界,跟隨奧爾特曼的腳步,探尋GPT模型“從零到一”的誕生歷程,致敬那些在創(chuàng)新道路上勇往直前的探索者們!
書(shū)名:《奧爾特曼傳》
作者:周恒星
定價(jià):99.90元
出版時(shí)間:2024年10月
出版社:湛廬文化/浙江科學(xué)技術(shù)出版社
(以下內(nèi)容,引自周恒星《奧爾特曼傳》)
01 西部世界
2016年初的硅谷,空氣中彌漫著焦慮的氣息。公開(kāi)和私下里,人們都在討論科技泡沫是不是要破了。
一方面,整個(gè)2015年科技公司IPO(首次公開(kāi)募股)的比例跌至過(guò)去7年來(lái)最低點(diǎn),一些小型科技公司(如yelp)的市值遭受了重創(chuàng);另一方面,科技巨頭(如蘋(píng)果和谷歌)的股價(jià)卻屢創(chuàng)新高。
這年秋天,在硅谷的一處豪宅里,舉行了一場(chǎng)私人放映活動(dòng),播放的是探討人工智能意識(shí)的科幻電視劇《西部世界》。
這場(chǎng)活動(dòng)的召集人是時(shí)年31歲的奧爾特曼;顒(dòng)地點(diǎn)在奧爾特曼的朋友、俄羅斯籍猶太裔風(fēng)險(xiǎn)投資家尤里米爾納(Yuri Milner)位于洛斯阿爾托斯山上的豪宅里。
受邀參加活動(dòng)的嘉賓都收到了這樣一封邀請(qǐng)函:
山姆奧爾特曼和尤里米爾納邀請(qǐng)您參加《西部世界》首播集上映前的觀影會(huì),這是一部HBO發(fā)行的,探索人工意識(shí)和人工智能未來(lái)的新連續(xù)劇。
參加放映活動(dòng)的嘉賓都是硅谷赫赫有名的人物,包括谷歌聯(lián)合創(chuàng)始人謝爾蓋布林,以及許多從YC孵化器中脫穎而出的年輕創(chuàng)始人。
作為硅谷社交圈的中心,奧爾特曼希望通過(guò)這場(chǎng)放映活動(dòng),一方面引起人們對(duì)AI技術(shù)和安全性的關(guān)注,另一方面,他希望引導(dǎo)人們將注意力從對(duì)互聯(lián)網(wǎng)轉(zhuǎn)移到對(duì)硬科技(hard tech)上!坝部萍肌敝傅氖且揽靠茖W(xué)技術(shù)的突破和工程能力的發(fā)展,帶來(lái)重大創(chuàng)新和變革的高科技領(lǐng)域。而AI毫無(wú)疑問(wèn)是硬科技“皇冠”上的“明珠”。
奧爾特曼認(rèn)為并不存在科技泡沫,當(dāng)時(shí)是處在科技低迷期。在一篇名為《硬科技回來(lái)了》(Hard Tech is Back)的博客文章中,奧爾特曼寫(xiě)道:
把那些關(guān)于股市何時(shí)崩盤(pán)以及融資環(huán)境受到影響的無(wú)聊文章留給其他人寫(xiě)吧,歷史也會(huì)忘記那些人,F(xiàn)在是采取長(zhǎng)期主義并利用技術(shù)解決重大問(wèn)題的最佳時(shí)機(jī),我們比以往任何時(shí)候都更需要這些問(wèn)題的解決方案。
在這篇文章的最后,奧爾特曼特別提到了AI:AGI和特定場(chǎng)景下的AI,在當(dāng)前創(chuàng)業(yè)領(lǐng)域中似乎是最明顯的贏家。
他顯然是在暗示OpenAI將成為贏家之一,雖然當(dāng)時(shí)它還默默無(wú)聞。
02 打造現(xiàn)代版施樂(lè)PARC
2016年1月4日,新年伊始的第一個(gè)周一,OpenAI創(chuàng)始團(tuán)隊(duì)的10個(gè)人就開(kāi)始在布羅克曼的家中工作了。
第一次開(kāi)會(huì)的時(shí)候,蘇茨克弗轉(zhuǎn)身想在白板上寫(xiě)些東西,卻發(fā)現(xiàn)布羅克曼家中并沒(méi)有白板。布羅克曼只好趕快去購(gòu)置了一些辦公用品。
OpenAI 前員工皮特阿貝爾(Pieter Abbeel)回憶稱:
舊金山市中心的房?jī)r(jià)很高,布羅克曼的公寓也不算大,只有一個(gè)較大的廚房和一間帶沙發(fā)的客廳。有時(shí)團(tuán)隊(duì)成員找不到地方,只好坐在臥室的床上工作。但團(tuán)隊(duì)的氛圍非常好,這10個(gè)人可以說(shuō)是世界上最聰明的群體。
接下來(lái)的一個(gè)月里,布羅克曼的帶領(lǐng)下,團(tuán)隊(duì)就愿景、工作方式和目標(biāo)進(jìn)行了深入討論,并制定了一套面試流程。接下來(lái),他們購(gòu)置了服務(wù)器,創(chuàng)建了一系列的賬號(hào)。剩余時(shí)間,布羅克曼拼命學(xué)習(xí)深度學(xué)習(xí)的教材。布羅克曼說(shuō):
我只是一個(gè)解決問(wèn)題的人,花上幾周時(shí)間找到一個(gè)工程問(wèn)題,然后成為這個(gè)問(wèn)題的解決者。
在OpenAI成立的頭兩年,布羅克曼和蘇茨克弗共同做出了大部分日常決策,布羅克曼管理初創(chuàng)公司的軟件工程師,蘇茨克弗則帶領(lǐng)研究人員開(kāi)展研究。
與此同時(shí),布羅克曼一直在與奧爾特曼通過(guò)電話保持溝通。奧爾特曼說(shuō):
布羅克曼具有很強(qiáng)的能力,既能洞察技術(shù)問(wèn)題每一部分的細(xì)枝末節(jié),又能把握每個(gè)層面的重點(diǎn),然后還能從戰(zhàn)略層面思考如何將所有部分整合在一起。
布羅克曼必須解決的一個(gè)難題是,如何讓研究人員和工程師從同樣的角度出發(fā)進(jìn)行工作。據(jù)內(nèi)部人士透露,一些OpenAI的工程師低估了研究人員貢獻(xiàn)的重要性,研究人員則有時(shí)將工程師視為技術(shù)人員而非科學(xué)家。
同為OpenAI董事會(huì)成員的Quora的CEO亞當(dāng)?shù)ぜ?Adam D’Angelo)說(shuō),過(guò)去的AI研究大多在實(shí)驗(yàn)室里進(jìn)行,要把技術(shù)轉(zhuǎn)化為產(chǎn)品很難,布羅克曼是那個(gè)讓AI成功產(chǎn)品化的人。
馬斯克和奧爾特曼每周都會(huì)來(lái)探班。阿貝爾回憶稱,馬斯克經(jīng)常一進(jìn)客廳就往沙發(fā)上一坐,然后說(shuō):“好吧,最近都發(fā)生了什么?”布羅克曼便會(huì)向他介紹最近一周的工作進(jìn)展。
自從跟施樂(lè)的計(jì)算機(jī)科學(xué)家艾倫凱共進(jìn)晚餐后,布羅克曼和蘇茨克弗就開(kāi)始計(jì)劃打造一家現(xiàn)代版的施樂(lè)PARC:PARC的開(kāi)放和自由研究催生了從圖形用戶界面到激光打印機(jī)再到面向?qū)ο缶幊痰纫幌盗袆?chuàng)新;盡管PARC雖然屬于施樂(lè)公司,但它的研究成果也惠及了包括蘋(píng)果在內(nèi)的眾多公司,史蒂夫喬布斯也能夠接觸PARC的研究成果。布羅克曼也希望每個(gè)人都能接觸到OpenAI的研究成果。布羅克曼說(shuō)道:
RARC真正特別的地方在于,他們聚集了一群聰明人,并賦予他們自由發(fā)揮的空間。我們希望構(gòu)建一個(gè)共同的愿景,同時(shí)避免中央控制。放棄控制是開(kāi)源理念的核心。秉持開(kāi)源理念的人相信,如果有足夠多的人致力于一個(gè)共同目標(biāo),最終的成果將超過(guò)任何封閉性環(huán)境中構(gòu)思出來(lái)的東西。
03 “OpenAI 是最好的去處”
2016年4月,團(tuán)隊(duì)終于告別了布羅克曼的家,搬進(jìn)了位于舊金山教會(huì)區(qū)的一家小型巧克力工廠的樓上。這間辦公室是奧爾特曼從紅杉資本那里租來(lái)的。
搬進(jìn)新辦公室后,奧爾特曼做的第一件事是在墻上寫(xiě)下美國(guó)海軍上將海曼里科弗(Hyman Rickover)的名言:
生命的偉大之處不在于知識(shí),而在于行動(dòng)。
在《硬科技回來(lái)了》這篇博客中,奧爾特曼并沒(méi)有提到OpenAI,因?yàn)樵诋?dāng)時(shí)的環(huán)境下,OpenAI顯然不是贏家。在與科技巨頭爭(zhēng)奪人才的戰(zhàn)爭(zhēng)中,OpenAI處于下風(fēng)。早在2014年,微軟副總裁彼得李(Petr Lee)就表示,一位頂級(jí) AI 研究員的成本已經(jīng)超過(guò)了美國(guó)國(guó)家橄欖球聯(lián)盟(NFL)中一位頂級(jí)四分衛(wèi)的成本。
作為一家非營(yíng)利性組織,OpenAI的資金有限,不能像許多創(chuàng)業(yè)公司那樣提供股權(quán)激勵(lì)。在OpenAI成立當(dāng)月,奧爾特曼接受媒體采訪時(shí)承認(rèn),自己在營(yíng)利性的初創(chuàng)企業(yè)方面積累了豐富的經(jīng)驗(yàn),而在非營(yíng)利性組織方面的經(jīng)驗(yàn)很少。但他相信,即使是一家非營(yíng)利性組織,組織的質(zhì)量也是由人才決定的。
由于奧爾特曼和馬斯克都有全職工作,蘇茨克弗將主要重心放在了研究上,招聘的重任便落在了布羅克曼肩上。奧爾特曼曾形容布羅克曼是“世界級(jí)”的招聘高手:“他會(huì)精心策劃面試的每個(gè)細(xì)節(jié),深入研究候選人的背景,并進(jìn)行周到而持久的后續(xù)跟進(jìn)!
“他非常愿意接受反饋。無(wú)論是大事小情,他總是樂(lè)于傾聽(tīng),從不生氣,并且能夠迅速處理。”奧爾特曼在自己的博客中對(duì)布羅克曼大加贊賞。
而且布羅克曼工作非常勤奮。他的同事回憶說(shuō),即使在OpenAI搬出他家的公寓后,他依然幾乎住在辦公室里。一位前員工說(shuō),當(dāng)他們?cè)缟系竭_(dá)辦公室時(shí),布羅克曼已經(jīng)在伏案工作,當(dāng)他們晚上離開(kāi)時(shí),他仍在敲擊鍵盤(pán)。
2016年5月,當(dāng)時(shí)在谷歌大腦工作的頂尖人工智能研究員達(dá)里奧阿莫代(Dario Amodei)到OpenAI的辦公室拜訪。奧爾特曼試圖說(shuō)服他加入,但阿莫代告訴奧爾特曼和布羅克曼,沒(méi)有人理解他們?cè)谧鍪裁矗篛penAI籌集了10億美元并雇用了一個(gè)有30名研究員的團(tuán)隊(duì),這令人印象深刻但這是為了什么?
“AI領(lǐng)域內(nèi)有二三十個(gè)人,還有哈佛大學(xué)哲學(xué)家尼克博斯特羅姆(Nick Bostrom)和維基百科的文章都在說(shuō),OpenAI的目標(biāo)是構(gòu)建友好型AI然后將源代碼發(fā)布給全世界!卑⒛苫蟮乜粗鴬W爾特曼和布羅克曼。
“我們不打算發(fā)布所有的源代碼,”奧爾特曼說(shuō),“但請(qǐng)不要試圖在維基百科上糾正這一點(diǎn)。通常情況下,這只會(huì)讓事情變得更糟!
“那你們的目標(biāo)是什么?”阿莫代繼續(xù)追問(wèn)。
布羅克曼有點(diǎn)無(wú)奈地回答說(shuō):“我們現(xiàn)在的目標(biāo)是……盡最大的努力。這有點(diǎn)模糊!
阿莫代走后,奧爾特曼和布羅克曼開(kāi)始思考,如果想招募最優(yōu)秀的團(tuán)隊(duì),就必須有清晰的使命和價(jià)值觀。
“我們應(yīng)該傳達(dá)一個(gè)足夠大膽的愿景!眾W爾特曼建議說(shuō)。
2016年6月,在一篇名為《我們的技術(shù)目標(biāo)》(OpenAI Technical Goals)的公告中,OpenAI詳細(xì)列出了公司的使命和幾大技術(shù)目標(biāo)。其中第一句就是:
OpenAI的使命是構(gòu)建安全的AI,并確保AI的好處盡可能廣泛而平等地分布。
這篇文章的署名是OpenAI的4位創(chuàng)始人:蘇茨克弗、布羅克曼、奧爾特曼、馬斯克。
《紐約時(shí)報(bào)》記者凱德梅茨(Cade Metz)評(píng)論說(shuō):
從一開(kāi)始,他們就設(shè)立了非常崇高的目標(biāo),這些目標(biāo)容易衡量、容易理解,并保證能夠吸引注意力,即使他們實(shí)際上還沒(méi)有做任何實(shí)質(zhì)性的事情。
OpenAI聯(lián)合創(chuàng)始人、研究員沃伊切赫扎倫巴(WojciechZaremba)回憶說(shuō),來(lái)自科技巨頭的工作邀約金簡(jiǎn)直高到離譜。盡管他對(duì)谷歌和Facebook等公司非常尊重,但那些近乎瘋狂的報(bào)價(jià)實(shí)際上讓他感到厭惡。他更加傾向于加入OpenAI這樣具有宏偉使命的創(chuàng)業(yè)公司。
“我意識(shí)到,”扎倫巴說(shuō),“OpenAI是最好的去處!
在OpenAI的官網(wǎng)上,這家初創(chuàng)組織的網(wǎng)頁(yè)設(shè)計(jì)顯得有些過(guò)于花哨,并且公告更新頻繁,每一篇文章都配有精美的插圖我相信這些插圖至少在早期是手工繪制的,而非AI所作。
在當(dāng)時(shí),OpenAI的官網(wǎng)上每隔幾天就會(huì)發(fā)布新成員加入的公告,公告中會(huì)詳細(xì)列出新成員的名字和簡(jiǎn)介,連實(shí)習(xí)生也未遺漏。這很可能是奧爾特曼的主意。一方面,這種儀式感增強(qiáng)了團(tuán)隊(duì)的凝聚力;另一方面,也吸引了潛在的招聘對(duì)象。(“哇,又一個(gè)行業(yè)大咖加入了OpenAI,我是不是也應(yīng)該考慮一下?”)
比如2016年3月,他們公布了4位全職研究員的加入,這些研究員都是在華盛頓瑰麗酒店的一次晚宴上招募的,其中就包括機(jī)器學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物伊恩古德費(fèi)洛(Ian Goodfellow);還有一位華人實(shí)習(xí)生范林曦(Linxi “Jim” Fan),他后來(lái)成了英偉達(dá)的 AI 科學(xué)家,在社交媒體上非;钴S。
5月加入的員工中,有幾位是布羅克曼在Stripe的舊部,包括設(shè)計(jì)團(tuán)隊(duì)主管路德維格彼得松(Ludwig Pettersson)和工程師喬納斯施奈德(Jonas Schneider)。
8月的公告顯示,奧爾特曼一直想招募的達(dá)里奧阿莫代加入了公司,出任首席研究員。他的妹妹丹妮拉阿莫代(Daniela Amodei)之前就與布羅克曼合作過(guò),兩年后,在布羅克曼的邀請(qǐng)下,丹妮拉也加入了團(tuán)隊(duì)。
2017年1月的公告顯示,前谷歌科學(xué)家、機(jī)器學(xué)習(xí)領(lǐng)域的重量級(jí)人物雅羅斯拉夫布拉托夫(Yaroslav Bulatov)加入了團(tuán)隊(duì),還有幾位YC的骨干成員也加入進(jìn)來(lái)。這篇公告還透露,OpenAI團(tuán)隊(duì)現(xiàn)在有45名成員,團(tuán)隊(duì)的目標(biāo)是:
齊心協(xié)力,不斷推進(jìn)AI能力的發(fā)展前沿?zé)o論是驗(yàn)證新的想法、創(chuàng)建新的軟件系統(tǒng),還是在機(jī)器人上部署機(jī)器學(xué)習(xí)。
04 “我們從零開(kāi)始”
OpenAI看似目標(biāo)明確,實(shí)則缺乏方向。
奧爾特曼在YC的經(jīng)歷似乎并沒(méi)有派上用場(chǎng)。在YC,奧爾特曼總是告訴創(chuàng)始人,要打破常規(guī)快速行動(dòng),迅速推出產(chǎn)品。然而,他后來(lái)承認(rèn):
OpenAI做了很多與YC建議的標(biāo)準(zhǔn)相反的事情。成立之初,我們對(duì)產(chǎn)品沒(méi)有任何概念,也沒(méi)有與用戶進(jìn)行交流。
奧爾特曼擅長(zhǎng)向投資人推銷項(xiàng)目,但在OpenAI這里卻行不通,因?yàn)镺penAI靠的是捐贈(zèng)而非投資。要持續(xù)獲得捐贈(zèng),就必須拿出實(shí)實(shí)在在的研究成果,而不是承諾投資回報(bào)。
由于缺乏明確的方向,團(tuán)隊(duì)在布羅克曼和蘇茨克弗的帶領(lǐng)下,確定了幾個(gè)關(guān)鍵的研究方向來(lái)探索AI的可能性。
l 第一,OpenAI推出了“Universe”平臺(tái),旨在創(chuàng)建一個(gè)虛擬世界,讓AI可以像人類一樣操作電腦,通過(guò)虛擬的鍵盤(pán)和鼠標(biāo)來(lái)玩游戲、瀏覽網(wǎng)頁(yè)和觀看視頻。這個(gè)平臺(tái)的靈感來(lái)源于成功推動(dòng)圖像識(shí)別技術(shù)發(fā)展的ImageNet。Universe提供了一個(gè)通用接口,通過(guò)VNC服務(wù)器連接無(wú)限的互聯(lián)網(wǎng)環(huán)境,使AI能夠在多種游戲和應(yīng)用中進(jìn)行訓(xùn)練,包括EA、MicrosoftStudios和Valve等公司授權(quán)的游戲。
l 第二,OpenAI在機(jī)器人技術(shù)方面取得了顯著進(jìn)展。沃伊切赫扎倫巴帶領(lǐng)的團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)能夠自學(xué)還原魔方的五指機(jī)械手。這個(gè)項(xiàng)目通過(guò)數(shù)字仿真,在虛擬現(xiàn)實(shí)中訓(xùn)練機(jī)器手,讓它在相當(dāng)于一萬(wàn)年的時(shí)間里學(xué)會(huì)了還原魔方的各種動(dòng)作。這種方法的巨大優(yōu)勢(shì)在于,機(jī)器人能夠在虛擬環(huán)境中學(xué)習(xí)技能,然后將這些技能應(yīng)用到現(xiàn)實(shí)世界中,處理各種不確定性。
l 第三,他們嘗試在復(fù)雜的游戲環(huán)境中訓(xùn)練AI。布羅克曼認(rèn)為,DOTA(《魔獸爭(zhēng)霸》)是一個(gè)極佳的訓(xùn)練場(chǎng),因?yàn)樗婕皥F(tuán)隊(duì)合作、實(shí)時(shí)策略、不完全信息以及龐大的英雄和物品組合。布羅克曼領(lǐng)導(dǎo)的DOTA2項(xiàng)目幫助打破了僵局。為了推動(dòng)這項(xiàng)工作,布羅克曼與DOTA2的開(kāi)發(fā)人員進(jìn)行了數(shù)小時(shí)的電話交談,以弄清楚如何讓玩游戲的軟件工作,這是一個(gè)技術(shù)挑戰(zhàn),因?yàn)橛螒蚝蚈penAI的算法是用不同的編程語(yǔ)言編寫(xiě)的。
OpenAI的AI首次亮相是在2017年的DOTA 2國(guó)際邀請(qǐng)賽上,它在1v1的對(duì)決中戰(zhàn)勝了頂尖選手登迪(Dendi)。
如果我們回頭看,實(shí)際上OpenAI的方向是錯(cuò)的:當(dāng)時(shí)OpenAI內(nèi)部以及業(yè)內(nèi)的普遍觀點(diǎn)是,要想做出強(qiáng)大的AI,有時(shí)需要從瑣碎的事情開(kāi)始。
電子游戲和機(jī)器人手臂將為自動(dòng)駕駛汽車和治愈癌癥的AI鋪平道路。所以當(dāng)時(shí)這些系統(tǒng)都是窄領(lǐng)域的,非常有針對(duì)性下圍棋的系統(tǒng)甚至不能下國(guó)際象棋,更不用說(shuō)理解語(yǔ)言了。預(yù)測(cè)機(jī)票價(jià)格波動(dòng)的系統(tǒng),卻不能處理文本。因此,每次有一個(gè)新的應(yīng)用程序,都需要訓(xùn)練一個(gè)新的系統(tǒng)。這需要很長(zhǎng)時(shí)間以及大量標(biāo)注數(shù)據(jù)等。
OpenAI的前員工回憶當(dāng)時(shí)的情景:
我們?cè)谧鲆恍╇S機(jī)的事情,看看會(huì)發(fā)生什么。有時(shí)感覺(jué)構(gòu)建的東西和想象的目標(biāo)之間有很大的差距。上班時(shí)大家編程讓機(jī)器人玩電子游戲,午餐時(shí)則圍坐在桌旁,談?wù)撝绾握热祟悺?br/>
客觀地說(shuō),通過(guò)在虛擬世界和復(fù)雜游戲環(huán)境中訓(xùn)練AI,OpenAI展示了其在AI領(lǐng)域的野心和創(chuàng)新。但他們并沒(méi)有取得突破性的進(jìn)展,最初捐贈(zèng)的資金也在一點(diǎn)點(diǎn)耗盡。雖然團(tuán)隊(duì)的干勁非常高漲,但馬斯克和奧爾特曼卻在暗暗著急。
奧爾特曼承認(rèn):
我們什么都不順利,而谷歌擁有一切:所有的人才、所有的人力、所有的資金。
布羅克曼后來(lái)回憶說(shuō):
我們已經(jīng)成立了兩年,我們做了什么?我們?nèi)〉昧耸裁闯删?我們有一支很棒的團(tuán)隊(duì),但是我們有出色的結(jié)果嗎?我認(rèn)為我們都非常雄心勃勃。我們都真誠(chéng)地希望能在這個(gè)領(lǐng)域產(chǎn)生影響。我們都渴望感覺(jué)到自己能夠引導(dǎo)它,讓情況與沒(méi)有我們時(shí)有所不同。這就是我們聚集在這里的原因。然而,當(dāng)時(shí)我們還不清楚這一切能否實(shí)現(xiàn)。
這種焦慮甚至讓布羅克曼開(kāi)始練習(xí)舉重,他開(kāi)玩笑說(shuō),即使OpenAI倒閉了,至少在這段時(shí)間里還能有個(gè)可以交代的事情。
在那段時(shí)間,OpenAI還進(jìn)行了一次小規(guī)模的裁員,暫停了機(jī)器人手臂的項(xiàng)目。機(jī)器學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物伊恩古德費(fèi)洛也在這段時(shí)間重新回到了谷歌。奧爾特曼后來(lái)回憶道:
我們太早開(kāi)始研究機(jī)器人了,所以不得不擱置那個(gè)項(xiàng)目。那個(gè)項(xiàng)目也因?yàn)殄e(cuò)誤的原因而變得困難,無(wú)助于我們?cè)跈C(jī)器學(xué)習(xí)研究的困難部分取得進(jìn)展。我們一直在處理糟糕的模擬器和肌腱斷裂之類的問(wèn)題。隨著時(shí)間的推移,我們也越來(lái)越意識(shí)到,我們首先需要的是智能和認(rèn)知,然后才能想辦法讓它適應(yīng)物理特性。從我們構(gòu)建這些語(yǔ)言模型的方式來(lái)看,從那兒開(kāi)始更容易。但我們一直計(jì)劃回到這個(gè)問(wèn)題上來(lái)。
與谷歌的競(jìng)爭(zhēng)漸漸演變成了一場(chǎng)軍備競(jìng)賽。資金難題并不是蘇茨克弗和布羅克曼可以解決的,于是問(wèn)題拋到了奧爾特曼和馬斯克兩位聯(lián)合主席這里。奧爾特曼后來(lái)坦誠(chéng),“我們并沒(méi)有直觀意識(shí)到這個(gè)項(xiàng)目會(huì)有多昂貴”,他補(bǔ)充道,“我們現(xiàn)在仍然不知道”。
在YC的經(jīng)歷讓奧爾特曼更善于傾聽(tīng)并想方設(shè)法解決問(wèn)題。他明白,為了提高算力必須籌措更多的資金。為此,奧爾特曼研究了多種為OpenAI籌集資金的方案,例如獲得美國(guó)政府的資金支持和推出新的加密貨幣。然而,他也承認(rèn):“沒(méi)有人愿意以任何方式資助這個(gè)項(xiàng)目,那段時(shí)間真的很艱難!
布羅克曼有些無(wú)奈地說(shuō):
想象一下我們從零開(kāi)始,“我們只是有這樣一個(gè)理想,希望AGI能夠順利發(fā)展!
就在此時(shí),他們的競(jìng)爭(zhēng)對(duì)手谷歌給了他們一次關(guān)鍵助攻。
05 Transformer論文和GPT-1發(fā)布
2017年初,蘇茨克弗與OpenAI的研究科學(xué)家亞歷克拉德福德(Alec Radford)開(kāi)展了一系列關(guān)于神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理領(lǐng)域的研究。拉德福德很年輕,當(dāng)時(shí)只有23歲。拉德福德的模型足夠直觀,當(dāng)他審視模型的隱藏層時(shí),他意外地發(fā)現(xiàn)了一個(gè)專門(mén)用于分析評(píng)論情感的特定神經(jīng)元。以往的神經(jīng)網(wǎng)絡(luò)雖然也能進(jìn)行情感分析,但它們需要明確的指示并接受特殊訓(xùn)練,還要使用標(biāo)記了情感的數(shù)據(jù)。然而,拉德福德的神經(jīng)網(wǎng)絡(luò)卻自發(fā)地學(xué)會(huì)了這項(xiàng)技能。
他們的第一個(gè)實(shí)驗(yàn)是掃描20億條Reddita的評(píng)論,用神經(jīng)網(wǎng)絡(luò)訓(xùn)練一個(gè)語(yǔ)言模型。像OpenAI早期的很多實(shí)驗(yàn)一樣,這個(gè)實(shí)驗(yàn)失敗了。這個(gè)模型只能偶爾生成一個(gè)通順的句子,而且要很費(fèi)力才能理解它。蘇茨克弗和布羅克曼鼓勵(lì)拉德福德不要泄氣,繼續(xù)嘗試。
“我們覺(jué)得亞歷克斯很棒,就讓他按自己的想法去做吧!辈剂_克曼說(shuō)。
后來(lái)拉德福德收集了大約1億條亞馬遜購(gòu)物網(wǎng)站上的產(chǎn)品評(píng)論,訓(xùn)練了另一個(gè)語(yǔ)言模型。這次的結(jié)果比上次要好很多。
于是,蘇茨克弗想,如果在更廣泛的語(yǔ)言數(shù)據(jù)上訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),是否能夠揭示出更豐富的世界意義結(jié)構(gòu)。如果其隱藏層能積累足夠多的概念知識(shí),它們或許能成為超級(jí)智能形成的基礎(chǔ)學(xué)習(xí)模塊。
蘇茨克弗鼓勵(lì)拉德福德將視野擴(kuò)大,不應(yīng)僅限于亞馬遜的評(píng)論。他提議,他們應(yīng)該培養(yǎng)一個(gè)AI,讓它從全球最大、最多樣化的數(shù)據(jù)源,也就是互聯(lián)網(wǎng)中進(jìn)行學(xué)習(xí)。
但在2017年初,基于當(dāng)時(shí)的神經(jīng)網(wǎng)絡(luò)架構(gòu),這個(gè)想法看上去顯得不切實(shí)際,因?yàn)檫@可能需要數(shù)年的時(shí)間來(lái)實(shí)現(xiàn)。
然而,恰恰在這時(shí),谷歌的“Transformer論文”出現(xiàn)了。
2017年6月,一篇由8位谷歌研究人員合著、具有里程碑意義的論文橫空世,它的正式標(biāo)題是《我注意力是你所需要的全部》(Attention Is All You Need)。
這篇論文所提出的Transformer模型是一個(gè)超級(jí)高效的學(xué)習(xí)者,它不僅能夠一次性把整句話都看進(jìn)去,還能理解每個(gè)詞和句子中其他詞之間的關(guān)系。就像是有一個(gè)超級(jí)記憶力的人,不僅記得每個(gè)人說(shuō)的每句話,還理解他們之間的關(guān)系。它賦予了計(jì)算機(jī)類似人類的語(yǔ)言理解能力。
Transformer模型用了一種特別的技巧“自我注意力”,它能夠一眼就看到句子中所有的詞,并且理解它們之間的聯(lián)系。這樣,它就能夠很好地處理那些需要長(zhǎng)時(shí)間記憶的信息,并且學(xué)習(xí)速度飛快。
Transformer模型做了一件對(duì)當(dāng)時(shí)來(lái)說(shuō)非常重要的事情。在過(guò)去,AI系統(tǒng)需要輸入非常具體的數(shù)據(jù),每條數(shù)據(jù)必須被標(biāo)注:這個(gè)是正確的,這個(gè)是錯(cuò)誤的;這個(gè)是垃圾郵件,這個(gè)不是垃圾郵件;這個(gè)是癌癥,這個(gè)不是癌癥……
但Transformer模型允許AI接收混亂的、未標(biāo)記的數(shù)據(jù)。而且它可以比預(yù)期更高效地做到這一點(diǎn),使用的算力更少。
Transformer模型的出現(xiàn),極大地提升了計(jì)算機(jī)處理語(yǔ)言的能力,使得機(jī)器翻譯、語(yǔ)音識(shí)別和文本摘要等任務(wù)變得更加高效和精確,這對(duì)整個(gè)行業(yè)來(lái)說(shuō)是一個(gè)巨大的飛躍。
現(xiàn)在,這些基于Transformer的模型可以自我學(xué)習(xí)。于是業(yè)內(nèi)領(lǐng)悟到:最好的AI并不來(lái)自最專業(yè)的訓(xùn)練技術(shù),而是來(lái)自擁有最多數(shù)據(jù)的技術(shù)。
然而,Transformer模型剛開(kāi)始并沒(méi)有馬上征服世界,甚至連谷歌都沒(méi)有征服。當(dāng)時(shí)只有少數(shù)幾個(gè)人理解這一突破有多么強(qiáng)大,蘇茨克弗就是其中之一。
在OpenAI的早期,蘇茨克弗就一直有一個(gè)預(yù)感,即AI的重大進(jìn)展不會(huì)來(lái)自某個(gè)特定的調(diào)整或新發(fā)明,而是來(lái)自更多的數(shù)據(jù),就像是向引擎中倒入越來(lái)越多的燃料,F(xiàn)在,Transformer論文支持了他的這個(gè)預(yù)感。
“當(dāng)這篇論文發(fā)布的第二天,我們就意識(shí)到,這正是我們所需要的,”蘇茨克弗回憶道,“它具備了我們所追求的一切特性!闭缢睦蠋熜令D所說(shuō),蘇茨克弗有非常好的技術(shù)直覺(jué)。
而布羅克曼把這看作是運(yùn)氣和努力的結(jié)合:“這一直是我們的策略努力解決問(wèn)題,然后相信我們或者領(lǐng)域內(nèi)的某個(gè)人將設(shè)法找到缺失的要素。”
蘇茨克弗建議拉德福德開(kāi)始嘗試使用Transformer架構(gòu)。結(jié)果不出所料,在接下來(lái)的兩周里,取得的進(jìn)展比過(guò)去兩年還要多。
就像奧爾特曼在2023年所說(shuō)的那樣:“Transformer論文發(fā)表時(shí),我覺(jué)得谷歌沒(méi)人意識(shí)到它會(huì)產(chǎn)生怎樣深遠(yuǎn)的影響。”
2018年6月,在Transformer論文發(fā)表的一年后,OpenAI發(fā)布了GPT-1,“GPT”是“generatively pretrained transformer”(生成式預(yù)訓(xùn)練變換器)的首字母縮寫(xiě)。最終,這個(gè)模型被普遍稱為“生成式人工智能”(generativeAI)。
為了開(kāi)發(fā)出這個(gè)模型,他們收集了7000本未出版的書(shū)籍,其中有很多屬于浪漫、奇幻、冒險(xiǎn)的類型,并根據(jù)Quora網(wǎng)站上的問(wèn)答以及從初中和高中考試?yán)镎浀臄?shù)千篇文章對(duì)其進(jìn)行了完善?偠灾,這個(gè)模型包含了1.17億個(gè)參數(shù)或變量。它在理解語(yǔ)言與生成答案方面超越了之前的所有產(chǎn)品。
GPT-1模型最令人驚奇的是它的廣泛適用性,它是一個(gè)“通才”。無(wú)論哪個(gè)話題,你都可以向它提問(wèn),而它總能給出令人驚嘆的高質(zhì)量答案。這是因?yàn)镚PT-1經(jīng)過(guò)了廣泛的訓(xùn)練,涵蓋了人類可用的整個(gè)文本語(yǔ)料庫(kù),包括數(shù)十億個(gè)句子。無(wú)論是你閱讀過(guò)的文件、備忘錄、瑣事,還是《哈利波特》系列小說(shuō),所有這些內(nèi)容都被納入了模型的訓(xùn)練之中。
這是我們第一次擁有這樣一個(gè)系統(tǒng)。這標(biāo)志著人工智能正在從狹窄領(lǐng)域向通用領(lǐng)域轉(zhuǎn)變。
06 規(guī)模法則:大力出奇跡
OpenAI團(tuán)隊(duì)很快發(fā)現(xiàn),充分發(fā)揮Transformer新模型潛力的關(guān)鍵是擴(kuò)大規(guī)模在龐大的數(shù)據(jù)集上訓(xùn)練模型。這一事實(shí)證明OpenAI已經(jīng)找到了突破點(diǎn)。蘇茨克弗說(shuō):
我們已經(jīng)找到了進(jìn)步的公式,現(xiàn)在每個(gè)人都知道深度學(xué)習(xí)的氧和氫就是大規(guī)模神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)計(jì)算。
而奧爾特曼后來(lái)在與比爾蓋茨對(duì)話時(shí)這樣總結(jié)道:
構(gòu)建GPT-1的那個(gè)人(拉德福德)基本上是獨(dú)立完成的,他獨(dú)自解決了這個(gè)問(wèn)題,這在某種程度上是令人印象深刻的,但他并沒(méi)有深入理解GPT-1是如何工作的或者為什么有效。隨后我們掌握了規(guī)模法則(Scaling Law)。我們能夠預(yù)測(cè)它會(huì)變得多么出色。這就是為什么,當(dāng)我們告訴你我們可以做一個(gè)演示時(shí),我們相當(dāng)有信心它會(huì)成功。我們還沒(méi)有訓(xùn)練模型,但我們相當(dāng)有信心。這導(dǎo)致我們進(jìn)行了一系列的嘗試,并逐漸獲得了更好的科學(xué)理解,了解到底發(fā)生了什么。但這確實(shí)首先來(lái)自于經(jīng)驗(yàn)結(jié)果。
后來(lái),OpenAI專門(mén)發(fā)表了一篇論文《神經(jīng)語(yǔ)言模型的規(guī)模法則》(Scaling Laws for Neural Language Models)來(lái)系統(tǒng)闡述規(guī)模法則。
此后,規(guī)模法則成為AI領(lǐng)域的第一性原理,這個(gè)詞也成為這波AI浪潮中最常被提及的關(guān)鍵詞。
規(guī)模法則其實(shí)就是俗話說(shuō)的“大力出奇跡”,依靠的是從量變到質(zhì)變,它之所以能成為AI時(shí)代的第一性原理,主要基于以下兩個(gè)方面:
l 首先是足夠通用,不管是文本、音頻還是視頻,所有的問(wèn)題都可以被轉(zhuǎn)換為“預(yù)測(cè)下一個(gè)token”。這里的“token”指的是文本數(shù)據(jù)的基本單位。在一次播客中,蘇茨克弗詳細(xì)闡述了他為何認(rèn)為像大型語(yǔ)言模型這樣本質(zhì)上只是預(yù)測(cè)下一個(gè)字符的工具,卻能夠產(chǎn)生超越人類智慧總和的智能。他解釋說(shuō):很多人認(rèn)為,大模型只是通過(guò)像統(tǒng)計(jì)學(xué)一樣的方式來(lái)模仿人類現(xiàn)有的知識(shí)和能力,沒(méi)有辦法超越人類。但是,如果你的基礎(chǔ)神經(jīng)網(wǎng)絡(luò)足夠聰明,你只需問(wèn)它一個(gè)具有偉大洞察力、智慧和能力的人會(huì)怎么做?也許這樣的人并不存在,但神經(jīng)網(wǎng)絡(luò)很有可能能夠推斷出這樣的人的行為方式。
l 其次是可規(guī);灰度胱銐蚨嗟乃懔Α(shù)據(jù),模型就會(huì)變得更強(qiáng)大。只要在較小的參數(shù)規(guī)模上驗(yàn)證了效果,就可以通過(guò)增加計(jì)算資源和數(shù)據(jù)量,以“大力出奇跡”的方式獲得更好的性能。這進(jìn)一步使得我們能夠模擬整個(gè)物理世界無(wú)論是自動(dòng)駕駛還是機(jī)器人等場(chǎng)景,都可以一并得到解決。
正如蘇茨克弗總結(jié)的那樣:
只要能夠非常好地預(yù)測(cè)下一個(gè)token,就能幫助人類達(dá)到AGI。
2017年12月,奧爾特曼在一篇博客里暗示了這一改變:
硬件正在以指數(shù)級(jí)的速度改進(jìn),在OpenAI工作期間,最令我驚訝的發(fā)現(xiàn)是:計(jì)算能力的增強(qiáng)與AI突破之間有著密切關(guān)聯(lián),從事AI研究的聰明人的數(shù)量也在呈指數(shù)級(jí)增長(zhǎng)。
這種方法還要求OpenAI改變公司文化。任OpenAI董事、Quora創(chuàng)始人亞當(dāng)?shù)ぜ灞硎荆骸盀榱顺浞掷肨ransformer,你需要將其擴(kuò)大規(guī)模。”他還說(shuō):“你需要像一個(gè)工程組織一樣運(yùn)行它。不能讓每個(gè)研究人員都各自為戰(zhàn),訓(xùn)練自己的模型,制作那些只為了發(fā)表論文的漂亮東西。你必須進(jìn)行更加繁瑣、不那么優(yōu)雅的工作。”他補(bǔ)充說(shuō),這正是OpenAI能夠做到而其他人無(wú)法做到的事情。
但這一改變帶來(lái)了一個(gè)新問(wèn)題,奧爾特曼和馬斯克很快發(fā)現(xiàn),光有人才遠(yuǎn)遠(yuǎn)不夠,還需要有大量的算力。
就在OpenAI和行業(yè)內(nèi)其它公司都在為缺乏算力發(fā)愁時(shí),一個(gè)傳奇創(chuàng)業(yè)者敏銳捕捉到了其中的機(jī)會(huì)。
07 黃仁勛押注AI,英偉達(dá)迎接挑戰(zhàn)
黃仁勛,這位手臂上有刺青、愛(ài)穿黑色皮衣的創(chuàng)業(yè)者,自30歲那年創(chuàng)立英偉達(dá)以來(lái),20多年間,經(jīng)歷了芯片半導(dǎo)體領(lǐng)域的起起落落。截至目前,在美國(guó)市值一萬(wàn)億美元以上的公司里,英偉達(dá)是唯一一家曾兩次從高點(diǎn)下跌超過(guò)85%的公司。
在標(biāo)準(zhǔn)計(jì)算機(jī)架構(gòu)中,一個(gè)被稱為“中央處理單元”(central processing unit,CPU)的微芯片承擔(dān)了大部分工作。程序員編寫(xiě)程序,這些程序?qū)?shù)學(xué)問(wèn)題交給CPU,后者一次產(chǎn)生一個(gè)解決方案。幾十年來(lái),CPU的主要制造商是英特爾,英特爾曾多次試圖將英偉達(dá)逼出市場(chǎng)。黃仁勛說(shuō):“我絕不接近英特爾”。他形容他們之間的關(guān)系就像貓和老鼠,“每當(dāng)他們靠近我們,我就抓起我的芯片跑掉。”
黃仁勛決定用差異化的產(chǎn)品與巨頭競(jìng)爭(zhēng),那就是“圖形處理單元”(graphics-processing unit,GPU)。1999年,英偉達(dá)在上市后不久推出了一款名為GeForce的顯卡,也就是后人常說(shuō)的GPU。與通用的CPU不同,GPU將復(fù)雜的數(shù)學(xué)任務(wù)分解為小計(jì)算,然后以并行計(jì)算的方法同時(shí)處理所有任務(wù)。CPU就像一輛遞送貨物的卡車,一次只能送出一個(gè)包裹;而GPU更像是一個(gè)遍布整個(gè)城市的摩托車隊(duì)。
正是基于這種特性,GPU可以完成復(fù)雜的運(yùn)算,這是加密貨幣市場(chǎng)、深度神經(jīng)網(wǎng)絡(luò)以及大屏幕上呈現(xiàn)絢麗色彩所必需的。同樣,這些技術(shù)可以讓殘酷的射擊游戲無(wú)比逼真,讓自動(dòng)駕駛汽車在沒(méi)有協(xié)助的情況下做出S型拐彎。它們可以賦予計(jì)算機(jī)視力、聽(tīng)力、理解能力和學(xué)習(xí)能力。
很快,一群人工智能研究員發(fā)現(xiàn)了英偉達(dá)GPU在訓(xùn)練神經(jīng)網(wǎng)絡(luò)過(guò)程中的潛力。2012年,辛頓帶領(lǐng)兩位愛(ài)徒亞歷克斯克里澤夫斯基和伊利亞蘇茨克弗推出AlexNet,相比谷歌用了16000顆CPU,AlexNet只用了4顆英偉達(dá)GPU,在學(xué)術(shù)界和產(chǎn)業(yè)界引發(fā)了轟動(dòng)。AlexNet完成了計(jì)算機(jī)視覺(jué)領(lǐng)域的巨大突破,它成功證明了深度神經(jīng)網(wǎng)絡(luò)(DNN)可以有效地對(duì)許多對(duì)象進(jìn)行分類,而增加訓(xùn)練數(shù)據(jù)量可以提高DNN的有效性。開(kāi)發(fā)和訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)需要大量計(jì)算資源,并且如果使用大規(guī)模并行性的GPU,可以比單獨(dú)使用多核CPU實(shí)現(xiàn)更短的訓(xùn)練周期。
黃仁勛敏銳地意識(shí)到,英偉達(dá)的下一個(gè)增長(zhǎng)點(diǎn)在人工智能領(lǐng)域。黃仁勛打賭英偉達(dá)的計(jì)算機(jī)芯片可以成為人工智能的大腦,他決定將自己所有的籌碼放上賭桌。
黃仁勛后來(lái)回憶說(shuō):
我們有幸退后一步,問(wèn)自己這對(duì)計(jì)算機(jī)未來(lái)意味著什么。我們得出了正確的結(jié)論,這將改變計(jì)算方式,這將改變軟件編寫(xiě)方式,這將改變我們可以編寫(xiě)的應(yīng)用程序類型。
黃仁勛開(kāi)始積極布局面向人工智能的GPU。英偉達(dá)差不多花了5年時(shí)間制作出了DGX,這個(gè)GPU重達(dá)31.75千克,黃仁勛把它形容為一輛電動(dòng)汽車。馬斯克聽(tīng)說(shuō)這個(gè)消息后,找到了黃仁勛,表示OpenAI想要一個(gè)這樣的GPU。
于是,在2016年8月的一天,黃仁勛造訪了OpenAI在舊金山的辦公室。他在一間會(huì)議室里將這臺(tái)超級(jí)計(jì)算機(jī)(屬于最新推出的DGX-1系列)親手交給了馬斯克。
那一刻,黃仁勛突發(fā)奇想,隨手拿起一支馬克筆,在這臺(tái)超級(jí)計(jì)算機(jī)的機(jī)身上寫(xiě)道:
為了埃隆和OpenAI團(tuán)隊(duì)!為了計(jì)算機(jī)和人類的未來(lái)!我將世界上第一臺(tái)DGX-1作為禮物送給你們!
寫(xiě)完后,他把筆交給馬斯克和圍過(guò)來(lái)的OpenAI團(tuán)隊(duì)成員,所有人逐一在機(jī)箱上簽了名。
當(dāng)天晚上馬斯克在X上寫(xiě)道:
十分感謝英偉達(dá)和Jensen(黃仁勛英文名)將第一臺(tái)DGX-1超級(jí)計(jì)算機(jī)捐贈(zèng)給OpenAI,以推動(dòng)AI技術(shù)的普及。
DGX-1超級(jí)計(jì)算機(jī)擁有高達(dá)170TFLOPS的半精度浮點(diǎn)運(yùn)算能力,相當(dāng)于250臺(tái)傳統(tǒng)服務(wù)器,可以將深度學(xué)習(xí)的訓(xùn)練速度加快75倍,使CPU性能提升56倍,報(bào)價(jià)12.9萬(wàn)美元。據(jù)黃仁勛介紹,這是由3000人耗時(shí)3年時(shí)間研發(fā)出的,開(kāi)發(fā)成本巨大!叭绻@個(gè)項(xiàng)目只為打造一臺(tái)這樣的超級(jí)計(jì)算機(jī),那么這個(gè)項(xiàng)目的成本將高達(dá)20億美元!
當(dāng)時(shí)OpenAI和英偉達(dá)均未解釋這臺(tái)超級(jí)計(jì)算機(jī)的準(zhǔn)確用途。但英偉達(dá)稱,DGX-1是為處理深度學(xué)習(xí)等AI問(wèn)題而量身打造的超級(jí)計(jì)算機(jī)。黃仁勛稱:
世界上第一臺(tái)專為AI打造的超級(jí)計(jì)算機(jī)即將落戶于一家專注于開(kāi)放式AI研究的實(shí)驗(yàn)室,這簡(jiǎn)直是天作之合。
此后幾年,隨著利用GPU訓(xùn)練大模型成為行業(yè)共識(shí),越來(lái)越多的公司開(kāi)始追逐高端GPU,導(dǎo)致GPU稀缺。馬斯克曾說(shuō),現(xiàn)在它們“比毒品還難搞”。這些芯片成為了一場(chǎng)淘金熱的鎬和鏟。
2022年,黃仁勛第一次嘗試使用ChatGPT,他讓它寫(xiě)一首關(guān)于他的公司的詩(shī)。ChatGPT返回的結(jié)果讓他很滿意:
英偉達(dá)迎接挑戰(zhàn)。
憑借強(qiáng)大的GPU和人工智能,
它正在推動(dòng)技術(shù)邊界。
看到這首詩(shī),黃仁勛開(kāi)心的笑了,他知道自己賭對(duì)了。
隨著最大規(guī)模的AI訓(xùn)練規(guī)模大約每6個(gè)月翻一番,英偉達(dá)成為了這場(chǎng)戰(zhàn)爭(zhēng)里唯一的“軍火商”。
幾年后隨著ChatGPT的走紅和英偉達(dá)市值突破2萬(wàn)億美元,馬斯克和黃仁勛出的看著這臺(tái)超級(jí)計(jì)算器的照片在網(wǎng)上流傳,背后是奧爾特曼寫(xiě)在墻上的那句名言。那句名言的后半句是:
我們每個(gè)人都有責(zé)任把世界的命運(yùn)寄托在自己身上。
時(shí)代的鐘聲從遠(yuǎn)處傳來(lái),當(dāng)算法(Transformer模型)、算力(英偉達(dá))和數(shù)據(jù)(互聯(lián)網(wǎng))都萬(wàn)事俱備的時(shí)候,一個(gè)新時(shí)代的大門(mén)敞開(kāi)了。
奧爾特曼后來(lái)回憶,在一個(gè)夏日涼爽的黃昏時(shí)分,OpenAI研究團(tuán)隊(duì)完成了一個(gè)關(guān)于規(guī)模法則的實(shí)驗(yàn),這個(gè)實(shí)驗(yàn)揭示了用于訓(xùn)練人工智能的計(jì)算能力與其結(jié)果能力之間的關(guān)系,并產(chǎn)生了一系列“完美、平滑的曲線”,這些指數(shù)曲線看起來(lái)更像是宇宙基本定律而不是實(shí)驗(yàn)數(shù)據(jù)。
奧爾特曼和一群研究人員走到辦公室外,望著遠(yuǎn)處的夕陽(yáng)。他們共同意識(shí)到,AGI不僅是可能實(shí)現(xiàn)的,而且它的來(lái)臨可能比他們先前所預(yù)期的要快得多。奧爾特曼后來(lái)回憶說(shuō):
我們都在想,這一切真的會(huì)發(fā)生,不是嗎?
這就像是科學(xué)史上的一個(gè)轉(zhuǎn)折點(diǎn)。我們已經(jīng)洞悉了一種全新的事物,即將向全人類宣告它的來(lái)臨。