注意,人機(jī)共存的時(shí)代不遠(yuǎn)了!可當(dāng)AI無所不能,人類做什么?
訪談丨薛芳 對(duì)話整理丨嘉林編輯丨薛芳
出品丨深網(wǎng)科技新聞小滿工作室
“叔叔,如果人工智能什么都能做了,我們未來能做什么?”一個(gè)小姑娘站起來問智源研究院院長(zhǎng)王仲遠(yuǎn)。去年3月,王仲遠(yuǎn)去北京的一所小學(xué)講了一堂人工智能的課,小朋友們發(fā)現(xiàn)他們的課程作業(yè)人工智能都能回答得非常好。
這個(gè)問題擊中了王仲遠(yuǎn)的心靈,一直在AI前沿的他內(nèi)心并沒有很明確的答案。2023年2月,王仲遠(yuǎn)履新智源研究院院長(zhǎng)。王仲遠(yuǎn)講話語速適中,氣質(zhì)沉穩(wěn)而內(nèi)斂。他過往的工作經(jīng)歷,十年磨一劍,霜刃未曾試。
此前,他曾擔(dān)任過微軟亞洲研究院的主任研究員,負(fù)責(zé)知識(shí)圖譜項(xiàng)目和對(duì)話機(jī)器人項(xiàng)目;也曾入職Facebook ,擔(dān)任計(jì)算機(jī)科學(xué)家;2018年,王仲遠(yuǎn)入職美團(tuán),用半年就領(lǐng)導(dǎo)團(tuán)隊(duì)構(gòu)建出世界上最大的知識(shí)圖譜“美團(tuán)大腦”。
他重新做出了選擇從研究院到公司,再從公司回到研究院,用了十五年時(shí)間,他從最初知春路的希格瑪?shù)浆F(xiàn)在五道口的智源大廈,距離2.7公里。當(dāng)然,這種選擇的背后王仲遠(yuǎn)看到了整個(gè)AI領(lǐng)域未來已來。
過去這些年,AI三次引發(fā)了公眾的關(guān)注。1997年,IBM的超級(jí)計(jì)算機(jī)深藍(lán)戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫;第二次則是2016年3月,AlphaGo在圍棋人機(jī)大戰(zhàn)中擊敗圍棋世界冠軍李世石;第三次是2023年直到一家叫OpenAI的公司打開了通往未來的星際之門。
“大模型帶來的技術(shù)突破,徹底解決了過去幾十年一直都無法攻克的一個(gè)難題自然語言理解與邏輯推理。以2023年為界限,之前是弱人工智能時(shí)代,而之后很有可能進(jìn)入通用人工智能時(shí)代,這里面有很多技術(shù)問題需要突破!蓖踔龠h(yuǎn)闡述。
可以想象王仲遠(yuǎn)內(nèi)心的震動(dòng)和興奮。他一直以來的夢(mèng)想就是希望能推動(dòng)人工智能技術(shù)的發(fā)展。那么,智源研究院無疑是在那個(gè)時(shí)間節(jié)點(diǎn)最能實(shí)現(xiàn)夢(mèng)想的地方。“智源是一家非營(yíng)利性機(jī)構(gòu),定位是做高校做不了,企業(yè)不愿意做的事情。”王仲遠(yuǎn)闡述。
2018年,北京智源人工智能研究院成立。智源研究院是中國(guó)最早開展AI大模型研究的機(jī)構(gòu)之一,也被稱作“AI大模型的黃埔軍校”。智譜AI創(chuàng)始人唐杰、月之暗面創(chuàng)始人楊植麟、面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)、以及行業(yè)內(nèi)的大模型領(lǐng)軍人物或技術(shù)骨干不少等都曾參與過智源研究院的大模型項(xiàng)目。
去年 3 月,微軟總裁Brad Smith在采訪中說全球有三家頂尖的AI機(jī)構(gòu), Open AI,Google和北京智源人工智能研究院。智源研究院的創(chuàng)始人張宏江和前院長(zhǎng)黃鐵軍的珠玉在前,成為這樣一家機(jī)構(gòu)的掌舵人,對(duì)于1985年出生的王仲遠(yuǎn)來說,肩上擔(dān)子并不輕。
王仲遠(yuǎn)不僅僅是一個(gè)科學(xué)家,智源研究院的負(fù)責(zé)人,他更像一個(gè)創(chuàng)業(yè)者。
“智源研究院致力于成為人工智能創(chuàng)新引領(lǐng)者,那么如何做出突破性的成果?我們的技術(shù)路線判斷是否正確?如何匯集最優(yōu)秀的人才?人工智能造福人類的同時(shí)如何做到安全可控?怎樣獲取可持續(xù)發(fā)展的資源和算力?”這些都是王仲遠(yuǎn)一直在思考的問題,也是他要解決的問題。
整個(gè)過程中,焦慮是存在的。在王仲遠(yuǎn)看來,人在對(duì)抗焦慮的過程中才會(huì)有進(jìn)步,焦慮往往會(huì)轉(zhuǎn)化為他前行的動(dòng)力。對(duì)他來說,“我自己會(huì)冥想、聽音樂、旅游,與人交流,用開放的心態(tài)去對(duì)抗焦慮!
焦慮,僅僅是一種情緒。那個(gè)小女孩的提問一直在王仲遠(yuǎn)腦海里縈繞,“我不能說有比較明確的答案,但我感受到了的責(zé)任。這個(gè)責(zé)任是既要促進(jìn)人工智能的發(fā)展,為各行各業(yè)賦能,同時(shí),要確保人工智能足夠的安全,不會(huì)傷害人類!
世界模型一定是未來的技術(shù)發(fā)展的路徑
《AI光年》:2024諾貝爾物理學(xué)獎(jiǎng)獲得者、“AI教父”Geoffrey Hinton(杰弗里辛頓)教授認(rèn)為,在AI領(lǐng)域,生物智能最終戰(zhàn)勝了機(jī)器智能,您怎么看?
王仲遠(yuǎn):今年 3 月智源研究院舉辦的北京 AI 安全國(guó)際對(duì)話上,辛頓教授分享,他終于想明白了為什么數(shù)字智能一定會(huì)超越生物智能。人類大腦的神經(jīng)網(wǎng)絡(luò)不能直接復(fù)制給另外一個(gè)人,每個(gè)人學(xué)習(xí)所形成的神經(jīng)網(wǎng)絡(luò)都是獨(dú)一無二的。不能把一個(gè)高智商的人的參數(shù)復(fù)制給另外一個(gè)人,使其具備同樣的智能,但機(jī)器可以復(fù)制。
如果不考慮能耗的情況之下,機(jī)器智能有它獨(dú)特的優(yōu)勢(shì)。當(dāng)我們訓(xùn)練出一個(gè)非常強(qiáng)大的人工智能神經(jīng)網(wǎng)絡(luò),它存在數(shù)字世界里,可以非常容易復(fù)制,每一個(gè)模型可以繼續(xù)訓(xùn)練變得更優(yōu)秀。只要模型的性能還能夠持續(xù)提升,復(fù)制效率和學(xué)習(xí)效率比人類高得多。人類的學(xué)習(xí)效率其實(shí)非常低,我們只能讀幾千本、幾萬本書,但是機(jī)器可以把人類歷史上的所有的書籍都閱讀完。未來當(dāng)人工智能寫的書籍比人類書籍質(zhì)量還高時(shí),這種合成的數(shù)據(jù)就可能反哺智能進(jìn)一步的提升。
《AI光年》:OpenAI的草莓目前好像部分地解決了大模型的幻覺問題,你怎么看?
王仲遠(yuǎn):幻覺是阻礙大模型產(chǎn)業(yè)化落地的一個(gè)問題。這個(gè)問題不會(huì)被消除,但是會(huì)被不斷地改進(jìn),直到控制在一定的范圍內(nèi)。
事實(shí)上,難道人類就沒有“幻覺”問題嗎,就能確保說的每句話都是正確的嗎?關(guān)鍵還是幻覺比例的問題,以及是否知道可能出現(xiàn)幻覺。產(chǎn)業(yè)界當(dāng)前通過信息檢索增強(qiáng)的方案來作為解決幻覺問題的解法之一,智源研究院所研發(fā)的 BGE 模型,它是一種檢索增強(qiáng)的模型,近期登頂了全球AI開源社區(qū)Hugging Face月度模型下載量榜首,成為了在信息檢索增強(qiáng)方向非常重要的模型。當(dāng)大模型需要回答法律、醫(yī)療或者產(chǎn)品的問題,必須有根有據(jù)。通過基于知識(shí)庫的文檔檢索增強(qiáng),增強(qiáng)模型回答的準(zhǔn)確性,所以這是一個(gè)非常重要的基礎(chǔ)模型。
Open AI的草莓模擬的是人腦的思考過程,會(huì)反思,糾正自己的錯(cuò)誤,直到找到一個(gè)可能的答案。這樣的雙系統(tǒng)(快系統(tǒng)和慢系統(tǒng))未來會(huì)逐漸成為主流。檢索系統(tǒng)也是一種路徑。正;卮饐栴}時(shí),如果知道這個(gè)答案就直接回答,不知道可能就會(huì)去搜索、查資料再來回答這個(gè)問題,搜索和查資料就是檢索增強(qiáng)。
《AI光年》:ChatGPT 被認(rèn)為是大腦的模擬器,Sora被稱為物理世界的模擬器。多模態(tài)會(huì)不會(huì)是未來的趨勢(shì)?
王仲遠(yuǎn):人工智能的研究都會(huì)參考人腦的工作機(jī)制。人腦雖然有不同的分區(qū),但它是一個(gè)整體的結(jié)構(gòu)。人腦不僅僅處理文字信息,還處理很多模態(tài)的信息,聲音、圖像乃至更復(fù)雜、更多元的信號(hào)。所以我們相信,統(tǒng)一原生的多模態(tài)大模型一定是未來的技術(shù)發(fā)展路徑。
當(dāng)前多模態(tài)技術(shù)仍然沒有收斂,行業(yè)在做多模態(tài)的理解與生成所使用的技術(shù)路線是完全不一樣的。智源研究院在研究一套能夠?qū)⒍呓y(tǒng)一的原生多模態(tài)世界模型的技術(shù)路線。行業(yè)現(xiàn)在多模態(tài)生成模型基本上走的是 Diffusion Transformer 這樣的 DiT 基礎(chǔ)路線,理解模型通常都是以語言模型為核心,再把視覺信號(hào)、其他信號(hào)映射到語言模型這樣的一條技術(shù)路線。這種圖像生成和視頻生成的效果確實(shí)非常驚艷。
但是兩者需要合為一嗎?不同的科學(xué)家有不同的觀點(diǎn)。不過,我們相信,多模態(tài)生成模型和多模態(tài)理解模型是要統(tǒng)一的。因?yàn)槿说拇竽X是有視頻生成能力的,我們每一天都在做夢(mèng),大腦每一天都在產(chǎn)生各種各樣的畫面和場(chǎng)景。這種生成能力也很可能會(huì)成為校準(zhǔn)理解能力的信號(hào),從而進(jìn)一步提升理解能力。最后的世界模型是更接近人腦的,不僅要理解、推理世界,還要能跟這個(gè)世界交互。
《AI光年》:你剛才談到了兩種技術(shù)路線,這兩種技術(shù)路線有沒有難易之說?
王仲遠(yuǎn):不是這兩種技術(shù)路線的難易,而是我們要走一條全新的技術(shù)路線,叫原生多模態(tài)世界模型的技術(shù)路線,國(guó)內(nèi)沒有幾個(gè)團(tuán)隊(duì)在嘗試這條技術(shù)路線,因?yàn)樗_實(shí)非常難。
智源研究院在過去半年的時(shí)間里攻克了一個(gè)又一個(gè)的基礎(chǔ)難關(guān),直到今天依然不能說完全攻克,但終于將不同的模態(tài),將生成和理解的能力壓縮在了一起。希望做到World in one,One for world。這是我們一個(gè)技術(shù)路徑的選擇。這個(gè)路徑的選擇,從創(chuàng)業(yè)的維度來講,有可能會(huì)失敗。沒有失敗的科研就不是真正的創(chuàng)新。失敗也是創(chuàng)新的形式之一,是必經(jīng)路徑。但永遠(yuǎn)要有信念,技術(shù)理想。
10月21日,智源研究院基于下一個(gè)token預(yù)測(cè),發(fā)布了原生多模態(tài)世界模型Emu3,無需擴(kuò)散模型或組合方法,即可完成文本、圖像、視頻三種模態(tài)數(shù)據(jù)的理解和生成。下一個(gè)token預(yù)測(cè)為構(gòu)建多模態(tài)AGI提供了一條前景廣闊的道路。
國(guó)內(nèi)文生視頻領(lǐng)域沒有跳脫舊模式
《AI光年》:今年國(guó)內(nèi)的文生視頻領(lǐng)域比較卷,你怎么看待這種現(xiàn)象?
王仲遠(yuǎn):世界模型和文生視頻模型是兩碼事。當(dāng)前的 DiT 架構(gòu)能否走到世界模型,從技術(shù)路徑判斷上是有爭(zhēng)議的,因?yàn)樗奶旎ò迨怯邢薜。Autoregressive 的技術(shù)路線天花板高很多。過去的這段時(shí)間,文生視頻模型國(guó)內(nèi)發(fā)布的越來越多,有點(diǎn)像去年大語言模型,因?yàn)橐呀?jīng)有一個(gè)機(jī)構(gòu)驗(yàn)證了這條技術(shù)路徑。國(guó)內(nèi)很多企業(yè)去跟進(jìn),這種跟進(jìn)也有價(jià)值和意義。但國(guó)內(nèi)所發(fā)布的文生視頻模型并沒有跳脫舊模式,依然是技術(shù)跟隨。
《AI光年》:這么卷有沒有意義?
王仲遠(yuǎn):短視頻賽道在過去幾年非;穑纳曨l一定找得到它的業(yè)務(wù)產(chǎn)品和商業(yè)模式。當(dāng)這條技術(shù)路徑效果非常好的時(shí)候,值得去做,因?yàn)橛猩虡I(yè)需求,但是它并不一定是達(dá)到 AGI 的技術(shù)路線。從實(shí)現(xiàn)AGI的角度,當(dāng)前文生視頻的技術(shù)路線不一定是完美的技術(shù)路線。
《AI光年》:去年卷大模型,今年卷文生視頻,一級(jí)市場(chǎng)一直有聲音,現(xiàn)在出來了AI 泡沫論,你怎么看?
王仲遠(yuǎn):任何一項(xiàng)技術(shù),任何一個(gè)領(lǐng)域,有爭(zhēng)論是一件好事。當(dāng)前的技術(shù)能力、商業(yè)模式是否足以支持資本投入和市場(chǎng)期望?這中間存在分歧。如果僅從技術(shù)路線上來看,2023 年是一個(gè)轉(zhuǎn)折點(diǎn),是一個(gè)通往通用人工智能時(shí)代的分界線,很有可能是第四次的工業(yè)革命。任何一次工業(yè)革命的周期會(huì)很長(zhǎng),技術(shù)突破到產(chǎn)業(yè)化需要周期,我相信這一次人工智能技術(shù)的發(fā)展和突破本身不是泡沫。AI 泡沫論是相對(duì)的。原來可能需要 5 - 10 年發(fā)生的事情,大家希望在一年內(nèi)發(fā)生,那么這就是泡沫。
《AI光年》:我之前問過一個(gè)著名投資人,這是不是意味著社會(huì)資源的浪費(fèi)?他說是,但也沒辦法。現(xiàn)在大模型好像依然重復(fù)這條路徑,好像也是沒辦法。你怎么看?
王仲遠(yuǎn):這證明在中國(guó)的這個(gè)市場(chǎng)上有了更加充分的競(jìng)爭(zhēng),人才濟(jì)濟(jì)。我們需要的是能夠突破核心技術(shù)的頂尖大模型,這樣會(huì)更利于應(yīng)用和產(chǎn)品的到來。大模型是對(duì)于算力資源、人才密度要求都非常高的賽道,所以我們希望最終能夠收斂為幾個(gè)基礎(chǔ)大模型,這樣會(huì)更利于生態(tài)的發(fā)展。
《AI光年》:你怎樣看待技術(shù)和產(chǎn)業(yè)的關(guān)聯(lián)?
王仲遠(yuǎn):回顧互聯(lián)網(wǎng)信息技術(shù)、人工智能技術(shù)的發(fā)展,我們會(huì)發(fā)現(xiàn)每一次重大技術(shù)革命都有周期性。當(dāng)年的互聯(lián)網(wǎng)出現(xiàn)之后,要有基礎(chǔ)設(shè)施建設(shè)的過程,后面才會(huì)有像門戶網(wǎng)站、電子商務(wù)等應(yīng)用形態(tài)和商業(yè)模式的誕生。從 2007年 iPhone1發(fā)布,到2010年 iPhone 4推出,移動(dòng)互聯(lián)網(wǎng)才真正進(jìn)入到成熟期,再配合當(dāng)時(shí) 4G 發(fā)展進(jìn)入到消費(fèi)級(jí),移動(dòng)互聯(lián)網(wǎng)的應(yīng)用開始大規(guī)模涌現(xiàn)。
大模型也類似,前幾年智源研發(fā)的悟道系列大模型,當(dāng)時(shí)還處在一個(gè)實(shí)驗(yàn)室階段。到過去這兩年,以 OpenAI 為代表的全球 AI 公司在大模型技術(shù)上不斷創(chuàng)新迭代,使其開始進(jìn)入到產(chǎn)業(yè)界。未來當(dāng)基座大模型進(jìn)入到相對(duì)成熟階段時(shí),基于大模型的應(yīng)用就能迎來蓬勃的發(fā)展。不論是過去還是現(xiàn)在,這都是正常的發(fā)展階段。
《AI光年》:如果投資ChatGPT 、大語言模型或文生視頻模型,如何考慮從投資到實(shí)現(xiàn)商業(yè)化所需的時(shí)間跨度?
王仲遠(yuǎn):如果是關(guān)注模式、應(yīng)用或產(chǎn)品創(chuàng)新的資本,應(yīng)該看準(zhǔn)時(shí)機(jī)再出手。如果是關(guān)注技術(shù)戰(zhàn)略型的投資,現(xiàn)在正是好時(shí)候。
《AI光年》:AI距離商用還有多遠(yuǎn)?
王仲遠(yuǎn):在 B 端作為一個(gè)效率工具,已經(jīng)在很多領(lǐng)域有了明確的應(yīng)用,比如,文章摘要、會(huì)議紀(jì)要,把非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,設(shè)計(jì)、廣告、電商等。大家更期待的是一個(gè)面向C端的殺手級(jí)應(yīng)用的誕生,這需要天時(shí)地利人和。模型能力提升,成本下降,場(chǎng)景出現(xiàn),需求解決,當(dāng)這些條件同時(shí)滿足的時(shí)候,基于大模型的超級(jí)應(yīng)用才有可能會(huì)誕生。C 端用戶對(duì)于體驗(yàn)非常敏感,對(duì)于很輕微的幻覺問題,都會(huì)感知強(qiáng)烈,當(dāng)這些都被解決,殺手級(jí)應(yīng)用自然就出現(xiàn)了。
大模型能力提升會(huì)造成小模型的顛覆
《AI光年》:Sam Altman發(fā)起過一個(gè)7萬億的芯片計(jì)劃,您怎么看?
王仲遠(yuǎn):傳言也好,真實(shí)事件也好,最大的問題還是算力成本?v觀整個(gè)基于神經(jīng)網(wǎng)絡(luò)的人工智能發(fā)展歷程,每一次大的發(fā)展都是算法、數(shù)據(jù)、算力加模型參數(shù)的提升,一次量級(jí)的提升就會(huì)帶來模型效果的提升。這在過去一年被定義為Scaling law,廣泛傳播。
未來,模型要繼續(xù)擴(kuò)大十倍、百倍的參數(shù)規(guī)模,數(shù)據(jù)量需要十倍、百倍,算力資源也需要十倍、百倍,而當(dāng)下的算力還開不足以支撐。單個(gè)芯片的性能以及集群規(guī)模都需要提升,當(dāng)提升到一定程度,很可能我們會(huì)見證新的人工智能發(fā)展階段。
《AI光年》:大小模型之爭(zhēng)是另外一個(gè)技術(shù)維度的問題,還是卷或者競(jìng)爭(zhēng)維度的問題?
王仲遠(yuǎn):一方面我覺得大模型會(huì)越來越大。10 年后很可能我們今天的模型就已經(jīng)變成了小模型。2018 年 Bert 發(fā)布時(shí),是億級(jí)的參數(shù)量,在那個(gè)時(shí)候幾乎就是世界上最大的模型,但在今天的時(shí)間節(jié)點(diǎn)來看就變成了小模型。所以未來 5 年、 10 年,算力、模型性能進(jìn)一步提升,大模型會(huì)越來越大。
但另一方面模型要做小,滿足性能和成本的要求,才能實(shí)現(xiàn)產(chǎn)業(yè)落地。將大模型做小,一種方式是通過技術(shù)的路徑,把同樣的性能壓縮在一個(gè)更小的模型上,另一種方式是推動(dòng)計(jì)算性能本身的提升,讓算力去承載大模型時(shí)成本足夠低。
《AI光年》:一個(gè)大模型技術(shù)很強(qiáng),做一些拆解和技術(shù)方面的切割,還是市場(chǎng)全面開花,出現(xiàn)很多大模型?
王仲遠(yuǎn):如果將大模型比喻為人腦,這個(gè)世界有 70 億人,也就是70億個(gè)大模型。大模型進(jìn)入到各個(gè)領(lǐng)域,各個(gè)行業(yè),各個(gè)企業(yè),一定有他自己的領(lǐng)域。這個(gè)問題一直有技術(shù)路線之爭(zhēng),在我看來,如果大模型的能力特別強(qiáng),可以通過 API 的方式調(diào)用,但是如果進(jìn)入各行各業(yè),每個(gè)行業(yè)都有自己獨(dú)特的數(shù)據(jù),需要對(duì)大模型進(jìn)一步訓(xùn)練、對(duì)齊、Fine-tuning ,就會(huì)產(chǎn)生所謂的領(lǐng)域模型。更有可能的情況是有一個(gè)很強(qiáng)的基礎(chǔ)大模型,又壓縮成小模型,然后進(jìn)入到各個(gè)領(lǐng)域進(jìn)一步的訓(xùn)練,變成這個(gè)領(lǐng)域里面最強(qiáng)的模型,但這僅僅是一個(gè)技術(shù)路線的猜測(cè)和判斷。
《AI光年》:那就是強(qiáng)大的通用世界模型,可以取代了各種垂類小模型?
王仲遠(yuǎn):每一次基礎(chǔ)大模型的能力提升確實(shí)可能帶來小模型的顛覆。但如果類比人,即使是博士畢業(yè),他進(jìn)入到一個(gè)企業(yè)工作,也依然有學(xué)習(xí)和適應(yīng)的過程。
《AI光年》:那是不是從某種意思來講,只有通用模型才有很強(qiáng)的競(jìng)爭(zhēng)力?小模型在中國(guó)這種市場(chǎng)環(huán)境還是蠻脆弱的?
王仲遠(yuǎn):要看這個(gè)小模型怎么定義。如果這個(gè)小模型是當(dāng)年弱人工智能的產(chǎn)物,那它的競(jìng)爭(zhēng)力一定是不穩(wěn)定的。如果這個(gè)小模型是基于大模型的一個(gè)產(chǎn)物,保留了大模型很多的推理能力,那么可能是非常強(qiáng)的。
其實(shí)在 AI 1.0 時(shí)代,已經(jīng)有很多小模型在各行各業(yè)里發(fā)揮作用,但是小模型因?yàn)閰?shù)量和訓(xùn)練語料的問題,能力的天花板是有限的。大模型將能力的天花板實(shí)現(xiàn)了重大提升,但不代表它在這個(gè)領(lǐng)域內(nèi)就能做得非常好,它進(jìn)入到這個(gè)領(lǐng)域依然需要去學(xué)習(xí)。就像我們從小學(xué)、中學(xué)、大學(xué)讀到碩士、博士,但我們進(jìn)入到企業(yè)依然也會(huì)接受企業(yè)的培訓(xùn),再去適應(yīng)這個(gè)行業(yè),適應(yīng)這個(gè)領(lǐng)域。
《AI光年》:面向未來,有一個(gè)疑問,Scaling law失效了嗎?下一代的模型性能能否有進(jìn)一步的提升?
王仲遠(yuǎn):我們來看數(shù)據(jù)、算力、這幾個(gè)要素。數(shù)據(jù)方面,全互聯(lián)網(wǎng)的文本數(shù)據(jù)已經(jīng)被用來做模型訓(xùn)練,如果我們不能突破數(shù)據(jù)的局限,模型性能就會(huì)遇到瓶頸,目前在一些特定的領(lǐng)域,例如編程,通過模擬器、編譯器,它能驗(yàn)證結(jié)果,用合成的數(shù)據(jù)去模擬人類的思維找到確定答案反哺,也是在解決數(shù)據(jù)不足的問題。另外,全世界的多模態(tài)數(shù)據(jù)是文本數(shù)據(jù)的百倍、千倍,如何有效利用這些數(shù)據(jù)來進(jìn)一步提升模型的能力,也是一個(gè)待解的問題。
算力方面,國(guó)外已經(jīng)有 10 萬卡級(jí)別的集群,如果我們的參數(shù)要繼續(xù)擴(kuò)大十倍、百倍乃至千倍,10 萬卡依然不夠,算力進(jìn)一步提升,集群規(guī)模進(jìn)一步擴(kuò)大都會(huì)是下一波模型重大提升的必備條件之一。參數(shù)方面,行業(yè)里普遍認(rèn)為 GPT 4是 1.8 萬億參數(shù),那么什么時(shí)候有十萬億、百萬億、千萬億的參數(shù),當(dāng)模型參數(shù)到千萬億級(jí)別就和人類的大腦容量相似,甚至超越人類大腦。這樣參數(shù)的模型如果能被訓(xùn)練出來,數(shù)據(jù)被突破,算力被突破,它很有可能達(dá)到通用人工智能。
我們這一代人會(huì)見證AGI的誕生
《AI光年》:智源設(shè)有 AI 大模型安全研究中心,你怎么看 AI 安全問題?比如AI會(huì)不會(huì)失控?
王仲遠(yuǎn):人工智能技術(shù)發(fā)展到今天,尤其大模型技術(shù)的發(fā)展,是有可能達(dá)到AGI的,這讓AI安全尤其重要。人類的歷史上,還沒有其他生物體或機(jī)器智能達(dá)到或者超越人類智能。當(dāng)大模型可能在未來幾年到幾十年實(shí)現(xiàn)AGI 時(shí),我們需要更早的開始思考它的安全性。作為一家非營(yíng)利機(jī)構(gòu),智源有責(zé)任更早地思考,這也是我加入智源的初心之一。
我們這一代很有可能會(huì)見證 AGI 的誕生,我們的下一代很有可能會(huì)與 AGI 共存。那么如何確保AGI 是安全可控的,是為人類服務(wù)而不是管控人類的?這是我們要解決的問題。當(dāng)前的大模型技術(shù)已有可能對(duì)人類帶來各種危害,比如大模型的語言能力可能帶來不良的文字引導(dǎo),文生圖、文生視頻的能力可能造成更多虛假信息的泛濫, AI安全已經(jīng)迫在眉睫。
智源研究院一直以來都非常關(guān)注AI安全。2023年智源大會(huì),我們首次設(shè)立了 AI 安全的論壇,OpenAI CEO Sam Altman和圖靈獎(jiǎng)獲得者Geoffrey Hinton教授(也是今年諾貝爾物理學(xué)獎(jiǎng)獲得者)參加了。2024年 3 月,智源舉辦了北京 AI 安全國(guó)際對(duì)話,我們創(chuàng)始理事長(zhǎng)張宏江博士和圖靈獎(jiǎng)獲得者Yoshua Bengio教授擔(dān)任論壇主席,與會(huì)專家聯(lián)合簽署《北京AI安全國(guó)際共識(shí)》。2024年的智源大會(huì)上也繼續(xù)設(shè)立 AI 安全論壇。這也反映了國(guó)際最頂尖的專家學(xué)者對(duì)于 AI 安全的思考和重視程度。我相信只要我們從現(xiàn)在開始努力,還是有可能將 AI 控制在一個(gè)安全的,造福人類的范圍之內(nèi)。
《AI光年》:AGI 會(huì)完全替代哪些職業(yè)?如果 AGI 是一種賦能,未來會(huì)在哪些領(lǐng)域落地和應(yīng)用?
王仲遠(yuǎn):這一波人工智能與以往最大的區(qū)別是越來越像人類的大腦,這就意味著所有人能做的事情,將來大模型或者人工智能都有可能發(fā)揮作用,幾乎會(huì)進(jìn)入各行各業(yè)。有些行業(yè)可能進(jìn)入得快一些,有些行業(yè)可能進(jìn)入得慢一些。
之前網(wǎng)絡(luò)上流傳一個(gè)玩笑話,我們?cè)疽詾槿斯ぶ悄軙?huì)先取代藍(lán)領(lǐng),沒想到先取代的是白領(lǐng),原本以為創(chuàng)造力是人類所獨(dú)有的,結(jié)果生成式AI的創(chuàng)造能力比人類還強(qiáng),想象力比人類還豐富。這一波人工智能的發(fā)展,不管有沒有達(dá)到AGI,對(duì)各行各業(yè)都會(huì)產(chǎn)生賦能。
《AI光年》:人類應(yīng)該怎樣接受被AI取代,用什么樣的心態(tài)去接受?
王仲遠(yuǎn):如果我們看人類過去的發(fā)展歷程,每一次重大的技術(shù)變革最初是解決不了問題的,但是我們始終要去思考如何讓技術(shù)向善,這是我們這一代人的責(zé)任,尤其智源作為一個(gè)非營(yíng)利性機(jī)構(gòu),更有責(zé)任去確保人工智能是安全的。這不是說人工智能一定會(huì)失控,我相信它還是可控的。在原子彈剛發(fā)明出來的時(shí)候,大家也擔(dān)心世界要?dú)缌耍祟惿鐣?huì)是非常有意思的群體,發(fā)展了幾千年,每一次危機(jī)最終都得到了控制。
《AI光年》:可以給年輕人什么建議?
王仲遠(yuǎn):一定要選擇自己熱愛的事情。我回顧過去15年的工作經(jīng)歷,最重要的是一直在做自己最熱愛的事情。我之所以從企業(yè)又回到了智源研究院這樣的一個(gè)偏科研性質(zhì)的機(jī)構(gòu),是因?yàn)槿斯ぶ悄苁俏乙恢睙釔鄣氖虑。讓人工智能像人類一樣理解世界,推理世界,?shí)現(xiàn)真正的通用人工智能,是我內(nèi)心一直以來的追求。
《AI光年》:您剛才說我們這一代人可能會(huì)見證 AGI 的到來,下一代可能會(huì)和 AGI 共存。那么,人和 AI 未來應(yīng)該是一個(gè)什么樣的關(guān)系?
王仲遠(yuǎn):如果 AGI 真的誕生,我希望它與人類是良性互動(dòng)和共存的,能為人類所用,造福人類。人類與動(dòng)物的區(qū)別在于會(huì)發(fā)明和使用工具,人類歷史上,技術(shù)的突破和發(fā)明,最終都變成了人類的工具。
人工智能過去也一直都是人類的工具,但是當(dāng)它的智能化水平接近、達(dá)到或者超越人類的時(shí)候,還能不能繼續(xù)作為工具為人類使用?這是一個(gè)非常難以回答的問題,但我們希望它是可控的。
《AI光年》:AGI何時(shí)到來?
王仲遠(yuǎn):這個(gè)問題行業(yè)里一直有不同的觀點(diǎn)。去年非常樂觀的時(shí)候,大家認(rèn)為 AGI 一兩年內(nèi)就能到來。GPT 5 遲遲沒有發(fā)布,大家又開始對(duì) AGI 是否有泡沫,這一波人工智能是不是已經(jīng)見底展開爭(zhēng)論。
但如果我們回顧過去整個(gè)基于神經(jīng)網(wǎng)絡(luò)的人工智能發(fā)展,算力的提升,數(shù)據(jù)規(guī)模的提升,模型參數(shù)規(guī)模的提升,我認(rèn)為 AGI 有可能在未來 5 ~ 20 年到來。這是為什么我認(rèn)為我們這一代有可能會(huì)見證 AGI 的誕生,下一代很可能要與 AGI 共存。