作者|駱軼航郵箱|tluo@pingwest.com
2024年11月12日,在“百度世界大會”期間,百度創(chuàng)始人、CEO李彥宏與硅星人創(chuàng)始人駱軼航、甲子光年創(chuàng)始人張一甲進行了一場對談。以下是對話實錄(確保書面閱讀習慣,個別語句進行了再編輯,部分問答進行了刪減):
為什么“應用來了”?
張一甲:過去一兩年,人工智能是全行業(yè)很火的賽道和技術方向,每天我們都看到非常多的產品和技術進展,今年世界大會為什么主題定為“應用來了”?
李彥宏:因為我從去年開始不斷講,模型本身不產生直接價值,只有在模型之上開發(fā)各種各樣應用,在各種場景找到所謂的PMF,才能真正產生價值。如果說2023年大家還在卷模型,讓模型能力逐步地達到可用地步的話,那未來所謂的“可用”,就是真的有東西用,應用的“用”。
過去這一年,整個行業(yè)有比較多的焦慮。這個焦慮是:超級應用到底在哪里?創(chuàng)業(yè)者機會是什么?大家都在問這些問題。我是希望通過百度的努力,包括我們開發(fā)的工具或者我們探索的各種各樣場景,能夠給大家探出來路徑,什么樣的應用是基于大模型能夠產生實際價值的。
今天百度世界大會之前,我覺得行業(yè)有比較大的困惑。到底應用在哪里?模型已經這么長時間,甚至有人覺得模型技術迭代速度已經慢下來了,但是超級應用沒出現,那怎么辦?所以當時就起了個名字,叫“應用來了”。我覺得,可以把我們的探索,我們的努力,我們的工具,我們找到的路徑、方法分享給大家;也把別人在我們平臺上做出來的有價值的東西,給大家介紹一下,這樣可以讓更多人找到自己發(fā)展的路徑和方向。
基座大模型兩年更新一代就夠了,得讓應用開發(fā)跟上
駱軼航:上午聽您百度世界大會的演講,跟我們聽到的很多演講有很大的不同,我?guī)缀鯖]有聽到兩個詞:一個詞是AGI,一個詞是Scaling Law(縮放定律)。不講這兩個詞的AI類主題演講和活動,幾乎已經不存在了。但您真的沒有講,你對這兩個詞是不是有什么看法?是AGI太遠,還是Scaling Law卡住了?
李彥宏:確實不是故意的。可能是它們沒有跑到我心里,讓我覺得說這兩個東西足夠重要,在百度世界上一定要提一提。AGI這個詞,就像一千個人心目中有一千個哈姆雷特。我如果再講百度怎么定義AGI,無非就是又增加了一種定義。即使跟別人不一樣,也沒有多大價值。既然主題是“應用來了”,咱就關注應用。至于說更加長期的東西,我們還是在沿著這條路在做。但把這些東西講得更完整或者更深入,我覺得只對非常小比例的人有價值,更大比例的人只是多知道了一種AGI的定義,意義是不大的。
張一甲:說到這兒,問一個大家心里面非常關注的話題。從ChatGPT上線以來,2023年業(yè)界不斷有很多重要的模型發(fā)布,很多重磅的進展,每天被各種標題黨和新聞給轟炸。但今年,首先是GPT5沒有發(fā)布,而OpenAI發(fā)了GPT4和O1的模型,看起來可能是一個分杈樹上的成果,或者是微創(chuàng)新成果。所以,我代表很多人,把心中的困惑問出來,大模型基礎技術的進步是不是在放緩?
李彥宏:我覺得還是取決于你從什么角度看這個問題。如果我就當做一個學術項目,北極星指標就是『哪一年或者哪一月能實現AGI』。這個角度上講,可以說技術進步的速度有所放緩。但我的視角更多是從應用角度看的,大模型的技術進步到底產生了什么應用。這個角度來說,我認為技術進步的速度不僅沒有放慢,而且有變快趨勢。
上午講的消除幻覺,你想一下,過去幻覺現象非常普遍,F在不管用哪個AI助手,問一些相關的問題,比如,我問問這個酒店游泳池有多長?過去在網上搜索這個答案,其實是得找半天的。官網沒有,攜程或者某個用戶評論區(qū)有這個信息,但你得找半天,F在大模型直接給你答案,這個答案能不能信呢?能信。就是因為像RAG這類技術的提升。
過去一年或者說兩年也好,我認為大模型在邁向實用的過程當中,發(fā)展出來的能力,其實仍然在以一個比較快的速度增長,所以你能夠看到我們今天看的調容量,上升那么快,為什么要調用,因為它有用,它在各種具體的場景當中產生了價值。
另外一個角度來講,反而是基礎模型不能夠特別快的迭代。如果老在變,那做應用的人就無所適從了,該做什么我不知道,我剛做了兩個月,你又升級了,把我做的沖掉了,白做了,我又得重新適應一遍新的規(guī)則之類的,我覺得可能兩年一個大的版本是一個比較合適的節(jié)奏。
駱軼航:所以我們不能等,第一我們不能等模型進化到AGI的階段再去做應用。
李彥宏:沒有必要。
駱軼航:第二我們不能讓應用開發(fā)的速度和模型進化的速度之間,產生了誤差,這樣的話會讓應用發(fā)展不起來。模型進化是整個能力的進化,剛才張一甲講了OpenAI的O1,O1是另外一個維度,是個深度思考的維度,這個維度本身對于做應用有沒有一個更好的促進作用?
李彥宏:有意義,這個維度非常有意義。百度大概也是從去年第四季度開始,我們在朝這個方向做,我們沒有把它叫做強化學習、O1什么。我們就說智能體,你可以注意到去年第四季度我們開始講智能體,智能體有什么功能呢?有反思、進化、使用工具這些,這些能力都是今天O1努力的方向,這個方向和傳統意義上大語言模型的方向確實不一樣。
這是我剛才講了,我們的開發(fā)者可能已經逐步適應了怎么在大語言模型上開發(fā)應用,突然你搞出來一個新的方向,又得適應一遍。其實我們也很希望大家趕緊適應這種新的思維邏輯,怎樣慢思考,調用工具。但這有大家學習和適應的過程,今天雖然我們發(fā)了多智能體協作這些東西,你說讓一個開發(fā)者開發(fā)一個多智能體協作的應用,其實難度還是很高的,成本很高,反應速度很慢,各種各樣的能力怎么調用,有一個接受的過程。我很看好,但是我們得逐步逐步的讓大家學習這種新的能力,接受然后再把它利用好。
駱軼航:基于百度AI能力開發(fā)智能體,提供了一套無代碼工具,你們說的是“只要會說話,就能開發(fā)應用,不需要會編程語言”,只要你會講中文和英文,理論上你就能開發(fā)應用和多智能體協作。這句話會不會多多少少造成誤導,讓大家覺得這個門檻真的已經降得很低了?其實在硅谷看到很多AI應用開發(fā)者,有的人在用不同的模型“調雞尾酒”,有的人其實是在fine-tune一個小模型,是蠻復雜的事情,您怎么看我們目前對這個“會說話就能開發(fā)AI應用”的定義,和真正AI應用開發(fā)之間的距離?
李彥宏:這還是兩個不同的track。在那些最復雜的應用場景,可能確實不僅要考慮應用,還要考慮模型的能力,還有剛才講的模型精調,數據標注等等,確實大量大量的工作仍然在可預見的未來是需要的。但另一方面,也使得很多相對沒有那么復雜的應用,在過去看來還不是那么容易的事兒,在今天看來,你不是程序員也好,花幾分鐘時間就能做出來了。
這一條賽道也是一個逐步發(fā)展的過程,我不希望大家有誤解,明年一季度所有程序員能干的事兒你就全部能干了,不會這樣一蹴而就的。但是它是非常非常有希望的賽道,我今天能夠寫兩百行代碼,一年以后可能能寫兩千行代碼,再過三年可以寫兩萬行代碼,這個能力會逐步發(fā)展出來,那它會讓更多人的創(chuàng)造性給激發(fā)出來。
Sora和多模態(tài)是兩碼事,百度當然做多模態(tài)
張一甲:我想聊聊今年另外一個比較火熱的概念,就是多模態(tài)。年初Sora開始,多模態(tài)成為了今年為數不多的炸點,有非常多的公司冒出來卷Sora,這個事情百度怎么看?百度做不做Sora?
李彥宏:我覺得Sora和多模態(tài)是兩個事兒。Sora本質上是在任意場景下的視頻生成能力。這件事情有沒有意義呢?非常有意義,與此同時又非常難。你想想它的本質是什么呢?本質是可以做到基本可以預測未來。我們今天看到這么一個畫面,你可以預測到下一個10秒,這個畫面變成什么樣子。無人駕駛是一個特殊場景的視頻生成,我現在開到這兒了,那我下一秒怎么開,會看到什么樣的景象,如果你都能解決的話,那無人駕駛不用做了,都可以靠那東西,可以做出來。正因為是這么大的一件事兒,所以我覺得它需要很長很長時間才能夠做出來。但是我們今天講的多模態(tài),實際上是解決另外一類型的問題。比如上午講的數字人,不是純語言模型,你生成的文字要用語音表達出來,語音表達的時候口型要能對得上,手勢應該做什么,我如果轉頭了,側面的圖像能不能跟正面保持一致等等,看起來都是一個比較簡單的事情,但是你仍然需要解決?咳我鈭鼍跋律梢曨l的東西,不一定能把這事兒解決得很好。
如果真的能夠做到任意場景下視頻生成,那可能要很長時間,而且成本很高。我要解決剛才說的這些東西,把這些簡單的多模態(tài)東西解決了,就能夠有很好的應用場景。我用簡單的方法,就能夠做到,那我為什么不呢?先把這些事兒解決了,讓這個應用能夠跑起來,這是我們的思路。所以外界有一種誤解就是,百度不做Sora,就是百度不做多模態(tài)。我們非常非?春枚嗄B(tài),我們也在多模態(tài)上有非常長期的多年投入,在真正有應用場景的地方,我們的多模態(tài)能力是非常強的。
張一甲:是不是iRAG就是百度走向多模態(tài)重要的一項基礎技術?
李彥宏:是的,它是我們在開發(fā)各種各樣應用過程中遇到的一個障礙,必須把障礙搬走之后,我才能再往前走。
駱軼航:這是你自己發(fā)現的問題?
李彥宏:沒錯。
張一甲:面向我們想要的人工智能未來,是我必須要解決的問題,沒有它我其他所有的應用,所有將來可能的圖景都是過不去的,所以我必須要完成那個事?
李彥宏:是這樣的。
張一甲:今天你非常詳細地講了iRAG,它是一項基礎技術,接下來iRAG準備怎么用?往哪個APP上用?還是以什么樣的形式走向終端應用?
李彥宏:終端應用應該是大家群策群力,每個人根據自己的實際需求,已經了解的場景,怎么更好地使用它。我能夠想到的,其實今天舉了不少車的例子。車這個行業(yè)你們非常清楚,很依賴市場推廣,他們在做市場推廣的時候非常非常講究。如果出一款新的車型,我要拍攝非常漂亮的畫面,照片也好,視頻也好,要花很多錢。拍一張車的圖片,最少得幾千塊錢,上萬塊錢;而它要拍好多張圖片,還要拍視頻等等。過去要五千塊錢做的事兒,現在五分錢就能做出來,如果能做出來就可以大量做。
今天的例子,車飛越長城,那個東西不可能靠拍攝的,車飛不起來。但是車飛起來的話,好看不好看?確實好看。在這種市場宣傳的場景,非常有用。我既要保持車該有的東西必須得有,不變的東西不能變,但是它又能夠放飛人們的想象,真正有創(chuàng)造力的故事情節(jié)能夠出來,那肯定會更吸引人。所以,在幾乎所有的創(chuàng)作場景,iRAG都非常有價值。
殺死大模型幻覺和智能涌現的矛盾能解決
駱軼航:iRAG代表了我們對于多模態(tài)和生成內容本身,另外一個維度的考量,不是炫技的維度,而是現實被什么人用到的維度。它生成的圖片精準可控不用再修改,真正降低人們使用它的門檻和成本。今天上午,你有一個非常重要的論斷,就是過去兩年大模型基本上消除了幻覺?墒腔糜X有的時候是涌現的伴生品,那么消滅了幻覺,會不會殺死了進一步涌現的能力?
李彥宏:這就需要我們這些從業(yè)者不斷的創(chuàng)新,我既要消滅幻覺,還要能夠保持你的涌現能力、創(chuàng)造力。其實國外很多人講,基礎模型將來能夠具備諾獎獲得者的智力水平,那是極大的創(chuàng)造力迸發(fā),這確實是努力方向。但與此同時,它的這種副作用,就是幻覺要能夠控制。
張一甲:技術的角度來講,讓它減少幻覺變得非常精準,和它給我們帶來很多的想象力,這兩個事情本質上是矛盾的嗎?
李彥宏:有一定的矛盾,但它是可以解決的。我覺得至少是可以逐步解決的。我遇到問題的話,總會想辦法。我希望鼓勵什么東西,我在這方面要加強,不鼓勵什么東西,要用其他的手段去進行控制。
我不認可說我是徹底的AI現實主義者
駱軼航:中國AI有兩派人,理想主義者和現實主義者,理想主義者追求模型的不斷進化和進展;現實主義者更重要看用到模型的能力做了多少具體的事情。您今天的演講沒有AGI和Scaling Law 這樣的大詞,沒有基座模型的進展,甚至不提文心一言和文小言,完全圍繞著應用。我想知道您是從哪個時間點開始越來越傾向于變成一個AI發(fā)展的現實主義者了?
李彥宏:其實講模型能力,我也可以講一個小時甚至時間更長,我也不認可自己就是純AI現實主義者。我們沒有講的,并不表明我們沒有做。事實上,我很多的研發(fā)資源還是投在了外界看來基礎的能力或者理想主義者看重的東西。我們在做,我們不斷地在這方面加大投入、付出努力。我只是覺得,沒有必要把這些只有極少數人才能夠聽得懂或者說才會appreciate的東西到處去講。我需要倒出去講的是,更多的人,幾千萬人,幾億人確確實實能夠用得到的東西,我希望多講。
張一甲:整體呈現的畫面是,我需要為更多人解決問題,所以世界大會聽下來,百度變得非常務實。而且你的演講風格變得非常具體,不像很多我們看到的,大家談一些想象力,談很大的命題,比如像文明、終極的人和機器交互。相比較來看,百度拋出了非常具體的case和具體做的事情,把想象中的未來,非常清晰地一個模塊一個模塊白描了出來。今天你有一個很大的篇幅講智能體、自由畫布,現場看大家很興奮,自由畫布這個idea怎么誕生的?它是百度對于多模態(tài)應用的一種終極的想象嗎?
李彥宏:其實還是基于需求。這個事情最早是因為百度有一個產品叫文庫,文庫最早是找現成的文檔,并不是做生成的。在生成式人工智能技術出現前,文庫已經出現了。但是當有了生成式AI,我們發(fā)現人們最根本的需求,不是找一個現成的文檔,而是為了創(chuàng)作自己的內容。
我們怎樣能夠基于現成的文檔,或者哪怕沒有現成的文檔,能夠讓他更好的創(chuàng)作,這條路走下去就是最早文庫的重構。后來我們又發(fā)了單獨的產品叫橙篇,現在又推自由畫布,是一步一步基于讓人們能夠更加方便地創(chuàng)作內容,或者說也不僅僅是創(chuàng)作,是communicate your ideas,心里怎么想的,你怎么能夠把它更方便,更準確的表達出來。過去人們覺得說,我有一個office就可以了。我心里怎么想的,怎么落到紙面上,不管語音也好,圖像、文字也好。這個過程,我們怎么enable這些用戶,做這些事情。
張一甲:自由畫布這個idea什么時候出現的,什么時候我們把產品形態(tài)構想成這樣子?
李彥宏:時間不長,三四個月之前。
駱軼航:一般人家說巨頭,比較大的公司做AI創(chuàng)新,最大的負擔是它的legacy,創(chuàng)業(yè)公司能夠沒有負擔的往前跑,但自由畫布今天出來以后,大家反應還是挺熱烈的,但這個東西恰恰是建立在百度的Legacy基礎之上,因為我們有百度文庫,所以你怎么看我們過去的一些積累?無論是深度學習還是產品上的積累,其實對我們現在掌握用戶需求,做用戶真正關心的AI應用,這個事兒上幫助是什么?這個其實是大家之前很少探討的,我們內部思考過這個問題嗎?
李彥宏:根本原因還是到底信什么?一旦你從這個視角考慮問題的話,都很好解釋了。百度信AI,不是今天才信,也不是兩年前信,是十幾年前就信這個東西。所以文庫的改造也好,或者說非常堅決的做一些在大家看來是全新的東西,或者說沒有太受legacy的束縛。更或者說,我們真正的legacy就是我信AI,一旦你把這個東西當成legacy,這些東西其實就都很好解釋,我就是在做我多年前一直想做的事。
駱軼航:對,十多年一直想做的事情。
超級應用不是沒有,而是時候未到
張一甲:百度應該是國內最早做AI的,是人工智能的扛旗者。下一個聊聊“超級應用”。去年開始,我們都不斷地在暢想或者期待,能夠出現一款超級應用。但是為什么今年并沒有出現超級應用?
駱軼航:本來就不該有嗎?還是說還沒出來?
李彥宏:第一,我先說不是說不會有,我認為會有,只是現在時機沒有到。之所以大家覺得該出來了,但是還沒出來,是因為大家很容易拿這波生成式人工智能和上一波移動互聯網或者上上一波PC互聯網相比。說那個都是火了幾年以后,我們就已經比較明確的能夠看到超級應用的出現。但其實你注意到,當生成式人工智能起來的時候,我們對外一直講這是一場新的工業(yè)革命。如果你看作工業(yè)革命的話,應該回去比較,當時電力革命發(fā)生的時候,這個超級應用是什么?過了多少年出來的?當時蒸汽機革命出現的時候,它的超級應用是什么?是怎么出來的?那些東西可能更具有可比性。
駱軼航:它不是長在一個設備上的一款APP或者一個軟件,可能是更基礎設施的東西。
李彥宏:沒錯。
百度從來沒對標過OpenAI
駱軼航:您剛才講,基座模型不能太快速迭代,應用開發(fā)者跟不上。這是我第一次聽到類似于這樣的觀點。我想到的是OpenAI。它一方面給開發(fā)者提供了一些工具和API,一方面不斷推進模型往前走,殺死一批創(chuàng)業(yè)公司,以至于現在看到的唯一有超級應用影子的AI應用,就是ChatGPT。所以我們現在能不能講,百度完全不想做另一個OpenAI?
李彥宏:說實話沒有想過這個問題。
張一甲:是不是百度從來沒有把OpenAI當做自己的對標?
李彥宏:沒有。
駱軼航:但是模型本身上會拿它當做參照。
李彥宏:對,我們還是很關注它在做什么事情,但確實沒有想過,要不要成為它。
張一甲:基因角度講,百度也從來不是OpenAI?
李彥宏:不是,不是。這并不表明,我們是一個純粹的現實主義者,其實我覺得我們也挺理想主義的。當你的夢想是讓幾億人、十幾億人都具備程序員的能力,這個又需要很多年大手筆投入的時候,這難道不是一種理想主義嗎?
駱軼航:對,長期的理想主義。
你上哪找那么多智能體?還是得用搜索
張一甲:你把一個工具做到了千家萬戶,讓所有人都可用,本身也是一個巨大的藍圖和理想。關于應用,我再問一下,之前我看到你的對外分享提到,從Copilot到Agent,到AIworker,智能體會是AI應用的終極形態(tài)嗎?還是過渡階段?
李彥宏:這個問題應該放在時間線的坐標軸上看,拉長這個時間線的話,肯定Agent是過渡形態(tài)。但是這個過渡形態(tài)我的判斷會持續(xù)比較久的時間,即使是AI worker出現以后,它跟智能體還是會長期并存的關系,有些東西可以完全自動化了,有些東西還是需要通過人和AI或者說跟虛擬人的協作來完成,還是分不同的場景。
張一甲:我聯想到一個問題。因為百度作為一個大的平臺,當我們看到智能體的時候,你知道它依然存在怎么激活,換句話說,存在一個分發(fā)和流量入口的問題。那在未來像百度的搜索,還有你今天列出這么多智能體,還有其他百度現有的產品矩陣,在流量的入口度,可能會是什么樣的情況?比如一個普通用戶在接觸百度AI產品的時候,我的典型體驗可能是什么樣子的?他們之間會不會有流量爭搶,競爭的關系?
李彥宏:我們想象的分發(fā)的機制或者流量入口,比較類似于現在的百度搜索。在百度里搜相應的詞,你出來就有可能是一個智能體,你跟這個智能體,就像跟一個律師在線問答一樣,可以進行很多輪的互動,我們看到有好幾十輪的互動,有一個用戶跟AI的智能體不斷地問。
駱軼航:搜索公司是不是更容易做好AI智能體和很多更好的AI應用的框架?
李彥宏:應該是。大語言模型跟搜索本身很近,我們搜索一直在處理目前語言文字的東西,這是為什么我們可以很快推出來文心一言。另一方面,你有那么多智能體的時候,還是說怎么能夠跟人的需求高效的匹配起來,人有了這種需求以后,上哪兒接觸到這些智能體,最高效的連接還是一個搜索。
張一甲:這里面會存在一些商業(yè)顧慮嗎?比如由于很多智能體的存在,讓我們原有的商業(yè)搜索蛋糕被稀釋了,有這樣的隱憂嗎?
李彥宏:沒有,我覺得現在根本沒有必要考慮對現有商業(yè)模式的沖擊,因為你一旦打開了更多的可能性給自己的用戶、給自己的客戶,創(chuàng)造了新的價值的時候,你總能找到新的商業(yè)模式。我今天展示的調用量的圖,你想想如果調用收費的話,那這種漲法是可以收到很多錢的。
駱軼航:把價格再壓下來95%,再收錢,還是收上來很多錢,這是現在API收費還能跑得通的原因,我們會有非常陡峭的調用曲線的上升。
李彥宏:沒錯。
駱軼航:比起很多同行,文心一言并不是API降價上非常激進的玩家,是什么導致了文心大模型最近兩個月調用量的陡升?
李彥宏:其實我們價格非常有競爭力的,甚至有些模型是大家可以免費調用的,相當于算力送你了,更重要的是,可以說是開發(fā)者群體的覺醒,他逐步意識到了可以用模型來做出什么應用來,這是為什么我們今天強調“應用來了”,當過去一開始曲線相對沒有那么陡峭,相對那么平的原因是因為絕大多數人還不知道大模型能做什么,一旦它知道了之后,那需求其實是足夠旺盛的。
駱軼航:所以這個曲線也不僅是針對百度和文心大模型的,是針對整個行業(yè)的。
李彥宏:對。
解決AI問題,用工程的方法不丟人
張一甲:人工智能是一個大的概念,里面涉及到的技術門類和產品迭代的方向又非常多,作為百度的掌舵者,每一天面對這么多的進展,你的底層思維是什么?怎么決定做什么、不做什么?取舍過程中,有沒有背后思考的第一性原理?
李彥宏:就是應用驅動。這個和美國很多公司做法很不一樣,美國很多公司一直都是夢想說我要做顛覆性的技術,我要多少年之內做成什么什么樣子。我更多希望盡早接觸場景及接觸應用,看在這個過程當中,到底遇到了什么問題,把這些問題帶回來,我們綜合一下,看大家遇到的最多的問題,就是我們優(yōu)先解決的問題。
駱軼航: 其實我們是在用產品的思路和工程的思路看待模型驅動應用的這個事情,而不是在攀登技術演進的珠穆朗瑪峰上尋找答案。
李彥宏:很多美國同行,他們做法是當做一個science(科學),我有一個終極目標,就想盡各種辦法解決它,我們這邊當做我要解決的問題,這個問題可能用工程的方法也可能用其他的方法、用數據這些驅動,最后解決下來。但是你看現在諾貝爾獎都授給公司CEO了,為什么呢?很多非常有意義的,即使是從science的角度很有意義的事,最后是靠工程的方法解決出來。所以做工程不丟人,做工程很有可能是比科學更早發(fā)現機會、發(fā)現規(guī)律的。其實飛機也是,飛機先飛上天了,人們才開始研究,原來有一個東西叫空氣動力學。
駱軼航:您認為科學家現在應該在一個AI公司里面,它真正扮演的角色應該是什么角色?驅動的角色、還是輔助的角色、還是什么環(huán)節(jié)的角色?因為我們現在看到了,這兩年以來,無論美國還是中國,無數科學家在創(chuàng)業(yè),無數科學家在離開創(chuàng)業(yè)公司,我們認為教授、科學家應該在這個體系中扮演什么作用?
李彥宏:我覺得科學家應該提供的是vision,他應該看的比工程師更遠一些,你看這一輪大語言模型的爆發(fā),其實背后的vision是什么?就是你剛才講的Scaling Law,有人看到了,我只要加算力,我只要用更多的數據來train這個模型,就會出現智能涌現,他是先有了這樣的想法,才去做這些事兒的,這些事兒從正的角度想的,之所以越來越多的教授創(chuàng)業(yè)或者是加入更大的公司去,是因為你創(chuàng)業(yè)能夠拿幾億美金,你在學校拿那些東西就幾百萬美金,全美所有的大學加起來,涌現不出一個GPT3.5。在大廠里頭,幾萬片,甚至十萬片的東西已經出現了,在這么大規(guī)模上去做,顯然比別人更早的知道,未來是什么樣子。這些年技術發(fā)展可以說是新的特色,不光是一種想法,剛才講了vision,要跟資源相結合,我只有有這么多資源的時候,我才能證明這個想法到底是對的還是錯的。有些人感興趣的是相對比較science的東西,沒問題,有價值,有些人感興趣的是,怎么在市場當中找到一個創(chuàng)造價值的地方,我覺得也是需要的。這個世界就應該這么多樣化,大家不同的人有不同的愛好,不同人有不同的信仰,最終才是有意思的世界。
AI是一次新的工業(yè)革命,不會三五年就結束
駱軼航:行至尾聲,我們聊一些輕松的議題。Geoffrey Hinton得諾貝爾物理學獎的那一天,我們忍不住把一篇講Hinton差點加入百度的老文章翻出來重新發(fā)了一遍。Hinton差點加入百度,然后Anthropic的創(chuàng)始人Dario Amodei在百度實習過。
李彥宏:他(Dario Amodei)是百度正式員工,Jim Fan在百度實習過。
駱軼航:對,Jim Fan在百度實習過,Dario Amodei是百度的正式員工,Andrew Ng也曾經是百度非常重要的科學家。
李彥宏:對。
駱軼航:所以你會發(fā)現,在全球的機器學習和人工智能領域,十年之前到現在,在幾個時間點上扮演一個非常有意思的角色,這個問題的延伸有兩個,一個是如果這些人現在都在百度,百度是個什么樣的公司?很少有公司像百度這樣,一個中國公司在全球的AI發(fā)展人才節(jié)點,資源節(jié)點和技術節(jié)點扮演過這么一個角色,百度未來還能不能再繼續(xù)扮演這個角色?
李彥宏:其實這個事也蠻有意思的。網上你們也看到了,像Geoffrey Hinton,后來他后來選擇加入了Google,不是因為我們不愿意出更多的錢,而是他自己更愿意在美國呆著。但是因為他沒有來呢,我們還是想要真正的大咖,能夠加入百度,所以后來就找了吳恩達,就是Andrew Ng,吳恩達來的理由其實也比較簡單,他當時在Google,做Google Brain(谷歌大腦),想買更多的GPU,Google說不行,太貴了。我們說你來,隨便買,那他就來了。他來了之后,像Dario Amodei,他原來是斯坦福的學生,Dario Amodei來了之后說Jim Fan不錯,我招他來實習。
所以一代一代的人,就把優(yōu)秀的人才能夠吸引過來,當然這些人后來陰差陽錯,后來又離開了百度,我覺得也沒問題,人才的這種流動對整個行業(yè)是健康的,他找到他的下一站,對于百度來說也培養(yǎng)了一批非常優(yōu)秀的人才。外界因為某一個人離開會有報道,但是這個人如果在這呆著的話,他就沒有報道,并不是因為這個人不優(yōu)秀,其實目前在百度內部做AI的有很多很多人,是非常非常優(yōu)秀的,只不過因為他們沒有離開,所以外界不知道,外界沒有報道。
所以對于我們來說,一方面好多公司的創(chuàng)始人是百度出去的,有不少互聯網公司的CTO是百度出去的,其實我很高興,這意味著我們既給社會做了貢獻,又樹立了百度的技術品牌。今天一個校招生加入百度會想,這個人是從百度出去的,這個人在百度做了什么事情,他會想在百度能獲得什么樣的學習成長機會,所以對于我們吸引新的優(yōu)秀人才,我認為是很好的事情。這些人反而是在百度能夠踏踏實實做事,能夠做出來東西的。我覺得更年輕一輩的,現在還沒有出名的那些人,是真正我們最寶貴的財富。
駱軼航:百度怎么在整個全球AI格局中,更加體現它的技術前瞻力?這件事越來越難了,因為我們是一家中國公司。
李彥宏:總是有解法的。中國畢竟有14億的人口,中國本身就是一個很大的市場,中國人總體來講對于先進技術其實是歡迎的,是愿意接受的。有了這樣一個環(huán)境,我們總是可以做出很多創(chuàng)新的。
張一甲:在我們今天這個節(jié)目的結尾,對我們所有在關注百度世界大會和關注人工智能方向的朋友們,你有沒有什么總結、寄語給大家分享?
李彥宏:其實我還是想說,人工智能很像是一次新的工業(yè)革命,這意味著它不是三五年就結束,不是一兩年就出現“超級應用”的過程,它更像是三五十年對于整個社會的方方面面一個非常徹底的重構。在這個過程當中,我們既需要耐心,又需要大的投入,同時需要不斷的傳播這種火種,讓越來越多的人,越來越多的組織和公司,能夠理解這件事情對他們的意義,并且很好的利用這些新的技術能力,給自己的組織、自己的公司創(chuàng)造出來更多的價值。
駱軼航:需要長期主義、理想主義和現實主義的三結合。