編者按:近日,首都科技領(lǐng)軍人才、東方通科技首席科學(xué)家謝耘在通州全球發(fā)展論壇(2025年春季)“DeepSeek中國人工智能、跳躍式發(fā)展與全球2050目標(biāo)”主題研討會上發(fā)言指出,未來大模型應(yīng)聚焦邊界明確的問題領(lǐng)域,避免處理無限開放性問題,同時需以理性態(tài)度看待AI發(fā)展,而不是用感性的期望想象,代替理性的分析認(rèn)識。現(xiàn)將其發(fā)言實錄發(fā)布如下:
大模型的基礎(chǔ)是什么?
我從科學(xué)的角度講一下對于大模型的看法。大模型的基礎(chǔ)是什么?講一下這兩個核心的基礎(chǔ)。因為一個東西的基礎(chǔ),決定其能做什么,能走多遠,所以我們還要理解它的基礎(chǔ)。大模型核心的基礎(chǔ)是基于文字符號的統(tǒng)計,它是對文字符號做統(tǒng)計來做各種各樣的事情的,這是它的核心基礎(chǔ)。通過統(tǒng)計來發(fā)現(xiàn)文字符號之間概率的關(guān)系,借助這個概率關(guān)系生成你需要的東西。簡單講一下統(tǒng)計,統(tǒng)計的方法在科學(xué)中屬于一種相對平凡的方法,為什么說是相對平凡的方法?它是一個就事論事的方法,沒有辦法超越統(tǒng)計的樣本,去談別的事情。它做不到,這是統(tǒng)計原理上根本的限制。舉一個最簡單的例子,當(dāng)年開普勒通過統(tǒng)計行星圍繞太陽運行的數(shù)據(jù),發(fā)現(xiàn)了行星軌道的特點。但是,他不可能通過統(tǒng)計,去發(fā)現(xiàn)兩個質(zhì)量相同的星體相互運動的規(guī)律。不可能統(tǒng)計出來,因為沒包含在那個數(shù)據(jù)里。他更不可能,通過統(tǒng)計產(chǎn)生超越數(shù)據(jù)的洞察。比如行星圍繞太陽轉(zhuǎn)是萬有引力決定的,他通過這個數(shù)據(jù)統(tǒng)計沒有辦法推出萬有引力定律,所以萬有引力定律最后是牛頓提出來的。牛頓不是用統(tǒng)計的方法,其實這是一種洞察的能力。對于洞察我們沒有辦法詳細解釋,所以我們說一個蘋果砸到牛頓的腦袋上,讓他發(fā)現(xiàn)了萬有引力定律,這種深刻的洞察沒有辦法通過統(tǒng)計發(fā)現(xiàn)。所以統(tǒng)計是科學(xué)中一種相對平凡的方法。人工智能開始并不是依賴統(tǒng)計,而是試過很多其它的方法,結(jié)果發(fā)現(xiàn)只有統(tǒng)計最好用。所以現(xiàn)在人工智能使用統(tǒng)計這個平凡的方法是沒辦法的辦法。大模型的第二個基礎(chǔ)是什么?這是被談?wù)摰母俚囊粋話題,其實這個更本質(zhì),大模型本質(zhì)是一種現(xiàn)代工匠技藝。為什么說是一種工匠技藝?因為它沒有背后的科學(xué)原理,人類現(xiàn)在沒有關(guān)于智能的科學(xué)理論。所以人工智能現(xiàn)在都是工匠性的實驗方法,為什么DeepSeek搞出一個東西大家很驚訝?就是因為這是一個工匠的東西。如果你有新的想法,你也可以搞出新的東西來,并不是某一個理論告訴你一定會怎么樣,不存在這個理論。所以這是大模型,是人工智能非常本質(zhì)的一件事情,它是現(xiàn)代工匠技藝。有很多朋友不理解這件事情,說用了那么復(fù)雜的數(shù)學(xué),你怎么說它是工匠?對不起,數(shù)學(xué)只是個工具,用了再復(fù)雜的數(shù)學(xué),也不等于是科學(xué)。為什么說它是現(xiàn)代工匠技藝?就是因為用了大量的數(shù)學(xué),和傳統(tǒng)的工匠技藝不一樣,只是后者用手,這是第二個核心的基礎(chǔ)。這兩個基礎(chǔ)決定了它能做什么,不能做什么,也決定了未來能發(fā)展到哪里,以及以什么形式去發(fā)展,F(xiàn)代工匠技藝有幾個特點:
一是有很大的盲目性,因為沒有科學(xué)理論做指導(dǎo);二是有很大的不確定性,新的方法可能突然出現(xiàn)取代已有的;三是工匠技藝和有現(xiàn)代科學(xué)理論支撐的技術(shù)發(fā)展相比,它可能走不太遠,這是歷史的經(jīng)驗告訴我們的;四是工匠技藝嚴(yán)重地依賴經(jīng)驗和悟性,是個經(jīng)驗的東西。關(guān)于人工智能,美國蘭德公司1965年就有一個報告,講了一個非常核心的觀點,就是人工智能是一種現(xiàn)代煉金術(shù),沒有科學(xué)的理論在支撐,這個結(jié)論到今天依然是成立的,這個領(lǐng)域依然如此。報告里面一個很形象的話送給大家,你不能因為爬到了一個很高的樹上,就覺得自己離登月這個目標(biāo)更近了。這是1965年的報告,大家有興趣可以查,網(wǎng)上能找到這份報告。
大模型與人的異同
大家現(xiàn)在在講大模型有理解能力,大模型的理解是基于字符的統(tǒng)計形成的,它和人基于意義的理解是不一樣的,底層邏輯完全不同。這樣兩種東西產(chǎn)生的結(jié)果會有重疊的地方,但是注定不完全一樣,這兩個機制是不等價的。所以大模型產(chǎn)生幻覺是必然的,幻覺只是站在人的角度去說,對于大模型來講,這就是它非常正常的輸出。因為按照它底層的機制,就會產(chǎn)生這些東西。所以它的理解和我們的理解在結(jié)果上有重疊的部分,但是不等價,一定有很多不一樣的地方。關(guān)于邏輯,現(xiàn)在很多人問大模型的邏輯能力,大模型底層沒有邏輯,還是基于概率統(tǒng)計的。他基于概率統(tǒng)計輸出的東西,從邏輯角度,和我們的邏輯可以重合,但是依然是不等價的。你用再多的數(shù)據(jù)訓(xùn)練,這兩個也不可能等價,因為底層機制不一樣,這個不是數(shù)據(jù)決定的,這是底層機制決定的。很多人說大模型會犯錯誤,人也會犯錯誤,這有什么了不起的?這兩個犯的錯誤不一樣。人犯的錯誤某種程度上是可預(yù)測的。比如說王院長,在他的領(lǐng)域里面他談的東西不可能出基本概念的錯誤,否則王院長不可能當(dāng)院長,在國際上做這么多講座。人的錯誤當(dāng)他達到一定水平,有些錯誤不會犯。高水平的人依然會犯錯誤,但是不會犯基本的錯誤。但大模型不是,大模型無法預(yù)測會犯什么類型的錯誤。就是因為底層的機制不一樣,它不是按照我們的理解去看這個事情。國際上有很多測試,發(fā)現(xiàn)你再增加數(shù)據(jù),它依然會在很基本的問題上犯錯,所以它出錯和人出錯的性質(zhì)不一樣。我清華的一個朋友問我大模型能不能展示出智慧?我說你要首先定義什么是智慧,你沒定義智慧沒法談會不會有智慧。
未來的發(fā)展
最后講一下未來的發(fā)展,人工智能的科學(xué)原理會不會有突破?我個人對于這個事情不看好。原因就是人類最聰明的一批大腦,研究智能科學(xué)已經(jīng)研究了上百年,到今天沒有突破?茖W(xué)界對大腦,對意識的一個基本結(jié)論就是,人類一公斤多重的大腦是現(xiàn)代科學(xué)最深的一個黑洞。所以你說未來會有突破,這個會很難,我覺得希望不是太大。工匠技藝可以走多遠,這個不太好預(yù)測,但是它會出現(xiàn)很低效率的發(fā)展,工匠技藝在盲目地摸索,這里有很大的偶然性。工匠技藝創(chuàng)新的模式可能是孤狼式的,因為沒有科學(xué)理論的指導(dǎo),讓大家都按照一個方向走。有可能今天DeepSeek用了一個低成本的方式做,有可能過兩天一個人用完全不同的方式做出一個新的東西來,這完全是有可能的。所以這個領(lǐng)域的創(chuàng)新其實恰恰應(yīng)該鼓勵大家不要沿著一個潮流去走,而是應(yīng)該鼓勵多方向去探索。未來人工智能,包括大模型的發(fā)展,我個人認(rèn)為以問題邊界受限的領(lǐng)域應(yīng)用為主可能會更好。因為一旦開放,問題就不受限了,可以有一個無窮的問題。你用有限的學(xué)習(xí)樣本的統(tǒng)計去解決無窮的問題,這是有問題的。所以用有限的統(tǒng)計方法,還應(yīng)該去解決有限、受限的問題,我覺得這是最好的方式。最后一個建議,面對人工智能大模型的發(fā)展,我們還是要用科學(xué)的態(tài)度去面對,而不是用感性的期望和自己的想象來解釋這里的事情。現(xiàn)在這個問題比較嚴(yán)重,我覺得還是要用理性的態(tài)度去面對這件事情。人類整個歷史其實說明一個很重要的問題,就是理性導(dǎo)致我們走到今天?茖W(xué)就是一個理性的產(chǎn)物,沒有理性我們是走不到今天的,所以我們往未來看,我想可能還是應(yīng)該強調(diào)科學(xué)的理性去面對這件事情,用科學(xué)負責(zé)任的態(tài)度去發(fā)展使用人工智能技術(shù)。謝謝大家!