當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > AI大模型發(fā)展路徑之爭(zhēng)將帶來(lái)哪些巨變

AI大模型發(fā)展路徑之爭(zhēng)將帶來(lái)哪些巨變
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-25 08:03:30 瀏覽：209次

導(dǎo)讀：一邊是“大力出奇跡”，一邊則瞄準(zhǔn)“四兩撥千斤”，2025年，AI大模型“下半場(chǎng)”有了新打法：路徑分化，擁抱開(kāi)源。“一方面，部分國(guó)家為保持在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì)，會(huì)不斷地‘卷算力’‘卷數(shù)據(jù)’‘拼規(guī)模’；另一方面，我國(guó)的AI發(fā)展路徑已經(jīng)逐漸明顯，在持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí)，做普惠AI，這樣就能形成明確的差異化優(yōu)勢(shì)�！盌eepSeek的橫空出世及開(kāi)源策略正在牽動(dòng)大模型賽 ......

一邊是“大力出奇跡”，一邊則瞄準(zhǔn)“四兩撥千斤”，2025年，AI大模型“下半場(chǎng)”有了新打法：路徑分化，擁抱開(kāi)源�！耙环矫�，部分國(guó)家為保持在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì)，會(huì)不斷地‘卷算力’‘卷數(shù)據(jù)’‘拼規(guī)模’；另一方面，我國(guó)的AI發(fā)展路徑已經(jīng)逐漸明顯，在持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí)，做普惠AI，這樣就能形成明確的差異化優(yōu)勢(shì)�！�

DeepSeek的橫空出世及開(kāi)源策略正在牽動(dòng)大模型賽道的分化，以及各國(guó)不同的AI發(fā)展路徑之爭(zhēng)。

2月18日，美國(guó)人工智能企業(yè)xAI發(fā)布Grok 3推理模型，其在多項(xiàng)性能上超過(guò)或媲美DeepSeek、GPT-4o等模型，埃隆里夫馬斯克稱這是“地球上最聰明的AI”。然而，馬斯克透露，Grok 3的算力支持來(lái)源于xAI的“Colossus”超級(jí)計(jì)算集群，其在訓(xùn)練過(guò)程中累計(jì)消耗了高達(dá)20萬(wàn)張英偉達(dá)GPU。

今年1月，國(guó)內(nèi)AI廠商深度求索（DeepSeek）發(fā)布了開(kāi)源推理模型DeepSeek-R1，該模型在多個(gè)基準(zhǔn)測(cè)試中與OpenAI公司的o1模型持平，但成本僅為o1的三十分之一，高性能、低算力需求使其迅速在全球走紅，并開(kāi)啟了低成本訓(xùn)練模型的風(fēng)潮。

一邊是“大力出奇跡”，一邊則瞄準(zhǔn)“花小錢辦大事”“四兩撥千斤”，2025年，AI大模型“下半場(chǎng)”有了新打法：路徑分化，擁抱開(kāi)源�！耙环矫�，部分國(guó)家為保持在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì)，會(huì)不斷地‘卷算力’‘卷數(shù)據(jù)’‘拼規(guī)�！�；另一方面，我國(guó)的AI發(fā)展路徑已經(jīng)逐漸明顯，在持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí)，做性價(jià)比高的普惠AI，這樣就能形成明確的差異化優(yōu)勢(shì)�！笨焖悸胙芯吭涸洪L(zhǎng)、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長(zhǎng)田豐說(shuō)。

　　“大力出奇跡”與“四兩撥千斤”

當(dāng)前，面對(duì)DeepSeek以高性價(jià)比強(qiáng)勢(shì)破局，以xAI為代表的部分AI廠商依然堅(jiān)持花重金“卷算力”，大模型領(lǐng)域?yàn)楹螘?huì)形成上述兩種路徑的分化？在田豐看來(lái)，這與“Scaling Laws”（尺度定律）的性價(jià)比降低有關(guān)。

在大模型中，“Scaling Laws”意味著當(dāng)算力、算法、數(shù)據(jù)這3個(gè)關(guān)鍵因素被不斷拉高上限并達(dá)到一定程度時(shí)，大模型的智能表現(xiàn)將出現(xiàn)躍升，即“智能涌現(xiàn)”。近兩年，國(guó)內(nèi)外AI廠商遵循著“Scaling Laws”持續(xù)投入，模型體積不斷膨脹，參數(shù)數(shù)量呈指數(shù)級(jí)增長(zhǎng)。“‘Scaling Laws’性價(jià)比最高的時(shí)候就是GPT-4時(shí)期，模型效果隨著參數(shù)的增加有著指數(shù)級(jí)的提升。彼時(shí)，各大AI廠商紛紛購(gòu)入高性能GPU，英偉達(dá)的市值更是迅速上升。”田豐說(shuō)。

可如今，“Scaling Laws”的性價(jià)比似乎沒(méi)有那么高了。有業(yè)內(nèi)人士提到，Grok 3的計(jì)算量幾乎是DeepSeek的幾十倍，但性能卻并沒(méi)有提升幾十倍，這從側(cè)面也印證了“Scaling Laws”的性價(jià)比正在降低。中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏也注意到，2024年，全球訓(xùn)練大語(yǔ)言模型的效果普遍不及預(yù)期，比如OpenAI的產(chǎn)品迭代速度明顯放緩等�！斑@些情況都表明，大模型競(jìng)賽的上半場(chǎng)已經(jīng)進(jìn)入了‘垃圾時(shí)間’。”何寶宏說(shuō)。

“預(yù)訓(xùn)練階段的‘Scaling Laws’已經(jīng)遇到瓶頸，但推理階段的‘Scaling Laws’依然有很大機(jī)會(huì)。”田豐強(qiáng)調(diào)，DeepSeek正是在模型推理階段找到了新解法。業(yè)內(nèi)普遍認(rèn)為，DeepSeek系列模型的橫空出世，為全球通向AI未來(lái)開(kāi)辟了一條新的路徑，也給AI大模型的落地普及打開(kāi)了更廣闊的空間。

對(duì)于不同的大模型發(fā)展路徑，AI廠商各有堅(jiān)持。據(jù)了解，xAI的“Colossus”超級(jí)計(jì)算集群仍在擴(kuò)張建設(shè)中，2025年年底規(guī)模有望達(dá)到50萬(wàn)張GPU；OpenAI等廠商也在繼續(xù)推進(jìn)“星際之門”AI基礎(chǔ)設(shè)施投資項(xiàng)目，未來(lái)4年該項(xiàng)目希望有5000億美元投入。與之相反的是，越來(lái)越多的科研團(tuán)隊(duì)開(kāi)始競(jìng)逐低成本AI模型，比如美國(guó)一研究團(tuán)隊(duì)近日宣布研發(fā)出名為“s1”的模型，在衡量數(shù)學(xué)和編碼能力的測(cè)試中，可媲美o1和DeepSeek-R1等模型，而訓(xùn)練租用所需的計(jì)算資源等成本只需約幾十美元。

到底哪一條路才是對(duì)的？清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授、面壁智能創(chuàng)始人劉知遠(yuǎn)認(rèn)為，極致高效、善用現(xiàn)有資源，走一條可持續(xù)的、高質(zhì)量發(fā)展的路線，才是AI發(fā)展的正確道路。而在天使投資人、資深人工智能專家郭濤看來(lái)，走向AGI（通用人工智能），“大力出奇跡”的優(yōu)勢(shì)更大。

郭濤說(shuō)，“大力出奇跡”憑借大規(guī)模數(shù)據(jù)和超強(qiáng)算力可以充分學(xué)習(xí)海量知識(shí)，挖掘深層次語(yǔ)義和邏輯關(guān)系，更有機(jī)會(huì)模擬人類的全面智能，逐漸逼近AGI�！岸膬蓳芮Ы铩墓こ虅�(chuàng)新雖然在特定場(chǎng)景高效，但很難快速拓展到能應(yīng)對(duì)所有通用任務(wù)所需的全面智能程度�！�

近期，國(guó)泰君安、中信證券等多家研究機(jī)構(gòu)也對(duì)算力的作用給予肯定。華泰證券在2月20日發(fā)布的研報(bào)中提出，Grok 3證明預(yù)訓(xùn)練在算力提升下仍能突破。雖然目前在預(yù)訓(xùn)練數(shù)據(jù)上存在瓶頸，但是合成數(shù)據(jù)、RL（強(qiáng)化學(xué)習(xí)）數(shù)據(jù)等，或能逐步打破瓶頸。中信證券則認(rèn)為，Grok 3作為全球首個(gè)在10萬(wàn)卡集群上訓(xùn)練的大模型，綜合能力較前代模型提升顯著，意味著算力堆積仍是模型進(jìn)步的關(guān)鍵變量之一。

站在我國(guó)的角度，不少業(yè)內(nèi)專家對(duì)記者表示，“花小錢辦大事”的DeepSeek路徑，更加符合當(dāng)前AI產(chǎn)業(yè)的發(fā)展實(shí)際。田豐提到，一方面，國(guó)產(chǎn)算力芯片產(chǎn)能、良品率正在逐漸提升，未來(lái)3到4年可能會(huì)有較大突破；另一方面，國(guó)內(nèi)企業(yè)利用軟件層面的性價(jià)比優(yōu)勢(shì)，提升模型訓(xùn)練效率，降低成本，這就形成了一個(gè)“剪刀差”�！鞍l(fā)展到一定程度，我國(guó)的AI產(chǎn)業(yè)將實(shí)現(xiàn)更快速的發(fā)展�！�

“整體來(lái)說(shuō)，更多算力、更多數(shù)據(jù)肯定會(huì)有更大的價(jià)值�！痹谔镓S看來(lái)，DeepSeek的出現(xiàn)使得AI技術(shù)在更大范圍被普及和使用，會(huì)帶來(lái)推理算力需求的增長(zhǎng)，這將是國(guó)產(chǎn)芯片的機(jī)會(huì)�！皩Ｓ猛评硇酒韧ㄓ眯酒菀籽邪l(fā)，我國(guó)在推理芯片的研發(fā)制造上有較大優(yōu)勢(shì)，只要能快速實(shí)現(xiàn)量產(chǎn)，將在全球AI芯片市場(chǎng)上占據(jù)主動(dòng)。”

國(guó)內(nèi)AI廠商已經(jīng)開(kāi)始行動(dòng)。2月24日，阿里巴巴集團(tuán)CEO吳泳銘宣布，未來(lái)3年，阿里將投入超過(guò)3800億元，用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施，總額超過(guò)去10年總和�！癆I爆發(fā)遠(yuǎn)超預(yù)期，國(guó)內(nèi)科技產(chǎn)業(yè)方興未艾，潛力巨大。阿里巴巴將不遺余力加速云和AI硬件基礎(chǔ)設(shè)施建設(shè)，助推全行業(yè)生態(tài)發(fā)展。”吳泳銘說(shuō)。

　　擁抱開(kāi)源開(kāi)放

除發(fā)展路徑分化外，新的一年，大模型還呈現(xiàn)出一個(gè)統(tǒng)一趨勢(shì)：開(kāi)源開(kāi)放。

最初，開(kāi)源指“開(kāi)放源代碼”，在人工智能和數(shù)字時(shí)代，開(kāi)源更指的是“開(kāi)放資源”。有業(yè)內(nèi)人士告訴記者，其實(shí)在DeepSeek-R1發(fā)布之前，o1模型已經(jīng)具備了深度思考的能力，只是OpenAI秉持閉源策略，并未公布o(jì)1的技術(shù)方案，而DeepSeek則是自主探索出了背后的技術(shù)，并對(duì)此進(jìn)行了全面開(kāi)源，引發(fā)全球熱潮。

記者注意到，今年，在DeepSeek的帶動(dòng)下，越來(lái)越多的AI廠商開(kāi)始擁抱開(kāi)源：2月14日，百度宣布文心大模型4.5系列將于6月30日正式開(kāi)源；OpenAI方面表示正在討論公開(kāi)AI模型權(quán)重；馬斯克宣布，xAI將在Grok 3變得穩(wěn)定后，對(duì)Grok 2開(kāi)源……就在剛剛過(guò)去的2025全球開(kāi)發(fā)者先鋒大會(huì)上，商湯科技、MiniMax、階躍星辰等多家參會(huì)企業(yè)也紛紛亮出自家最新的開(kāi)源模型。

“對(duì)企業(yè)自身而言，開(kāi)源可以吸引更多的關(guān)注和使用者，激發(fā)開(kāi)源社區(qū)的創(chuàng)新活力，推動(dòng)技術(shù)快速發(fā)展，還能通過(guò)共享資源和知識(shí)，來(lái)降低企業(yè)的研發(fā)成本�！惫鶟龑�(duì)記者表示，越來(lái)越多AI企業(yè)選擇開(kāi)源，一方面將促使各企業(yè)更加注重打造差異化的生態(tài)體系，圍繞開(kāi)源模型衍生出不同的服務(wù)、插件、工具等產(chǎn)品；另一方面，為了在生態(tài)競(jìng)爭(zhēng)中勝出，企業(yè)會(huì)聯(lián)合起來(lái)制定統(tǒng)一的接口規(guī)范、數(shù)據(jù)格式等標(biāo)準(zhǔn)，提高整個(gè)行業(yè)的協(xié)同效率和兼容性。

實(shí)際上，大模型研發(fā)一直有開(kāi)源和閉源兩大陣營(yíng)，比如OpenAI是閉源，Meta堅(jiān)持開(kāi)源。田豐告訴記者，在AI領(lǐng)域，很多企業(yè)會(huì)選擇開(kāi)源上一代模型，而對(duì)最新技術(shù)有所保留，但DeepSeek的出現(xiàn)，把最新的技術(shù)和成果都共享了出來(lái)，不藏私，這就徹底改變了開(kāi)源的格局�！伴_(kāi)發(fā)者沒(méi)有足夠的時(shí)間去適應(yīng)所有大模型，大家只會(huì)選擇最領(lǐng)先開(kāi)源模型社區(qū)貢獻(xiàn)力量。”在他看來(lái)，如今，大模型開(kāi)源已經(jīng)從技術(shù)開(kāi)源逐漸走向了生態(tài)競(jìng)爭(zhēng)。

2月21日，DeepSeek宣布將陸續(xù)開(kāi)源5個(gè)代碼庫(kù)，以完全透明的方式分享其進(jìn)展。在不少人看來(lái)，DeepSeek此舉的目的就是以充分的開(kāi)源，推動(dòng)建設(shè)自己的大模型開(kāi)源生態(tài)�！斑@就相當(dāng)于開(kāi)發(fā)者在DeepSeek的內(nèi)部一樣，可以看到它每天哪條路走通了，哪條路沒(méi)走通。”田豐說(shuō)，在保持技術(shù)領(lǐng)先的情況下，越大程度的開(kāi)源就越有利于吸引全球開(kāi)發(fā)者的關(guān)注和參與，這就形成了穩(wěn)定的開(kāi)源生態(tài)。

未來(lái)，要想讓人工智能更好地發(fā)展，我們應(yīng)該堅(jiān)持閉源還是開(kāi)源？對(duì)于這個(gè)問(wèn)題，DeepSeek-R1給出的答案是：在人工智能發(fā)展路徑的選擇上，開(kāi)源與閉源并非非此即彼的對(duì)立關(guān)系，人工智能發(fā)展需兼顧開(kāi)源的技術(shù)普惠價(jià)值和閉源的商業(yè)可持續(xù)性，通過(guò)分層協(xié)作實(shí)現(xiàn)“共享-共贏”的科技平權(quán)目標(biāo)。

“AI這個(gè)領(lǐng)域本身就是由開(kāi)源推動(dòng)的。”劉知遠(yuǎn)認(rèn)為，開(kāi)源不僅是一種技術(shù)選擇，更是一種信任機(jī)制。當(dāng)一個(gè)項(xiàng)目開(kāi)源，意味著它向全世界證明自身的可信度我說(shuō)它能做到什么，任何人都可以去驗(yàn)證，這種機(jī)制將極大地提升現(xiàn)代社會(huì)的運(yùn)作效率�！拔磥�(lái)，開(kāi)源會(huì)得到更深入、更廣泛的應(yīng)用，它是一種不可逆的趨勢(shì)�！�

對(duì)于企業(yè)，劉知遠(yuǎn)表示，不能簡(jiǎn)單地將開(kāi)源視作一種無(wú)條件的共享，而是要注重如何在開(kāi)源的基礎(chǔ)上，構(gòu)建更深層次的技術(shù)優(yōu)勢(shì)�！罢嬲母�(jìng)爭(zhēng)力，不在于某一個(gè)具體的開(kāi)源模型，而在于如何高效、穩(wěn)定、可持續(xù)地生產(chǎn)更先進(jìn)的模型。這才是決定一家AI公司能否保持領(lǐng)先的關(guān)鍵�！彼f(shuō)。

本報(bào)北京2月24日電

來(lái)源：中國(guó)青年報(bào)客戶端

上一篇：專家訪談匯總：在AI市場(chǎng)，價(jià)格壁壘從未如此嚴(yán)峻

下一篇：多地政務(wù)系統(tǒng)接入DeepSeek，“AI公務(wù)員”上崗將帶來(lái)哪些影響？

AI大模型發(fā)展路徑之爭(zhēng)將帶來(lái)哪些巨變
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-25 08:03:30 瀏覽：209次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

AI大模型發(fā)展路徑之爭(zhēng)將帶來(lái)哪些巨變 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-25 08:03:30 瀏覽：209次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

AI大模型發(fā)展路徑之爭(zhēng)將帶來(lái)哪些巨變
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-25 08:03:30 瀏覽：209次