展會(huì)信息港展會(huì)大全

AI大模型發(fā)展路徑之爭(zhēng)將帶來(lái)哪些巨變
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-25 08:03:30   瀏覽:209次  

導(dǎo)讀:一邊是“大力出奇跡”,一邊則瞄準(zhǔn)“四兩撥千斤”,2025年,AI大模型“下半場(chǎng)”有了新打法:路徑分化,擁抱開(kāi)源。“一方面,部分國(guó)家為保持在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì),會(huì)不斷地‘卷算力’‘卷數(shù)據(jù)’‘拼規(guī)模’;另一方面,我國(guó)的AI發(fā)展路徑已經(jīng)逐漸明顯,在持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí),做普惠AI,這樣就能形成明確的差異化優(yōu)勢(shì)!盌eepSeek的橫空出世及開(kāi)源策略正在牽動(dòng)大模型賽 ......

一邊是“大力出奇跡”,一邊則瞄準(zhǔn)“四兩撥千斤”,2025年,AI大模型“下半場(chǎng)”有了新打法:路徑分化,擁抱開(kāi)源!耙环矫,部分國(guó)家為保持在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì),會(huì)不斷地‘卷算力’‘卷數(shù)據(jù)’‘拼規(guī)模’;另一方面,我國(guó)的AI發(fā)展路徑已經(jīng)逐漸明顯,在持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí),做普惠AI,這樣就能形成明確的差異化優(yōu)勢(shì)!

DeepSeek的橫空出世及開(kāi)源策略正在牽動(dòng)大模型賽道的分化,以及各國(guó)不同的AI發(fā)展路徑之爭(zhēng)。

2月18日,美國(guó)人工智能企業(yè)xAI發(fā)布Grok 3推理模型,其在多項(xiàng)性能上超過(guò)或媲美DeepSeek、GPT-4o等模型,埃隆里夫馬斯克稱這是“地球上最聰明的AI”。然而,馬斯克透露,Grok 3的算力支持來(lái)源于xAI的“Colossus”超級(jí)計(jì)算集群,其在訓(xùn)練過(guò)程中累計(jì)消耗了高達(dá)20萬(wàn)張英偉達(dá)GPU。

今年1月,國(guó)內(nèi)AI廠商深度求索(DeepSeek)發(fā)布了開(kāi)源推理模型DeepSeek-R1,該模型在多個(gè)基準(zhǔn)測(cè)試中與OpenAI公司的o1模型持平,但成本僅為o1的三十分之一,高性能、低算力需求使其迅速在全球走紅,并開(kāi)啟了低成本訓(xùn)練模型的風(fēng)潮。

一邊是“大力出奇跡”,一邊則瞄準(zhǔn)“花小錢辦大事”“四兩撥千斤”,2025年,AI大模型“下半場(chǎng)”有了新打法:路徑分化,擁抱開(kāi)源!耙环矫,部分國(guó)家為保持在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì),會(huì)不斷地‘卷算力’‘卷數(shù)據(jù)’‘拼規(guī)!;另一方面,我國(guó)的AI發(fā)展路徑已經(jīng)逐漸明顯,在持續(xù)推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí),做性價(jià)比高的普惠AI,這樣就能形成明確的差異化優(yōu)勢(shì)!笨焖悸胙芯吭涸洪L(zhǎng)、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長(zhǎng)田豐說(shuō)。

  “大力出奇跡”與“四兩撥千斤”

當(dāng)前,面對(duì)DeepSeek以高性價(jià)比強(qiáng)勢(shì)破局,以xAI為代表的部分AI廠商依然堅(jiān)持花重金“卷算力”,大模型領(lǐng)域?yàn)楹螘?huì)形成上述兩種路徑的分化?在田豐看來(lái),這與“Scaling Laws”(尺度定律)的性價(jià)比降低有關(guān)。

在大模型中,“Scaling Laws”意味著當(dāng)算力、算法、數(shù)據(jù)這3個(gè)關(guān)鍵因素被不斷拉高上限并達(dá)到一定程度時(shí),大模型的智能表現(xiàn)將出現(xiàn)躍升,即“智能涌現(xiàn)”。近兩年,國(guó)內(nèi)外AI廠商遵循著“Scaling Laws”持續(xù)投入,模型體積不斷膨脹,參數(shù)數(shù)量呈指數(shù)級(jí)增長(zhǎng)。“‘Scaling Laws’性價(jià)比最高的時(shí)候就是GPT-4時(shí)期,模型效果隨著參數(shù)的增加有著指數(shù)級(jí)的提升。彼時(shí),各大AI廠商紛紛購(gòu)入高性能GPU,英偉達(dá)的市值更是迅速上升。”田豐說(shuō)。

可如今,“Scaling Laws”的性價(jià)比似乎沒(méi)有那么高了。有業(yè)內(nèi)人士提到,Grok 3的計(jì)算量幾乎是DeepSeek的幾十倍,但性能卻并沒(méi)有提升幾十倍,這從側(cè)面也印證了“Scaling Laws”的性價(jià)比正在降低。中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏也注意到,2024年,全球訓(xùn)練大語(yǔ)言模型的效果普遍不及預(yù)期,比如OpenAI的產(chǎn)品迭代速度明顯放緩等!斑@些情況都表明,大模型競(jìng)賽的上半場(chǎng)已經(jīng)進(jìn)入了‘垃圾時(shí)間’。”何寶宏說(shuō)。

“預(yù)訓(xùn)練階段的‘Scaling Laws’已經(jīng)遇到瓶頸,但推理階段的‘Scaling Laws’依然有很大機(jī)會(huì)。”田豐強(qiáng)調(diào),DeepSeek正是在模型推理階段找到了新解法。業(yè)內(nèi)普遍認(rèn)為,DeepSeek系列模型的橫空出世,為全球通向AI未來(lái)開(kāi)辟了一條新的路徑,也給AI大模型的落地普及打開(kāi)了更廣闊的空間。

對(duì)于不同的大模型發(fā)展路徑,AI廠商各有堅(jiān)持。據(jù)了解,xAI的“Colossus”超級(jí)計(jì)算集群仍在擴(kuò)張建設(shè)中,2025年年底規(guī)模有望達(dá)到50萬(wàn)張GPU;OpenAI等廠商也在繼續(xù)推進(jìn)“星際之門”AI基礎(chǔ)設(shè)施投資項(xiàng)目,未來(lái)4年該項(xiàng)目希望有5000億美元投入。與之相反的是,越來(lái)越多的科研團(tuán)隊(duì)開(kāi)始競(jìng)逐低成本AI模型,比如美國(guó)一研究團(tuán)隊(duì)近日宣布研發(fā)出名為“s1”的模型,在衡量數(shù)學(xué)和編碼能力的測(cè)試中,可媲美o1和DeepSeek-R1等模型,而訓(xùn)練租用所需的計(jì)算資源等成本只需約幾十美元。

到底哪一條路才是對(duì)的?清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授、面壁智能創(chuàng)始人劉知遠(yuǎn)認(rèn)為,極致高效、善用現(xiàn)有資源,走一條可持續(xù)的、高質(zhì)量發(fā)展的路線,才是AI發(fā)展的正確道路。而在天使投資人、資深人工智能專家郭濤看來(lái),走向AGI(通用人工智能),“大力出奇跡”的優(yōu)勢(shì)更大。

郭濤說(shuō),“大力出奇跡”憑借大規(guī)模數(shù)據(jù)和超強(qiáng)算力可以充分學(xué)習(xí)海量知識(shí),挖掘深層次語(yǔ)義和邏輯關(guān)系,更有機(jī)會(huì)模擬人類的全面智能,逐漸逼近AGI!岸膬蓳芮Ы铩墓こ虅(chuàng)新雖然在特定場(chǎng)景高效,但很難快速拓展到能應(yīng)對(duì)所有通用任務(wù)所需的全面智能程度!

近期,國(guó)泰君安、中信證券等多家研究機(jī)構(gòu)也對(duì)算力的作用給予肯定。華泰證券在2月20日發(fā)布的研報(bào)中提出,Grok 3證明預(yù)訓(xùn)練在算力提升下仍能突破。雖然目前在預(yù)訓(xùn)練數(shù)據(jù)上存在瓶頸,但是合成數(shù)據(jù)、RL(強(qiáng)化學(xué)習(xí))數(shù)據(jù)等,或能逐步打破瓶頸。中信證券則認(rèn)為,Grok 3作為全球首個(gè)在10萬(wàn)卡集群上訓(xùn)練的大模型,綜合能力較前代模型提升顯著,意味著算力堆積仍是模型進(jìn)步的關(guān)鍵變量之一。

站在我國(guó)的角度,不少業(yè)內(nèi)專家對(duì)記者表示,“花小錢辦大事”的DeepSeek路徑,更加符合當(dāng)前AI產(chǎn)業(yè)的發(fā)展實(shí)際。田豐提到,一方面,國(guó)產(chǎn)算力芯片產(chǎn)能、良品率正在逐漸提升,未來(lái)3到4年可能會(huì)有較大突破;另一方面,國(guó)內(nèi)企業(yè)利用軟件層面的性價(jià)比優(yōu)勢(shì),提升模型訓(xùn)練效率,降低成本,這就形成了一個(gè)“剪刀差”!鞍l(fā)展到一定程度,我國(guó)的AI產(chǎn)業(yè)將實(shí)現(xiàn)更快速的發(fā)展!

“整體來(lái)說(shuō),更多算力、更多數(shù)據(jù)肯定會(huì)有更大的價(jià)值!痹谔镓S看來(lái),DeepSeek的出現(xiàn)使得AI技術(shù)在更大范圍被普及和使用,會(huì)帶來(lái)推理算力需求的增長(zhǎng),這將是國(guó)產(chǎn)芯片的機(jī)會(huì)!皩S猛评硇酒韧ㄓ眯酒菀籽邪l(fā),我國(guó)在推理芯片的研發(fā)制造上有較大優(yōu)勢(shì),只要能快速實(shí)現(xiàn)量產(chǎn),將在全球AI芯片市場(chǎng)上占據(jù)主動(dòng)。”

國(guó)內(nèi)AI廠商已經(jīng)開(kāi)始行動(dòng)。2月24日,阿里巴巴集團(tuán)CEO吳泳銘宣布,未來(lái)3年,阿里將投入超過(guò)3800億元,用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,總額超過(guò)去10年總和!癆I爆發(fā)遠(yuǎn)超預(yù)期,國(guó)內(nèi)科技產(chǎn)業(yè)方興未艾,潛力巨大。阿里巴巴將不遺余力加速云和AI硬件基礎(chǔ)設(shè)施建設(shè),助推全行業(yè)生態(tài)發(fā)展。”吳泳銘說(shuō)。

  擁抱開(kāi)源開(kāi)放

除發(fā)展路徑分化外,新的一年,大模型還呈現(xiàn)出一個(gè)統(tǒng)一趨勢(shì):開(kāi)源開(kāi)放。

最初,開(kāi)源指“開(kāi)放源代碼”,在人工智能和數(shù)字時(shí)代,開(kāi)源更指的是“開(kāi)放資源”。有業(yè)內(nèi)人士告訴記者,其實(shí)在DeepSeek-R1發(fā)布之前,o1模型已經(jīng)具備了深度思考的能力,只是OpenAI秉持閉源策略,并未公布o(jì)1的技術(shù)方案,而DeepSeek則是自主探索出了背后的技術(shù),并對(duì)此進(jìn)行了全面開(kāi)源,引發(fā)全球熱潮。

記者注意到,今年,在DeepSeek的帶動(dòng)下,越來(lái)越多的AI廠商開(kāi)始擁抱開(kāi)源:2月14日,百度宣布文心大模型4.5系列將于6月30日正式開(kāi)源;OpenAI方面表示正在討論公開(kāi)AI模型權(quán)重;馬斯克宣布,xAI將在Grok 3變得穩(wěn)定后,對(duì)Grok 2開(kāi)源……就在剛剛過(guò)去的2025全球開(kāi)發(fā)者先鋒大會(huì)上,商湯科技、MiniMax、階躍星辰等多家參會(huì)企業(yè)也紛紛亮出自家最新的開(kāi)源模型。

“對(duì)企業(yè)自身而言,開(kāi)源可以吸引更多的關(guān)注和使用者,激發(fā)開(kāi)源社區(qū)的創(chuàng)新活力,推動(dòng)技術(shù)快速發(fā)展,還能通過(guò)共享資源和知識(shí),來(lái)降低企業(yè)的研發(fā)成本!惫鶟龑(duì)記者表示,越來(lái)越多AI企業(yè)選擇開(kāi)源,一方面將促使各企業(yè)更加注重打造差異化的生態(tài)體系,圍繞開(kāi)源模型衍生出不同的服務(wù)、插件、工具等產(chǎn)品;另一方面,為了在生態(tài)競(jìng)爭(zhēng)中勝出,企業(yè)會(huì)聯(lián)合起來(lái)制定統(tǒng)一的接口規(guī)范、數(shù)據(jù)格式等標(biāo)準(zhǔn),提高整個(gè)行業(yè)的協(xié)同效率和兼容性。

實(shí)際上,大模型研發(fā)一直有開(kāi)源和閉源兩大陣營(yíng),比如OpenAI是閉源,Meta堅(jiān)持開(kāi)源。田豐告訴記者,在AI領(lǐng)域,很多企業(yè)會(huì)選擇開(kāi)源上一代模型,而對(duì)最新技術(shù)有所保留,但DeepSeek的出現(xiàn),把最新的技術(shù)和成果都共享了出來(lái),不藏私,這就徹底改變了開(kāi)源的格局!伴_(kāi)發(fā)者沒(méi)有足夠的時(shí)間去適應(yīng)所有大模型,大家只會(huì)選擇最領(lǐng)先開(kāi)源模型社區(qū)貢獻(xiàn)力量。”在他看來(lái),如今,大模型開(kāi)源已經(jīng)從技術(shù)開(kāi)源逐漸走向了生態(tài)競(jìng)爭(zhēng)。

2月21日,DeepSeek宣布將陸續(xù)開(kāi)源5個(gè)代碼庫(kù),以完全透明的方式分享其進(jìn)展。在不少人看來(lái),DeepSeek此舉的目的就是以充分的開(kāi)源,推動(dòng)建設(shè)自己的大模型開(kāi)源生態(tài)!斑@就相當(dāng)于開(kāi)發(fā)者在DeepSeek的內(nèi)部一樣,可以看到它每天哪條路走通了,哪條路沒(méi)走通。”田豐說(shuō),在保持技術(shù)領(lǐng)先的情況下,越大程度的開(kāi)源就越有利于吸引全球開(kāi)發(fā)者的關(guān)注和參與,這就形成了穩(wěn)定的開(kāi)源生態(tài)。

未來(lái),要想讓人工智能更好地發(fā)展,我們應(yīng)該堅(jiān)持閉源還是開(kāi)源?對(duì)于這個(gè)問(wèn)題,DeepSeek-R1給出的答案是:在人工智能發(fā)展路徑的選擇上,開(kāi)源與閉源并非非此即彼的對(duì)立關(guān)系,人工智能發(fā)展需兼顧開(kāi)源的技術(shù)普惠價(jià)值和閉源的商業(yè)可持續(xù)性,通過(guò)分層協(xié)作實(shí)現(xiàn)“共享-共贏”的科技平權(quán)目標(biāo)。

“AI這個(gè)領(lǐng)域本身就是由開(kāi)源推動(dòng)的。”劉知遠(yuǎn)認(rèn)為,開(kāi)源不僅是一種技術(shù)選擇,更是一種信任機(jī)制。當(dāng)一個(gè)項(xiàng)目開(kāi)源,意味著它向全世界證明自身的可信度我說(shuō)它能做到什么,任何人都可以去驗(yàn)證,這種機(jī)制將極大地提升現(xiàn)代社會(huì)的運(yùn)作效率!拔磥(lái),開(kāi)源會(huì)得到更深入、更廣泛的應(yīng)用,它是一種不可逆的趨勢(shì)!

對(duì)于企業(yè),劉知遠(yuǎn)表示,不能簡(jiǎn)單地將開(kāi)源視作一種無(wú)條件的共享,而是要注重如何在開(kāi)源的基礎(chǔ)上,構(gòu)建更深層次的技術(shù)優(yōu)勢(shì)!罢嬲母(jìng)爭(zhēng)力,不在于某一個(gè)具體的開(kāi)源模型,而在于如何高效、穩(wěn)定、可持續(xù)地生產(chǎn)更先進(jìn)的模型。這才是決定一家AI公司能否保持領(lǐng)先的關(guān)鍵!彼f(shuō)。

本報(bào)北京2月24日電

來(lái)源:中國(guó)青年報(bào)客戶端

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港