AI時代架構(gòu)創(chuàng)新不斷涌現(xiàn),而DeepSeek的出現(xiàn)為整個AI市場帶來了全新活力。近日,達(dá)摩院首席科學(xué)家、知合計算CEO孟建熠在2025玄鐵RISC-V生態(tài)大會上表示,DeepSeek在一定程度上改變了行業(yè)對AI硬件架構(gòu)的訴求,模型持續(xù)創(chuàng)新是所有算力架構(gòu)的機(jī)會。對RISC-V發(fā)展而言,打造標(biāo)桿產(chǎn)品是關(guān)鍵。
DeepSeek讓大模型從云走向端孟建熠表示,DeepSeek問世之后,業(yè)界產(chǎn)生了三種不同觀點的爭論:一是開源架構(gòu)與閉源架構(gòu)誰更好。DeepSeek證明了開源架構(gòu)也有很好的表現(xiàn)。二是該用Dense模型還是MoE模型。前者是通用全能的模型,后者是更好的專家模型,二者各有所長。三是算力敏感與內(nèi)存容量敏感之爭。之前模型對算力的需求非常大,現(xiàn)在是容量很大,算力下降了,所以內(nèi)存容量成為一項關(guān)鍵指標(biāo)!癉eepSeek在一定程度上改變了大家對AI硬件架構(gòu)的訴求!泵辖谡J(rèn)為。模型深度優(yōu)化為算力架構(gòu)帶來了全新可能。具體而言,一是MoE模型,以更低激活比達(dá)成更低的計算成本,并使模型的單機(jī)部署成為可能。二是稀疏計算與模型壓縮技術(shù),識別并跳過模型中不重要的計算節(jié)點(如權(quán)重接近零的部分節(jié)點),同時結(jié)合模型壓信技術(shù)減少參數(shù)量。三是混合精度計算與量化技術(shù),浮點計算轉(zhuǎn)化為低精度計算(如INT8、FP8、FP16),同時保持模型精度。四是動態(tài)計算圖優(yōu)代技術(shù),實時調(diào)整計算結(jié)構(gòu)減少冗余計算。五是內(nèi)存優(yōu)化與數(shù)據(jù)流重構(gòu)技術(shù),減少內(nèi)存訪問延遲以及數(shù)據(jù)傳輸開銷。六是分布式計算與負(fù)載均衡技術(shù),將大規(guī)模模型推理任務(wù)拆分到多個計算節(jié)點,并通過負(fù)載均衡技術(shù)優(yōu)化任務(wù)分配。DeepSeek的出現(xiàn),推動行業(yè)更加關(guān)注底層硬件能力的適配!霸诤荛L一段時間里,大家都喜歡‘大炮打蚊子’,當(dāng)然這樣是效率很高,但是今天我們有了一個新思路可以用軟硬件融合的視角來看待整個AI的發(fā)展!泵辖趶(qiáng)調(diào),算力、內(nèi)存、互聯(lián)之間原有的平衡發(fā)生了劇變,對于新的算力架構(gòu)機(jī)會而言,大家再次進(jìn)入同一起跑線。同時,開源大模型單機(jī)部署成為可能,進(jìn)一步推動實際應(yīng)用落地。另一個趨勢是大模型走向趨同,幫助算子收斂。值得關(guān)注的是,大模型的參數(shù)量和計算量巨大,但如今算子的個數(shù)在逐步收斂,主要以矩陣計算為中心,而且通過開源相互學(xué)習(xí)正在走向趨同。從云端協(xié)同的層面,DeepSeek幫助大模型從云走向端,由此也帶來了幾個變化:一是從算力瓶頸變?yōu)榇鎯Φ膸捄腿萘科款i,容量瓶頸成為全量大模型最關(guān)鍵的因素,比如671B大模型。二是降低計算資源需求,讓幾T、幾十T和幾百T的算力成為可能。三是實現(xiàn)單機(jī)部署的可能,能夠讓開源模型被更多私有數(shù)據(jù)優(yōu)化,形成私有解決方案。四是支持邊緣設(shè)備,使得高性能AI應(yīng)用能夠在邊緣設(shè)備上順利運(yùn)行!按竽P驮谠贫说脑,實施成本比較高,只有有限的企業(yè)可能在部分領(lǐng)域應(yīng)用,而一旦到了端側(cè),就有大量的應(yīng)用都會發(fā)展起來。”孟建熠表示。模型創(chuàng)新是算力架構(gòu)的機(jī)會當(dāng)前算力基礎(chǔ)是以GPGPU(CUDA)為代表的傳統(tǒng)閉源硬件與生態(tài),而DeepSeek、Llama、Grok等開源大模型不斷涌現(xiàn),給算力架構(gòu)帶來了新機(jī)會。當(dāng)然,這個機(jī)會對所有架構(gòu)都有效,并非只對RISC-V而言。如今,這些開源模型正在吸引更多算力架構(gòu),包括x86、Arm這樣的傳統(tǒng)CPU架構(gòu),DSA、ASIC這樣的自研架構(gòu),以及以RISC-V為代表的開源架構(gòu)!拔覀兌荚谝粋新的起點上,現(xiàn)在就看誰能夠跑得快!泵辖谡f道。作為三大主流指令集架構(gòu)中最靈活、最開放的一個,RISC-V適應(yīng)了AI時代的技術(shù)創(chuàng)新節(jié)奏。它在原生AI支持上,擁有開源與開放架構(gòu)、更易實現(xiàn)的軟硬件協(xié)同設(shè)計、更優(yōu)的能效比,以及覆蓋全球、不斷成熟的生態(tài)。在孟建熠看來,“RISC-V架構(gòu)+AI”是以AI原生成為架構(gòu)創(chuàng)新的最終答案。隨著開源RISG-V架構(gòu)的快速發(fā)展,重新自研架構(gòu)已意義不大,以RISC-V為基礎(chǔ)構(gòu)建處理芯片是未來的主流。RISC-V在AI領(lǐng)域具備很高的包容性,可以支持做CPU/DSA,也支持做GPU、多核產(chǎn)品或者近內(nèi)存計算。“大家可以在硬件上不斷創(chuàng)新,而生態(tài)上統(tǒng)一在RISC-V。盡管目前有不同的實踐方案,但最終一定會走向生態(tài)統(tǒng)一!泵辖诒硎。RISC-V如何真正走出來,是備受業(yè)界關(guān)注的一個問題。發(fā)展至今,RISC-V生態(tài)已經(jīng)慢慢建立起來,從IoT等功耗敏感型場景向服務(wù)器等高算力場景成長,從純通用計算向AI計算與通用計算融合成長,其中已經(jīng)有了一些標(biāo)桿性產(chǎn)品。打造標(biāo)桿產(chǎn)品是RISC-V成長路徑的關(guān)鍵環(huán)節(jié)。孟建熠指出,RISC-V發(fā)展中的一個新趨勢是從“小標(biāo)桿產(chǎn)品”向“大標(biāo)桿產(chǎn)品”成長,引領(lǐng)軟件生態(tài)加速配適,吸引產(chǎn)業(yè)資源加大傾斜。實際上,國內(nèi)外企業(yè)都在嘗試打造RISC-V的標(biāo)桿產(chǎn)品。比如,國內(nèi)的達(dá)摩院2022年發(fā)布了基于玄鐵C910 RISC-V核的4核產(chǎn)品,推動了包括安卓在內(nèi)的軟件廠商加入RISC-V生態(tài)。國際上,Tenstorrent、Vantana和SiFive等企業(yè)也推出一些標(biāo)桿產(chǎn)品。其中,Tenstorrent最新的RISC-V核“Ascalon”采用了CPU中少見的8-Wide指令集解碼器設(shè)計。孟建熠認(rèn)為,下一代RISC-V標(biāo)桿產(chǎn)品在服務(wù)器場景、AI PC場景、AI場景有著一些關(guān)鍵指標(biāo)。要真正從產(chǎn)業(yè)中走出來,性價比很重要。“標(biāo)準(zhǔn)建設(shè)是RISC-V下階段發(fā)展的重中之重。”孟建熠表示,國內(nèi)產(chǎn)業(yè)需要在標(biāo)準(zhǔn)建設(shè)中盡快形成合力。目前,國際上在指令架構(gòu)上的貢獻(xiàn)明顯高于國內(nèi),國內(nèi)力量的參與度還不夠。國內(nèi)已經(jīng)建立多個組織,都在進(jìn)行相關(guān)的指令集的制定工作,需要聯(lián)合起來統(tǒng)一到一個平臺工作。另外,技術(shù)路線上要考慮相對集中,以AI為目標(biāo)先做一輪國內(nèi)標(biāo)準(zhǔn)制定的嘗試。此外,計算原語是相似的,所以CPU、GPGPU、TPU在擴(kuò)展上要形成一定的梯度,不能把指令集做成很多套并行大而全的擴(kuò)展,這樣生態(tài)就無法形成。延伸閱讀:新型儲能制造業(yè)全面邁向高質(zhì)量發(fā)展今年全國兩會,代表委員對《中國電子報》記者說……作者丨楊鵬岳編輯丨張心怡美編丨馬利亞監(jiān)制丨連曉東