英偉達(dá)困局,中國(guó)AI芯片走出筑基期
芯師爺
2024-12-19 17:49發(fā)布于廣東芯師爺官方賬號(hào)
作者/質(zhì)子
編輯/嘉嘉
來源/司庫(kù)財(cái)經(jīng)
近期,因涉嫌市場(chǎng)壟斷,英偉達(dá)被國(guó)家市場(chǎng)監(jiān)督管理總局立案調(diào)查。受此影響,英偉達(dá)、AMD、阿斯麥等美股半導(dǎo)體公司股價(jià)應(yīng)聲而下,其中在被立案調(diào)查當(dāng)日,英偉達(dá)股價(jià)下跌近3%,市值蒸發(fā)掉6400億元。
與海外半導(dǎo)體公司普遍下跌相比,中國(guó)AI半導(dǎo)體概念股集體上漲,寒武紀(jì)盤中漲超3%,海光信息漲超4%,景嘉微漲超5%……
作為AI加速芯片沙皇,英偉達(dá)掌握著全球90%的市場(chǎng)份額,H100、A100更是被全球AI公司跪求,在AI產(chǎn)業(yè)發(fā)展的關(guān)鍵期,對(duì)英偉達(dá)立案調(diào)查是否會(huì)影響中國(guó)AI大模型的發(fā)展?
其實(shí)完全不用擔(dān)心,雖然在性能上,中國(guó)AI芯片企業(yè)跟英偉達(dá)還有較大差距,但在產(chǎn)業(yè)鏈生態(tài)上,中國(guó)AI企業(yè)已經(jīng)度過了筑基期,正在加速發(fā)展。
【1】Open AI將英偉達(dá)送上王座
2022年11月30日,Open AI發(fā)布全新聊天機(jī)器人模型ChatGPT,產(chǎn)品上線五天,全球用戶量就突破100萬(wàn),宣告了AI技術(shù)取得重大突破。
這一天對(duì)黃仁勛來說,是英偉達(dá)的“iPhone時(shí)刻”此后全球成立的AI企業(yè)數(shù)量近3萬(wàn)家,其中僅生成式AI,國(guó)內(nèi)企業(yè)數(shù)量就高達(dá)4500 家,這些企業(yè)對(duì)算力、AI芯片有著極強(qiáng)的渴求度。
據(jù)了解,2018年,Open AI發(fā)布GPT-1時(shí),模型擁有的參數(shù)為1.17億個(gè),但到了2023年發(fā)布GPT-4時(shí),其模型參數(shù)達(dá)到了1.8萬(wàn)億個(gè),五年時(shí)間參數(shù)量增幅超過一萬(wàn)倍。
更為重要的是,算力需求還在持續(xù)增長(zhǎng)。華為預(yù)測(cè)數(shù)據(jù)顯示,在2020年的算力基礎(chǔ)上,2030年AI的算力要求將增長(zhǎng)500倍,通用算力要求將增長(zhǎng)10倍。
“數(shù)據(jù)結(jié)構(gòu)發(fā)生變化,現(xiàn)在都是大量的非結(jié)構(gòu)數(shù)據(jù),都是圖片、視頻、語(yǔ)音,CPU處理能力很弱的數(shù)據(jù)”,在接受第一財(cái)經(jīng)采訪時(shí),華為騰計(jì)算業(yè)務(wù)總裁張迪煊表示,海量的非結(jié)構(gòu)性數(shù)據(jù)需要更高的算力支撐,這就需要英偉達(dá)的GPU。
與專注一件事的CPU不同,英偉達(dá)GPU專為并行計(jì)算而設(shè)計(jì),它本來適用于對(duì)圖形進(jìn)行渲染,能同時(shí)處理數(shù)千個(gè)計(jì)算線程,極大提升了大模型的訓(xùn)練速度。
英偉達(dá)GPU在AI訓(xùn)練速度上有多強(qiáng)悍?看一組數(shù)據(jù)對(duì)比就知道了,以GPT-3基準(zhǔn)測(cè)試為例,英特爾系統(tǒng)訓(xùn)練耗時(shí)67分鐘,而英偉達(dá)系統(tǒng)只需要3.4分鐘,英偉達(dá)在效率上完勝英特爾。
靠著AI算力需求的浪潮,英偉達(dá)達(dá)到了歷史巔峰。天眼查數(shù)據(jù)顯示:2023年,英偉達(dá)營(yíng)收為609 億美元,凈利潤(rùn)更是達(dá)到297.6億美,市值更是達(dá)到3.36萬(wàn)億美元。
而要知道,在十年前,英偉達(dá)還是那個(gè)全年?duì)I收41億,要給雷軍站臺(tái)才能拉來訂單的IT邊緣廠商。
生成式AI將英偉達(dá)送上了王座,但在大國(guó)角逐的舞臺(tái)上,即便強(qiáng)如英偉達(dá),依然受到波及。
【2】中國(guó)AI被打壓
“中國(guó)的現(xiàn)狀是一流的應(yīng)用、二流的模型、三流的算力”,中金公司研究部計(jì)算機(jī)行業(yè)首席分析師于鐘海在談及中國(guó)AI產(chǎn)業(yè)發(fā)展時(shí)認(rèn)為,算力是最為薄弱的環(huán)節(jié),也是國(guó)內(nèi)AI企業(yè)最重要的環(huán)節(jié)。
但想要國(guó)產(chǎn)替代談何容易。
國(guó)內(nèi)AI加速芯片最能打的型號(hào)是騰910B,該芯片采用采用7nm工藝,擁有496億個(gè)晶體管,其FP16的運(yùn)算性能約為320Tflops,整體性能達(dá)到英偉達(dá)A100的水平。
而英偉達(dá)目前最先進(jìn)的AI芯片為GB200,該芯片采用4nm工藝,擁有2080億個(gè)晶體管。
目前國(guó)內(nèi)普遍認(rèn)為:“H100性能是A100的2至3倍,Blackwell B200是H100的5倍”,我們可以換算出,一顆英偉達(dá)GB200相當(dāng)于1015顆騰910B。
可以說英偉達(dá)要性能有性能,要生態(tài)有生態(tài),要性價(jià)比有性價(jià)比,在這種綜合能力打擊下,英偉達(dá)壟斷了國(guó)內(nèi)90%的AI加速芯片,華為等AI芯片只能做點(diǎn)邊緣業(yè)務(wù)。
(來源:英偉達(dá))
歷史是驚人的巧合,與光刻機(jī)、手機(jī)芯片等半導(dǎo)體產(chǎn)業(yè)一樣,中國(guó)AI加速芯片轉(zhuǎn)折點(diǎn)源于一次又一次的封鎖和打壓。
2022年9月,美國(guó)通過設(shè)置功率門檻和芯片之間通信速度門檻,限制英偉達(dá)A100 和 H100以及 AMD MI250出口。為了能供貨,英偉達(dá)根據(jù)限制條件,研發(fā)出了“閹割”版本的A800和H800芯片。
2023年10月,為了進(jìn)一步限制中國(guó)AI產(chǎn)業(yè),美國(guó)升級(jí)限制力度,要求英偉達(dá)禁止向中國(guó)市場(chǎng)出售運(yùn)行速度達(dá)到300 teraflops(即每秒可計(jì)算 3億次運(yùn)算)及以上的數(shù)據(jù)中心芯片。
這也意味著,此前“閹割”版的A800和H800也被禁止出售中國(guó),為此,英偉達(dá)不得不再次“閹割”,推出HGX H20、L20 PCle、L2 PCle三款A(yù)I加速芯片。
據(jù)了解,“閹割”版在“閹割”后的HGX H20芯片,價(jià)格為11萬(wàn)一顆,但整體計(jì)算能力只有H100的15%,L20 PCle和L2 PCl其FP16稠密算力分別為8.8TFLOPS和4.4TFLOPS,只有H100的12%、6%。
這樣的性能根本不能滿足國(guó)內(nèi)AI大模型廠商的算力需求。
確實(shí),誰(shuí)都知道AI是未來,是方向,但出口已經(jīng)被美國(guó)封死壓制,沒有一點(diǎn)出路,留下的只有反抗。
【3】走過筑基期
正如《三體》中水滴對(duì)地球科技發(fā)展的鎖死一樣,美國(guó)政府對(duì)英偉達(dá)一而再,再而三的不斷施壓,中國(guó)AI企業(yè)從英偉達(dá)等國(guó)外廠商進(jìn)口的AI加速芯片的通道已經(jīng)被鎖死。
“美國(guó)在AI芯片領(lǐng)域?qū)χ袊?guó)的制裁長(zhǎng)期不會(huì)取消,而中國(guó)半導(dǎo)體制造工藝由于也受美國(guó)制裁,將在相當(dāng)長(zhǎng)時(shí)間處于落后狀態(tài)”,在華為全聯(lián)接大會(huì)2024上,華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍直接挑明,“這就意味著我們所能制造的芯片的先進(jìn)性將受到制約。這是我們打造算力解決方案必須面對(duì)的挑戰(zhàn)。”
科技有國(guó)界,形勢(shì)異常艱巨,核心基礎(chǔ)技術(shù)卡脖子意味著將生存的命脈放在對(duì)方手中,中國(guó)AI企業(yè)必須放棄幻想,準(zhǔn)備戰(zhàn)斗,然而反抗的火種已經(jīng)在各個(gè)產(chǎn)業(yè)悄然打響。
12月2日,美國(guó)商務(wù)部宣布了新的對(duì)華半導(dǎo)體出口管制措施,將140家中國(guó)企業(yè)列入實(shí)體清單。次日,中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)、中國(guó)汽車工業(yè)協(xié)會(huì)、中國(guó)半導(dǎo)體行業(yè)協(xié)會(huì)以及中國(guó)通信企業(yè)協(xié)會(huì)集體發(fā)表聲明:美國(guó)相關(guān)芯片產(chǎn)品不再安全、不再可靠,建議國(guó)內(nèi)企業(yè)謹(jǐn)慎采購(gòu)美國(guó)芯片。
顯然現(xiàn)在國(guó)內(nèi)像華為、百度等AI加速芯片在性能上無法替代英偉達(dá)的高端芯片,但中國(guó)AI加速芯片已經(jīng)初見成效,形成產(chǎn)業(yè)集群。
騰910B,寒武紀(jì)推出910B AI芯片,其FP16稠密算力達(dá)到128TFLOPS,超過英偉達(dá)A100;海光信息推出的海光2000 AI芯片,是國(guó)內(nèi)首款基于5nm工藝的云端推理芯片;百度昆侖與飛槳及其他國(guó)產(chǎn)軟硬件組合打造了國(guó)產(chǎn)化AI技術(shù)生態(tài)……
更為重要的是,在國(guó)產(chǎn)供給的同時(shí),因?yàn)椴粷M英偉達(dá)“閹割版”的“閹割版”的AI芯片性能,中國(guó)移動(dòng)、百度等企業(yè)開始采購(gòu)國(guó)內(nèi)AI芯片。
2024年4月,中國(guó)移動(dòng)智算中心(呼和浩特)投產(chǎn)使用,部署2萬(wàn)張AI加速卡,其中AI芯片國(guó)產(chǎn)化率為85%。但到了8月底,中國(guó)移動(dòng)智算中心(哈爾濱)投入使用時(shí),AI芯片國(guó)產(chǎn)化率100%。
外采變內(nèi)購(gòu),在美國(guó)行政命令的限制下,英偉達(dá)只能向中國(guó)提供性能被大幅“閹割”的AI芯片,根本無法滿足國(guó)內(nèi)市場(chǎng)需求,但正是因?yàn)檎呦拗,反而推?dòng)了國(guó)產(chǎn)AI加速芯片研發(fā)生產(chǎn)。
曾經(jīng)相似被卡脖子的困境我們也曾遇到。2019年,H公司無法獲得7nm芯片,其消費(fèi)電子業(yè)務(wù)被直接按下剎車鍵,但隨著MATE60、三折疊屏手機(jī)的問世,華為內(nèi)磐重生。
如今類似的境遇也發(fā)生在百度等AI大模型廠商身上,英偉達(dá)的大模型訓(xùn)練工具被斷供,但好消息是,面對(duì)美國(guó)的不斷封鎖,中國(guó)AI加速芯片已經(jīng)走過了筑基期,剩下的只需要耐心和等待。
2019年,對(duì)于中國(guó)制造光刻機(jī),ASML首席執(zhí)行官溫彼得一臉傲慢:就算給你們?nèi)讏D紙,中國(guó)也造不出光刻機(jī)。但四年后,面對(duì)同樣的問題,溫彼得頗為憂傷:中國(guó)有14億人,而且聰明人很多,我們太自以為是了。
我們真心希望,光刻機(jī)、手機(jī)芯片發(fā)生的事情,四年后能AI加速芯片身上上演,這一定很難,但一定會(huì)實(shí)現(xiàn)。