英偉達(dá)新一代旗艦AI芯片Blackwell正在交付。但有市場人士爆料稱,Blackwell GPU在裝有72個(gè)處理器的服務(wù)器中使用時(shí)會產(chǎn)生過熱問題,這些機(jī)器預(yù)計(jì)每個(gè)機(jī)架的功耗高達(dá)120kw。過熱會限制GPU性能并有損壞組件的風(fēng)險(xiǎn)。
11月18日,英偉達(dá)發(fā)言人就此問題向第一財(cái)經(jīng)記者回應(yīng)稱:“我們正在與領(lǐng)先的云服務(wù)提供商合作,將其作為我們工程團(tuán)隊(duì)和流程中不可或缺的一部分。工程迭代是正常且符合預(yù)期的。將GB200這一迄今為止最先進(jìn)的系統(tǒng)集成到各種數(shù)據(jù)中心環(huán)境中,需要與我們的客戶共同設(shè)計(jì)。”
這已不是英偉達(dá)新一代的AI芯片第一次被曝出技術(shù)問題。此前市場還爆料Blackwell處理器的設(shè)計(jì)缺陷導(dǎo)致產(chǎn)量下降,推遲生產(chǎn),并稱英偉達(dá)為此修改了GPU的某些結(jié)構(gòu)設(shè)計(jì),以提高生產(chǎn)可靠性。
盡管最新被曝出的過熱技術(shù)問題可能進(jìn)一步延遲GB200的交付,但從需求來看,英偉達(dá)的AI芯片仍處于供不應(yīng)求。在AI芯片領(lǐng)域,全球近90%的市場仍被英偉達(dá)牢牢把控。
英偉達(dá)表示:“目前客戶正在搶占GB200系統(tǒng)的市場先機(jī)”。
據(jù)社交媒體上公司發(fā)布的最新消息,目前GB200已經(jīng)向客戶交付。11月18日,戴爾宣布向Coreweave公司交付了全球首款GB200NVL72服務(wù)器機(jī)架,稱“這將為AI基礎(chǔ)設(shè)施樹立新標(biāo)桿”。
另據(jù)最新消息稱,馬斯克的人工智能xAI本周有望宣布新一輪融資,該融資據(jù)悉將用來購買10萬塊英偉達(dá)的GPU芯片。
鴻海集團(tuán)上個(gè)月也宣布,該公司位于中國臺灣最大的超級計(jì)算機(jī)基于英偉達(dá)的Blackwell架構(gòu)構(gòu)建,并采用GB200 NVL72平臺,該平臺共包含64個(gè)機(jī)架和4608個(gè)Tensor Core GPU。
近日,英偉達(dá)在日本技術(shù)峰會上表示,將與軟銀集團(tuán)共同打造日本最大的AI數(shù)據(jù)中心。
英偉達(dá)將于本周公布最新季度財(cái)報(bào),新一代AI芯片系統(tǒng)的交付情況也被市場高度關(guān)注。目前英偉達(dá)市值接近3.5萬億美元,仍超過蘋果公司位居美股市值榜首。今年以來,英偉達(dá)股價(jià)累計(jì)上漲近200%。
(本文來自第一財(cái)經(jīng))