芝能智芯出品
生成式人工智能(Gen AI)已成為炙手可熱的話題。隨著ChatGPT和Sora等Gen AI應(yīng)用在全球范圍內(nèi)的迅速普及,對計算能力的需求也呈現(xiàn)出爆發(fā)式增長。
這一趨勢正將焦點轉(zhuǎn)移到半導(dǎo)體行業(yè),將其推向了新的發(fā)展階段,我們可以形象地將其描述為"下一個S曲線"。這也帶來了一個緊迫的問題,半導(dǎo)體行業(yè)能否跟上這股變革的步伐。
半導(dǎo)體行業(yè)的領(lǐng)軍者們紛紛采取措施,投入大量資本用于擴大數(shù)據(jù)中心和半導(dǎo)體制造工廠,并不斷探索芯片設(shè)計、材料和架構(gòu)方面的進步,目標是要滿足新一代Gen AI驅(qū)動的商業(yè)環(huán)境所帶來的不斷變化的需求。
Part 1
半導(dǎo)體行業(yè)的S曲線
半導(dǎo)體行業(yè)面臨著一個新的增長曲線S曲線。這要求行業(yè)領(lǐng)導(dǎo)者進行大量資本投入,以擴大數(shù)據(jù)中心和半導(dǎo)體制造工廠(fabs),并探索芯片設(shè)計、材料和架構(gòu)的進步,以滿足新一代AI驅(qū)動的商業(yè)環(huán)境的需求。
在B2B和B2C市場中,生成式AI的影響正在開發(fā)多種場景,這些場景都預(yù)示著計算需求的顯著增長。這些場景主要關(guān)注數(shù)據(jù)中心,并承認邊緣設(shè)備如智能手機的影響,盡管規(guī)模較校
生成式AI應(yīng)用程序的需求可以分為兩個主要階段:訓練和推理。
●訓練階段通常需要處理大量數(shù)據(jù),是計算密集型的,
●而推理階段則在每次運行用例時需要較少的計算量。
B2C應(yīng)用程序預(yù)計將占新一代AI計算需求的70%,而B2B用例預(yù)計占30%。
Part 2
B2B和B2C
麥肯錫分析了六種B2B用例原型,并根據(jù)服務(wù)計算成本和AI價值創(chuàng)造進行了組織。這些原型包括編碼和軟件開發(fā)應(yīng)用、創(chuàng)意內(nèi)容生成應(yīng)用、客戶互動應(yīng)用、創(chuàng)新應(yīng)用、簡單簡潔的應(yīng)用和復(fù)雜簡潔的應(yīng)用。
分析的核心是服務(wù)計算成本,包括訓練、微調(diào)和推理成本,以及基礎(chǔ)設(shè)施即服務(wù)(IaaS)利潤,其中包括計算硬件、服務(wù)器組件、IT基礎(chǔ)設(shè)施、功耗和人才成本。
B2B需求場景:
●基礎(chǔ)采用:在18年內(nèi)預(yù)計實現(xiàn)90%的采用率,需要大量投資于計算基礎(chǔ)設(shè)施。
●保守采用:采用率可能減緩,僅產(chǎn)生部分價值捕獲,受監(jiān)管限制和數(shù)據(jù)隱私問題的影響。
●加速采用:預(yù)計13年內(nèi)實現(xiàn)90%的采用率,受到新商業(yè)模式和技術(shù)進步的推動。
對于B2C計算需求,消費者參與度和計算含義是關(guān)鍵驅(qū)動因素。基本、保守和加速采用場景代表了新一代AI對B2B和B2C應(yīng)用程序需求的可能結(jié)果。例如,到2030年,在基本場景中,新一代AI計算總需求可能達到25x10^30 FLOP,其中約70%來自B2C應(yīng)用程序,30%來自B2B應(yīng)用程序。
B2C計算需求場景:
●基礎(chǔ)采用:預(yù)計每個智能手機用戶的日常交互次數(shù)將增加,對B2C應(yīng)用程序的需求將持續(xù)增長。
●保守采用:擔憂數(shù)據(jù)隱私和監(jiān)管問題可能導(dǎo)致交互次數(shù)減半。
●加速采用:高度信任和用戶接受度可能會導(dǎo)致消費者應(yīng)用程序交互數(shù)量的急劇增加。
Part 3
AI對行業(yè)的影響
隨著組織應(yīng)對采用新一代AI的復(fù)雜性,對這些原型的戰(zhàn)略利用變得勢在必行。經(jīng)濟性、算法效率以及硬件的持續(xù)進步等因素進一步影響著新一代AI的采用和技術(shù)進步。
在數(shù)據(jù)中心基礎(chǔ)設(shè)施方面,生成式AI應(yīng)用程序通常在專用服務(wù)器上運行,這些服務(wù)器可能需要更高的機架功率密度和液體冷卻。服務(wù)器將采用高性能GPU或?qū)S肁I芯片,如ASIC,以高效處理工作負載。訓練服務(wù)器預(yù)計將采用CPU+GPU架構(gòu),而推理工作負載預(yù)計將轉(zhuǎn)向?qū)S糜布,因為它們成本更低,能源效率更高?/p>
晶圓需求的增長對半導(dǎo)體行業(yè)產(chǎn)生了顯著影響。到2030年,非新一代AI應(yīng)用對邏輯晶圓的需求將約為1500萬片,而生成式AI需求將需要額外的120萬至360萬片晶圓。這可能導(dǎo)致需要三到九座新的邏輯晶圓廠來滿足需求。
對于DRAM和HBM內(nèi)存芯片,到2030年,gen AI應(yīng)用對DRAM的需求可能在5至1300萬片晶圓之間,相當于4至12個專用晶圓廠。NAND存儲器的總需求預(yù)計為2至800萬片晶圓,對應(yīng)1至5家晶圓廠。
除了邏輯和內(nèi)存芯片,其他組件如高速網(wǎng)絡(luò)和互連設(shè)備、功率半導(dǎo)體等也將面臨增長的需求。gen AI的增長推動了對計算能力的相應(yīng)需求,促進了軟件創(chuàng)新以及對數(shù)據(jù)中心基礎(chǔ)設(shè)施和半導(dǎo)體工廠的大量投資。
小結(jié)
為了應(yīng)對新一代AI帶來的挑戰(zhàn)與機遇,半導(dǎo)體行業(yè)必須擁抱變革,制定相應(yīng)的應(yīng)對策略。行業(yè)領(lǐng)軍者加大對計算基礎(chǔ)設(shè)施的投資,以滿足不斷增長的需求。
在B2C市場,制定針對智能手機等邊緣設(shè)備的芯片設(shè)計與制造策略至關(guān)重要,以滿足日益增長的消費者需求。