導(dǎo)讀THECAPITAL
智能服務(wù)器作為算力關(guān)鍵基礎(chǔ)設(shè)施,隨AI技術(shù)興起而快速發(fā)展,成為支撐大數(shù)據(jù)、云計算及AI應(yīng)用的關(guān)鍵基礎(chǔ)設(shè)施,其市場潛力巨大且正呈現(xiàn)行業(yè)規(guī)?焖僭鲩L的態(tài)勢。本文3733字,約5.3分鐘作者 | 融中咨詢來源 | 融中咨詢(ID:gh_fdc07527ac52)
行業(yè)概況
(1)智能服務(wù)器定義智能服務(wù)器是專門為人工智能應(yīng)用而設(shè)計和配置的服務(wù)器,一般采用CPU+加速芯片的架構(gòu)形式,具備強大的計算能力和高效的數(shù)據(jù)處理能力,承載深度學(xué)習(xí)訓(xùn)練和推理業(yè)務(wù),可應(yīng)用于視頻監(jiān)控、圖像處理、自動化客服等典型AI應(yīng)場景。表1 智能服務(wù)器、通用服務(wù)器對比
信息來源:融中研究整理
2023年,ChatGPT引爆大家對于人工智能的關(guān)注,各大廠商紛紛加大AI方面的投入,對AI服務(wù)器的需求大幅增加,據(jù)Counterpoint Research,2024Q2全球服務(wù)器收入達454.22億美元,同比增長35%。從2023Q1-2024Q2,AI 服務(wù)器銷售額占比穩(wěn)步提升,2024Q2比例已達近30%。圖1全球服務(wù)器與人工智能服務(wù)器收入,2022-2027
信息來源:Counterpoint Research
(2)智能服務(wù)器分類根據(jù)應(yīng)用場景、架構(gòu)和部署方式的不同,智能服務(wù)器可以分為訓(xùn)練服務(wù)器、推理服務(wù)器和GPU服務(wù)器、NPU服務(wù)器、FPGA服務(wù)器,以及云端AI服務(wù)器、邊緣AI服務(wù)器。表2 智能服務(wù)器分類
信息來源:融中研究整理
(1)按應(yīng)用場景分類模型訓(xùn)練即使用大量已知數(shù)據(jù)來訓(xùn)練機器學(xué)習(xí)模型的過程,需要短時間內(nèi)并行,且要在短時間內(nèi)能夠做到交付,所以訓(xùn)練需要較高的計算性能、海量的數(shù)據(jù),訓(xùn)練出的網(wǎng)絡(luò)具有一定通用性,需要更計算性能(高吞吐率)、低功耗的智能服務(wù)器。模型推理是指利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論,是借助神經(jīng)網(wǎng)絡(luò)模型并行運算,利用輸入的新數(shù)據(jù)獲得正確結(jié)論,相對來說對算力性能和精度要求不高,在特定的場景下,對通用性要求也低,因此用于推理的人工智能服務(wù)器主要追求的是低延時、低功耗。從比例看,2023年來大模型的興起帶動了對訓(xùn)練服務(wù)器的需求,據(jù)IDC,2023年訓(xùn)練服務(wù)器占比近60%,但隨著人工智能應(yīng)用的逐步落地,對智能服務(wù)器的需求將逐漸從訓(xùn)練端轉(zhuǎn)向推理端,2027年推理服務(wù)器占比預(yù)計將超70%。圖 2中國人工智能服務(wù)器工作負(fù)載預(yù)測,2022-2027
信息來源:IDC
(2)按架構(gòu)分類按架構(gòu)分類,智能服務(wù)器可分為CPU+GPU、CPU+NPU、CPU+FPGA、CPU+ASIC或CPU+多種加速卡等多種類別。目前市場中GPU的應(yīng)用最為廣泛。(3)按部署方式分類按部署方式分類,智能服務(wù)器可分為云側(cè)及邊緣側(cè)兩類智能服務(wù)器。表3 各類技術(shù)領(lǐng)域在不同應(yīng)用場景下的典型設(shè)備、核心需求、技術(shù)關(guān)鍵總結(jié)
信息來源:趙春昊《基于應(yīng)用場景的人工智能芯片技術(shù)分類方法研究》
(3)政策梳理政策端,我國中央各部委陸續(xù)出臺頂層政策推進人工智能產(chǎn)業(yè)建設(shè),各地政府針對智能算力基礎(chǔ)設(shè)施建設(shè)、區(qū)域協(xié)同發(fā)展、技術(shù)創(chuàng)新等維度發(fā)文,推進地方人工智能產(chǎn)業(yè)發(fā)展。表4中國人工智能算力政策梳理
信息來源:融中研究整理
產(chǎn)業(yè)鏈分析
智能服務(wù)器上游為各類元器件,價值量占比較高的元器件包括CPU、GPU、內(nèi)存、硬盤等硬件,也包括操作系統(tǒng)、數(shù)據(jù)庫、中間件等各類軟件,中游為服務(wù)器廠商,下游客戶主要涉及互聯(lián)網(wǎng)、金融、電信、政府及各個傳統(tǒng)行業(yè),其中互聯(lián)網(wǎng)為主要采購方。圖 3 智能服務(wù)器產(chǎn)業(yè)鏈情況
信息來源:融中研究整理
(1)上游供應(yīng)鏈分析不同類型的服務(wù)器的成本構(gòu)成存在差異,智能服務(wù)器中價值量較高的元器件包括CPU、GPU、內(nèi)存、硬盤等。相較于基礎(chǔ)的通用服務(wù)器,智能服務(wù)器的一大成本來源于GPU,用于推理的智能服務(wù)器中GPU占比約30%,用于訓(xùn)練的智能服務(wù)器中GPU價值占比可超過70%。表5智能服務(wù)器上游零部件市場情況
信息來源:融中研究整理
(2)中游市場分析(1)市場規(guī)模在AI浪潮下,全球人工智能服務(wù)器呈穩(wěn)步增長態(tài)勢,據(jù)IDC數(shù)據(jù),市場規(guī)模角度,2023年全球人工智能服務(wù)器市場規(guī)模為515億美元,預(yù)計2028年將達1016億美元,2023-2028年CAGR為14.6%;出貨量角度,2023年全球人工智能服務(wù)器出貨約154萬臺,預(yù)計2028年將達343萬臺,2023-2028年CAGR為17.4%。圖 4全球人工智能服務(wù)器市場規(guī)模
信息來源:IDC
圖 5中國人工智能服務(wù)器市場規(guī)模及出貨量
信息來源:IDC
國內(nèi)人工智能服務(wù)器市場增速較全球市場更快。(2)競爭格局從商業(yè)模式來看,目前服務(wù)器廠商整體可以分為兩大類:一類是以浪潮、新華三、戴爾、聯(lián)想等為代表的品牌服務(wù)器,他們自己進行服務(wù)器方案設(shè)計,并把自有方案交給OEM廠商進行產(chǎn)品代工,再銷售給下游客戶;另外一類是以鴻海、英業(yè)達、廣達、緯創(chuàng)等為代表的白牌廠商,這類廠商不進行自主研發(fā)設(shè)計,而是根據(jù)下游客戶給定的方案進行代工。在傳統(tǒng)模式下,下游客戶往往向品牌服務(wù)器廠商進行采購,但隨著云計算興起,由于新興的互聯(lián)網(wǎng)、通信、云計算服務(wù)商等下游客戶自身具備較強軟硬件開發(fā)能力和產(chǎn)品維護能力,且需求更加定制化,出于縮短周期和降低成本的考慮,這些廠商傾向于直接找白牌廠商進行制造,促使傳統(tǒng)的商業(yè)模式發(fā)生轉(zhuǎn)變。圖 6 服務(wù)器商業(yè)模式變化
信息來源:融中研究整理
根據(jù)Digitimes Research 2022年數(shù)據(jù)顯示,在全球服務(wù)器代工制造市場,鴻海的份額高達43%,隨后為廣達、緯創(chuàng)、英業(yè)達、美超微等,市場份額分別為17%、14%、12.8%、7.6%,CR5達94.4%,集中度高。圖 7 全球服務(wù)器代工市場格局,2022
信息來源:Digitimes Research
在品牌服務(wù)器市場,2022年我國市場浪潮、新華三、寧暢銷售額位居前三,CR3近70%,其中浪潮信息一家的份額近50%,其余國產(chǎn)廠商還包括安擎、坤前、華為、寶德等,每家份額約5~10%。圖 8 中國人工智能服務(wù)器市場格局(按銷售額),2022
信息來源:IDC
(3)下游客戶分析人工智能服務(wù)器下游客戶涉及的行業(yè)廣泛,其中互聯(lián)網(wǎng)客戶占比最高,接近60%,主因互聯(lián)網(wǎng)廠商積極布局大模型,且其在大數(shù)據(jù)處理、云計算、人工智能等領(lǐng)域擁有廣泛的應(yīng)用場景,對AI服務(wù)器需求更大,與此同時,隨著垂直大模型的逐步商業(yè)化落地,服務(wù)、政府、電信、金融、工業(yè)制造等多個傳統(tǒng)行業(yè)對智能服務(wù)器的需求也不斷擴大。圖 9中國AI服務(wù)器下游客戶結(jié)構(gòu)
信息來源:IDC,F(xiàn)rost & Sullivan……(4)代表公司分析浪潮信息:公司是全球領(lǐng)先的IT基礎(chǔ)設(shè)施產(chǎn)品、方案和服務(wù)提供商,為客戶提供云計算、大數(shù)據(jù)、人工智能等各類創(chuàng)新IT產(chǎn)品和解決方案,公司業(yè)務(wù)遍及全球主要國家和地區(qū),服務(wù)器出貨量全球第二,存儲裝機容量全球第三,人工智能服務(wù)器銷售額全球第一。新華三:公司起源于華為數(shù)據(jù)通信部,前身是由華為與美國3com的合資公司華三,今年9月紫光股份通過剩余股權(quán)收購,已正式持有的新華三81%股權(quán)。公司最初業(yè)務(wù)聚焦于交換機和企業(yè)級路由器,目前擁有計算、存儲、網(wǎng)絡(luò)、5G、安全、終端等全方位的數(shù)字化基礎(chǔ)設(shè)施整體能力。據(jù)IDC,2024Q1公司在中國以太網(wǎng)交換機、企業(yè)網(wǎng)交換機、園區(qū)交換機市場、中國企業(yè)級WLAN分別以34.8%、36.5%、41.6%、30.3%的市場份額排名第一,中國x86服務(wù)器市場份額15.6%,保持市場第二。寧暢:公司專注服務(wù)器領(lǐng)域已有15年,是集研發(fā)、生產(chǎn)、部署、運維一體的服務(wù)器廠商及IT系統(tǒng)解決方案提供商,為全行業(yè)客戶提供基于X86架構(gòu)通用機架、人工智能、多節(jié)點、邊緣計算及JDM全生命周期定制等多類型服務(wù)器及IT基礎(chǔ)設(shè)施產(chǎn)品。從廠商銷售額角度看,2024 上半年寧暢位居國內(nèi)加速服務(wù)器市場第三。表 6智能服務(wù)器廠商融資歷史
信息來源:融中研究整理
行業(yè)未來發(fā)展趨勢
(1)液冷隨著AI技術(shù)的發(fā)展,算力需求不斷擴大,人工智能服務(wù)器的增加所帶來的功耗問題愈加明顯,傳統(tǒng)的風(fēng)冷散熱逐漸跟不上當(dāng)前散熱需求,散熱方式向液冷轉(zhuǎn)變。液冷(Liquid Cooling)的原理是通過將冷卻介質(zhì)流過電子設(shè)備的散熱器,吸收設(shè)備產(chǎn)生的熱量,然后將熱量帶走,從而降低設(shè)備的溫度。相較于風(fēng)冷,液冷的優(yōu)勢主要為:一是散熱效率高,液體的導(dǎo)熱能力是空氣的15~25倍,空氣散熱所需時間更長;二是噪聲低,液冷方式不會產(chǎn)生空氣流動所帶來的噪聲;三是靈活性強,液冷的設(shè)備體積較小,可提升數(shù)據(jù)中心靈活性;四是穩(wěn)定性強,能夠更快速、有效地將芯片產(chǎn)生的大量熱量傳導(dǎo)到冷卻系統(tǒng),降低芯片溫度,減少因溫度過高導(dǎo)致的故障。圖 10不同制冷技術(shù)PUE對比
信息來源:呂天文,張藍心《中國智算中心現(xiàn)狀及液冷技術(shù)應(yīng)用展望》
按冷卻方式,液冷技術(shù)可分為噴淋式液冷、冷板式液冷、浸沒式液冷等。噴淋式液冷是將具有絕緣非腐蝕特性的冷卻液直接噴淋到發(fā)熱器件表面或與發(fā)熱器件接觸的擴展表面行熱交換,實現(xiàn)冷卻所屬設(shè)備,由于噴淋式液冷技術(shù)的應(yīng)用場景比較有限,目前應(yīng)用和開發(fā)案例較少。表 7不同液冷技術(shù)路線
信息來源:融中研究整理
(2)國產(chǎn)化近年AI的發(fā)展促使我國不斷加強AI算力基礎(chǔ)設(shè)施的建設(shè),但在美國出口限制背景下,科技自立自強逐步成為發(fā)展主旋律。國內(nèi)廠商經(jīng)過多年的技術(shù)積累和市場打磨,產(chǎn)品已從“可用”進入“好用”階段,以運營商和金融為代表的大客戶為例,近年集采項目中國產(chǎn)服務(wù)器的比重逐漸加大,信創(chuàng)服務(wù)器的集采和規(guī)模化應(yīng)用正有序進行。中國電信在2020年就開始將全國產(chǎn)化服務(wù)器單獨列入招標(biāo)目錄,在當(dāng)年的集采項目中國產(chǎn)化服務(wù)器占比近20%,此后集采中國產(chǎn)化率不斷提升,2021年中國電信進一步將國產(chǎn)化比例提到26.7%,2023年的AI服務(wù)器集采中,國產(chǎn)化的比例已經(jīng)接近50%。10月21日,中國電信公示2024-2025年服務(wù)器集采的中標(biāo)候選人,本次服務(wù)器集采中國產(chǎn)化比例則達到了67.5%。圖 11 中國電信服務(wù)器集采國產(chǎn)化率情況
信息來源:中國電信陽光采購網(wǎng)
目前我國服務(wù)器廠商往往和上游芯片廠商綁定,形成生態(tài)圈,如中科院系的海光信息和中科曙光,華為系的鯤鵬+騰和寶德、超聚變、神州數(shù)碼、烽火通信、新華三、安擎等,以及中電子系的飛騰和中國長城。圖 12騰硬件合作伙伴
信息來源:騰官網(wǎng)#線索爆料# rzcj@thecapital.com.cn