一、事件:
在AIGC等催化下智算需求激增,InfiniBand一直以零丟包的特點在AI訓練中獨占鰲頭,配合英偉達GPU幾乎壟斷AI智算市常
為抵抗這種市場擠壓,2023年AMD、Arista、博通、思科等聯(lián)合組織超以太聯(lián)盟正式成立,力在推動行業(yè)格局變化。超以太網(wǎng)聯(lián)盟(UltraEthernetConsortium,UEC)旨在創(chuàng)建一個“基于以太網(wǎng)的完整通信堆棧架構”,用超以太網(wǎng)傳輸協(xié)議取代基于以太網(wǎng)的RoCE協(xié)議,提高網(wǎng)絡吞吐量、降低延遲,增強網(wǎng)絡的可靠性和穩(wěn)定性,既保持了以太網(wǎng)的成本效益和普及性,又提供了超級計算互連所需的性能。
UEC集結了AMD、Arista、博通、思科等設備商和Meta、微軟等云廠商,國內(nèi)企業(yè)包括阿里云、百度、世紀互聯(lián)、字節(jié)跳動、華為、新華三、光迅科技、騰訊、銳捷網(wǎng)絡等。
事件點評:華夏基金認為,以太網(wǎng)具備通用性和硬件部署經(jīng)濟性,在短期與InfiniBand有望形成抗衡,并隨著豐富生態(tài)中參與者的合作迭代,在長期勝出;以太網(wǎng)生態(tài)中的頭部供應商未來有望受益于AI催化下的硬件擴容和以太網(wǎng)占有率提升的雙重利好因素。相關ETF方面,5G通信ETF(515050),其前十大持倉股分別為立訊精密、中際旭創(chuàng)、工業(yè)富聯(lián)、中興通訊、紫光股份、兆易創(chuàng)新、新易盛、三安光電、天孚通信、滬電股份。
二、人工智能對網(wǎng)絡要求更高,催動通信技術協(xié)議發(fā)展
智能計算對通信網(wǎng)絡的需求大幅提升。2017年Google發(fā)布《AttentionIsAllYouNeed》,成為后續(xù)大模型架構基礎,論文中提出的Transformer神經(jīng)網(wǎng)絡利用Self-attention自注意力機制實現(xiàn)并行處理。自此,人們意識到模型表現(xiàn)與其參數(shù)規(guī)模成正比,從Transformer的1億參數(shù)量到SwitchTransformer的1.6萬億參數(shù)量,參數(shù)和訓練集規(guī)模不斷刷新。大模型通過數(shù)據(jù)并行和模型并行輔助訓練,計算節(jié)點較多,且節(jié)點之間需要高頻進行中間計算結果的通信,為了提高GPU有效計算時間占比、避免網(wǎng)絡延遲和帶寬限制拖累AI訓練效率,智算場景對通信性能提出了更高要求。
人工智能對通信網(wǎng)絡需求包括超大規(guī)模組網(wǎng)需求、超高帶寬需求、超低時延及抖動需求、超高穩(wěn)定性需求、網(wǎng)絡自動化部署需求。在人工智能大規(guī)模訓練任務中,高效集群組網(wǎng)方案能夠提升AI分布式訓練的效率,所以智能計算對通信網(wǎng)絡的規(guī)模、帶寬、時延、穩(wěn)定性和網(wǎng)絡部署提出高要求,相較于傳統(tǒng)的通用計算和超算有所提升。
三、InfiniBand和超以太簡介
1.InfiniBand
InfiniBand是服務器硬件平臺的I/O標準,通過交換機在節(jié)點間的點對點通道進行數(shù)據(jù)傳輸,通道私有且受保護。InfiniBand擁有極高吞吐量和極低延遲,擴展性好,最高能擴展到具有數(shù)萬個節(jié)點的集群。實際部署時,需要使用一整套符合InfiniBand標準的硬件設備。InfiniBand多應用于高性能計算集群、人工智能和超大規(guī);A設施,為大型企業(yè)或科研中心提供服務。
每一個InfiniBand體系結構(InfiniBandArchitecture,即IBA)稱為子網(wǎng)(Subnet),每個子網(wǎng)內(nèi)最高可有65,536個節(jié)點(Node)。InfiniBand交換機用于子網(wǎng)范圍內(nèi),跨子網(wǎng)需要使用路由器或網(wǎng)關系統(tǒng)。每個節(jié)點通過網(wǎng)卡連接至子網(wǎng):使用主信號適配器(HCA)連接至CPU、內(nèi)存;通過目標通道適配器(TCA)連接至I/O。
IBTA(InfiniBandTradeAssociation)于1999年成立,成立之初主要為了改良PCI總線升級慢、導致I/O性能限制系統(tǒng)發(fā)展的痛點,主要成員包括Cray、Emulex、HP、IBM、Intel、Mellanox、Microsoft、Oracle、QLogic。InfiniBand推出之初,IBM、SUN、HP、Dell等多家企業(yè)發(fā)布InfiniBand相關產(chǎn)品,Cisco、QLogic等公司也相繼通過收購進入InfiniBand市常而在2003-2004年間,多家InfiniBand企業(yè)退出市場,到2008年主要參與者僅剩Cisco、QLogic、Voltaire和Mellanox。后Cisco轉(zhuǎn)向FCoE(FibreChanneloverEthernet,以太網(wǎng)光纖通道)和10Gb以太網(wǎng);Intel收購QLogic的InfiniBand交換機和適配器,后推出Omni-Path架構;Mellanox于2010年收購Voltaire。由此,InfiniBand市場形成Mellanox一枝獨秀的局面。2019年,英偉達(Nvidia)公司豪擲69億美元,擊敗對手英特爾和微軟(分別出價60億和55億美元),成功收購了Mellanox。
IB市場上,主要是Nvidia(收購的Mellanox公司)和Intel(收購的Qlogic公司)兩大玩家。IB雖然性能更好,但價格較貴。
2.超以太
以太網(wǎng)是目前全球應用最廣泛的局域網(wǎng)技術,由IEEE的802.3標準制定相關的技術標準。標準中包括了物理層的連接、電信號以及介質(zhì)訪問控制等內(nèi)容。除了IEEE標準組織,還有以太網(wǎng)技術聯(lián)盟(ETC)和超級以太網(wǎng)聯(lián)盟(UEC)等組織也會發(fā)布相關標準。憑借著高可靠性、低成本、易于管理以及高速等優(yōu)勢,以太網(wǎng)技術廣泛應用于自動化、自動駕駛、企業(yè)網(wǎng)和云計算等領域。
AMD等廠商共同組建超以太網(wǎng)聯(lián)盟(UltraEthernetConsortium,UEC),旨在創(chuàng)建一個“基于以太網(wǎng)的完整通信堆棧架構”,用超以太網(wǎng)傳輸協(xié)議取代基于以太網(wǎng)的RoCE協(xié)議,提高網(wǎng)絡吞吐量、降低延遲,增強網(wǎng)絡的可靠性和穩(wěn)定性,既保持了以太網(wǎng)的成本效益和普及性,又提供了超級計算互連所需的性能。
UEC分別從物理層、鏈路層、傳輸層、軟件層四大方面改進以太網(wǎng)技術,近期又成立了存儲、管理、兼容性&測試、性能&調(diào)試工作組,剛剛展開工作。
UEC旨在用一種新的超以太傳輸協(xié)議替代現(xiàn)有的RoCE協(xié)議,致力于改造以太網(wǎng)上的RDMA操作來優(yōu)化AI和HPC工作負載。超以太傳輸協(xié)議和RoCE協(xié)議都屬于RDMA協(xié)議是當今AI訓練工作的基本組成部分,它允許CPU,GPU,TPU或其他加速器將數(shù)據(jù)直接從發(fā)送方的存儲器傳輸?shù)浇邮辗降拇鎯ζ。這種零拷貝方法可實現(xiàn)低延遲并避免操作系統(tǒng)開銷。RoCE主要被設計用于傳統(tǒng)數(shù)據(jù)中心環(huán)境,而UET協(xié)議支持多路徑、分組噴射傳輸和高效的速率控制算法,這些特性使得UET特別適合于AI和HPC工作負載,能夠為這些高負載應用提供更好的網(wǎng)絡效能和效率,適用于高性能計算場景。此外在性能上向AI和HPC工作負載提供更加簡單的的API,致力于提高網(wǎng)絡利用率和降低尾部延遲,有利于加速RDMA操作。
最后,UEC通過智能RDMA、網(wǎng)絡級負載均衡、優(yōu)先級流量控制(PFC)、iLossless智能算法、ACC(AutomaticECN)和全生命周期自動管理等關鍵技術打造無損網(wǎng)絡架構,解決丟包和重傳問題,實現(xiàn)0丟包以太網(wǎng)。
3.InfiniBandVS.超以太
超以太與InfiniBand作為兩種用于AI和HPC領域的網(wǎng)絡通信技術,各具特點,適用于不同應用場景。
在效應上,超以太網(wǎng)注重解決大規(guī)模部署中的性能和效率問題,而InfiniBand可能因端點間的一對一關系限制網(wǎng)絡效率。目前,以太網(wǎng)和InfiniBand在支持大規(guī)模部署時都存在實際端點數(shù)量的限制,例如InfiniBand的尾延遲增加問題。
在生態(tài)上,超以太網(wǎng)以其開放標準促進了廣泛的技術融合和不同制造商和設備間的聯(lián)合創(chuàng)新,采取開放的方式尋求未來AI與HPC解決方案,而InfiniBand則與NVIDIAGPU共同形成了一個封閉但優(yōu)化的性能高地。
在定位上,InfiniBand主要應用于高性能計算,追求高速率和可靠性,有物理地址限制。而以太網(wǎng)在推出目的是兼容性,面向更多終端設備互聯(lián),目前在全世界范圍內(nèi)應用廣泛。
在成本上,基于InfiniBand的網(wǎng)絡架構硬件供應商僅有英偉達,生態(tài)較為封閉,英偉達議價能力強;而基于以太網(wǎng)協(xié)議的網(wǎng)絡架構有豐富的硬件供應商,下游客戶采購時選擇多,成本可控。
四、投資觀點
UEC將以新形式進行傳輸層處理,在非無損網(wǎng)絡的情況下也可實現(xiàn)以太網(wǎng)性能提升,較RDMA更靈活;赨EC提供的功能,以太網(wǎng)將不會發(fā)生隊頭阻塞,可實現(xiàn)以最小的丟包控制到目標主機最終鏈路上的扇入,并能減少消息延遲,無需針對網(wǎng)絡和工作負載調(diào)整擁塞算法參數(shù),網(wǎng)絡擴展性強,支持1,000,000個端點。華夏基金表示,UEC傳輸協(xié)議未來有望超越RoCE協(xié)議,力爭對標InfiniBand性能,實現(xiàn)以太網(wǎng)在智算領域滲透率的提升。
UEC成立進一步增強網(wǎng)絡設備端對AI和HPC大規(guī)模部署的靈活性,開放的生態(tài)與環(huán)境也有望催化對于解耦等需求較多的客戶選擇相應的解決方案,UEC成立進一步增強網(wǎng)絡設備端對AI和HPC大規(guī)模部署的靈活性,開放的生態(tài)與環(huán)境有望催化對于解耦等需求較多的客戶選擇相應的解決方案。超以太聯(lián)盟相關企業(yè)及網(wǎng)絡側(cè)交換機與光模塊相關企業(yè)也有望受益。
相關產(chǎn)品:
5G通信ETF(515050)及其聯(lián)接基金(008086/008087),指數(shù)成分股在光通信、光模塊主題的暴露超30%,5G通信ETF跟蹤中證5G通信主題指數(shù),選取產(chǎn)品和業(yè)務與5G通信技術相關的上市公司股票作為樣本股,捕捉通信技術革新帶來的機遇。
人工智能AIETF(515070)及其聯(lián)接基金(008585/008586):中證人工智能主題指數(shù)(指數(shù)代碼:930713.CSI,指數(shù)簡稱:CS人工智)選取為人工智能提供基礎資源、技術以及應用支持的公司中選取代表性公司作為樣本股,反映人工智能主題公司的整體表現(xiàn)。該指數(shù)已納入截至2018年9月30日的IOSCO金融基準原則鑒證報告范圍。
云計算50ETF(516630)及其聯(lián)接基金(019868/019869):中證云計算與大數(shù)據(jù)主題指數(shù)(指數(shù)代碼:930851.CSI,指數(shù)簡稱:云計算指數(shù))選取50只業(yè)務涉及提供云計算服務、大數(shù)據(jù)服務以及上述服務相關硬件設備的上市公司A股作為樣本股,以反映云計算與大數(shù)據(jù)主題股票的整體表現(xiàn)。