智東西(公眾號(hào):zhidxcom)
作者 | 程茜
編輯 | 漠影
2024年,千行百業(yè)對(duì)AI推理的需求將呈現(xiàn)出爆發(fā)式增長(zhǎng),行業(yè)對(duì)算力的需求遠(yuǎn)遠(yuǎn)超越以往。在這樣的形勢(shì)下,如何突破能耗瓶頸,進(jìn)而獲取更充足的算力,已經(jīng)成為每個(gè)企業(yè)迫在眉睫且亟待解決的關(guān)鍵問題。
然而,當(dāng)前的現(xiàn)實(shí)情況是有效算力供給已無法滿足算力需求:一方面,從儲(chǔ)備到應(yīng)用的算力需求都愈發(fā)旺盛,OpenAI CEO召集全球投資者組建聯(lián)盟為大模型構(gòu)建基礎(chǔ)設(shè)施,馬斯克的無人駕駛出租車Cybercab為科技行業(yè)描繪了未來感十足的面面,還有性能愈發(fā)強(qiáng)大的GPT-o1等模型層出不窮。
另一方面,數(shù)據(jù)中心的算力潛能尚未被完全挖掘出來。數(shù)據(jù)中心常被認(rèn)為是“耗電怪獸”,因?yàn)榉⻊?wù)器運(yùn)行伴隨著熱量釋放,溫度一旦超過極限值,服務(wù)器性能就會(huì)顯著降低,限制數(shù)據(jù)中心算力發(fā)揮。于是各類創(chuàng)新技術(shù)涌現(xiàn),試圖讓數(shù)據(jù)中心再次突破能效瓶頸,釋放出被束縛的算力潛能。
這背后的關(guān)鍵變量就是冷卻技術(shù),液冷技術(shù)作為推手幫助數(shù)據(jù)中心一次次突破制約。就在聯(lián)想集團(tuán)Tech World上,聯(lián)想集團(tuán)董事長(zhǎng)兼CEO楊元慶與NVIDIA創(chuàng)始人兼CEO黃仁勛,這兩大全球科技行業(yè)頂尖企業(yè)的領(lǐng)軍者同臺(tái),聯(lián)合發(fā)布全新液冷AI服務(wù)器,勇闖“最大工業(yè)革命”。
今天,伴隨2024/2025財(cái)年Q2財(cái)報(bào),聯(lián)想集團(tuán)發(fā)布《Game of AI》系列知識(shí)科普視頻的第二集《數(shù)據(jù)中心:如何與世界交換算力》。
視頻延續(xù)桌面電影形式,通過《權(quán)力的游戲》風(fēng)格的開場(chǎng)片頭,復(fù)刻北境冰雪氣候變化,打造亦真亦幻的三維沙盤動(dòng)畫,以此緊扣液冷主線。
同時(shí),視頻還以兩條科技樹線索,介紹了數(shù)據(jù)中心和能效的角逐演進(jìn)歷程,采用冰雪白為主的配色方案與模擬芯片的三維結(jié)構(gòu),融入液冷主題。
視頻中以第一人稱桌面電影的創(chuàng)新手法,讓觀眾跟隨存在于2100年未來時(shí)空,以科技?xì)v史學(xué)家李約瑟為原型的智能體,并通過它的主觀視角展開了一場(chǎng)算力史與能源技術(shù)史的探究,如何通過計(jì)算重構(gòu)世界,以及其中的可持續(xù)發(fā)展路徑,發(fā)現(xiàn)液冷技術(shù)在釋放數(shù)據(jù)中心算力中的關(guān)鍵作用。
一、提升能效、維持功耗,數(shù)據(jù)中心效率革命正當(dāng)時(shí)
聯(lián)想集團(tuán)最新發(fā)布的第六代Neptune海神液冷解決方案,可以為生成式AI高效計(jì)算提供動(dòng)力。這在當(dāng)下對(duì)于數(shù)據(jù)中心算力效率提升的重要性不言而喻。
通過視頻中聯(lián)想集團(tuán)梳理的數(shù)據(jù)中心百年發(fā)展歷史,我們發(fā)現(xiàn),數(shù)據(jù)中心的算力與能效密切相關(guān),二者共同掌握著能量密碼。
人類對(duì)算力的利用由來已久,但隨著信息技術(shù)革命到來,算力的性能和規(guī)模迎來爆發(fā),算力需求逐漸多元化,深入汽車、大模型等各種應(yīng)用場(chǎng)景。
2024年,算力提升的關(guān)鍵已經(jīng)從狂堆硬件轉(zhuǎn)向提升效率,如今數(shù)據(jù)中心需要的革命是基建效率的角力。目標(biāo)是在充分利用數(shù)據(jù)中心已有硬件設(shè)備的基礎(chǔ)上,使其發(fā)揮出更高能耗并提供更強(qiáng)大的算力。視頻以桌面電影第一視角,通過網(wǎng)頁(yè)、文件等多樣化載體提取信息,給觀眾帶來更多操控互動(dòng)感受。
在明確數(shù)據(jù)中心效率這一概念的同時(shí),需要先搞清楚一個(gè)指標(biāo)TDP熱設(shè)計(jì)功耗。這指的就是當(dāng)芯片達(dá)到最大負(fù)荷時(shí)熱量釋放的指標(biāo),也是冷卻系統(tǒng)要面對(duì)的重大挑戰(zhàn)。
一旦超過這一極限值,處理器的溫度繼續(xù)升高,就會(huì)導(dǎo)致數(shù)據(jù)中心的性能降低,讓芯片發(fā)揮計(jì)算能力的前提就是,處理器運(yùn)行過程中產(chǎn)生的熱量和冷卻技術(shù)的散熱能力達(dá)到平衡。
因此提升基建能效,將其從能耗制約下拯救出來的關(guān)鍵就是冷卻技術(shù)。二者相互制約又相互關(guān)聯(lián),共同決定了數(shù)據(jù)中心的穩(wěn)定運(yùn)行和能源利用效率。
數(shù)據(jù)中心和能效兩條技術(shù)路線交織前進(jìn)的同時(shí),一步步助推AI產(chǎn)業(yè)的技術(shù)創(chuàng)新與應(yīng)用落地加速實(shí)現(xiàn),加速智能時(shí)代到來。
二、冷卻技術(shù):算力歷史長(zhǎng)河中的關(guān)鍵脈絡(luò)
算力工具從僅憑大腦運(yùn)算到機(jī)械計(jì)算機(jī)、電子計(jì)算機(jī),形態(tài)幾經(jīng)變遷,已經(jīng)從數(shù)據(jù)中心的無限擴(kuò)張轉(zhuǎn)移到基建效率的角力上。
聯(lián)想集團(tuán)以桌面電影的形式,讓我們親身體驗(yàn)了計(jì)算的百年歷史。視頻中通過更契合冷卻與算力主題模擬芯片三維結(jié)構(gòu),展現(xiàn)出數(shù)據(jù)中心變遷的關(guān)鍵環(huán)節(jié)。最初圖靈機(jī)理論出現(xiàn),奠定計(jì)算的設(shè)計(jì)理念,由虛擬機(jī)器替代人類進(jìn)行數(shù)學(xué)運(yùn)算。再到1946年運(yùn)算速度達(dá)到了手工計(jì)算20萬倍的ENIAC出現(xiàn),1951年第一臺(tái)商用計(jì)算機(jī)UNIVAC I首次擁有存儲(chǔ)能力,為現(xiàn)代計(jì)算機(jī)的體系結(jié)構(gòu)奠定了基礎(chǔ)。
再到后面,20世紀(jì)60年代分時(shí)操作系統(tǒng)使得計(jì)算開始通用,計(jì)算機(jī)的處理器占用被切分,可以讓多人同時(shí)使用計(jì)算機(jī)。
計(jì)算性能的大幅提升,隨之而來的就是散熱系統(tǒng)的工作負(fù)荷急劇增加。視頻以水上、水下逐步揭示數(shù)據(jù)中心明線與能效暗線,通過水中浮起等細(xì)節(jié)動(dòng)畫,讓人沉浸其中。
早期風(fēng)冷技術(shù)是數(shù)據(jù)中心散熱的主要方式之一,20世紀(jì)90年代出現(xiàn)的機(jī)架式服務(wù)器就是數(shù)據(jù)中心的初始形態(tài),但因?yàn)榭臻g緊湊、設(shè)備密度較高,風(fēng)冷無法再滿足散熱需求。
機(jī)械冷卻登上歷史舞臺(tái),空調(diào)通過壓縮機(jī)、冷凝器、蒸發(fā)器等核心部件的協(xié)同工作,產(chǎn)生低溫冷風(fēng)帶走熱量。從而使冷卻技術(shù)在互聯(lián)網(wǎng)首次蔓延,第一次拯救了算力。
冷卻技術(shù)拯救算力的第二大節(jié)點(diǎn),就是高性能計(jì)算集群的出現(xiàn)。高性能計(jì)算集群將單機(jī)柜功耗直線拉升百倍,達(dá)到50kW,冷卻技術(shù)再遇瓶頸,空調(diào)無法滿足如此快速、高效散熱的需求。
其中的標(biāo)志性事件就是聯(lián)想集團(tuán)2012年推出的海神Neptune溫水水冷技術(shù)。其率先提出了適用于高密度計(jì)算環(huán)境的溫水水冷技術(shù),使用45℃~50℃的溫水在冷卻板和循環(huán)水路中循環(huán),達(dá)到降溫的效果。視頻通過對(duì)溫水水冷服務(wù)器進(jìn)行首次全方位拆解,結(jié)合圖表、動(dòng)畫,深入淺出展現(xiàn)了溫水水冷技術(shù)。
該技術(shù)通過全水冷無風(fēng)扇設(shè)計(jì),使服務(wù)器散熱效率達(dá)98%,并實(shí)現(xiàn)90%的余熱回收再利用,降低42%的能耗,數(shù)據(jù)中心PUE可降至1.1,同時(shí)其總體成本低于風(fēng)冷。
這之后,液冷技術(shù)全面爆發(fā),成為高性能計(jì)算的主流選擇。
液冷技術(shù)的發(fā)展為數(shù)據(jù)中心能效提升,開辟了一條行之有效的路線,并為大模型時(shí)代的算力注入了新的動(dòng)力。
三、液冷AI時(shí)代釋放澎湃算力的 “動(dòng)力源泉”
AI時(shí)代下半場(chǎng),百模大戰(zhàn)落下帷幕,GPU、CPU、TPU、服務(wù)器演化出千百種形態(tài),AI軍備競(jìng)賽的焦點(diǎn),正從模型向數(shù)據(jù)中心轉(zhuǎn)移。
AI訓(xùn)練和推理的算力需求激增,對(duì)數(shù)據(jù)中心的需求水漲船高。一張GPU的功率飆升至1000W,單機(jī)柜功率密度增至100kW。
隨之而來的就是對(duì)冷卻系統(tǒng)的又一次嚴(yán)峻考驗(yàn)。這是因?yàn)樵诟吖β拭芏鹊沫h(huán)境下,設(shè)備單位體積內(nèi)產(chǎn)生的熱量會(huì)大幅增加,就需要散熱系統(tǒng)的工作效率更高,才能快速帶走熱量保證設(shè)備持續(xù)運(yùn)轉(zhuǎn)。
聯(lián)想集團(tuán)2024 Tech World大會(huì)上發(fā)布的全新液冷AI服務(wù)器,搭載第六代海神液冷系統(tǒng),具備突破性的垂直液冷設(shè)計(jì)方案。視頻通過三維動(dòng)畫直接對(duì)該系統(tǒng)進(jìn)行了拆解,更為直接的呈現(xiàn)了其內(nèi)部構(gòu)造。
憑借ThinkSystem N1380 Neptune和新的ThinkSystem SC777 V4 Neptune,聯(lián)想集團(tuán)率先在不需要專用數(shù)據(jù)中心空調(diào)的情況下就可以運(yùn)行100kW以上的服務(wù)器機(jī)架,這一設(shè)備就是專為大模型而打造。
在優(yōu)化部署方面,液冷服務(wù)器可豎直放置,能在提升空間利用效率的同時(shí),進(jìn)一步增強(qiáng)散熱效果,這在此前的液冷系統(tǒng)中并不多見。
其還采用精巧封裝設(shè)計(jì),包含8個(gè)托盤槽、4個(gè)15kW功率轉(zhuǎn)換站以及Neptune水流分配系統(tǒng)。
基于這樣的優(yōu)化設(shè)計(jì),第六代海神技術(shù)使得數(shù)據(jù)中心的PUE趨近于1.0的極限,這也意味著整個(gè)數(shù)據(jù)中心設(shè)備對(duì)能源的利用率接近100%。
視頻畫面穿越數(shù)據(jù)中心的服務(wù)器,看到了海神液冷系統(tǒng)為解決數(shù)據(jù)中心能耗問題帶來的希望。
但這并不是液冷技術(shù)的終場(chǎng)戰(zhàn)局。如今,算力需求洶涌向前,聯(lián)想集團(tuán)通過顛覆機(jī)柜、機(jī)房固有格局,用全面液冷的超大型AI集群解決方案液冷集群微模塊,為AI產(chǎn)業(yè)的突破裝載了推進(jìn)器。
視頻中通過逼真寫實(shí)風(fēng)格的服務(wù)器形態(tài)切換三維動(dòng)畫,再輔以鼠標(biāo)手動(dòng)操作方式,讓觀眾直觀感受了從服務(wù)器模塊到機(jī)柜再到液冷微模塊的重構(gòu)過程。
液冷集群微模塊的出現(xiàn),成為數(shù)據(jù)中心的最優(yōu)解之一,液冷技術(shù)第三次釋放了數(shù)據(jù)中心的算力能耗限制。
從高性能計(jì)算時(shí)代,到AI時(shí)代的下半場(chǎng),聯(lián)想集團(tuán)持續(xù)引領(lǐng)液冷解決方案設(shè)計(jì),加速算力的釋放。液冷技術(shù)的革命日益受到廣泛而密切的關(guān)注,并對(duì)數(shù)據(jù)中心產(chǎn)業(yè)鏈、供應(yīng)鏈產(chǎn)生革命性影響。
結(jié)語:液冷成可持續(xù)算力保障,AI加速向?qū)?br/>
算力已經(jīng)成為人工智能進(jìn)入真實(shí)的產(chǎn)業(yè)環(huán)境中不可或缺的核心要素,液冷技術(shù)更高效地帶走高溫,使算力可持續(xù),讓數(shù)據(jù)中心源源不斷與世界交換算力。
黃仁勛在與楊元慶對(duì)話時(shí)提到:“現(xiàn)在,我們正在以前所未有的規(guī)模重塑計(jì)算領(lǐng)域的整個(gè)架構(gòu),F(xiàn)在,速度就是可持續(xù)性,速度就是表現(xiàn)力,速度就是能源利用率。”
如今,AI重塑整個(gè)世界運(yùn)行邏輯,算力正是其堅(jiān)實(shí)的底座。正如聯(lián)想集團(tuán)打造的視頻結(jié)尾所說,“服務(wù)器與數(shù)據(jù)中心作為千行百業(yè)的基礎(chǔ)設(shè)施建設(shè),將重新定義AI作為生產(chǎn)力的能量源泉,并以世界之力再造世界”。