人工智能是機(jī)遇也是挑戰(zhàn)。正如Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven在Arm技術(shù)大會(huì)的主題演講中所說:“人工智能的發(fā)展,對(duì)終端的性能和內(nèi)存需求提出了空前的挑戰(zhàn)。同時(shí)促使芯片、軟件和系統(tǒng)層面的供應(yīng)商面臨更高標(biāo)準(zhǔn)的要求!
Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven
“在過去多十年里,Arm已經(jīng)為此做了充分的準(zhǔn)備”,James McNiven強(qiáng)調(diào)。
AI 時(shí)代,芯片的變與不變
縱觀行業(yè)現(xiàn)狀,在人工智能到來前的大部分時(shí)間里,以 CPU 為代表的處理器所做的大部分工作都是各種數(shù)學(xué)運(yùn)算。然后,GPU 的出現(xiàn)給終端應(yīng)用帶來了更加逼真的圖形體驗(yàn)。隨著人工智能,尤其是通用人工智能 (AGI) 的橫空出世,芯片行業(yè)正經(jīng)歷一場(chǎng)從云端到終端的變革浪潮,AI芯片技術(shù)成為科技行業(yè)的焦點(diǎn),市場(chǎng)對(duì)芯片和算力的需求也變了。
在James McNiven看來,人工智能歸根結(jié)底還是要回歸到多樣化的應(yīng)用場(chǎng)景,這些場(chǎng)景的實(shí)現(xiàn)不僅依賴于可擴(kuò)展的計(jì)算平臺(tái),還要求該平臺(tái)具備出色的性能,以及能夠縮短客戶產(chǎn)品的上市時(shí)間。
多年來,GPU 和專門設(shè)計(jì)的 AI 芯片因?yàn)槠洫?dú)到之處,能夠在訓(xùn)練階段發(fā)揮重要的作用。但在推理方面,GPU 等芯片受困于高成本、高功耗等問題,并不太適宜。特別是在 AI 推理逐漸從云端和數(shù)據(jù)中心向邊緣設(shè)備遷移的趨勢(shì)下,越來越多的 AI 負(fù)載將在邊緣設(shè)備上完成。
于是,憑借卓越的靈活性與通用性,以及低功耗、低成本的特點(diǎn),高能效 CPU 再次成為市場(chǎng)焦點(diǎn),成為邊緣AI 推理的核心,并在 AI 應(yīng)用的各個(gè)階段都發(fā)揮著關(guān)鍵作用。作為一家與時(shí)俱進(jìn)的計(jì)算平臺(tái)公司,Arm洞察到了這一市場(chǎng)發(fā)展趨勢(shì),從幾年前開始就投身其中。
未雨綢繆,厚積薄發(fā)
眾所周知,讓 Arm 公司聲名大噪的是與其同名的 Arm 架構(gòu),其低功耗、高性能的特點(diǎn)使它成為全球應(yīng)用范圍最為普及的技術(shù)架構(gòu)。
據(jù)了解,早在 2005 年發(fā)布 Armv7-A 架構(gòu)的時(shí)候,Arm 就引入了 SIMD (Single Instruction Multiple Data:單指令多數(shù)據(jù))擴(kuò)展技術(shù),為一系列整型和浮點(diǎn)型提供單指令多數(shù)據(jù) (SIMD) 擴(kuò)展操作,讓終端開發(fā)者可以初探如何更好地加速機(jī)器學(xué)習(xí)負(fù)載;在 2016 年,Arm 在 Armv8-A 中又引入了 SVE(Scalable Vector Extension:可伸縮向量擴(kuò)展)技術(shù),增強(qiáng)了其向量處理能力。
James McNiven也直言,十多年前,Arm便開始了對(duì)AI技術(shù)的投入。尤其是到2021 年發(fā)布 Armv9之后,Arm 在人工智能市場(chǎng)的實(shí)力再上新臺(tái)階。
據(jù)James McNiven介紹,Armv9架構(gòu)是專門面向AI工作負(fù)載設(shè)計(jì)。除了引入SVE2 技術(shù)外,還引入了 SME( Scalable Matrix Extension,可伸縮矩陣擴(kuò)展 )和 SME2技術(shù),顯著提升了 Arm CPU 對(duì)現(xiàn)有人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 工作負(fù)載的處理能力,從而在各種 AI 驅(qū)動(dòng)的設(shè)備和應(yīng)用中帶來速度更快、響應(yīng)更靈敏的用戶體驗(yàn)。
具體而言,Arm SME 是一個(gè)建立在 SVE2 基礎(chǔ)之上的增強(qiáng)矩陣操作的架構(gòu)擴(kuò)展。與前者相比,SME新增了高效處理矩陣的能力。其關(guān)鍵功能包括:計(jì)算兩個(gè) SVE 向量的外積 (outer product)、矩陣塊 (tile) 的存儲(chǔ)、存取矩陣塊中的向量、向矩陣塊中插入向量和提取矩陣塊里的向量,包括 on-the-fly 矩陣轉(zhuǎn)置以及Streaming SVE 模式。
上表總結(jié)了 SME、SVE 和 SVE2 的主要功能
在 Arm 看來,Arm SME 是為了滿足當(dāng)前日益復(fù)雜和高能耗的 AI 和 ML 應(yīng)用需求,創(chuàng)新性地設(shè)計(jì)的 CPU 功能。除了加速現(xiàn)今的 AI,SME 也提供了在 Arm 架構(gòu)上處理不斷更新的生成式 AI 應(yīng)用的靈活性。
從Arm的季度財(cái)報(bào)來看,具備SME與SVE2等AI新功能的Armv9已占據(jù)Arm版稅營收的 25%,這主要來自智能手機(jī)市場(chǎng)的強(qiáng)勁表現(xiàn)。
從產(chǎn)品到平臺(tái),再接再厲
如果說架構(gòu)的升級(jí),是 Arm 從底層基礎(chǔ)對(duì) AI 的賦能。那么 Arm 終端 CSS (CSS for Client)的推出,則可以看作是 Arm 在上層應(yīng)用對(duì) AI 的支持。
過去,Arm 向客戶提供多樣化的 IP 授權(quán)服務(wù),并從中收取授權(quán)費(fèi)和版稅。在處理器領(lǐng)域,除了少部分拿到架構(gòu)授權(quán)的客戶外,Arm 主要為大多數(shù)客戶提供已經(jīng)設(shè)計(jì)好的 Arm Cortex-A、 Cortex-M和 Cortex-R 以及 Arm GPU 等產(chǎn)品;隨后,Arm還拓展出了Arm Neoverse平臺(tái)、Arm 全面計(jì)算解決方案 (Arm Total Compute Solutions)以及Arm Corstone,這些都已經(jīng)開始走向多個(gè)IP預(yù)集成驗(yàn)證的計(jì)算平臺(tái)。
這些平臺(tái)的推出,也推動(dòng)了 Arm 逐步轉(zhuǎn)型成為一家計(jì)算平臺(tái)解決方案供應(yīng)商。在全面計(jì)算解決方案于移動(dòng)終端取得成功之際,Arm 更進(jìn)一步,推出了 Arm 終端計(jì)算子系統(tǒng) (CSS)。
從 Arm 過去的介紹我們看到,Arm終端CSS 在進(jìn)階制程節(jié)點(diǎn)上集結(jié)了最新 Arm 計(jì)算 IP 及可立即生產(chǎn)的物理實(shí)現(xiàn),可滿足日益增長的計(jì)算效率需求,協(xié)助合作伙伴打造同級(jí)最佳的消費(fèi)應(yīng)用解決方案。通過Arm終端CSS,Arm不僅幫助芯片合作伙伴減少了開發(fā)工作量及縮短上市時(shí)間,同時(shí)提供了可擴(kuò)展的差異化能力,使他們能夠構(gòu)建出獨(dú)特且貼合市場(chǎng)需求的解決方案。
今年發(fā)布的Arm終端CSS搭載了最新的 Armv9.2 CPU 集群,集成了性能最高的 Arm Cortex-X925 CPU、最高效的 Arm Cortex-A725 CPU 和更新的 Arm Cortex-A520 CPU。這為 AI 和其他實(shí)際計(jì)算工作負(fù)載提供了前所未有的性能和效率。
值得一提的是,在聯(lián)發(fā)科最新發(fā)布的旗艦芯片天璣 9400 就采用了這個(gè)設(shè)計(jì)。其集成的 SVE2 可讓聯(lián)發(fā)科的芯片協(xié)助開發(fā)者和終端提升視頻和圖像處理,提供更好的照片質(zhì)量,并為用戶在觀看流媒體視頻和瀏覽社交媒體應(yīng)用程序時(shí)提供了更好的續(xù)航能力。
軟件也是Arm生態(tài)的重要組成,據(jù)了解,Arm 在軟件領(lǐng)域深耕30多年,與廣大的軟件生態(tài)伙伴共同在 Arm CPU 平臺(tái)上進(jìn)行了大量的軟件開發(fā)與優(yōu)化,目前全球基于Arm平臺(tái)進(jìn)行軟件開發(fā)的開發(fā)者人數(shù)已多達(dá) 2,000 萬。
James McNiven強(qiáng)調(diào),在軟件方面,Arm需要高度一致性的軟件平臺(tái),讓客戶只需要一次部署,就能將其應(yīng)用到所有應(yīng)用中;同時(shí),這些軟件也能幫助開發(fā)者更好地挖掘硬件性能;實(shí)現(xiàn)易用性和易訪問性的雙重保障!败浖亲 Arm 計(jì)算平臺(tái)獨(dú)樹一幟的原因,這也得益于公司擁有的龐大且卓越的軟件開發(fā)生態(tài)系統(tǒng)!彼M(jìn)一步補(bǔ)充道。
目前,通過持續(xù)壯大并打造開放且多樣化的生態(tài)系統(tǒng),Arm 正在支持 AI 時(shí)代下各領(lǐng)域的發(fā)展。
寫在最后
在過去多年里,Arm和眾多生態(tài)合作伙伴聯(lián)手,加速創(chuàng)新 AI 應(yīng)用的落地。James McNiven也重申,Arm能取得當(dāng)前的成績,合作伙伴的貢獻(xiàn)功不可沒。如圖所示,軟件和固件、先進(jìn)的晶圓廠支持、可靠的第三方IP以及專業(yè)的設(shè)計(jì)服務(wù),在AI時(shí)代,Arm強(qiáng)調(diào)與這些生態(tài)伙伴合作的緊密性將更勝以往。
在本屆的 Arm年度技術(shù)大會(huì)上,我們除了看到公司面向 AI 應(yīng)用帶來的上述產(chǎn)品和技術(shù)展示外,Arm 與中國生態(tài)伙伴的合作也是值得關(guān)注的亮點(diǎn)。作為 Arm 營收的重要貢獻(xiàn)來源之一,Arm 在中國的發(fā)展具有重要的參考。
例如本土手機(jī)大廠 vivo 與Am通過聯(lián)合實(shí)驗(yàn)室的合作形式,將vivo熟知的用戶場(chǎng)景向底層計(jì)算平臺(tái)Arm輸送,成為Arm底層計(jì)算架構(gòu)更新的關(guān)鍵參考要素。
中興微電子也與 Arm 深入合作,借助 Armv9 Neoverse技術(shù)使 5G 服務(wù)器芯片在性能和能效上均達(dá)到領(lǐng)先水平,為本地?cái)?shù)據(jù)中心的擴(kuò)展和 5G 應(yīng)用的部署提供了強(qiáng)有力的支持。
Arm在活動(dòng)上也官宣與騰訊合作,通過KleidiAI集成提升混元大模型端側(cè)AI性能。
James McNiven透露,根據(jù)Arm預(yù)估,截止2025年底,全球?qū)⒂?000億基于Arm架構(gòu)的設(shè)備能夠支持AI功能。尤其在當(dāng)前崛起的AI PC方面,Arm也將和合作伙伴一起,推動(dòng)這個(gè)新生態(tài)快速成長。
“過去兩年,Arm推出的CSS倍受歡迎,這個(gè)平臺(tái)也被推向了數(shù)據(jù)中心和智能終端等市場(chǎng)。未來,我們將加大在CSS的投入,并計(jì)劃在2025年推出汽車計(jì)算子系統(tǒng),助力客戶迎接市場(chǎng)變革帶來的巨大機(jī)遇。”James McNiven說。