機(jī)器之心報(bào)道
編輯:澤南
生成式 AI 的驅(qū)動(dòng)力,就在這塊「至尊」芯片上?
身處 2024 年末的我們,已經(jīng)能感覺(jué)到大模型就在身邊。
新一代的旗艦手機(jī)上,動(dòng)態(tài)壁紙、AI 畫(huà)圖、語(yǔ)音通話總結(jié)等功能一字排開(kāi),常用功能也有了新技術(shù)加持。
智能手機(jī)現(xiàn)在獲得了與現(xiàn)實(shí)世界互動(dòng)的能力。你可以拍照直接問(wèn)手機(jī)「看到了什么」,它既能向你進(jìn)行介紹,也可以對(duì)畫(huà)面進(jìn)行圖像增強(qiáng)。
AI 領(lǐng)域最前沿的智能體也被塞進(jìn)了手機(jī),它可以像人類(lèi)一樣點(diǎn)擊屏幕操縱不同的 App。你可以拿起手機(jī)用自然語(yǔ)言給出指令:「點(diǎn)三杯瑞幸的美式咖啡,大杯!惯^(guò)一會(huì)兒 AI 就自動(dòng)把外賣(mài)的店鋪、商品和口味選好了,只等你來(lái)付款。
在新一代大模型和芯片的加持下,很多 AI 手機(jī)的體驗(yàn)有了質(zhì)的升級(jí),新引入的能力包括但不限于端側(cè) AI 智能體、多模態(tài)大模型應(yīng)用、視頻 AI 消除、超級(jí) AI 助手等等。
值得注意的是,這些生成式 AI 的背后,都是高通的「驍龍 8 至尊版」在提供動(dòng)力。作為業(yè)界最新的旗艦 SoC,它不負(fù)眾望,在部分性能上對(duì)同行實(shí)現(xiàn)了「降維打擊」。不僅有顛覆性的性能提升,還有跨時(shí)代的體驗(yàn)升級(jí)。
驍龍 8 至尊版:桌面級(jí)性能,移動(dòng)端的能效
今年的驍龍究竟通過(guò)什么引發(fā)了端側(cè) AI 的質(zhì)變?
說(shuō)到「驍龍 8 至尊版」,就不得不從今年如火如荼的 AI PC 領(lǐng)域說(shuō)起。
今年 6 月,微軟發(fā)布了專(zhuān)為 AI 設(shè)計(jì)的「Windows 11 + PC」。它是迄今為止速度最快、最智能的 Windows 個(gè)人電腦。憑借其中搭載的驍龍 X 系列 PC 平臺(tái),能夠?qū)崿F(xiàn)超過(guò) 45 TOPS(每秒萬(wàn)億次操作)的 AI 算力,與此同時(shí)電池續(xù)航時(shí)間長(zhǎng)達(dá)一整天。
這種新類(lèi)型的 PC 結(jié)合先進(jìn)的端側(cè)大模型技術(shù),擁有一系列獨(dú)特的 AI 能力,不僅可以感知、理解世界的多模態(tài)信息,還能與人進(jìn)行自然的交流,并執(zhí)行復(fù)雜任務(wù)。
微軟官方表示:在很長(zhǎng)一段時(shí)間里,這是「獨(dú)占」的能力。Windows 11 中的部分生成式 AI,只有在搭載 Oryon CPU 的驍龍芯片上才能正常運(yùn)行。
沒(méi)過(guò)幾個(gè)月,這種級(jí)別的能力就進(jìn)入到了手機(jī)上。在上個(gè)月的驍龍峰會(huì)上,高通正式推出驍龍 8 至尊版(Snapdragon 8 Elite)移動(dòng)平臺(tái),它是目前全球速度最快的移動(dòng)端系統(tǒng)級(jí)芯片。
與上一代驍龍 8 Gen3 相比,驍龍 8 至尊版在 CPU 單核、多核性能直接提升 45%,GPU 性能提升 40%,NPU 輸出的速度達(dá)到了 70+Tokens 每秒,與此同時(shí)整體 SoC 功耗還降低了 40%。
在性能提升的背后,驍龍 8 至尊版從里到外,有了脫胎換骨的改變:
首先是 CPU,它成功地把高通自研架構(gòu)的桌面級(jí)能力帶到了手機(jī)上,采用第二代定制高通 Oryon CPU,由兩個(gè)主頻為 4.32 GHz 的「超級(jí)內(nèi)核」和六個(gè)頻率 3.53 GHz 的性能內(nèi)核組成,取消了以往的能效核,既提供更好的性能,又提升了功耗效率。
GPU 方面,高通對(duì) Adreno GPU 架構(gòu)進(jìn)行了重新設(shè)計(jì),為每個(gè)切片分配了專(zhuān)用內(nèi)存,性能提升了 40%,功耗降低 40%,光線追蹤性能也提升了 35%。
AI 能力方面,在驍龍 8 至尊版上,全新架構(gòu)的 Hexagon NPU 性能提升 45%,能效提升 45%,這得益于所有加速器內(nèi)核的吞吐量提升。此外,結(jié)合全面提升的 CPU 和 GPU,該芯片能夠跨所有核心動(dòng)態(tài)管理 AI 負(fù)載,相比上一代,基礎(chǔ)大語(yǔ)言模型 token 生成速率提升了 100%。
在這些新技術(shù)的加持下,搭載驍龍新平臺(tái)的智能手機(jī)不僅可以滿幀跑 3A 游戲大作,還可以運(yùn)行一系列終端側(cè)多模態(tài)生成式 AI 應(yīng)用,帶來(lái)改變?nèi)藗兪褂昧?xí)慣的體驗(yàn),包括強(qiáng)大的 AI 影像功能、下一代游戲 AI、超級(jí)智能助手等。
重構(gòu)的不止硬件:大模型優(yōu)化「呼朋喚友」
除了芯片本身,高通在做的另一件事是軟硬件的整合。驍龍 8 至尊版的發(fā)布幾乎被辦成了一場(chǎng)生成式 AI 技術(shù)的 Demo 大會(huì)。
這塊移動(dòng)芯片的發(fā)布,獲得了各路科技公司大佬的祝福。在發(fā)布時(shí),OpenAI CEO 山姆·奧特曼、微軟 CEO 薩提亞·納德拉、Meta CEO 馬克·扎克伯格等人紛紛連線進(jìn)行了背書(shū)。
這三位分別闡述了生成式 AI 在 PC、增強(qiáng)現(xiàn)實(shí)設(shè)備、大模型應(yīng)用等方向的愿景。此時(shí)此刻,他們都把目光聚焦在了端側(cè) AI 上。
正如奧特曼所說(shuō),云端和端側(cè)的生成式 AI 形態(tài)是互相成就的關(guān)系:服務(wù)器擅長(zhǎng)訓(xùn)練大模型,而利用端側(cè)設(shè)備的算力則可以保護(hù)個(gè)人隱私,同時(shí)提升服務(wù)的可靠性。
由于大語(yǔ)言模型相當(dāng)耗費(fèi)算力,此前生成式 AI 的技術(shù)落地大多是在云端,將更多能力部署在端側(cè)則是未來(lái)的必然趨勢(shì)。除了微軟、Meta 等硅谷巨頭,很多國(guó)內(nèi)廠商也同高通在新一代硬件上展開(kāi)了合作。
致力于對(duì)標(biāo) OpenAI 的智譜就與高通共同宣布,已圍繞驍龍 8 至尊版,對(duì)最新一代端側(cè)視覺(jué)大模型 GLM-4V 進(jìn)行了深度適配和推理優(yōu)化。在端側(cè)部署后,手機(jī)等設(shè)備現(xiàn)在已可以支持豐富的多模態(tài)交互方式,讓人們獲得更加情境化、個(gè)性化的終端側(cè)智能體驗(yàn)。
國(guó)內(nèi)大廠騰訊的混元大模型,也在高通的幫助下完成了端側(cè)部署,在驍龍 8 至尊版移動(dòng)平臺(tái)上,混元大模型 7B 和 3B 版本展示了優(yōu)化后的運(yùn)行表現(xiàn)。
結(jié)合高通完善的 AI 軟件棧,包括高通 AI 模型增效工具包(AIMET)等,驍龍 8 至尊版可以為大語(yǔ)言模型提供從底層硬件到框架的全面優(yōu)化。通過(guò)使用基于硬件的 INT4 量化技術(shù),驍龍大幅提升了混元大模型在終端側(cè)的運(yùn)行效率,端側(cè)推理可以做到首個(gè) token 生成時(shí)延僅有 150ms,解碼速率超過(guò)了 30 token/s。
此前,騰訊混元大模型已為騰訊自家的大量 App 提供了底層支持,包括微信輸入法、騰訊手機(jī)管家、QQ、騰訊視頻、QQ 瀏覽器、企業(yè)微信、騰訊會(huì)議等,覆蓋超過(guò) 700 個(gè)業(yè)務(wù)場(chǎng)景。
在經(jīng)過(guò)高通技術(shù)棧的深度優(yōu)化后,很多亟待落地的大模型已經(jīng)達(dá)到了端側(cè)可用的程度。
比如,騰訊手機(jī)管家的短信智能識(shí)別功能,基于混元端側(cè)模型現(xiàn)在已經(jīng)跑通,具備了更強(qiáng)的語(yǔ)義理解能力,可以更準(zhǔn)確地理解短信意圖,短信召回率提高了將近 200%,識(shí)別準(zhǔn)確率提升 20%。由于短信經(jīng)常會(huì)涉及用戶的個(gè)人信息,端側(cè) AI 還可以在保證出色性能的同時(shí),有效保護(hù)用戶的個(gè)人信息隱私安全。
經(jīng)過(guò)高通與合作伙伴們的整合,端側(cè)大模型從芯片到應(yīng)用的優(yōu)化路徑得以打通。或許在未來(lái)的某一天,你會(huì)發(fā)現(xiàn)天天在用的 App 在某次更新后,就多出了生成式 AI 功能。
端側(cè) AI 堆棧,合縱連橫
推出了至尊版芯片的高通,其想要拓展的版圖還不止 PC 和移動(dòng)端。
高通 CEO 安蒙在驍龍峰會(huì)上表示:「高通一直是推動(dòng)無(wú)線通信產(chǎn)業(yè)發(fā)展進(jìn)程的公司,也是最專(zhuān)注于無(wú)線技術(shù)的公司。但我們也積極迎接變化,高通不僅僅是一家專(zhuān)注無(wú)線連接的公司,更將成為連接的計(jì)算公司以適應(yīng)新時(shí)代的人工智能處理。更令人振奮的是,驍龍現(xiàn)在不僅引領(lǐng)著移動(dòng)行業(yè)的創(chuàng)新,還在推動(dòng)著其他行業(yè)的進(jìn)步!
上個(gè)月與驍龍 8 至尊版一同發(fā)布的芯片,還有驍龍座艙至尊版(Snapdragon CocKpit Elite)和驍龍 Ride 至尊版(Snapdragon Ride Elite)平臺(tái),它們專(zhuān)為汽車(chē)定制,分別面向智能座艙和自動(dòng)駕駛。
其中,驍龍座艙至尊版使用的 Oryon CPU 圍繞車(chē)用平臺(tái)進(jìn)行了多方面的提升。它的 CPU 算力較上一代提升了三倍,AI 性能也有飛躍式增長(zhǎng),達(dá)到了前代產(chǎn)品的 12 倍。此外它也通過(guò)軟件虛擬化和多操作系統(tǒng)等機(jī)制,支持實(shí)現(xiàn)了車(chē)機(jī)任務(wù)的靈活的集中式處理,滿足了汽車(chē)安全標(biāo)準(zhǔn)。
現(xiàn)在,車(chē)廠能夠在同一塊 SoC 上無(wú)縫運(yùn)行數(shù)字座艙和智能駕駛等功能,真正實(shí)現(xiàn)了近年來(lái)一直在追求的硬件架構(gòu)統(tǒng)一。
驍龍座艙至尊版平臺(tái)和 Snapdragon Ride 至尊版平臺(tái)將于 2025 年出樣。理想汽車(chē)已經(jīng)官方宣布,將率先搭載高通最新發(fā)布的驍龍至尊版汽車(chē)平臺(tái)。
在驍龍峰會(huì)上,理想展示了自家智能座艙的一系列功能,從語(yǔ)音助手、旅行助手到智能問(wèn)答。
驍龍至尊版汽車(chē)平臺(tái)是驍龍「數(shù)字底盤(pán)」解決方案組合中的最新產(chǎn)品,除了高算力的芯片,高通還提供智能駕駛和 AI 軟件棧體系,提供端到端的智能駕駛系統(tǒng),具備視覺(jué)感知、傳感器融合、路徑規(guī)劃、定位和整車(chē)控制等先進(jìn)特性。
在采用 Oryon CPU 的驍龍 8 至尊版發(fā)布之后,再加上高通自研的 Adreno GPU、Spectra ISP 和 Hexagon NPU 等,高通補(bǔ)齊了自研 SoC 的最后一塊拼圖,也統(tǒng)一了 PC、手機(jī)、汽車(chē)三條產(chǎn)品線的芯片架構(gòu)。
自研芯片架構(gòu)的意義,在于能夠根據(jù)不同產(chǎn)品線的需求,對(duì) CPU 進(jìn)行微架構(gòu)層面的調(diào)優(yōu)和定制。與此同時(shí),高通 AI 軟件棧(AI Stack)也在不同產(chǎn)品線的 AI 部署中作用顯著。
至此,從芯片、大模型到 App 的縱向,以及從手機(jī)、PC 到汽車(chē)的橫向,高通已經(jīng)做到了 AI 能力的全鏈路打通。
正如大模型公司不斷通過(guò)新技術(shù)優(yōu)化降低大模型使用門(mén)檻,高通的布局正在幫助眾多 OEM 廠商和應(yīng)用公司,把越來(lái)越多的生成式 AI 技術(shù),從不可能變?yōu)榭赡堋?br/>
生成式 AI 可能會(huì)「無(wú)處不在」
大模型的落地推動(dòng)到現(xiàn)在,人們已經(jīng)越來(lái)越重視起端側(cè)能力的體驗(yàn)。
從 AI 技術(shù)領(lǐng)域里,研究「小模型」(SLM)的趨勢(shì)開(kāi)始,在科技公司的努力下,端側(cè)模型從文本到圖像,再到多模態(tài)的一步步逐步落地。如今,高通端側(cè)芯片的 AI 能力,完整的開(kāi)發(fā)平臺(tái)以及統(tǒng)一的生態(tài)體系,已經(jīng)為生成式 AI 的大規(guī)模應(yīng)用鋪平了道路。
不過(guò),高通的「至尊版」芯片只是起點(diǎn)。經(jīng)由全鏈路的技術(shù)推動(dòng),我們還將見(jiàn)證不久的未來(lái),很多事物改頭換面。
其實(shí)在最近的發(fā)布活動(dòng)中,我們已經(jīng)看到了端倪。在《永劫無(wú)間》手游的測(cè)試版本中,驍龍 8 至尊版除了利用 CPU、GPU 能力帶來(lái)高幀且穩(wěn)定的游戲體驗(yàn),還在端側(cè)跑起了 18 億參數(shù)的大語(yǔ)言模型。配合高通 AI 軟件棧從硬件到軟件的全棧優(yōu)化,網(wǎng)易在手游的端側(cè)直接打造出了 AI 隊(duì)友功能。
現(xiàn)在,玩家們?cè)谟螒蚶飺碛辛丝梢哉Z(yǔ)音交互的 AI 隊(duì)友,他們?cè)趹?zhàn)斗過(guò)程中不僅能夠聽(tīng)玩家指令行事,還會(huì)在你不會(huì)的時(shí)候進(jìn)行提示。
如果說(shuō)在手游這樣高能耗的應(yīng)用上,我們已能用得起大模型的智能體,那么在日常的應(yīng)用上,AI 智能體就更可以為我們架起橋梁,讓很多功能實(shí)現(xiàn)高度的自動(dòng)化,甚至消除 App 之間的壁壘。再延伸到 AI PC、汽車(chē)甚至機(jī)器人,高通的技術(shù)棧,或許還能把不同的硬件連成一體。
正如奧特曼所說(shuō),高通在所有邊緣端設(shè)備上都擁有強(qiáng)大的技術(shù),能夠應(yīng)用 AI 模型匯集全球幾十億用戶,F(xiàn)在僅僅是生成式 AI 的開(kāi)始,未來(lái)將會(huì)出現(xiàn)什么?是發(fā)揮想象力的時(shí)候了。