在本次世界人工智能大會上,螞蟻除了發(fā)布多模態(tài)醫(yī)療大模型和大模型安全一體化解決方案“蟻天鑒”2.0版,還發(fā)布了“隱語Cloud”大模型密算平臺,并圍繞隱私計算產(chǎn)品通用安全分級和個人信息匿名化制度,聯(lián)合國內(nèi)多家產(chǎn)學(xué)研機構(gòu)聯(lián)合發(fā)布《個人信息匿名化制度白皮書:技術(shù)與法律(2024)》、《隱私計算產(chǎn)品通用安全分級白皮書》兩份白皮書。
相比更加貼近用戶的智能助手,隱私計算似乎離大眾相對遙遠和陌生,但數(shù)據(jù)要素在螞蟻集團未來的戰(zhàn)略中舉足輕重。
螞蟻集團董事長兼CEO井賢棟在今年數(shù)字中國建設(shè)峰會上表示:螞蟻面向未來十年的科技戰(zhàn)略有兩條主線,聚焦人工智能和數(shù)據(jù)要素,而隱語Cloud大模型密算平臺便代表螞蟻在數(shù)據(jù)要素領(lǐng)域的最新商業(yè)化進展。
今年5月31日,螞蟻成立了螞蟻密算科技,螞蟻集團副總裁兼首席技術(shù)安全官韋韜擔(dān)任董事長,釋放了一個關(guān)鍵信號螞蟻在可信數(shù)據(jù)流通領(lǐng)域已經(jīng)從技術(shù)探索開始走向市常
根據(jù)螞蟻的展望,在打通了數(shù)據(jù)孤島實現(xiàn)可信數(shù)據(jù)流通后,上至智能大模型開發(fā)、AI智能醫(yī)療,下至農(nóng)民小額貸款、新能源車險降價,數(shù)據(jù)要素流通將會徹底改變現(xiàn)在的行業(yè)生態(tài),推動密態(tài)計算的普惠化。
在今年世界人工智能大會期間,螞蟻密算董事長韋韜和CEO王磊向觀察者網(wǎng)闡述了關(guān)于螞蟻在密算領(lǐng)域的技術(shù)探索和商業(yè)藍圖。
AI短期看算力,長期看數(shù)據(jù)
作為近年來最火熱的賽道,AIGC的出現(xiàn)讓世界第一次見證了通用人工智能,這也讓不少人暢享AI即將改變未來的一切,然而AIGC的應(yīng)用領(lǐng)域依然存在不少的問題,在本次世界人工智能大會上就有嘉賓表示:“聰明的AI幫小忙,笨的AI捅大簍子”,AI在垂直行業(yè)還有巨大的發(fā)展和進步空間。
對于AI的現(xiàn)狀和前景,韋韜認(rèn)為AI目前發(fā)展屬于初級階段,但未來的前景極其光明。
他表示,目前AI領(lǐng)域發(fā)展僅僅處于發(fā)明蒸汽機時代。作為人類歷史上第一次通用動力,蒸汽機誕生時也很粗糙,這并不代表開始時汽車跑不過馬車就是蒸汽機的本質(zhì)問題,而是需要進一步的迭代升級。
不少AI產(chǎn)業(yè)界人士也有類似的看法,華為人工智能戰(zhàn)略與產(chǎn)業(yè)發(fā)展副總裁秦堯在人工智能大會《可信大模型助力產(chǎn)業(yè)創(chuàng)新》論壇上也表示,考慮到AI可能有50年發(fā)展進程,目前AI依然處于初級發(fā)展階段,有很大的進步發(fā)展空間。
而提到升級,去年以來,“算力恐慌”一直是國產(chǎn)廠商繞不過去的一個詞,對此韋韜有著不同的看法。
他認(rèn)為AI時代由算法,算力,數(shù)據(jù)三個核心要素構(gòu)成,三者目前均有進一步發(fā)展的空間,而相比算法和算力,數(shù)據(jù)才是限制AI能力上限的關(guān)鍵要素,無論在通用領(lǐng)域,還是專業(yè)的垂直領(lǐng)域,大模型最缺的都是數(shù)據(jù),現(xiàn)在的算力恐慌,未來反而有可能變成算力陷阱。
韋韜解釋道,目前大模型在推理層面由于成本和性能的限制,不可能用非常復(fù)雜的算力,因此所謂的缺算力其實是指訓(xùn)練時缺算力。而考慮到具體的使用場景,訓(xùn)練需要的算力其實存在上限,不會無限制的升高,盲目囤積算力反而可能會面臨過度投資和能耗瓶頸的風(fēng)險。
而比起可以克服的算力缺口,數(shù)據(jù)的缺口才是所有大模型企業(yè)面臨的更緊迫的共性問題。
當(dāng)沒有數(shù)據(jù)的時候,無論是更聰明的大模型,還是最聰明的人都是做不出決策的,要硬做決策只能盲猜或者胡說八道。目前普遍出現(xiàn)的AI不夠?qū)I(yè)的現(xiàn)象,本質(zhì)則是因為數(shù)據(jù)不足的原因,這個問題并不能靠算法和算力層面解決。
韋韜眼里,真正的行業(yè)專業(yè)應(yīng)用問題的解決,都是依賴于關(guān)鍵數(shù)據(jù)的供給能不能按需獲得,而中文語料的稀缺使得大模型無論在訓(xùn)練還是推理層面都存在較大數(shù)據(jù)供給缺口,也成為了限制大模型進一步發(fā)展的瓶頸。
要解決這個問題,最大的挑戰(zhàn)便是如何讓數(shù)據(jù),尤其是高質(zhì)量的數(shù)據(jù)流動起來讓其發(fā)揮自身的價值。
打破數(shù)據(jù)流通壁壘,是挑戰(zhàn)更是機遇
事實上,我國并不缺乏高質(zhì)量的數(shù)據(jù),但是現(xiàn)狀則是,鑒于對于數(shù)據(jù)安全和數(shù)據(jù)隱私的擔(dān)憂,越有價值的數(shù)據(jù),反而愈發(fā)難以流通。
與美國“重發(fā)展弱監(jiān)管”模式、歐洲的歐盟“強監(jiān)管弱發(fā)展”模式不同,我國遵循的是“既要安全也要發(fā)展”模式,這也導(dǎo)致在數(shù)據(jù)充分開發(fā)使用上挑戰(zhàn)更大。
想要實現(xiàn)數(shù)據(jù)流通,存在高昂的信任成本,韋韜表示:數(shù)據(jù)非常容易被拷貝、分割、加工、變形,本來你的數(shù)據(jù)產(chǎn)品應(yīng)該有1000個用戶、10000個用戶的,但你可能賣到第十家的時候,全行業(yè)都已經(jīng)有了,因為它非常容易被拷貝,所以商業(yè)利益也非常容易被侵害,大家也不愿意讓數(shù)據(jù)流通。更糟糕的時候,明文流通時它會泄露,泄露后又很難追蹤是誰泄露的,這件事情導(dǎo)致數(shù)據(jù)源方有巨大的連帶風(fēng)險,所以大家不敢流通。
而除了信任成本,數(shù)據(jù)的安全風(fēng)險也不容忽視。
去年5月,由于一個月內(nèi)出現(xiàn)三起內(nèi)部代碼泄露事件,三星徹底禁止員工使用ChatGPT,這也給國內(nèi)的企業(yè)敲響了警鐘,基于對大模型是否會拿數(shù)據(jù)二次訓(xùn)練從而泄露核心技術(shù)和商業(yè)機密的不確定性,大量公司不允許將涉及公司機密和商業(yè)信息的內(nèi)容輸入大模型。
而數(shù)據(jù)方對于數(shù)據(jù)安全的擔(dān)憂也并非杞人憂天。IBM《2023年度數(shù)據(jù)泄露成本報告》顯示,2023年數(shù)據(jù)泄露平均成本為445萬美元,其中82%數(shù)據(jù)泄露涉及云環(huán)境,而更為令人擔(dān)心的是,有三分之二的數(shù)據(jù)泄露當(dāng)事方甚至對此毫無知覺。
除開外部泄露風(fēng)險,內(nèi)鬼員工引發(fā)的公司數(shù)據(jù)泄露在國內(nèi)也屢見不鮮,近年來就有某招聘網(wǎng)站公司員工出售簡歷庫信息造成2500萬元損失,某快遞公司快遞員勾結(jié)外部人士泄露用戶信息造成1200萬損失等案件。
北京交通大學(xué)信息管理理論與技術(shù)國際研究中心(ICIR)特聘教授張向宏對此表示,過去幾年,數(shù)據(jù)市場主要面臨著三大問題:數(shù)據(jù)“供不出、流不動、用不好”,數(shù)據(jù)“不敢用、不能用、不好用”,數(shù)據(jù)“確權(quán)難、定價難、流通難”。在他看來,在數(shù)據(jù)要素化的過程中,這三大問題需要分別用資源(制度)、技術(shù)和商業(yè)模式的路徑來破解。
針對數(shù)據(jù)“供不出、流不動”,在頂層設(shè)計上,從中央到地方已經(jīng)開始出臺一系列政策《加快公共數(shù)據(jù)開發(fā)利用指導(dǎo)意見》《促進數(shù)據(jù)流通交易指導(dǎo)意見》《“數(shù)據(jù)要素×”三年行動計劃(20242026年)》等均在加速理順制度卡點。而根據(jù)國家數(shù)據(jù)局今年以來在公開官方場合的表態(tài)看,一系列落地細(xì)則和配套規(guī)則均在緊鑼密鼓推進中。
在數(shù)據(jù)流動的政策東風(fēng)之外,大模型行業(yè)的蓬勃發(fā)展對于數(shù)據(jù),尤其是高質(zhì)量數(shù)據(jù)的如饑似渴,也讓螞蟻看到了商業(yè)化的機遇,如果能夠給數(shù)據(jù)方吃“定心丸”,打通數(shù)據(jù)孤島,這不僅意味著大模型乃至整個AI行業(yè)的爆炸性發(fā)展,也代表螞蟻能夠?qū)⒆约涸跀?shù)據(jù)要素流通的儲備技術(shù)實現(xiàn)商業(yè)化,這也是螞蟻投入密態(tài)計算的契機。
韋韜表示,我們認(rèn)為數(shù)據(jù)密態(tài)是未來的必然趨勢,密算會成為數(shù)據(jù)可信流通的新算力。只有讓數(shù)據(jù)是密態(tài)方式流通的時候,才能發(fā)揮正向價值、控制負(fù)向風(fēng)險。現(xiàn)在有太多的數(shù)據(jù)源方不敢把數(shù)據(jù)拿出來,因為發(fā)揮數(shù)據(jù)價值的過程本身會造成泄露,而密態(tài)研發(fā)會把以前不能流通的數(shù)據(jù)流通起來,發(fā)揮數(shù)據(jù)價值。
7月5日,螞蟻密算在世界人工智能大會上發(fā)布“隱語Cloud”大模型密算平臺,“隱語Cloud”大模型密算平臺首批推出兩大服務(wù),分別為大模型密態(tài)托管和大模型密態(tài)推理。大模型密態(tài)托管,指模型提供方可以將模型加密后托管在平臺上,一鍵完成云上密態(tài)部署,保護模型資產(chǎn)不被泄漏和盜用;大模型密態(tài)推理,是指數(shù)據(jù)以密態(tài)形式完成推理,保護用戶交互時的數(shù)據(jù)安全、商業(yè)機密等。通過軟硬件結(jié)合的可信隱私計算技術(shù),在大模型托管和大模型推理等環(huán)節(jié)實現(xiàn)數(shù)據(jù)密態(tài)流轉(zhuǎn),保護模型資產(chǎn)、數(shù)據(jù)安全和用戶隱私。
今天的密算就是十年前的云計算
實際上,對于數(shù)據(jù)安全的需求,市面上已經(jīng)存在多家隱私計算公司提供相關(guān)的服務(wù),但是翻看行業(yè)發(fā)展,由于高昂的安全成本,不僅沒有公司近年來高速發(fā)展脫穎而出,甚至整個行業(yè)甚至顯得有些掙扎,學(xué)界甚至傳出了“不是隱私計算用不起,只是別的技術(shù)更有性價比”的言論,那么此時螞蟻決定進入這個賽道,能否給行業(yè)帶來變化呢?
對此王磊表示,數(shù)據(jù)安全客觀存在成本,目前行業(yè)客戶端用不起,企業(yè)端虧不起的現(xiàn)狀背后是隱私計算只能解決小規(guī)模的應(yīng)用,不僅很難實現(xiàn)規(guī);,賣軟件模式的高交付成本也將極大地給數(shù)據(jù)安全企業(yè)帶來經(jīng)營壓力。
對于螞蟻密算的商業(yè)模式,王磊認(rèn)為一方面隱語Cloud平臺通過用可信芯片和機密計算技術(shù)來協(xié)同保障,從而大幅度降低成本,實現(xiàn)低成本密態(tài)計算,形成行業(yè)里規(guī);瘧(yīng)用方案。
而另一方面,螞蟻密算試圖通過結(jié)果導(dǎo)向,通過保證安全來降低企業(yè)維護數(shù)據(jù)安全的額外成本,并通過數(shù)據(jù)獲利分成的方式,實現(xiàn)數(shù)據(jù)方和螞蟻密算的雙贏。
針對企業(yè)是否有必要購買數(shù)據(jù)安全服務(wù)的問題上,韋韜也坦承,并非所有數(shù)據(jù)企業(yè)均需要數(shù)據(jù)安全服務(wù),即便需要數(shù)據(jù)安全服務(wù),數(shù)據(jù)安全的等級需求也不盡相同,螞蟻密算計劃從高價值場景數(shù)據(jù)入手,最終實現(xiàn)行業(yè)的規(guī);l(fā)展。
對于密算領(lǐng)域的發(fā)展前景,韋韜表達了積極地看法:十幾年前,剛推出云計算的時候,大家覺得這不就虛擬化嘛,但真正上云后,上規(guī)模后,本質(zhì)的改變發(fā)生了。我們認(rèn)為算力從智算會走向密算,算力變化讓全行業(yè)有巨大的改變,演變的速度及對中遠期的影響比我們今天想象大得多。
對于目前客戶畫像和落地場景,螞蟻密算也分享了數(shù)個實際案例。
在新能源車保險領(lǐng)域,由于新能源車駕駛習(xí)慣,駕駛?cè)巳簩傩跃^傳統(tǒng)燃油車有所區(qū)別,但保險公司的數(shù)據(jù)不足,無法通過多維畫像對,為了覆蓋新能源車的額外風(fēng)險溢價,最終形成了新能源行業(yè)低電費,高保費的現(xiàn)狀,而通過密態(tài)計算,保險公司有從險的數(shù)據(jù),平臺的從人的數(shù)據(jù),以及從車的數(shù)據(jù)融合起來,更精準(zhǔn)判斷車主出險概率多大。螞蟻密算通過和人保財險、平安產(chǎn)險、太平洋產(chǎn)險多家保險公司合作,使得新能源車平均保費下降了8%。
而在金融領(lǐng)域,螞蟻密算則舉了一個農(nóng)民貸款的案例,過去由于貸款金額低,盡調(diào)成本高,農(nóng)民貸款一直是利潤微薄甚至是金融機構(gòu)不賺錢的領(lǐng)域,成為了金融服務(wù)難以覆蓋的盲區(qū)。
而農(nóng)業(yè)農(nóng)村部大數(shù)據(jù)發(fā)展中心與網(wǎng)商銀行、螞蟻集團聯(lián)合發(fā)起的“農(nóng)戶秒貸”服務(wù),基于隱語與星綻可信隱私計算技術(shù)棧,聯(lián)合搭建金融風(fēng)控模型,發(fā)起農(nóng)戶秒貸服務(wù)。截至2024年5月初,超過600萬種植戶獲得貸款額度,其中78.3%農(nóng)戶種植面積不到10畝,是以往金融服務(wù)難以覆蓋的人群。該項目還入選了2024年國家數(shù)據(jù)局“數(shù)據(jù)要素x”典型案例。
韋韜對觀察者網(wǎng)表示,基于現(xiàn)有的行業(yè)實踐,他對于行業(yè)的發(fā)展非常的樂觀,認(rèn)為最快三年,密算行業(yè)就將迎來高速發(fā)展階段。
行業(yè)發(fā)展不能靠單打獨斗
對于行業(yè)發(fā)展的終極形態(tài),韋韜描述為數(shù)據(jù)要素行業(yè)將從最初的數(shù)據(jù)孤島,就像自家水井一樣自產(chǎn)自銷,走向“桶裝水”式的點對點流通,接下來大規(guī)模數(shù)據(jù)流轉(zhuǎn)會發(fā)展為猶如“城市自來水網(wǎng)”的行業(yè)、區(qū)域間可信流通,走向未來更廣域的可信流通,形成綜合水利工程。大模型產(chǎn)業(yè)及各種數(shù)據(jù)要素的應(yīng)用場景,都能充分應(yīng)用數(shù)據(jù)要素價值,實現(xiàn)跨行業(yè)、跨地域和跨云可信流轉(zhuǎn)和互聯(lián)互通。
想要實現(xiàn)這樣的商業(yè)生態(tài),除了企業(yè)層面的技術(shù)實力,行業(yè)技術(shù)生態(tài)和技術(shù)體系標(biāo)準(zhǔn)也不可或缺。
而想要實現(xiàn)數(shù)據(jù)流通,面臨的兩個最現(xiàn)實問題便是個人隱私的保護,當(dāng)數(shù)據(jù)不在某一個封閉系統(tǒng)內(nèi)單獨流轉(zhuǎn)而變成互聯(lián)互通,如何保障個人信息隱私成為了行業(yè)發(fā)展的重要課題。
值得注意的是,在本次人工智能大會上發(fā)布了《個人信息匿名化制度白皮書:技術(shù)與法律(2024)》,由對外經(jīng)濟貿(mào)易大學(xué)、大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進委員會和螞蟻集團共同發(fā)布。這是學(xué)術(shù)與產(chǎn)業(yè)界首次聯(lián)合從技術(shù)與法律雙重維度對個人信息匿名化問題做系統(tǒng)性梳理與闡釋、探尋可落地技術(shù)方案與數(shù)據(jù)流通解決路徑。
而在提出了個人信息匿名化制度的同時,如何建立行業(yè)標(biāo)準(zhǔn),讓產(chǎn)業(yè)落地也成了行業(yè)發(fā)展的核心問題。
目前,由于隱私計算技術(shù)路線眾多,在產(chǎn)業(yè)落地應(yīng)用中出現(xiàn)“講不清”“看不懂”“不敢用”的情況。隱私計算產(chǎn)品需要安全分級方法,可以為實際產(chǎn)品選型提供指導(dǎo),讓隱私計算技術(shù)在產(chǎn)業(yè)界得到大規(guī)模落地。
當(dāng)前,雖然針對單一技術(shù)路線已經(jīng)有一些安全分級標(biāo)準(zhǔn),但是不同技術(shù)路線的分級標(biāo)準(zhǔn)完全無法對應(yīng),用戶無法對所有的產(chǎn)品進行橫向比較,這些標(biāo)準(zhǔn)也不適用于新出現(xiàn)的技術(shù)路線。因此,適用所有技術(shù)路線的通用安全分級思路亟需明確,來引導(dǎo)數(shù)據(jù)跨域流通不同技術(shù)的安全評估工作。
為了解決這個問題,在本次人工智能大會上發(fā)布了《隱私計算產(chǎn)品通用安全分級白皮書》
該白皮書由螞蟻集團、中國通信標(biāo)準(zhǔn)化協(xié)會大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進委員會、深圳國家金融科技測評中心、清華大學(xué)牽頭編寫,另有國內(nèi)16家機構(gòu)參與編寫。編寫指導(dǎo)組成員包括中國科學(xué)院院士、國際密碼協(xié)會會士王小云,浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院院長、區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室副主任任奎等權(quán)威學(xué)者。
在本次人工智能大會上,螞蟻集團董事長井賢棟表示,未來智能化的用戶體驗,一定不是只靠一個大模型,而是需要全行業(yè)深度協(xié)作,需要很多的專業(yè)智能體共同參與、各司其職。螞蟻堅持走開放道路,和行業(yè)共建專業(yè)智能體生態(tài)。
而對于螞蟻密算而言,本次白皮書的發(fā)布也代表了螞蟻準(zhǔn)備深耕數(shù)據(jù)要素賽道,和合作伙伴共建行業(yè)生態(tài)和行業(yè)標(biāo)準(zhǔn)的決心。
螞蟻集團CTO何征宇曾描述過螞蟻未來的發(fā)展路線,螞蟻的第一個十年聚焦于支付,第二個十年聚焦于金融,那么螞蟻的第三個十年的重點便在于科技,螞蟻希望未來成為大眾眼中的一家科技公司。
在本次人工智能大會上,韋韜則描述了他眼中螞蟻密算的使命:“螞蟻集團是非常篤定相信數(shù)據(jù)的價值,我們的業(yè)務(wù)是也很依賴于數(shù)據(jù)。我們認(rèn)為數(shù)據(jù)要素的流通將為全社會、全行業(yè)帶來巨大的變革,這個變革是非常深遠的。螞蟻密算的使命是通過密算科技推動數(shù)據(jù)可信流通。”
自從2016年開始在隱私計算開啟探索,到如今數(shù)據(jù)要素成為螞蟻集團科技核心戰(zhàn)略并成立密算公司開啟商業(yè)化,在未來的人工智能時代,螞蟻不僅想做C端的多模態(tài)智能助理,更想做B端的賣鏟人。