近日,在中國信息通信研究院(以下簡稱“信通院”)組織的首批“面向大模型的增強(qiáng)型可信執(zhí)行環(huán)境基礎(chǔ)能力專項(xiàng)測試”中,螞蟻數(shù)科順利完成全部測試內(nèi)容,成為首批通過此項(xiàng)測評的廠商。據(jù)了解,這也是信通院今年首次開設(shè)的全新資質(zhì)測評方向,首批共有3家廠商通過。
《面向大模型訓(xùn)練與推理數(shù)據(jù)保護(hù)的可信執(zhí)行環(huán)境技術(shù)要求》是信通院云計(jì)算與大數(shù)據(jù)研究所依托中國通信標(biāo)準(zhǔn)化協(xié)會大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(CCSA TC601),聯(lián)合30余家企業(yè)的專家共同編制,旨在為可信執(zhí)行環(huán)境產(chǎn)品/集群在面向大模型場景時(shí)的研發(fā)、測試、評估和驗(yàn)收提供參考和指引。
據(jù)此標(biāo)準(zhǔn)形成的測試方法共覆蓋數(shù)據(jù)工程、模型訓(xùn)練支持、模型推理支持、硬件加速、安全要求五大能力域,包含數(shù)據(jù)增強(qiáng)、模型管理、環(huán)境安全和數(shù)據(jù)安全等16個(gè)子能力域,共計(jì)57個(gè)測試項(xiàng)。
當(dāng)前,通用人工智能正在加速從“以模型為中心”向“以數(shù)據(jù)為中心”轉(zhuǎn)變,高質(zhì)量、大規(guī)模數(shù)據(jù)集愈加重要。然而,高質(zhì)量數(shù)據(jù)集普遍以孤島形式存在,限制了大模型在產(chǎn)業(yè)應(yīng)用中落地。為實(shí)現(xiàn)可信的多方聯(lián)合訓(xùn)練與推理,以可信執(zhí)行環(huán)境、聯(lián)邦學(xué)習(xí)為代表的隱私計(jì)算是可行的技術(shù)解法。
大模型在訓(xùn)練和推理過程中,都可能會導(dǎo)致用戶個(gè)人隱私及企業(yè)核心數(shù)據(jù)等重要敏感信息泄露,對大模型落地應(yīng)用的安全性提出了更高要求。螞蟻數(shù)科自主研發(fā)的摩斯安全計(jì)算平臺通過差分隱私、聯(lián)邦大模型拆分和跨域微調(diào)、模型混淆、可信硬件等多種隱私計(jì)算技術(shù)相結(jié)合的獨(dú)創(chuàng)性方案,能在各方原始數(shù)據(jù)不出域的情況下,實(shí)現(xiàn)大模型的數(shù)據(jù)輸入、微調(diào)、推理全鏈路數(shù)據(jù)安全和模型隱私保護(hù)。
據(jù)了解,在軟件層面,摩斯大模型隱私保護(hù)產(chǎn)品,在原有大模型使用鏈路上疊加隱私計(jì)算能力,進(jìn)行數(shù)據(jù)和模型雙重保護(hù),并支持大模型隱私微調(diào)和安全推理,可實(shí)現(xiàn)微調(diào)精度損失可控、隱私推理性能提升、密文吞吐量有效提升、算力可擴(kuò)展,并支持云部署、一體機(jī)、自有算力等多種部署方式。在硬件層面,結(jié)合適配于可信執(zhí)行環(huán)境的加速硬件,可實(shí)現(xiàn)隱私推理性能和密文吞吐量進(jìn)一步提升。并主要基于Intel SGX和TDX、AMD SEV、海光CSV、NVIDIA CC等可信計(jì)算硬件及螞蟻?zhàn)匝械臋C(jī)密計(jì)算底座構(gòu)建起隱私計(jì)算大模型系統(tǒng),滿足多場景中的安全性需求。
公開信息顯示,螞蟻數(shù)科持續(xù)深耕區(qū)塊鏈、隱私計(jì)算及AI技術(shù),其持有的隱私計(jì)算專利數(shù)連續(xù)多年排名全球第一。在全球頂尖賽事iDASH國際隱私計(jì)算大賽中,螞蟻數(shù)科累計(jì)獲得六項(xiàng)冠軍,覆蓋多方安全計(jì)算、機(jī)密計(jì)算、聯(lián)邦學(xué)習(xí)等賽道。據(jù)IDC發(fā)布的《2022中國隱私計(jì)算平臺市場份額》報(bào)告,螞蟻數(shù)科以36.9%的市場份額位居第一。