Tech星球(微信ID:tech618)
文|陳橋輝
封面來源|圖蟲創(chuàng)意
AI已成為各大科技巨頭角逐的關(guān)鍵賽道,而螞蟻集團(tuán)在AI領(lǐng)域的密集布局,愈發(fā)引人注目。2024年12月30日,支付寶宣布推出新一代AI視覺搜索產(chǎn)品“探一下”,基于自研的多模態(tài)大模型技術(shù),可“用AI之眼探索萬物”,提供更快速、有用、趣味的生成式搜索服務(wù)。螞蟻的AI布局,早就有跡可循,板塊也愈發(fā)清晰。過去兩年,螞蟻?zhàn)越巳f卡異構(gòu)算力集群,自研了百靈大語言模型和多模態(tài)大模型;應(yīng)用層面,推出三大AI管家,讓AI“有手有腳”能辦事,開拓全新的辦事型AI形態(tài);生態(tài)方面,以支付寶商業(yè)生態(tài)為主陣地,發(fā)布智能體開發(fā)平臺“百寶箱”,為千萬商家打造AI“掘金鏟”。久未露面的馬云,也公開表達(dá)了AI之于螞蟻的動能。他在螞蟻20周年晚會上表示,“未來的20年,AI時(shí)代所帶來的巨大的變革,會超出所有人的想象”。毫無疑問,螞蟻正在嘗試以支付寶為核心,用AI加速科技驅(qū)動力。未來的螞蟻,AI或?qū)蔀槠渲匾牡咨,甚至是打造新螞蟻的推進(jìn)器。
借AI“探”萬象
相比于大廠熱衷布局的AI社交、AI視頻、AI音樂等熱門賽道不同,此次支付寶通過推出“探一下”,則切入了一條全新的生成式AI視覺搜索賽道。Tech星球體驗(yàn)發(fā)現(xiàn),“探一下”是基于螞蟻百靈多模態(tài)大模型技術(shù)的AI產(chǎn)品,相比于傳統(tǒng)的視覺識別產(chǎn)品,“探一下”可以提供更快速、有用、趣味的生成式搜索服務(wù)。用戶在支付寶首頁點(diǎn)擊 “掃一掃” 后往左劃,即可找到 “探一下”的入口,在支小寶App也能快速訪問。進(jìn)入“探一下”的主界面后,只需定格攝像頭所捕捉的畫面,系統(tǒng)便會開始分析并生成結(jié)果。
圖注:支付寶“掃碼”旁邊就是“探一下”。
不同于以往的掃五福等玩法,運(yùn)用的都只是圖片識別技術(shù)。支付寶上線的“探一下”,除了融合原有的AR掃之外,還有三個(gè)特色核心功能探知識、探靈感、探文本,兼具實(shí)用性和趣味性!疤街R”是對內(nèi)容進(jìn)行識別,在捕捉畫面主體后主動生成識別結(jié)果,并基于此進(jìn)行發(fā)散性的信息智能推薦。探知識的使用場景并不少,在生活、旅行、學(xué)習(xí)、購物等場景中,都有著很大需求。譬如,用戶在購買手機(jī)時(shí),不僅可以通過 “探知識” 直觀地看到手機(jī)的配置信息、設(shè)計(jì)靈感等知識,還可以通過其附帶的“探商品”入口,跳轉(zhuǎn)至商品界面,完成從了解手機(jī)到購買手機(jī)的鏈路。
“探文本”也是基礎(chǔ)的通用功能,可用于文本提取和翻譯。譬如,對于跨境游客、跨境商家和海淘買家大有作用,遇到外文菜單或商品詳情頁,就可以快速提取關(guān)鍵信息并翻譯。除此之外,“探一下”還有“探靈感”的功能,Tech星球發(fā)現(xiàn),在小紅書內(nèi),“探靈感”成為了不少用戶討論最多的一個(gè)功能。一位用戶直言,“探靈感”讓內(nèi)容有了生命。從AI的視角看,這種生命感,源自“探靈感”讓內(nèi)容被AI賦予了特別的視角濾鏡。譬如,可用幽默或治愈的視角,對靜態(tài)圖片進(jìn)行趣味解讀,讓你在網(wǎng)上曬圖再也不愁寫啥文案。
總體上,“探一下”是一款具有創(chuàng)新性和實(shí)用性的生成式AI視覺搜索產(chǎn)品。不過,從目前的使用體驗(yàn)來看,也還有待完善的地方,例如,會受到光線、角度、距離等實(shí)際場景因素的影響,導(dǎo)致識別結(jié)果不準(zhǔn)確或出現(xiàn)錯誤。
從“搜”到“探”,引領(lǐng)下一代AI視覺搜索
搜索誕生20年,一直致力于幫助用戶更平等地獲取信息。傳統(tǒng)搜索一直在進(jìn)化,信息輸入方式從手動打字到語音喚醒、圖片識別,但始終未能煥新呈現(xiàn)結(jié)果。在Make 2024釘釘生態(tài)大會上,釘釘COO傅徐軍在接受媒體采訪時(shí)還談及了傳統(tǒng)搜索引擎難用的更多原因。他表示,傳統(tǒng)的搜索檢索到的大量信息是碎片化、離散化、非結(jié)構(gòu)化的。這背后折射出的是傳統(tǒng)搜索模式基于關(guān)鍵詞匹配的低效,較難精準(zhǔn)理解用戶的真實(shí)意圖,僅僅是機(jī)械羅列可能相關(guān)的內(nèi)容。而用戶得到想要的內(nèi)容,還需要在搜索到的內(nèi)容中進(jìn)行二次甚至多次檢索。生成式AI技術(shù)讓搜索有了革新的可能。不少企業(yè)正在嘗試革新搜索,比如搜索鼻祖Google旗下的視覺搜索產(chǎn)品Google Lens。Google Lens近年來不斷拓展功能邊界,比如增加視頻搜索與語音輸入等形式,然而其核心依然是圍繞傳統(tǒng)搜索以“搜”為主的理念的修補(bǔ),比如Google Lens生成的內(nèi)容必須鏈接到Google自己的搜索結(jié)果,但是Google自己的結(jié)果跟內(nèi)容生態(tài)并不是為視覺入口去設(shè)計(jì)的,很多還是基于文本的一個(gè)入口;國內(nèi)的識別類AI則專注于花草等識別,卻也只是在細(xì)分領(lǐng)域深耕細(xì)作,未能投入大規(guī)模應(yīng)用。在支付寶探一下業(yè)務(wù)負(fù)責(zé)人蔡偉看來:未來的搜索有兩大發(fā)展趨勢,第一個(gè)趨勢就是從搜索到生成;第二個(gè)趨勢是從文本主導(dǎo)的交互走向多模態(tài)交互。技術(shù)極客們的終極目標(biāo),正是希望用戶一次就可以得到滿意的答案和服務(wù)。這是探一下和其他搜索工具的核心區(qū)別。探一下通過視覺大模型的識別和思考后,基于生成式AI技術(shù)給出系統(tǒng)性的答案,而不是碎片化的信息。這不僅是簡單的技術(shù)升級,實(shí)際上背后是一種全新的交互邏輯。以潮玩識別為例,傳統(tǒng)搜索可能只是敷衍地給出基本信息,“掃” 模式也僅是略知一二,而 “探一下” 則將被動搜索轉(zhuǎn)變?yōu)橹悄芡扑],能深挖其收藏價(jià)值、市場動態(tài)及同系列產(chǎn)品的前世今生,這種深度挖掘能力源于其先進(jìn)的算法架構(gòu)和海量數(shù)據(jù)的精準(zhǔn)訓(xùn)練,使其在知識理解與關(guān)聯(lián)拓展上更進(jìn)一步。同時(shí),“探靈感” 像是創(chuàng)意的源泉,為圖片量身定制趣味盎然的文案,開啟用戶與 AI 攜手創(chuàng)作的大門,這也是以“搜”為主導(dǎo)的搜索時(shí)代無法完成的功能,因?yàn)樗軓挠杏眯畔⑦~向有趣內(nèi)容 ,給用戶獨(dú)特的情緒價(jià)值。搜索引擎的核心始終是如何正確理解并回答用戶的提問。在生成式AI技術(shù)的加持下,“探一下” 正探索一種全新的視覺交互方式和入口。它有眼睛能探索萬物,也像人腦一樣思考,想要一步到位給出用戶最全的知識圖譜,讓用戶的搜索體驗(yàn)得以變革性提升。
積厚成勢,AI煥新螞蟻
20年前,中國開通國際64K Internet信道,標(biāo)志著中國正式全功能接入了國際互聯(lián)網(wǎng),并且誕生了一批傳奇性互聯(lián)網(wǎng)企業(yè)。如今,隨著技術(shù)紅利見頂,互聯(lián)網(wǎng)市場飽和,對于螞蟻這樣的互聯(lián)網(wǎng)公司而言,急需探索新的技術(shù)點(diǎn)、挖掘新的盈利點(diǎn),尋求破局關(guān)鍵。
AI技術(shù),或許能成為網(wǎng)絡(luò)寬帶一樣的使能技術(shù),催生新的商業(yè)形態(tài)。
從戰(zhàn)略規(guī)劃層面看,螞蟻集團(tuán)確立“AI First”方針,這是基于自身大規(guī)模業(yè)務(wù)場景需求所做出的決策。螞蟻集團(tuán)著手布局多項(xiàng)AI前沿技術(shù),涵蓋大模型、知識圖譜、運(yùn)籌優(yōu)化、圖學(xué)習(xí)以及可信AI等領(lǐng)域,構(gòu)建起自身技術(shù)體系。
在2024外灘大會上,螞蟻集團(tuán)集中一口氣推出多項(xiàng)成果:發(fā)布AI生活管家App“支小寶”,聚焦日常生活服務(wù);升級AI金融管家 “螞小財(cái)”,主打金融專業(yè)智能服務(wù);推出面向醫(yī)療及泛健康行業(yè)的“AI健康管家”,開拓健康領(lǐng)域智能化應(yīng)用。
同時(shí),螞蟻集團(tuán)啟動支付寶智能體生態(tài)開放計(jì)劃,上線智能體開發(fā)平臺“百寶箱”,吸引外部開發(fā)者參與,豐富生態(tài)多樣性。
此外,螞蟻以百靈大模型為核心驅(qū)動力,為各應(yīng)用賦予多模態(tài)理解與生成等能力,推動產(chǎn)品穩(wěn)定運(yùn)行與煥新。如2024年支付寶五福節(jié),百靈大模型服務(wù)近6億人次,讓大眾通過AI互動玩法感受新年氛圍。
螞蟻AI發(fā)展路徑也不止于內(nèi)部研發(fā),還通過投資與合作拓展邊界。2024年,其投資與成立多家AI相關(guān)企業(yè),比如12月在上海成立 “上海螞蟻靈波科技有限公司”,聚焦具身智能領(lǐng)域;8月領(lǐng)投秘塔科技超1億元新一輪融資,推動AI搜索技術(shù)發(fā)展。
此外,支付寶在垂直行業(yè)持續(xù)泛化AI能力,如針對政務(wù)場景打造了政務(wù)AI解決方案,推動民生服務(wù)分發(fā)效率提高 50%,發(fā)揮了AI在實(shí)際場景中的作用。
大模型的競技是一場關(guān)于技術(shù)、資金、人才的比拼。AI能否開啟螞蟻集團(tuán)諸多新業(yè)務(wù)大門,助力螞蟻集團(tuán)塑造新形態(tài),實(shí)現(xiàn)新一輪成長蛻變,值得期待。