(圖片來源:unsplash)
鈦媒體AGI獲悉,1月8日上午,北京智源人工智能研究院(以下簡稱“智源研究院”)發(fā)布《十大人工智能技術(shù)及應(yīng)用趨勢》報(bào)告,包括“具身智能”、世界模型、合成數(shù)據(jù)等全新 AI 技術(shù)趨勢,以剖析科技演進(jìn)軌跡。
智源研究院院長王仲遠(yuǎn)表示,當(dāng)前我們處在 AI 發(fā)展的新拐點(diǎn),大模型的能力涌現(xiàn)加速通用人工智能(AGI)時代的到來,原生統(tǒng)一多模態(tài)、具身智能、AI for Science,將進(jìn)一步深化人工智能對世界的感知、理解與推理,連接數(shù)字世界與物理世界,驅(qū)動科學(xué)研究創(chuàng)新突破。智源研究院作為聚焦 AU 領(lǐng)域的新型研發(fā)機(jī)構(gòu),希望在這個特殊的時刻以十大趨勢為出發(fā)點(diǎn),為 AI 技術(shù)領(lǐng)域指明發(fā)展方向,攜手共進(jìn)。
智源研究院副院長兼總工程師林詠華在會上表示,大家都期待 AI 能夠超越人類的智力,實(shí)現(xiàn)通用人工智能(AGI),并從數(shù)字世界走向物理世界,甚至在未來幫助我們?nèi)ヌ剿魑粗念I(lǐng)域(世界)。然而,隨著AGI目標(biāo)的逐步推進(jìn),實(shí)現(xiàn)這一目標(biāo)的過程中可能會出現(xiàn)多種路徑和方法(百花齊放),至于哪條路徑能夠通往終點(diǎn),以及真正實(shí)現(xiàn)AGI還有多遠(yuǎn)的路要走,這些問題目前尚無定論。
具體到智源研究院公布的2025年十大 AI 技術(shù)趨勢中,趨勢一是 AI for Science(AI4S)驅(qū)動科學(xué)研究范式變革。據(jù)統(tǒng)計(jì),2024年,科研人員使用AI的比例快速增加,接近半數(shù)的科研人員認(rèn)為,AI將對其工作領(lǐng)域產(chǎn)生積極影響,而美國和印度分別只有28%和41%。這意味著,AI對科學(xué)研究方法和流程的變革效應(yīng)也開始顯現(xiàn)。
隨著諾貝爾獎物理學(xué)、化學(xué)獎都頒給了 AI 賽道,推動科學(xué)研究與 AI 技術(shù)不斷結(jié)合,從聚焦優(yōu)化特定任務(wù)向更復(fù)雜、更動態(tài)、更交叉的問題發(fā)展。2025年,多模態(tài)大模型將進(jìn)一步融入科學(xué)研究,將賦能多維數(shù)據(jù)的復(fù)雜結(jié)構(gòu)挖掘,輔助科研問題綜合理解與全局分析,為生物醫(yī)學(xué)、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎(chǔ)與應(yīng)用科學(xué)研究開辟新方向。
趨勢二“具身智能元年”,具身大小腦和本體的協(xié)同進(jìn)化。2025年,“具身智能”將繼續(xù)從本體擴(kuò)展到具身腦的敘事主線,我們可以從三方面有更多期待。在行業(yè)格局上,國內(nèi)近100家的具身初創(chuàng)公司或?qū)⒂瓉硐磁,廠商數(shù)量開始收斂;在技術(shù)路線上,端到端模型繼續(xù)迭代,小腦大模型的嘗試或有突破;在商業(yè)變現(xiàn)上,我們也必將看到更多的工業(yè)場景下的具身智能應(yīng)用,部分人形機(jī)器人迎來量產(chǎn)。
趨勢三、“下一個Token預(yù)測”:統(tǒng)一的多模態(tài)大模型實(shí)現(xiàn)更高效AI。人工智能的本質(zhì)在于對人的思維的信息過程的模擬,人類對于信息的交互和處理,總是呈現(xiàn)多模態(tài)、跨模態(tài)的輸入輸出狀態(tài)。當(dāng)前的語言大模型、拼接式的多模態(tài)大模型,在對人類思維過程的模擬,存在天然的局限性。從訓(xùn)練之初就打通多模態(tài)數(shù)據(jù),實(shí)現(xiàn)端到端輸入和輸出的原生多模態(tài)技術(shù)路線給出了多模態(tài)發(fā)展的新可能;诖,訓(xùn)練階段即對齊視覺、音頻、3D等模態(tài)的數(shù)據(jù),實(shí)現(xiàn)多模態(tài)的統(tǒng)一,構(gòu)建原生多模態(tài)大模型成為多模態(tài)大模型進(jìn)化的重要方向。
趨勢四,Scaling Law擴(kuò)展:RL(強(qiáng)化學(xué)習(xí))+ LLMs,模型泛化從預(yù)訓(xùn)練向后訓(xùn)練、推理遷移。基于Scaling Law推動基礎(chǔ)模型性能提升的訓(xùn)練模式“性價比”持續(xù)下降,后訓(xùn)練與特定場景的Scaling law不斷被探索。強(qiáng)化學(xué)習(xí)作為發(fā)現(xiàn)后訓(xùn)練、推理階段的Scaling Law的關(guān)鍵技術(shù),也將會得到更多的應(yīng)用和創(chuàng)新使用。
趨勢五、世界模型加速發(fā)布,有望成為多模態(tài)大模型的下一階段。據(jù)悉,世界模型具備更注重“因果”推理作用,賦予AI更高級別的認(rèn)知和更符合邏輯的推理與決策能力,這種能力不僅能推動AI在自動駕駛、機(jī)器人控制及智能制造等前沿領(lǐng)域的深度應(yīng)用,更有望突破傳統(tǒng)的任務(wù)邊界,探索人機(jī)交互的新可能。
趨勢六、合成數(shù)據(jù)將成為大模型迭代與應(yīng)用落地的重要催化劑。高質(zhì)量數(shù)據(jù)將成為大模型進(jìn)一步Scaling up的發(fā)展阻礙。合成數(shù)據(jù)已經(jīng)成為基礎(chǔ)模型廠商補(bǔ)充數(shù)據(jù)的首選。合成數(shù)據(jù)可以降低人工治理和標(biāo)注的成本,緩解對真實(shí)數(shù)據(jù)的依賴,不再涉及數(shù)據(jù)隱私問題;提升數(shù)據(jù)的多樣性,有助于提高模型處理長文本和復(fù)雜問題的能力。此外,合成數(shù)據(jù)可以緩解通用數(shù)據(jù)被大廠壟斷,專有數(shù)據(jù)存在獲取成本等問題,促進(jìn)大模型的應(yīng)用落地。
趨勢七、推理優(yōu)化迭代加速,成為AI Native應(yīng)用落地的必要條件。大模型硬件載體從云端向手機(jī)、PC等端側(cè)硬件滲透,在這些資源受限(AI算力、內(nèi)存等)的設(shè)備上,大模型的落地應(yīng)用會面臨較大的推理側(cè)的開銷限制,對部署資源、用戶體驗(yàn)、經(jīng)濟(jì)成本等均帶來巨大挑戰(zhàn)。算法加速和硬件優(yōu)化技術(shù)持續(xù)迭代,雙輪驅(qū)動加速AI Native應(yīng)用落地。
在圓桌對話上,螞蟻集團(tuán)大模型對齊負(fù)責(zé)人溫祖杰表示,OpenAI發(fā)布會上曾推出現(xiàn)實(shí)版的“Her”,你可以跟它進(jìn)行實(shí)時互動,利用大模型觀察你的行為動作,看周圍的環(huán)境,交互更自然。多模態(tài)不止是指視頻生成,其實(shí)還有圖文多模態(tài),OCR多模態(tài)等能力。比如螞蟻集團(tuán)的“探一探”,不僅通過視覺能力去拍照識圖,而且還可以基于多模態(tài)能力實(shí)現(xiàn)多輪對話式的互動交流,這是一個更加符合真實(shí)體驗(yàn)的產(chǎn)品感知,在這些方向上可能會比較有前景。
趨勢八、重塑產(chǎn)品應(yīng)用形態(tài),Agentic AI成為產(chǎn)品落地的重要模式。2025年,更通用、更自主的智能體將重塑產(chǎn)品應(yīng)用形態(tài),進(jìn)一步深入工作與生活場景,成為大模型產(chǎn)品落地的重要應(yīng)用形態(tài),在2025年我們將看到更多智能化程度更高、對業(yè)務(wù)流程理解更深的多智能體系統(tǒng)在應(yīng)用側(cè)的落地。
智源研究院行業(yè)研究組負(fù)責(zé)人倪賢豪表示,從Chatbot到Copilot,再到Agent與Agentic AI,行業(yè)對于AI應(yīng)用形態(tài)的理解越發(fā)深入。尤其是Agent到Agentci AI,其背后標(biāo)志著從判斷產(chǎn)品是否屬于Agent,到探討產(chǎn)品的智能化程度這一更有落地意義的轉(zhuǎn)變。在未來一年時間里,未必我們能看到更多迥異的應(yīng)用形態(tài)變化,也并不會出現(xiàn)很多完全不一樣的Agent應(yīng)用模式。
趨勢九、AI應(yīng)用熱度漸起,Super App(超級應(yīng)用)花落誰家猶未可知。近一年時間,生成式AI模型在圖像、視頻側(cè)的處理能力得到大幅提升,疊加推理優(yōu)化帶來的降本,Agent/RAG框架、應(yīng)用編排工具等技術(shù)的持續(xù)發(fā)展,為AI超級應(yīng)用的落地積基樹本。大模型應(yīng)用從功能點(diǎn)升級,滲透到AI原生的應(yīng)用構(gòu)建及AI OS的生態(tài)重塑。雖然Super APP花落誰家尚未塵埃落定,但從用戶規(guī)模、交互頻次、停留時長等維度來看,AI應(yīng)用熱度持續(xù)攀升,已到應(yīng)用爆發(fā)的黎明前夕。
倪賢豪表示,目前做出“超級應(yīng)用”是有一定機(jī)會的。盡管移動互聯(lián)網(wǎng)用戶增速已經(jīng)見頂,但我們在非網(wǎng)民用戶群體里還是能看到規(guī)模過億、具備消費(fèi)能力但因代際原因無法便捷入網(wǎng)的用戶。這些用戶面臨非現(xiàn)金支付、信息獲取、線上買票掛號等剛需問題。對于這些問題的解決,我們未必需要Agent在智能化程度、自主性上做極致追求,基于較好的基礎(chǔ)模型,結(jié)合以上不同能力對應(yīng)的廠商接口適配(PlugIn、Tools),做出一款能滿足上述用戶群體需求的Agent,對于目前來說,模型和工程能力都是可行的。
倪賢豪認(rèn)為,在這個邏輯下,如何對接不同廠商完成接口適配、封裝,反而成為一個同樣重要的問題。諸如此類的對接適配,對應(yīng)的反而是對廠商渠道建設(shè)和運(yùn)營能力的要求。
“因此,在All in One為標(biāo)志特征的超級應(yīng)用敘事里,大廠可能更有機(jī)會,以上提及的渠道建設(shè)能力,對于大廠而言相對成熟。但對于創(chuàng)業(yè)公司來說,這些工作需要從0到1做起,難度極大。”倪賢豪稱。
趨勢十、模型能力提升與風(fēng)險預(yù)防并重,AI安全治理體系持續(xù)完善。作為復(fù)雜系統(tǒng),大模型的Scaling帶來了涌現(xiàn),但復(fù)雜系統(tǒng)特有的涌現(xiàn)結(jié)果不可預(yù)測、循環(huán)反饋等特有屬性也對傳統(tǒng)工程的安全防護(hù)機(jī)制帶來了挑戰(zhàn)。基礎(chǔ)模型在自主決策上的持續(xù)進(jìn)步帶來了潛在的失控風(fēng)險,如何引入新的技術(shù)監(jiān)管方法,如何在人工監(jiān)管上平衡行業(yè)發(fā)展和風(fēng)險管控?這對參與AI的各方來說,都是一個值得持續(xù)探討的議題。
溫祖杰表示,AI安全具有顯著的“對抗性”特征,這是一種此消彼長的關(guān)系。也就是說,當(dāng)攻擊手段增強(qiáng)時,防御手段也會相應(yīng)提升,因此,在大型模型的安全能力方面,我們需要不斷地提升攻防兩端的實(shí)力,而采用“大模型對抗大模型”的方法,是一個積極的發(fā)展趨勢。另外,在安全圍欄技術(shù)方面,我們必須確保輸入和輸出的安全性,降低遭受攻擊的風(fēng)險,通過建立一套完整的策略系統(tǒng)和安全防護(hù)組合,我們可以推動AI大模型的安全應(yīng)用落地。
事實(shí)上,AI 作為新質(zhì)生產(chǎn)力的重要引擎,不僅代表了科技的前沿趨勢,更是未來經(jīng)濟(jì)發(fā)展的關(guān)鍵驅(qū)動力,目前已產(chǎn)生明顯的經(jīng)濟(jì)效益和社會效益。
研究機(jī)構(gòu)IDC最新數(shù)據(jù)顯示,隨著 AI 應(yīng)用持續(xù)走深向?qū),行業(yè)大模型在金融、醫(yī)療、教育、零售、能源等多個行業(yè)領(lǐng)域?qū)崿F(xiàn)初步應(yīng)用,到2025年,全球 AI 支出將達(dá)2270億美元。預(yù)計(jì)到2030年,AI 將為全球經(jīng)濟(jì)貢獻(xiàn)19.9萬億美元(約合145.9萬億元人民幣),推動全球GDP增長3.5%。而目前,幾乎98%的企業(yè)領(lǐng)導(dǎo)者將AI視為其組織的優(yōu)先事項(xiàng)。
對于未來展望,多位行業(yè)專家紛紛表示,他們期望在2025年能夠見證像GPT-5這樣的下一代大模型的誕生,并在大模型的安全性和理論可解釋性方面取得重大進(jìn)展。“我不知道這是不是太美好了,但我希望有一個AI,可以跟人的學(xué)習(xí)效率差不多!