人工智能的下一個(gè)前沿是Agentic AI(代理式人工智能),它使用復(fù)雜推理和迭代規(guī)劃自主解決復(fù)雜的多步驟問題,提高各行業(yè)的生產(chǎn)力和運(yùn)營(yíng)。
過去幾年,生成式AI(gen AI)一直是熱門話題。但現(xiàn)在一個(gè)新名詞正在悄悄進(jìn)入人工智能開發(fā)社區(qū)?萍季揞^和AI大牛都在談?wù)摰腁gentic AI(代理式人工智能)到底是什么?
最近,OpenAI前首席科學(xué)家、 安全超級(jí)智能公司聯(lián)合創(chuàng)始人伊利亞蘇茨克維(Ilya Sutskever)預(yù)測(cè),下一代模型將“以一種真正的方式實(shí)現(xiàn)代理化(agentic)”,未來的系統(tǒng)除了具有自主性,還具有推理能力。芯片巨頭英偉達(dá)同樣認(rèn)為,人工智能的下一個(gè)前沿是Agentic AI(代理式人工智能),它使用復(fù)雜推理和迭代規(guī)劃自主解決復(fù)雜的多步驟問題,提高各行業(yè)的生產(chǎn)力和運(yùn)營(yíng)。著名AI學(xué)者吳恩達(dá)(Andrew Ng)今年也幫助推廣了Agentic AI這個(gè)詞,以平息哪些技術(shù)應(yīng)被視為智能體的爭(zhēng)論。
在談?wù)揂gentic AI之前,首先要理解AI智能體(agent)。上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華曾對(duì)包括澎湃科技在內(nèi)的媒體介紹,所謂智能體,就是模型能夠和一些外部系統(tǒng)提供的功能相結(jié)合,真正執(zhí)行一些任務(wù)。人類和大模型可以對(duì)話交流,有的手機(jī)廠商將模型植入手機(jī),讓模型幫助查看天氣、定餐廳、完成郵件發(fā)送任務(wù)。這時(shí)候的模型不再是一個(gè)只會(huì)問答的工具,而是可以將用戶的意圖變成某種可以操作的指令,模型還能夠利用系統(tǒng)本身提供的功能操作用戶的需求,讓動(dòng)作真正發(fā)生。
高級(jí)智能體可以幫助人類預(yù)訂跨洲商務(wù)旅行的機(jī)票和酒店。谷歌近期推出的智能體Mariner基于谷歌大模型Gemini 2.0,可以瀏覽電子表格、購物網(wǎng)站等,幫助用戶裝滿虛擬購物車。谷歌CEO桑達(dá)爾皮查伊(Sundar Pichai)曾表示,在過去的一年里,谷歌一直在投資開發(fā)更多的agentic模型,這意味著它們可以更多地了解用戶周圍的世界,提前考慮多個(gè)步驟,并在用戶的監(jiān)督下代表用戶采取行動(dòng)。Gemini 2.0是為了agentic時(shí)代推出的大模型,能夠構(gòu)建新的AI智能體,從而離構(gòu)建通用助手更進(jìn)一步。
所謂Agentic AI,看起來是AI智能體發(fā)展的下一階段。據(jù)《福布斯》(Forbes)報(bào)道,AI智能體已經(jīng)存在了幾十年,2010年代機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的興起引入了認(rèn)知智能,2020年代的生成式人工智能增加了復(fù)雜的自然語言理解和推理,創(chuàng)造了一條從傳統(tǒng)AI智能體到Agentic AI的直通線。
Agentic AI是能夠通過設(shè)計(jì)工作流和使用工具,代表用戶或其他系統(tǒng)自主執(zhí)行任務(wù)的系統(tǒng)或程序。聊天機(jī)器人需要人類輸入提示才能做出回應(yīng),而Agentic AI可以自己行動(dòng)。Agentic AI也與簡(jiǎn)單的AI智能體不同,Agentic AI聚焦獨(dú)立自主行動(dòng)以及處理復(fù)雜任務(wù)和環(huán)境的更廣泛功能,它可以在沒有人類的情況下完成任務(wù)。IBM認(rèn)為,Agentic AI系統(tǒng)具有“代理”功能,可做出決策、采取行動(dòng)、解決復(fù)雜問題,并在訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)之外與外部環(huán)境進(jìn)行交互。Agentic AI將大模型的通用性和靈活性與傳統(tǒng)編程的精確性結(jié)合在一起。譬如,國(guó)內(nèi)AI大模型企業(yè)智譜近期推出的智能體AutoGLM可自主執(zhí)行超過50步的長(zhǎng)步驟操作,也可以跨app執(zhí)行任務(wù),開啟全自動(dòng)上網(wǎng),用戶不用動(dòng)手就能完成點(diǎn)外賣、朋友圈點(diǎn)贊、高鐵購票等常見的手機(jī)操作。
那么,Agentic AI是如何工作的?根據(jù)英偉達(dá)的解釋,Agentic AI主要通過四個(gè)步驟來解決問題。第一步是感知,AI智能體集和處理來自傳感器、數(shù)據(jù)庫和數(shù)字接口等的各種數(shù)據(jù),提取有意義的特征,識(shí)別物體或識(shí)別環(huán)境中的相關(guān)實(shí)體。第二步是推理,大模型充當(dāng)推理引擎,它理解任務(wù),生成解決方案,并為特定功能協(xié)調(diào)專用模型。第三步是執(zhí)行,通過應(yīng)用程序編程接口(API)與外部工具和軟件集成,Agentic AI可以根據(jù)計(jì)劃快速執(zhí)行任務(wù)。第四步是學(xué)習(xí),Agentic AI通過“數(shù)據(jù)飛輪”不斷改進(jìn),從交互中產(chǎn)生的數(shù)據(jù)被喂入系統(tǒng)增強(qiáng)模型。
伊利亞認(rèn)為,未來的AI智能體將結(jié)出碩果,擁有更深入的理解和自我意識(shí),人工智能將像人類一樣推理問題,不過,“它推理得越多,就越難以預(yù)測(cè)!睂(duì)數(shù)以百萬計(jì)的選項(xiàng)進(jìn)行推理,可能會(huì)導(dǎo)致任何結(jié)果都不明顯。例如DeepMind開發(fā)的圍棋人工智能程序AlphaGo在2016年的一場(chǎng)比賽中擊敗了韓國(guó)棋手李世石,令人費(fèi)解的第37步讓圍棋專家們感到驚訝。伊利亞表示,真正優(yōu)秀的人工智能對(duì)于最優(yōu)秀的人類棋手來說是不可預(yù)測(cè)的。