展會(huì)信息港展會(huì)大全

智能體商用元年開啟,2025年AI Agent行業(yè)發(fā)展十三大趨勢(shì)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-01-07 20:33:50   瀏覽:239次  

導(dǎo)讀:文 | 王吉偉自2023年AutoGPT開啟智能體序幕以來(lái),AI Agent作為新一代智能交互范式,展現(xiàn)出前所未有的發(fā)展活力。2024年,這一領(lǐng)域的發(fā)展更是呈現(xiàn)出爆發(fā)式增長(zhǎng)態(tài)勢(shì),從個(gè)人助手到企業(yè)級(jí)解決方案,從通用型Agent到垂直領(lǐng)域?qū)<遥珹I Agent正在重塑數(shù)字世界的運(yùn)作方式。這種增長(zhǎng)不僅體現(xiàn)在技術(shù)突破上,更反映在實(shí)際應(yīng)用場(chǎng)景的深度和廣度方面。智能客服、金融交易、醫(yī)療診斷及市場(chǎng)營(yíng) ......

文 | 王吉偉

自2023年AutoGPT開啟智能體序幕以來(lái),AI Agent作為新一代智能交互范式,展現(xiàn)出前所未有的發(fā)展活力。2024年,這一領(lǐng)域的發(fā)展更是呈現(xiàn)出爆發(fā)式增長(zhǎng)態(tài)勢(shì),從個(gè)人助手到企業(yè)級(jí)解決方案,從通用型Agent到垂直領(lǐng)域?qū)<,AI Agent正在重塑數(shù)字世界的運(yùn)作方式。

這種增長(zhǎng)不僅體現(xiàn)在技術(shù)突破上,更反映在實(shí)際應(yīng)用場(chǎng)景的深度和廣度方面。智能客服、金融交易、醫(yī)療診斷及市場(chǎng)營(yíng)銷、人力資源等領(lǐng)域?qū)τ谥悄荏w的嘗試以及所取得的成果,彰顯了AI Agent正在各個(gè)領(lǐng)域展現(xiàn)出強(qiáng)大的應(yīng)用潛力。

特別是在企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中,AI Agent展現(xiàn)出的自主決策能力、多任務(wù)協(xié)同能力以及持續(xù)學(xué)習(xí)能力,正在為傳統(tǒng)業(yè)務(wù)流程帶來(lái)革命性的變革。

IDC預(yù)測(cè),到2026年,將有50%的中國(guó)500強(qiáng)數(shù)據(jù)團(tuán)隊(duì)使用AI Agent來(lái)實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備和分析。Gartner預(yù)測(cè),到2028年,至少15%的日常工作決策將通過(guò)Agentic AI自主做出,33%的企業(yè)軟件應(yīng)用程序也將包含Agentic AI。

值得注意的是,在Gartner發(fā)布的《2025年十大技術(shù)趨勢(shì)》報(bào)告中,"Agentic AI"被列為首位,凸顯了其在企業(yè)數(shù)字化轉(zhuǎn)型中的核心地位。這一趨勢(shì),得到了眾多行業(yè)專家的認(rèn)可。

在投資領(lǐng)域,AI Agent也獲得了空前關(guān)注。相關(guān)數(shù)據(jù)顯示,在過(guò)去兩年中,投資者向Agentic AI初創(chuàng)公司投入了超過(guò)20億美元,重點(diǎn)關(guān)注面向企業(yè)市場(chǎng)的公司。與此同時(shí),眾多科技巨頭也在通過(guò)自研、收購(gòu)和技術(shù)授權(quán)等多種方式,加速布局AI Agent領(lǐng)域。

在企業(yè)決策層面,AI Agent的戰(zhàn)略地位也在不斷提升。麥肯錫最新研究表明,超過(guò)70%的企業(yè)CEO認(rèn)為AI Agent將在未來(lái)3年內(nèi)顯著改變其經(jīng)營(yíng)模式和競(jìng)爭(zhēng)格局。德勤的調(diào)查數(shù)據(jù)更進(jìn)一步揭示,到2025年,25%使用生成式AI的企業(yè)將部署AI Agent,這一比例預(yù)計(jì)在2027年將增長(zhǎng)到50%。

從技術(shù)發(fā)展來(lái)看,2024年AI Agent領(lǐng)域已經(jīng)取得了一系列突破性進(jìn)展。在認(rèn)知能力方面,多模態(tài)理解能力的提升使得AI Agent能夠更好地理解和處理圖像、語(yǔ)音、文本等多種形式的信息;在決策能力方面,基于強(qiáng)化學(xué)習(xí)的自主決策框架使得AI Agent能夠在復(fù)雜場(chǎng)景下做出更準(zhǔn)確的判斷;在協(xié)作能力方面,多Agent協(xié)同框架的成熟使得不同Agent之間能夠更有效地配合完成復(fù)雜任務(wù)。

在技術(shù)實(shí)踐方面,科技巨頭正在積極布局AI Agent領(lǐng)域。微軟、亞馬遜等科技巨頭全力布局AI Agent產(chǎn)品線,推動(dòng)AI助手在企業(yè)辦公場(chǎng)景的應(yīng)用;OpenAI GPT-4、Google Gemini、阿里Qwen2、騰訊混元等多模態(tài)能力的提升,為Agent技術(shù)發(fā)展提供了新的可能性。同時(shí),眾多創(chuàng)新型科技公司也在垂直領(lǐng)域推出了特色解決方案,推動(dòng)AI Agent在不同場(chǎng)景下的落地應(yīng)用。

2024年的AI Agent的發(fā)展速度,比我們想象的要迅猛很多,短短1年時(shí)間智能體就有了一個(gè)大進(jìn)化。而面對(duì)接下來(lái)被稱為AI Agent商用元年的2025年,我們又應(yīng)該了解什么呢?

本文王吉偉頻道將為讀者詳細(xì)解析2025年AI Agent領(lǐng)域的13個(gè)關(guān)鍵發(fā)展趨勢(shì)。這些趨勢(shì)不僅反映了技術(shù)演進(jìn)的方向,更揭示了產(chǎn)業(yè)變革的脈絡(luò),希望能為企業(yè)決策者和行業(yè)從業(yè)者提供有價(jià)值的參考。

這13個(gè)趨勢(shì)涵蓋了技術(shù)創(chuàng)新、應(yīng)用落地、商業(yè)模式、產(chǎn)業(yè)生態(tài)等多個(gè)維度,將幫助讀者全面把握AI Agent領(lǐng)域的發(fā)展機(jī)遇與挑戰(zhàn)。

趨勢(shì)一:AI Agent采用率大幅增加

Gartner將Agentic AI列為2025年頂級(jí)技術(shù)趨勢(shì)的第一名。Agentic AI可以幫助從查詢和響應(yīng)系統(tǒng)向自主機(jī)器Agent的轉(zhuǎn)變,能夠在沒(méi)有人工指導(dǎo)的情況下執(zhí)行與企業(yè)相關(guān)的任務(wù)。

微軟等全球的科技公司正在積極開發(fā)Agent人工智能。例如,微軟與英國(guó)政府簽署了一項(xiàng)多年協(xié)議,為公共部門組織提供使用其人工智能工具的權(quán)限。Agentic AI的目標(biāo)是通過(guò)使軟件Agent能夠承擔(dān)復(fù)雜的決策密集型任務(wù)來(lái)提高效率和生產(chǎn)力。

Gartner認(rèn)為,Agentic AI有潛力實(shí)現(xiàn)CIO提高整個(gè)組織生產(chǎn)力的愿望。這種動(dòng)機(jī)正在推動(dòng)企業(yè)和供應(yīng)商探索、創(chuàng)新和建立以強(qiáng)大、安全和值得信賴的方式提供該機(jī)構(gòu)所需的技術(shù)和實(shí)踐。

Agentic AI流行,勢(shì)必會(huì)帶來(lái)AI Agent的廣泛應(yīng)用。未來(lái)一年,各行各業(yè)的組織都將采用 AI Agent來(lái)處理跨部門的任務(wù)。目前,已有多家數(shù)據(jù)機(jī)構(gòu)給出相關(guān)預(yù)測(cè)數(shù)據(jù),均看好AI Agent未來(lái)的高速發(fā)展。

Capgemini 的一份報(bào)告指出,大多數(shù)組織(82%)計(jì)劃到 2026 年集成 AI Agent。這主要用于電子郵件生成、編碼和數(shù)據(jù)分析等任務(wù)。在一項(xiàng)類似的研究中,德勤預(yù)測(cè),到 2025 年,25% 使用 GenAI 的企業(yè)將部署 AI Agents,到2027 年將增長(zhǎng)到50%。

Gartner 預(yù)測(cè),到2028年,至少15%的日常工作決策將通過(guò)Agentic AI 自主做出。它還指出,屆時(shí),33% 的企業(yè)軟件應(yīng)用程序也將包含Agentic AI。

IDC預(yù)測(cè),到2026年,將有50%的中國(guó)500強(qiáng)數(shù)據(jù)團(tuán)隊(duì)使用AI Agent來(lái)實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備和分析,并成為重要組織者和協(xié)調(diào)者。

隨著2025年AI Agent商用元年的開啟,我們還將看到專門從事金融(自動(dòng)交易機(jī)器人)、零售(個(gè)性化購(gòu)物助手)和醫(yī)療保。ㄌ摂M健康顧問(wèn))等領(lǐng)域的AI Agent產(chǎn)品及實(shí)際應(yīng)用案例。

趨勢(shì)二:多模態(tài)AI Agent增強(qiáng)用戶體驗(yàn)

多模態(tài)AI Agent是一種先進(jìn)的智能系統(tǒng),它能夠理解和處理包括文本、圖像、音頻在內(nèi)的多種模態(tài)輸入。其優(yōu)勢(shì)在于其強(qiáng)大的多模態(tài)理解能力,能夠整合視覺和語(yǔ)言輸入,適用于多種環(huán)境;提高模型的泛化能力,減少大型基礎(chǔ)模型的幻覺現(xiàn)象;以及通過(guò)與環(huán)境的互動(dòng)實(shí)現(xiàn)持續(xù)學(xué)習(xí)和自我改進(jìn)。

多模態(tài)AI Agent的興起代表了AI能力的重大飛躍。這些高級(jí)Agent可以處理和集成多種類型的輸入數(shù)據(jù),包括文本、圖像、音頻甚至視頻。這種多功能性,為各行各業(yè)開辟了廣泛的應(yīng)用。

通過(guò)模擬人類的感知和認(rèn)知過(guò)程,多模態(tài)AI Agent為用戶提供了更豐富和直觀的交互體驗(yàn),同時(shí)推動(dòng)了AI技術(shù)的智能化和人性化發(fā)展。

在醫(yī)療保健領(lǐng)域,多模態(tài)AI Agent正在徹底改變?cè)\斷和患者護(hù)理。他們可以分析醫(yī)學(xué)成像數(shù)據(jù)以及患者記錄和癥狀,提供更全面、更準(zhǔn)確的診斷建議。在零售領(lǐng)域,這些Agent通過(guò)將視覺識(shí)別與自然語(yǔ)言處理相結(jié)合來(lái)增強(qiáng)客戶體驗(yàn),實(shí)現(xiàn)更直觀和交互式的購(gòu)物助手。

在廣告和設(shè)計(jì)中,這些Agent可以生成結(jié)合文本和圖像的內(nèi)容,了解視覺和語(yǔ)言交流的細(xì)微差別。此功能在大規(guī)模創(chuàng)建有針對(duì)性的營(yíng)銷材料和個(gè)性化內(nèi)容時(shí)特別有價(jià)值。

多模態(tài)AI在游戲、機(jī)器人技術(shù)、醫(yī)療保健等多個(gè)領(lǐng)域的應(yīng)用,推動(dòng)了研究和創(chuàng)新的發(fā)展。它處理和合成各種類型信息的能力比以往任何時(shí)候都更緊密地反映了人類的認(rèn)知過(guò)程,使其成為復(fù)雜決策場(chǎng)景中的寶貴工具。

隨著AI Agent對(duì)特定行業(yè)的影響不斷增長(zhǎng)以及大模型向多模態(tài)演進(jìn),2025年多模態(tài)AI Agent將會(huì)成為重要的智能體產(chǎn)品形態(tài)。

趨勢(shì)三:多Agent系統(tǒng)開始流行

雖然單個(gè)AI Agent可以提供有價(jià)值的增強(qiáng)功能,但AI Agent的真正變革力量來(lái)自于它們與其他Agent一起工作。

多Agent AI系統(tǒng)使用多個(gè)特定于角色的 AI Agent來(lái)理解請(qǐng)求、規(guī)劃工作流程、協(xié)調(diào)特定于角色的Agent、簡(jiǎn)化操作、與人類協(xié)作并驗(yàn)證輸出。它通常涉及標(biāo)準(zhǔn)任務(wù)Agent(例如,用戶界面和數(shù)據(jù)管理Agent)與專業(yè)技能和工具Agent(例如,數(shù)據(jù)提取器或圖像解釋器Agent)合作,以實(shí)現(xiàn)用戶指定的目標(biāo)。

每個(gè) AI Agent的核心都是一個(gè)語(yǔ)言模型,它提供對(duì)語(yǔ)言和上下文的語(yǔ)義理解,但根據(jù)用例,系統(tǒng)中的Agent可能會(huì)使用相同或不同的語(yǔ)言模型。這種方法可以允許一些Agent共享知識(shí),而其他Agent則驗(yàn)證整個(gè)系統(tǒng)中的輸出,從而提高流程的質(zhì)量和一致性。

通過(guò)為Agent提供共享的短期和長(zhǎng)期內(nèi)存資源,減少在給定項(xiàng)目或用例的規(guī)劃、驗(yàn)證和迭代階段對(duì)人工提示的需求,進(jìn)一步增強(qiáng)了這種潛力。

隨著企業(yè)需要越來(lái)越復(fù)雜的解決方案,多智能體系統(tǒng)的開發(fā)將成為中心舞臺(tái)。AI Agent將相互協(xié)作以解決問(wèn)題并執(zhí)行需要多層決策的任務(wù)。

這些Agent將能夠共享信息、協(xié)調(diào)他們的行動(dòng),甚至處理跨部門或服務(wù)的更復(fù)雜的工作流程。例如,在物流方面,多智能體系統(tǒng)可以優(yōu)化供應(yīng)鏈、管理庫(kù)存和預(yù)測(cè)需求波動(dòng)。

2025 年,更多組織將部署多Agent系統(tǒng)來(lái)管理和優(yōu)化業(yè)務(wù)流程。OpenAI Swarm 和 Microsoft 的 Magentic AI 等Agent編排平臺(tái)將引領(lǐng)這一趨勢(shì),使企業(yè)能夠協(xié)作部署和管理多個(gè)Agent。

趨勢(shì)四:AI Agent集群大行其道

AI Agent集群指的是一組AI Agent的集合,它們可以協(xié)同工作以解決復(fù)雜的問(wèn)題或執(zhí)行任務(wù)。在集群中,每個(gè)AI Agent可能負(fù)責(zé)不同的任務(wù)或具有不同的專長(zhǎng),通過(guò)相互協(xié)作和通信,它們能夠發(fā)揮出超越單個(gè)Agent的能力。

例如,在游戲場(chǎng)景中,多個(gè)AI Agent可以分別負(fù)責(zé)策略規(guī)劃、資源管理、角色行為控制等不同任務(wù),通過(guò)相互配合來(lái)戰(zhàn)勝人類玩家或者應(yīng)對(duì)更具挑戰(zhàn)性的游戲關(guān)卡。

AI Agent網(wǎng)絡(luò)是指AI Agent之間通過(guò)通信協(xié)議相互連接和交互的系統(tǒng)。這種網(wǎng)絡(luò)可以是分布式的,允許AI Agent在不同的地理位置或計(jì)算節(jié)點(diǎn)上運(yùn)行,同時(shí)保持協(xié)同工作的能力。

AI Agent網(wǎng)絡(luò)的一個(gè)關(guān)鍵特點(diǎn)是去中心化,每個(gè)Agent都可以自主地與其他Agent互動(dòng),共享信息和資源,以實(shí)現(xiàn)更高效的任務(wù)分配和問(wèn)題解決。例如,AI Agent與Web3的結(jié)合可以開創(chuàng)一個(gè)全新的數(shù)字經(jīng)濟(jì)時(shí)代,通過(guò)去中心化區(qū)塊鏈網(wǎng)絡(luò),在保障數(shù)據(jù)隱私與安全的同時(shí),為用戶提供高度個(gè)性化的服務(wù)。

AI Agent集群與AI Agent網(wǎng)絡(luò),是實(shí)現(xiàn)復(fù)雜任務(wù)和提升AI系統(tǒng)性能的重要方式,并且在實(shí)際應(yīng)用中,它們往往是相輔相成的。

2025年,AI Agent將進(jìn)一步實(shí)現(xiàn)協(xié)作和協(xié)同工作。Salesforce AI研究負(fù)責(zé)人Silvio Savarese認(rèn)為,在未來(lái)的一年里,AI Agent將會(huì)成群結(jié)隊(duì)地合作,協(xié)作解決日常任務(wù)和業(yè)務(wù)挑戰(zhàn)。這種演變將以前所未有的規(guī)模,重新定義生產(chǎn)力和解決問(wèn)題的能力。

AI Agent將無(wú)縫集成到我們的生活中,個(gè)人擁有個(gè)人Agent,組織將部署專門的Agent。這些Agent可通過(guò) Agentforce 等平臺(tái)獲得,針對(duì)特定任務(wù)量身定制,并共同努力實(shí)現(xiàn)共同目標(biāo)。未來(lái)將不僅僅是使用 AI,也將是關(guān)于創(chuàng)建和定制Agent,這些Agent協(xié)作以理解和執(zhí)行戰(zhàn)略任務(wù)和決策,無(wú)論是在個(gè)人還是商業(yè)環(huán)境中。

趨勢(shì)五:垂直AI Agent快速崛起

垂直AI Agent是指專注于特定行業(yè)或領(lǐng)域,利用人工智能技術(shù)自動(dòng)執(zhí)行任務(wù)、提高效率并取代部分人工的軟件程序。業(yè)內(nèi)人士認(rèn)為,垂直Agent未來(lái)垂直Agent的市場(chǎng)規(guī)模將是SaaS市場(chǎng)的10倍,并有可能在很多領(lǐng)域取代SaaS。

它們就像專門為特定任務(wù)定制的虛擬助手,能夠理解行業(yè)特定的語(yǔ)言、流程和數(shù)據(jù),并根據(jù)用戶的需求提供個(gè)性化的解決方案。垂直AI Agent可以執(zhí)行各種任務(wù),例如收集和分析數(shù)據(jù)、生成報(bào)告、與用戶交互、執(zhí)行工作流程等等。

從市場(chǎng)角度來(lái)看,當(dāng)前技術(shù)無(wú)法更好地支持跨業(yè)務(wù)、跨場(chǎng)景、跨部門乃至跨行業(yè)的超級(jí)智能體,但可以更垂直細(xì)分業(yè)務(wù)流程、場(chǎng)景或者某個(gè)領(lǐng)域,適應(yīng)市場(chǎng)需求的垂直AI Agent也就由此而生。

垂直AI Agent的主要優(yōu)勢(shì)在于其高度專業(yè)化和定制化的特點(diǎn),這使得它們?cè)谔囟I(lǐng)域中的表現(xiàn)往往優(yōu)于通用智能體。它們具有效率高、響應(yīng)快的特點(diǎn),并且在特定領(lǐng)域內(nèi)經(jīng)過(guò)大量訓(xùn)練和優(yōu)化,具有較高的穩(wěn)定性和可靠性。

當(dāng)然垂直AI Agent的劣勢(shì)在于適應(yīng)性較差,難以處理超出其專業(yè)領(lǐng)域的任務(wù),同時(shí)開發(fā)成本較高,因?yàn)樾枰槍?duì)特定領(lǐng)域進(jìn)行深度定制和優(yōu)化。

垂直AI Agent的應(yīng)用領(lǐng)域非常廣泛,包括但不限于醫(yī)療、金融、客戶支持、市場(chǎng)研究與分析等。例如,在醫(yī)療領(lǐng)域,IBM Watson for Oncology 是一款專注于癌癥治療的垂直智能體,通過(guò)分析大量的醫(yī)療數(shù)據(jù)和文獻(xiàn),幫助醫(yī)生制定個(gè)性化的治療方案。在金融領(lǐng)域,自動(dòng)交易系統(tǒng)是一種應(yīng)用于金融領(lǐng)域的垂直智能體,通過(guò)分析市場(chǎng)數(shù)據(jù)和歷史交易記錄,自動(dòng)執(zhí)行買賣操作,以實(shí)現(xiàn)最大化收益。

2025年開始,基于更成熟的技術(shù)和更大的用戶需求量,垂直Agent將會(huì)快速占領(lǐng)市場(chǎng)。

趨勢(shì)六:Agentic AI將成企業(yè)頂層戰(zhàn)略

Agentic AI(Agent智能\代理智能),是指能夠感知環(huán)境、理解情境并在此基礎(chǔ)上執(zhí)行復(fù)雜任務(wù)的人工智能系統(tǒng)。這些系統(tǒng)通常被設(shè)計(jì)成能夠在物理世界或虛擬環(huán)境中以自主或半自主的方式運(yùn)作,它們能夠處理多種輸入模式,如視覺、語(yǔ)言、聲音等,并以此作出決策和響應(yīng)。

Gen AI聊天機(jī)器人和副駕駛可以直觀地與人類交互,合成復(fù)雜的信息并生成內(nèi)容。但它們?nèi)狈gentic AI的Agent性和自主性。AI Agent能夠獨(dú)立行動(dòng),將工作分解為離散的步驟,并在最少的人工監(jiān)督或干預(yù)下完成工作。AI Agent不僅僅是交互,hai 可以更有效地代表用戶進(jìn)行推理和操作。

Agentic AI具有“能動(dòng)性”,具備采取行動(dòng)和選擇要采取的行動(dòng)的能力。這些目標(biāo)是由人類設(shè)定的,但Agent決定如何實(shí)現(xiàn)這些目標(biāo)。其中的重點(diǎn)不在于AI Agent將會(huì)多么智能,而是人工智能從GenAI發(fā)展到Agentic AI ,隨著它的流行可以將“AI Agent”技術(shù)帶入到更多的業(yè)務(wù)流程中,成為企業(yè)AI戰(zhàn)略的主流技術(shù),從而提升AI Agent在各領(lǐng)域的市場(chǎng)滲透。

AI技術(shù)發(fā)展到當(dāng)前這個(gè)時(shí)間節(jié)點(diǎn),我們沒(méi)有用大語(yǔ)言模型或者GenAI對(duì)AI進(jìn)行宏觀敘事,而是用Agentic AI來(lái)表述現(xiàn)階段的AI特征,顯然它能夠簡(jiǎn)單、直觀的體現(xiàn)目前的AI應(yīng)用現(xiàn)狀及趨勢(shì)。接下來(lái),Agentic AI所代表的主動(dòng)性、可感知的自動(dòng)化技術(shù),將會(huì)一改專家系統(tǒng)和RPA步履蹣跚的現(xiàn)狀,成為各大組織戰(zhàn)略層面發(fā)展愿景并進(jìn)入技術(shù)采購(gòu)清單。

在過(guò)去兩年中,投資者向Agentic AI初創(chuàng)公司投入了超過(guò)20億美元,將投資重點(diǎn)放在針對(duì)企業(yè)市場(chǎng)的公司上。與此同時(shí),許多科技公司、云提供商和其他公司正在開發(fā)自己的Agentic AI 產(chǎn)品。他們還在進(jìn)行戰(zhàn)略收購(gòu),越來(lái)越多地從初創(chuàng)公司那里獲得Agent人工智能技術(shù)的許可并雇用他們的員工,而不是直接收購(gòu)這些公司。

Agentic AI 不同于現(xiàn)在的聊天機(jī)器人和副駕駛,它能夠明顯提高知識(shí)工作者的工作效率,并跨業(yè)務(wù)職能實(shí)現(xiàn)多步驟流程的自動(dòng)化。德勤預(yù)測(cè),到2025年,25% 使用一代AI的公司將推出Agentic AI試點(diǎn)或概念驗(yàn)證,到2027年將增長(zhǎng)到 50%。

趨勢(shì)七:GUI Agent產(chǎn)品得到更多應(yīng)用

圖形用戶界面(GUI)長(zhǎng)期以來(lái)是人機(jī)交互的核心,通過(guò)直觀、可視化的方式,讓用戶能夠輕松操控?cái)?shù)字系統(tǒng)。但傳統(tǒng)的GUI交互自動(dòng)化多依賴腳本或規(guī)則驅(qū)動(dòng)的方法,這些方法在固定流程中表現(xiàn)尚可,卻缺乏靈活性和適應(yīng)性,難以滿足復(fù)雜、動(dòng)態(tài)的實(shí)際需求。

GUI Agent被定義為在GUI環(huán)境中運(yùn)行的智能體,利用LLM作為核心推理引擎,以靈活、自適應(yīng)的方式生成、規(guī)劃和執(zhí)行操作。

LLM驅(qū)動(dòng)的GUI Agent代表了GUI自動(dòng)化的新范式,整合了自然語(yǔ)言理解、視覺識(shí)別和決策制定,極大提升了任務(wù)自動(dòng)化的直觀性和效率。與傳統(tǒng)API驅(qū)動(dòng)Agent不同,GUI Agent無(wú)需訪問(wèn)內(nèi)部API,利用圖形界面的通用性實(shí)現(xiàn)跨平臺(tái)操作,具有無(wú)侵入特性,擴(kuò)展了應(yīng)用范圍。這種轉(zhuǎn)變簡(jiǎn)化了用戶與復(fù)雜系統(tǒng)的交互,降低了認(rèn)知負(fù)擔(dān),使非技術(shù)用戶也能輕松使用。

例如,SeeAct、AppAgent和UFO等Agent在網(wǎng)絡(luò)導(dǎo)航、移動(dòng)應(yīng)用交互和操作系統(tǒng)中展現(xiàn)了巨大潛力,類似于科幻電影中的“虛擬助手”,能夠理解用戶目標(biāo)并執(zhí)行跨應(yīng)用任務(wù)。實(shí)際應(yīng)用中,如Microsoft Power Automate和Copilot,它們通過(guò)LLM支持低代碼/無(wú)代碼自動(dòng)化,設(shè)計(jì)跨應(yīng)用工作流,彌合了自然語(yǔ)言指令與應(yīng)用操作之間的鴻溝,同時(shí)為無(wú)障礙功能提供了新機(jī)遇,幫助視障用戶更高效地操作GUI。

LLM驅(qū)動(dòng)的GUI Agent在網(wǎng)絡(luò)導(dǎo)航、移動(dòng)應(yīng)用交互和桌面自動(dòng)化等領(lǐng)域展現(xiàn)出巨大潛力,為用戶與軟件的交互方式帶來(lái)顛覆性改變。這一新興領(lǐng)域正在快速發(fā)展,學(xué)術(shù)界和工業(yè)界均取得了顯著進(jìn)展。

目前GUI Agent技術(shù)框架有騰訊AppAgent、智譜AutoGLM、微軟OmniParser、Athropic的Compute Use、CogAgent等。

需要說(shuō)明的是,除了GUI Agent,UI Agent也在快速發(fā)展。UI Agent是更廣泛的概念,是能夠與任何用戶界面(User Interface)交互的智能體,包括圖形用戶界面(GUI)、命令行界面(CLI)、觸摸屏界面等。

2025年,隨著更多多模態(tài)大語(yǔ)言模型的深度應(yīng)用以及相關(guān)技術(shù)框架的推出,GUI Agent、UI Agent產(chǎn)品將會(huì)得到更多的應(yīng)用。

趨勢(shì)八:RAG類Agent更受企業(yè)青睞

檢索增強(qiáng)生成技術(shù)(Retrieval-Augmented Generation,RAG)正在為企業(yè)級(jí)人工智能應(yīng)用帶來(lái)革新性變革。該技術(shù)巧妙地將大型語(yǔ)言模型的生成能力與外部知識(shí)檢索機(jī)制相融合,構(gòu)建了一個(gè)具備精確性、可靠性且具有上下文感知能力的AI Agent。

從技術(shù)層面來(lái)看,RAG的核心機(jī)制在于在生成響應(yīng)之前,引入專業(yè)知識(shí)庫(kù)的檢索和驗(yàn)證環(huán)節(jié)。這一創(chuàng)新顯著降低了AI系統(tǒng)產(chǎn)生"幻覺"(生成表面合理但實(shí)際錯(cuò)誤信息)的可能性。對(duì)企業(yè)而言,這種機(jī)制的重要性尤為突出,特別是在法律、醫(yī)療衛(wèi)生、金融服務(wù)等對(duì)信息準(zhǔn)確性要求極高的領(lǐng)域。

推動(dòng)企業(yè)采用RAG技術(shù)的主要因素在于其顯著的經(jīng)濟(jì)效益和資源整合優(yōu)勢(shì)。企業(yè)無(wú)需持續(xù)進(jìn)行大規(guī)模模型重訓(xùn)練,即可有效提升AI系統(tǒng)的準(zhǔn)確性;同時(shí)能夠充分利用現(xiàn)有知識(shí)庫(kù)和數(shù)據(jù)資源,確保AI輸出與企業(yè)專有信息和政策保持高度一致。

基于RAG技術(shù)的AI Agent在企業(yè)應(yīng)用中展現(xiàn)出巨大潛力。在智能客服領(lǐng)域,它能提供基于企業(yè)知識(shí)庫(kù)的精準(zhǔn)答復(fù),實(shí)現(xiàn)多輪對(duì)話中的上下文理解;在知識(shí)管理方面,可以構(gòu)建智能化文檔檢索系統(tǒng),優(yōu)化企業(yè)內(nèi)部知識(shí)流轉(zhuǎn);在決策支持領(lǐng)域,能夠基于歷史數(shù)據(jù)提供決策建議,實(shí)時(shí)分析市場(chǎng)動(dòng)態(tài);在業(yè)務(wù)流程方面,可實(shí)現(xiàn)智能化文檔處理和數(shù)據(jù)分析,顯著提升工作效率。

從機(jī)器學(xué)習(xí)技術(shù)發(fā)展趨勢(shì)來(lái)看,RAG技術(shù)的應(yīng)用將更加深入和廣泛。其獨(dú)特優(yōu)勢(shì)在于實(shí)現(xiàn)了生成模型的靈活性與專業(yè)知識(shí)庫(kù)的可靠性的有機(jī)結(jié)合,為企業(yè)提供了一條在保證準(zhǔn)確性和相關(guān)性的前提下,有效實(shí)施AI解決方案的可行路徑。

這種技術(shù)框架的創(chuàng)新,不僅優(yōu)化了企業(yè)AI應(yīng)用的性能表現(xiàn),更為企業(yè)數(shù)字化轉(zhuǎn)型提供了新的技術(shù)支撐。隨著技術(shù)的不斷完善,基于RAG的AI Agent將在企業(yè)智能化建設(shè)中發(fā)揮越來(lái)越重要的作用,推動(dòng)企業(yè)運(yùn)營(yíng)效率和服務(wù)質(zhì)量的全面提升。

這種形勢(shì)下,在2025年,RAG類AI Agent將會(huì)在企業(yè)中中得到更深入的應(yīng)用。

趨勢(shì)九:Agentic workflow推動(dòng)代理編排層興起

Agentic Workflow是一種AI驅(qū)動(dòng)的工作流程,通過(guò)自適應(yīng)循環(huán)和多步驟任務(wù)分解,實(shí)現(xiàn)復(fù)雜任務(wù)的自動(dòng)化。它利用AI Agent收集反饋、評(píng)估性能,并動(dòng)態(tài)調(diào)整行為以優(yōu)化工作流。

Agentic Workflow在簡(jiǎn)化AI應(yīng)用程序開發(fā)的同時(shí),也促進(jìn)了Agent編排層(agentic orchestration layer) 的興起,使開發(fā)人員能夠更輕松地構(gòu)建復(fù)雜的AI 解決方案。

從LLM到AI Agent,從Workflow到Agentic Workflow,25篇論文全面了解智能體工作流

Agent編排層正在重塑AI應(yīng)用程序的開發(fā)格局,它通過(guò)簡(jiǎn)化工作流程、提升效率和促進(jìn)協(xié)作,使得構(gòu)建復(fù)雜的AI解決方案變得更加便捷。這一趨勢(shì)的核心在于Agent工作流的興起,它賦予開發(fā)人員能力,使其能夠輕松構(gòu)建和管理執(zhí)行各種任務(wù)的多個(gè)自治Agent,如提供保險(xiǎn)報(bào)價(jià)、處理談判、執(zhí)行合同和提交索賠等。

智能體商用元年開啟,2025年AI Agent行業(yè)發(fā)展十三大趨勢(shì)

編排層的運(yùn)作機(jī)制涉及多個(gè)關(guān)鍵方面:

首先,它協(xié)調(diào)自治Agent,管理執(zhí)行不同任務(wù)的多個(gè)Agent,這些Agent相互交互,并與編排層交互,以提供全面的任務(wù)驅(qū)動(dòng)型解決方案。

其次,編排層利用上下文層動(dòng)態(tài)提取相關(guān)數(shù)據(jù),確保Agent具有上下文感知能力,從而提高決策的準(zhǔn)確性和效率。

再者,它從數(shù)據(jù)層為Agent提供執(zhí)行任務(wù)所需的信息,彌合大型數(shù)據(jù)源和AI模型之間的差距,并最終將自主Agent連接到應(yīng)用程序?qū),用戶在這里與系統(tǒng)交互并接收結(jié)果,簡(jiǎn)化了用戶體驗(yàn)。

編排層的益處在于它能夠簡(jiǎn)化復(fù)雜的工作流程,通過(guò)協(xié)調(diào)多個(gè)Agent,抽象出復(fù)雜性,讓開發(fā)人員專注于構(gòu)建更高級(jí)別的功能。它支持無(wú)縫添加新的Agent和工具,輕松擴(kuò)展AI解決方案。自動(dòng)化數(shù)據(jù)檢索、上下文管理和決策流程,減少人工干預(yù),加快任務(wù)完成速度。

編排層增強(qiáng)了協(xié)作能力,使座席能夠動(dòng)態(tài)協(xié)作,共享上下文和結(jié)果,實(shí)現(xiàn)更全面的解決方案。它的靈活性還體現(xiàn)在能夠集成各種工具,如LLM、API和數(shù)據(jù)庫(kù),使系統(tǒng)適應(yīng)不同的行業(yè)和用例。這些優(yōu)勢(shì),共同推動(dòng)了AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用和發(fā)展。

2025年,由Agentic workflow推動(dòng)的Agent編排層將會(huì)成為智能體平臺(tái)的標(biāo)配。

趨勢(shì)十:端側(cè)AI Agent加速落地

端側(cè)AI Agent,即在用戶設(shè)備上直接運(yùn)行的智能體,它們能夠在本地處理數(shù)據(jù),提供即時(shí)響應(yīng),同時(shí)保護(hù)用戶隱私。這種技術(shù)的應(yīng)用,正在改變我們與智能設(shè)備的互動(dòng)方式,以及設(shè)備處理信息的能力。

端側(cè)AI Agent的應(yīng)用場(chǎng)景廣泛,從智能手機(jī)、PC、汽車到XR設(shè)備以及物聯(lián)網(wǎng)設(shè)備,幾乎涵蓋了所有消費(fèi)電子產(chǎn)品品類。這些智能體能夠根據(jù)用戶的行為和偏好提供個(gè)性化的服務(wù)和響應(yīng),極大地提升了設(shè)備的智能化程度。

隨著硬件廠商的集成,全球智能手機(jī)市場(chǎng)進(jìn)入存量發(fā)展階段,AI智能體有望開啟創(chuàng)新驅(qū)動(dòng)周期,提高手機(jī)智能化程度,顛覆現(xiàn)有人機(jī)交互模式。同時(shí),端側(cè)AI的長(zhǎng)期發(fā)展需要云端協(xié)同,將催生大量云端推理算力需求,推動(dòng)云計(jì)算和邊緣計(jì)算的進(jìn)一步發(fā)展。

端側(cè)AI Agent的加速落地不僅標(biāo)志著AI技術(shù)從云端向邊緣設(shè)備的轉(zhuǎn)移,也為AI的創(chuàng)新和發(fā)展打開了無(wú)限想象空間。在更廣泛的消費(fèi)電子產(chǎn)品品類中,端側(cè)AI Agent為用戶帶來(lái)全新的AI體驗(yàn),也推動(dòng)了相關(guān)產(chǎn)業(yè)鏈的升級(jí)和變革。

隨著技術(shù)的不斷成熟和應(yīng)用的不斷深入,端側(cè)AI Agent有望在未來(lái)幾年內(nèi)成為智能設(shè)備的標(biāo)準(zhǔn)配置,引領(lǐng)智能交互的新潮流。

2025 年,AI Agent將與物聯(lián)網(wǎng) (IoT) 更加深入地集成。這種集成將實(shí)現(xiàn)設(shè)備之間的無(wú)縫通信,從而增強(qiáng)自動(dòng)化、數(shù)據(jù)分析和實(shí)時(shí)決策。從智能家居和辦公室到智慧城市,AI Agent將很快無(wú)需人工干預(yù)即可控制設(shè)備、管理工作流程和優(yōu)化系統(tǒng)。

在未來(lái)的一年里,我們還將看到AI Agent集成到手機(jī)、PC 和智能手表等個(gè)人設(shè)備中。在你智能手機(jī)或筆記本電腦上擁有虛擬助手,隨時(shí)可以為你自主運(yùn)行任務(wù)。

端側(cè)AI Agent,正以前所未有的速度在各個(gè)領(lǐng)域落地。

趨勢(shì)十一:Web Agent將成殺手級(jí)AI應(yīng)用

隨著人工智能技術(shù)的快速發(fā)展,Web Agent作為新一代智能交互方式,正在引起業(yè)界廣泛關(guān)注。這一技術(shù)旨在實(shí)現(xiàn)網(wǎng)絡(luò)任務(wù)的全自動(dòng)化處理,包括訂閱管理、賬單支付、醫(yī)療預(yù)約、在線購(gòu)物、餐廳預(yù)訂等日常事務(wù),用戶無(wú)需伸出手指操作網(wǎng)頁(yè)通過(guò)語(yǔ)音或文字指令即可完成操作。

縱觀技術(shù)發(fā)展歷程,Web Agent的理念雖然由來(lái)已久,但在實(shí)際應(yīng)用層面,目前市場(chǎng)尚未出現(xiàn)一款成熟的通用型Web Agent產(chǎn)品。Radical Ventures風(fēng)險(xiǎn)投資人Rob Toews認(rèn)為這種情況正在發(fā)生改變:得益于語(yǔ)言模型與計(jì)算機(jī)視覺技術(shù)的持續(xù)突破,特別是在"第二系統(tǒng)思維"(System 2 thinking)推理能力方面的重要進(jìn)展,Web Agent的實(shí)用化進(jìn)程正在顯著加快。

第二系統(tǒng)思維"源自諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾卡尼曼(Daniel Kahneman)提出的雙系統(tǒng)理論。與直覺性、快速的"第一系統(tǒng)思維"相比,"第二系統(tǒng)思維"是一種更為深入、審慎的認(rèn)知過(guò)程,體現(xiàn)為緩慢、理性、分析性的思考方式。在AI領(lǐng)域,這種能力具體表現(xiàn)為系統(tǒng)可以進(jìn)行多步推理、復(fù)雜規(guī)劃和邏輯分析,這正是Web Agent執(zhí)行復(fù)雜任務(wù)所必需的核心能力。

值得注意的是,專注于AI Agent研發(fā)的初創(chuàng)公司Adept的發(fā)展受阻,從側(cè)面反映出技術(shù)成熟度與市場(chǎng)時(shí)機(jī)的重要性。對(duì)初創(chuàng)企業(yè)而言,準(zhǔn)確把握技術(shù)發(fā)展周期與市場(chǎng)需求的最佳結(jié)合點(diǎn)至關(guān)重要。

業(yè)界普遍認(rèn)為,2025年將成為Web Agent技術(shù)發(fā)展的重要里程碑。盡管該技術(shù)在企業(yè)級(jí)應(yīng)用中具有顯著潛力,但從市場(chǎng)發(fā)展態(tài)勢(shì)來(lái)看,消費(fèi)者市場(chǎng)很可能成為Web Agent最先突破的領(lǐng)域。

目前,在消費(fèi)級(jí)AI應(yīng)用中,除ChatGPT外,能夠?qū)崿F(xiàn)廣泛應(yīng)用的產(chǎn)品相對(duì)有限。Web Agent有望改變這一現(xiàn)狀,成為AI領(lǐng)域繼ChatGPT之后的又一個(gè)具有變革性意義的應(yīng)用。

趨勢(shì)十二:AI Agent重塑工作方式

AI Agent正逐步改變我們的工作方式,預(yù)計(jì)2025年,這一趨勢(shì)將加速發(fā)展。

微軟研究顯示,近70%的財(cái)富500強(qiáng)企業(yè)員工已開始使用AI工具處理繁瑣任務(wù),如篩選電子郵件、記錄會(huì)議紀(jì)要等。未來(lái),AI Agent將能處理更復(fù)雜的任務(wù),甚至替代人類完成某些工作。

微軟商業(yè)與行業(yè)Copilot 副總裁 Charles Lamanna 表示:將Agent視為AI 時(shí)代的應(yīng)用程序,就像使用不同的應(yīng)用來(lái)完成各種任務(wù)一樣,Agent將開始改變每個(gè)業(yè)務(wù)流程,革新工作以及管理組織的方式。

隨著記憶、推理和多模態(tài)能力的進(jìn)步,Agent將會(huì)以新的技能和互動(dòng)形式處理更復(fù)雜的任務(wù)。組織機(jī)構(gòu)可以借此重新構(gòu)想報(bào)告生成和人力資源任務(wù)等流程,例如幫助解決新?lián)Q筆記本電腦的問(wèn)題或回答福利問(wèn)題,讓員工能夠?qū)W⒂诟邇r(jià)值的工作。企業(yè)也可以設(shè)置多個(gè)Agent來(lái)提醒供應(yīng)鏈經(jīng)理關(guān)于庫(kù)存中斷的問(wèn)題,推薦新的供應(yīng)商并執(zhí)行銷售訂單,以應(yīng)對(duì)日常挑戰(zhàn),從而保持銷售。

AI Agent將不僅僅是助手,它們還能根據(jù)用戶需求獨(dú)立或協(xié)同完成工作流程,從創(chuàng)建報(bào)告、處理客戶需求到協(xié)調(diào)供應(yīng)鏈管理,全面提升工作效率,讓人類有更多精力投入創(chuàng)造性和戰(zhàn)略性任務(wù)。

目前,微軟已經(jīng)建立世界最大的AI智能體生態(tài)系統(tǒng)。官方數(shù)據(jù)顯示,已經(jīng)有超過(guò)10萬(wàn)家公司,用Copilot Studio創(chuàng)建了AI 智能體。比如,麥肯錫通過(guò)自動(dòng)化的流程分配智能體,將項(xiàng)目受理流程從 20 天縮短至僅 2 天;Pets at Home 在不到兩周內(nèi)部署了防欺詐智能體,每年節(jié)省數(shù)百萬(wàn)美元……

可以預(yù)見,2025年AI Agent將隨著更多科技公司服務(wù)更多的企業(yè)用戶,重塑更多用戶的工作方式。

趨勢(shì)十三:AI Agent進(jìn)一步改變大眾生活

AI不僅將影響工作,還將深度融入我們的日常生活。到2025年,AI工具將成為個(gè)人生活中不可或缺的一部分。許多AI工具幫助用戶處理日常任務(wù),如管理信息、提醒重要事項(xiàng)、回答個(gè)人問(wèn)題等,簡(jiǎn)化生活瑣事。

事實(shí)上,很多AI工具現(xiàn)在已經(jīng)升級(jí)成為AI Agent,或者實(shí)現(xiàn)了與Agent的聯(lián)動(dòng)。AI工具不僅能提升生活效率,還能增強(qiáng)與用戶的互動(dòng)。例如,根據(jù)用戶閱讀的新聞提供摘要,或通過(guò)視覺能力理解網(wǎng)頁(yè)內(nèi)容并給出即時(shí)反饋。

在家居生活方面,AI助手還能推薦合適家具、幫助布置家居環(huán)境,甚至提供風(fēng)水建議。隨著技術(shù)進(jìn)步,未來(lái)的AI伴侶將更智能、更有情感,提供更個(gè)性化和貼心的服務(wù),讓生活更加便捷和豐富。

以Microsoft Copilot為例,作為AI助理,它將全天候提供支持,它可以幫助簡(jiǎn)化和優(yōu)先處理如日常收到的大量信息等任務(wù),在保護(hù)隱私、數(shù)據(jù)和安全的同時(shí),為用戶釋放更多時(shí)間。接下來(lái)更多公司的智能助理類產(chǎn)品都將因?yàn)椴捎肁gent模式而變得更加智能和易用,并能夠主動(dòng)幫助用戶處理更多的問(wèn)題。

如今所有采用AI技術(shù)的軟件應(yīng)用都在向AI Agent過(guò)渡,這也就意味著2025年開始我們所使用的手機(jī)、PC、手表等智能硬件將會(huì)迭代成為智能體,我們所使用的更多軟件應(yīng)用也將會(huì)升級(jí)為智能體。未來(lái)所有軟件與硬件都要向智能體發(fā)展,它會(huì)更大程度地改變我們的生活。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港