新智元報(bào)道
編輯:peter東 喬楊【新智元導(dǎo)讀】經(jīng)過了LLM、RAG、多模態(tài)等多輪技術(shù)風(fēng)口的洗禮后,AI智能體的應(yīng)用現(xiàn)狀究竟如何?Langbase公司最近發(fā)布的調(diào)查報(bào)告通過11個(gè)關(guān)鍵問題,為我們提供了一份有價(jià)值的現(xiàn)狀切面。2024年,AI智能體技術(shù)無疑是科技界的焦點(diǎn)。
通過對來自100多個(gè)國家的3400名開發(fā)者進(jìn)行深入調(diào)查,Langbase公司近日發(fā)布的一項(xiàng)報(bào)告揭示了智能體開發(fā)中的關(guān)鍵問題。這項(xiàng)調(diào)查的受訪者中,有46%是企業(yè)領(lǐng)導(dǎo)層,26%是工程師。Langbase專注于提供無服務(wù)器的AI云開發(fā)體驗(yàn)。作為一個(gè)提供可組合基礎(chǔ)設(shè)施的AI平臺,他們在2024年一共處理了來自3.6萬開發(fā)人員的1840億個(gè)token和7.86億個(gè)API請求。提起Langbase這個(gè)名字,你也許不太熟悉。事實(shí)上,這家公司非常年輕,2023年剛剛成立。
根據(jù)Crunchbase披露的數(shù)據(jù),他們剛剛才在9月份進(jìn)行了pre-seed輪融資,但已經(jīng)得到了谷歌、蘋果、OpenAI、微軟等大廠高管們的資金支持。下面就讓我們一起來看看這家年輕有為的Langbase發(fā)布的這份圖文并茂的報(bào)告中究竟提到了哪些內(nèi)容。問題1:開發(fā)者在使用哪些基座大模型在這場AI智能體的競賽中,OpenAI的大模型服務(wù)占據(jù)了主導(dǎo)地位,但谷歌正迅速崛起,成為其強(qiáng)勁的競爭對手,Anthropic緊隨其后。其中,Meta的Llama、Mistral和Cohere雖然影響力較小,但增長勢頭不容忽視,顯示出基座大模型市場的激烈競爭。
問題2:不同大模型對應(yīng)的的具體用途OpenAI在翻譯任務(wù)中被廣泛應(yīng)用,Anthropic在技術(shù)任務(wù)中備受青睞,而谷歌的模型在健康和翻譯領(lǐng)域占據(jù)主導(dǎo)地位。此外,Meta在科技和科學(xué)應(yīng)用中得到了廣泛使用,Cohere也在多個(gè)領(lǐng)域得到重視,包括科學(xué)和營銷。
問題3:哪些因素阻礙了你對大模型技術(shù)的應(yīng)用在模型的擴(kuò)展和部署中,數(shù)據(jù)隱私和安全合規(guī)性成為主要關(guān)注點(diǎn),「缺乏監(jiān)控工具」和「高基礎(chǔ)設(shè)施成本」這兩項(xiàng)因素也阻礙了技術(shù)的落地應(yīng)用。對AI驅(qū)動(dòng)解決方案的抵制或懷疑反映了使用者們的長期顧慮,這表明,模型和技術(shù)的提供商們需要更加透明和用戶友好的AI平臺。
問題4:哪些因素影響大模型的選擇在選擇大型語言模型(LLM)時(shí),準(zhǔn)確性是最重要的因素,其次是安全性和可定制性,成本的影響相對較小。
問題5:在部署大模型時(shí),你遇到的最大挑戰(zhàn)是什么?在生產(chǎn)環(huán)境中部署大模型和智能體面臨著種種關(guān)鍵挑戰(zhàn),包括定制困難、質(zhì)量保證評估方法有限,以及缺乏可重用的基礎(chǔ)設(shè)施。此外,工具碎片化、集成問題和可擴(kuò)展性等方面的顧慮進(jìn)一步復(fù)雜化了這個(gè)過程。
問題6:采用大模型技術(shù)時(shí),你的主要目標(biāo)是什么?「自動(dòng)化」和「簡化」是AI應(yīng)用的首要任務(wù),使公司在效率和流程簡化方面受益;此外,定制解決方案和提升合作流程等方面的目標(biāo),反映了大模型日益增長的靈活性,以及消費(fèi)者對系統(tǒng)共享訪問的興趣。
問題7:您的公司如何使用大模型智能體?LLM在軟件開發(fā)中得到廣泛應(yīng)用,尤其在市場營銷、IT運(yùn)營和文本摘要等方面,客服、人力資源和法律領(lǐng)域的使用興趣也在日益增長。
問題8:那些平臺特征對你至關(guān)重要大多數(shù)受訪者都需要多智能體檢索增強(qiáng)生成(RAG)功能以提高上下文信息處理,同時(shí),評估工具對于確保人工智能系統(tǒng)按預(yù)期工作也很重要。
問題9,在編排AI流水線時(shí),開發(fā)者偏好哪種工具大多數(shù)受訪者更喜歡能提供靈活、基礎(chǔ)原語的開發(fā)工具以設(shè)計(jì)定制AI流水線(pipeline)。預(yù)構(gòu)建的、針對特定問題的解決方案雖然可以直接解決具體問題,但它們的可定制性較低。
問題10:什么因素影響大模型智能體開發(fā)工具的選擇開發(fā)者將AI智能體的版本控制視為開發(fā)平臺最重要的功能。強(qiáng)大的SDK或庫生態(tài)系統(tǒng)以及本地開發(fā)環(huán)境也受到重視。
問題11:大模型在公司中的應(yīng)用程度大多數(shù)開發(fā)者將 AI 用于實(shí)驗(yàn)和生產(chǎn)。相比之下,實(shí)驗(yàn)用途的比例遠(yuǎn)遠(yuǎn)大于生產(chǎn)用途,但后者的比例仍在穩(wěn)步前進(jìn)的過程中。
隨著AI智能體基礎(chǔ)設(shè)施的成熟,越來越多的企業(yè)會嘗試開發(fā)智能體,而隨著多模態(tài)及大模型操作計(jì)算環(huán)境(例如Claude通過接口在線互動(dòng))的發(fā)展,智能體在2025年的應(yīng)用將更加廣泛,甚至不僅僅局限于報(bào)告中提到的軟件開發(fā)、市場營銷、IT運(yùn)營和文本摘要等領(lǐng)域。然而,該調(diào)查中揭示的開發(fā)者關(guān)注的問題,例如更看重準(zhǔn)確性、安全性和可定制性,而成本因素影響較小,以及偏好靈活、可定制的AI流水線開發(fā)工具,并重視AI智能體版本控制功能。無論技術(shù)怎么進(jìn)步,這份調(diào)查結(jié)果都會對智能體平臺及開發(fā)者有參考價(jià)值。參考資料:
https://langbase.com/state-of-ai-agents?genai
https://x.com/MrAhmadAwais/status/1866483416981786821