展會(huì)信息港展會(huì)大全

OpenAI憋新大招:將推AI Agent,會(huì)操控電腦
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-14 20:44:52   瀏覽:0次  

導(dǎo)讀:智東西(公眾號(hào):zhidxcom)編譯 | 汪越編輯 |Panken智東西11月14日消息,據(jù)彭博社報(bào)道,據(jù)知情人士透露,OpenAI正在開發(fā)一款名為“Operator”的AI Agent(AI代理、AI智能體),計(jì)劃于明年1月發(fā)布。這款工具將能夠自動(dòng)執(zhí)行包括編寫代碼、預(yù)訂旅行等在內(nèi)的復(fù)雜任務(wù),并將作為研究預(yù)覽版發(fā)布,面向開發(fā)者提供API接口。OpenAI目前尚未置評(píng)。據(jù)三位知情人士透露,OpenAI還在進(jìn)行多 ......

智東西(公眾號(hào):zhidxcom)

編譯 | 汪越

編輯 |Panken

智東西11月14日消息,據(jù)彭博社報(bào)道,據(jù)知情人士透露,OpenAI正在開發(fā)一款名為“Operator”的AI Agent(AI代理、AI智能體),計(jì)劃于明年1月發(fā)布。這款工具將能夠自動(dòng)執(zhí)行包括編寫代碼、預(yù)訂旅行等在內(nèi)的復(fù)雜任務(wù),并將作為研究預(yù)覽版發(fā)布,面向開發(fā)者提供API接口。OpenAI目前尚未置評(píng)。

據(jù)三位知情人士透露,OpenAI還在進(jìn)行多個(gè)與Agent相關(guān)的研究項(xiàng)目,其中最接近完成的是一款通用工具,能夠在Web瀏覽器中執(zhí)行任務(wù)。

隨著大語(yǔ)言模型(LLM)發(fā)展進(jìn)入瓶頸期,OpenAI、美國(guó)AI大模型獨(dú)角獸Anthropic、微軟、谷歌等科技公司紛紛轉(zhuǎn)向開發(fā)AI Agent,試圖通過這一新領(lǐng)域打破現(xiàn)有的技術(shù)平臺(tái)期,搶占市場(chǎng)先機(jī)。

據(jù)彭博社報(bào)道,Anthropic在10月推出了一款類似的AI Agent。與其他AI Agent不同,這款工具不僅能夠與瀏覽器進(jìn)行互動(dòng),還能直接控制用戶計(jì)算機(jī)上的多個(gè)應(yīng)用程序。這項(xiàng)名為“計(jì)算機(jī)使用”的功能可以實(shí)時(shí)解析用戶屏幕上的內(nèi)容,并在獲得授權(quán)后,執(zhí)行如瀏覽網(wǎng)頁(yè)、點(diǎn)擊按鈕和輸入文本等任務(wù)。

目前,Anthropic正在向其Claude模型的開發(fā)者提供該工具的測(cè)試版,幾周前,該工具也已在部分企業(yè)客戶中進(jìn)行了初步測(cè)試。

OpenAI憋新大招:將推AI Agent,會(huì)操控電腦

▲Anthropic展示如何在計(jì)算機(jī)中使用AI Agent(圖源:YouTube)

微軟也在加速推進(jìn)其AI Agent的商業(yè)化。今年10月,在倫敦舉辦的微軟“AI Tour”活動(dòng)中,微軟宣布將為Dynamics 365系列業(yè)務(wù)應(yīng)用推出10個(gè)新的AI Agent,涵蓋銷售、客戶支持和會(huì)計(jì)等領(lǐng)域。微軟計(jì)劃從12月起提供這些AI Agent的公共預(yù)覽版,并持續(xù)至2025年初。

同時(shí),微軟還計(jì)劃在11月發(fā)布Copilot Studio的公開預(yù)覽版,幫助企業(yè)構(gòu)建和使用定制化的AI Agent。Copilot Studio是微軟Copilot的擴(kuò)展平臺(tái),允許用戶根據(jù)需求定制AI Agent。

OpenAI憋新大招:將推AI Agent,會(huì)操控電腦

▲微軟將推出10個(gè)AI Agent,幫助完成銷售、客戶支持和會(huì)計(jì)等工作。(圖源:微軟)

據(jù)The Information報(bào)道,谷歌正在研發(fā)一款名為“Jarvis”的AI Agent,該工具可以接管用戶的網(wǎng)絡(luò)瀏覽器,自動(dòng)執(zhí)行如收集研究資料、購(gòu)買產(chǎn)品和預(yù)訂航班等任務(wù)。預(yù)計(jì)這款工具將在12月發(fā)布預(yù)覽版,并將與谷歌的下一代大語(yǔ)言模型Gemini一同推出。

谷歌的AI AgentAnthropic的相似,都能通過頻繁捕捉用戶計(jì)算機(jī)屏幕的內(nèi)容來響應(yīng)指令,但在操作范圍上有所不同。谷歌的Jarvis專注于瀏覽器操作,Anthropic的工具能控制用戶計(jì)算機(jī)上的各類應(yīng)用程序。

結(jié)語(yǔ):誰能占領(lǐng)AI Agent市場(chǎng)的制高點(diǎn)?

發(fā)布AI Agent的舉措,正值OpenAI及其競(jìng)爭(zhēng)對(duì)手在開發(fā)更先進(jìn)AI模型時(shí)發(fā)現(xiàn)高昂投入的回報(bào)遞減之際。

隨著LLM改進(jìn)速度放緩,OpenAI和其他公司正在積極尋找新的技術(shù)突破口。今年10月,OpenAI CEO薩姆阿爾特曼(Sam Altman)在Reddit的“Ask Me Anything”會(huì)議上談道,AI Agent將是下一個(gè)重大突破的方向。

AI Agent正在逐步成為自動(dòng)化任務(wù)和提升生產(chǎn)力的重要組成部分。OpenAI、Anthropic、微軟和谷歌等科技公司都在爭(zhēng)相開發(fā)各自的AI Agent,Salesforce等公司也開始加入進(jìn)來,計(jì)劃推出定制化的AI Agent。未來,誰能在這場(chǎng)競(jìng)爭(zhēng)中脫穎而出,將取決于其如何平衡技術(shù)深度、商業(yè)化進(jìn)程以及對(duì)市場(chǎng)需求的精準(zhǔn)洞察。

來源:彭博社

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港