劃重點(diǎn)
01微軟AI CEO穆斯塔法蘇萊曼接受WIRED專訪,詳解Copilot愿景、AI智能體的三個(gè)階段以及與OpenAI的關(guān)系。
02Copilot旨在創(chuàng)造一種伙伴間的持續(xù)互動(dòng)體驗(yàn),提供情感支持,分為信息處理、長期記憶、交互三大階段。
03微軟對(duì)OpenAI的模型進(jìn)行了微調(diào),使其不僅專注于解決數(shù)學(xué)和科學(xué)問題,還能進(jìn)行并列比較和消費(fèi)者分析。
04除此之外,微軟本月宣布其AI助手Copilot升級(jí),類似人類的聲音、能看到用戶的屏幕、擁有更好的推理能力。
05蘇萊曼認(rèn)為,AI伙伴在未來將能代表用戶購買東西、談判、簽訂合同,甚至規(guī)劃周六下午的日程。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
智東西(公眾號(hào):zhidxcom)
編輯 | Panken
智東西10月18日消息,近日,微軟AI CEO穆斯塔法蘇萊曼(Mustafa Suleyman)接受WIRED專訪,詳細(xì)解讀了微軟Copilot愿景、AI智能體(AI Agent)的三個(gè)階段、微軟與OpenAI的關(guān)系、AI后續(xù)挑戰(zhàn)等焦點(diǎn)話題。
蘇萊曼說,微軟Copilot旨在創(chuàng)造一種伙伴間的持續(xù)互動(dòng)體驗(yàn),不僅關(guān)乎技術(shù),更在于提供情感支持;AI智能體分為信息處理、長期記憶、交互三大階段;微軟對(duì)OpenAI的模型進(jìn)行了微調(diào),使其不僅專注于解決數(shù)學(xué)和科學(xué)問題,還能進(jìn)行并列比較和消費(fèi)者分析。
微軟本月宣布其AI助手Copilot升級(jí)類似人類的聲音、能看到用戶的屏幕、擁有更好的推理能力。對(duì)此蘇萊曼稱,這都是讓用戶重新愛上PC的計(jì)劃的一部分。
微軟全球資深副總裁、微軟AI亞太區(qū)總裁張祺博士總結(jié)了此次訪談的啟示:
“2024年諾貝爾獎(jiǎng)的各個(gè)獎(jiǎng)項(xiàng)已經(jīng)全部揭曉,令人矚目的是,諾貝爾物理學(xué)獎(jiǎng)與化學(xué)獎(jiǎng)雙雙花落AI領(lǐng)域。AI技術(shù)及其應(yīng)用成為今年諾獎(jiǎng)最大的亮點(diǎn)。諾獎(jiǎng)對(duì)AI相關(guān)成果及科學(xué)家的高度認(rèn)可,不但有力地推動(dòng)了AI技術(shù)的進(jìn)一步發(fā)展和跨學(xué)科研究的深化,也預(yù)示著AI將以更快的速度推動(dòng)人類社會(huì)的經(jīng)濟(jì)增長和高質(zhì)量發(fā)展。
AI的發(fā)展速度驚人,這在人類歷史上尚屬首次機(jī)器學(xué)會(huì)了運(yùn)用我們的語言。但AI所提供的信息能否符合人類的認(rèn)知需求和價(jià)值判斷?AI能否真正理解語言背后的情感內(nèi)涵?在AI與人類深度交互的背景下,如何確保數(shù)據(jù)和隱私安全?從長遠(yuǎn)來看,哪些挑戰(zhàn)可能成為制約AI可持續(xù)發(fā)展的根本性因素?
在直面這些難題的同時(shí),蘇萊曼先生對(duì)如何最大限度利用技術(shù)滿足用戶需求給出了一個(gè)清晰的路線圖。他探討了人工智能的發(fā)展、倫理問題以及未來的技術(shù)前景。這正是本次蘇萊曼先生采訪帶來的啟示 。”
以下是穆斯塔法蘇萊曼與WIRED資深記者Will Knight的深度訪談實(shí)錄:
一、Copilot目標(biāo)提供情感支持,Vision功能完全保護(hù)用戶隱私
主持人:Copilot的新愿景是什么?
穆斯塔法蘇萊曼:我們正處于一個(gè)驚人的轉(zhuǎn)型點(diǎn)。AI伙伴現(xiàn)在能夠看到我們所見,聽到我們所聽,并使用我們溝通的同一種語言。這種新的設(shè)計(jì)理念關(guān)注的是持久性、關(guān)系和情感。我正在打造一種體驗(yàn),是關(guān)于與伙伴進(jìn)行持久、持續(xù)互動(dòng)。
主持人:你從Inflection AI加入微軟,該公司專注于構(gòu)建支持性和同理心的AI。聽起來你把這種理念帶到了新的雇主這里。
穆斯塔法蘇萊曼:我一直相信AI有提供支持的潛力。情感支持實(shí)際上是我19歲時(shí)開始工作的第一個(gè)項(xiàng)目,那時(shí)我啟動(dòng)了一項(xiàng)電話咨詢服務(wù)。這正是這個(gè)技術(shù)時(shí)刻的美妙之處體驗(yàn)與一個(gè)真正了解你的AI伙伴互動(dòng)。它會(huì)指導(dǎo)你、鼓勵(lì)你、支持你、教導(dǎo)你。我認(rèn)為這將不再讓人感覺像是在跟一臺(tái)計(jì)算機(jī)互動(dòng)。
主持人:Copilot Vision是什么?這個(gè)“實(shí)驗(yàn)室”功能將讓Pro用戶嘗試到什么?
穆斯塔法蘇萊曼:Copilot Vision讓你能夠說“那邊的東西是什么[在你的屏幕上]?”或“等一下,那是什么?你覺得那個(gè)怎么樣?”在你坐在電腦前時(shí),會(huì)有很多這樣的小瞬間。這個(gè)AI伙伴可以看到你所見,并實(shí)時(shí)與你討論你正在看的內(nèi)容,這是非常了不起的。它在某種程度上改變了你在數(shù)字生活中的體驗(yàn),因?yàn)槟悴槐卦儋M(fèi)力輸入內(nèi)容。
主持人:這聽起來像是Recall,那項(xiàng)有爭議的、現(xiàn)在需要選擇的Windows功能,用于記錄用戶屏幕上的內(nèi)容。
穆斯塔法蘇萊曼:保護(hù)用戶的隱私是至關(guān)重要的。目前我們不會(huì)用Copilot Vision保存任何內(nèi)容,因此一旦會(huì)話結(jié)束后關(guān)閉瀏覽器,所有內(nèi)容都會(huì)消失,完全刪除。但我在思考是否以及如何在未來引入這一功能,因?yàn)楹芏嗳舜_實(shí)希望有這樣的體驗(yàn)。
如果你可以說,“我前幾天在網(wǎng)上看到的那張圖片是什么?那個(gè)表情包是什么?”我想我們總有一天得研究這個(gè)問題。不過目前,Copilot Vision工具是這樣的。我們需要隨著時(shí)間進(jìn)行實(shí)驗(yàn),看看如何在這方面做更有意義的事情。
二、新功能類似于OpenAI“草莓”模型,針對(duì)消費(fèi)者需求做調(diào)整
主持人:你們還推出了Think Deeper,這將使Copilot能夠處理更復(fù)雜的問題。這是基于OpenAI的o1模型,也就是Strawberry,對(duì)嗎?
穆斯塔法蘇萊曼:是的,類似于Strawberry。我們對(duì)OpenAI的模型進(jìn)行了調(diào)整,為了更符合消費(fèi)者的需求,我們讓它以一種更符合AI伙伴主題的方式運(yùn)行。
主持人:有什么區(qū)別?
穆斯塔法蘇萊曼:OpenAI的模型更專注于純數(shù)學(xué)和科學(xué)問題的解決。我們?cè)噲D讓它專注于并列比較和消費(fèi)者分析等內(nèi)容。當(dāng)你在解決一個(gè)難題時(shí)卡住了,想要推理時(shí),它可以真正列出一個(gè)并列比較,或者進(jìn)行大規(guī)模分析。
主持人:微軟的人們已經(jīng)在使用這個(gè)新版本的Copilot了嗎?
穆斯塔法蘇萊曼:是的,大家都在使用。我們幾天前剛在公司內(nèi)部全面上線。所以每個(gè)人都在使用,并且提供大量反潰我們的反饋渠道非常繁忙,這很有趣。
三、朝AI伙伴邁進(jìn)一步,AI智能體三大階段解讀
主持人:人們會(huì)記得Clippy,微軟最后一個(gè)Windows AI助手。那里的員工有看到相似之處嗎?
穆斯塔法蘇萊曼:我前幾天見到了比爾蓋茨,他說,你知道嗎,你給整個(gè)AI的命名搞錯(cuò)了?應(yīng)該叫Clippy(回形針)。這確實(shí)顯示了蓋茨這樣的人的前瞻性。他們不僅能預(yù)見未來兩年,還能預(yù)見未來二十年。
主持人:新功能是否是朝著所謂的AI伙伴邁進(jìn)了一步,AI伙伴可以在電腦上幫你處理有用的瑣事嗎?
穆斯塔法蘇萊曼:是的,絕對(duì)是。
第一階段是AI處理與用戶相同的信息看到用戶所見、聽到用戶所聽、閱讀用戶閱讀的文本。
第二階段是AI具備長期、持續(xù)的記憶,隨著時(shí)間的推移建立起共同理解。
第三階段是AI通過發(fā)送指令和采取行動(dòng)與第三方互動(dòng)比如購買東西、預(yù)訂東西、規(guī)劃日程。
我們正在研發(fā)實(shí)驗(yàn)?zāi)J街械倪@兩個(gè)功能。
主持人:你們有一個(gè)可以為你去購買東西的Windows AI智能體嗎?
穆斯塔法蘇萊曼:這還有一段時(shí)間,但是的,我們已經(jīng)形成了閉環(huán),我們已經(jīng)完成了交易 。這項(xiàng)技術(shù)的問題是,你可以讓它在50%到60%的時(shí)間里正常工作,但要讓它達(dá)到90%的可靠性還需要付出很多努力。
我已經(jīng)看到了一些令人驚嘆的演示,其中它可以獨(dú)立啟動(dòng)并進(jìn)行購買等等。但我也見過一些事故的時(shí)候,它不知道自己在做什么。
主持人:能多告訴我一點(diǎn)“事故”的事嗎?它是否用蓋茨的信用卡去買了輛蘭博基尼?
穆斯塔法蘇萊曼:如果它用的是蓋茨的信用卡,那就好笑了。但不,如我所說我們還在一步步摸索。這項(xiàng)技術(shù)仍然身處實(shí)驗(yàn)室的困境中,還有很長的路要走,但我想進(jìn)展可以按季度來計(jì)算,而不是按年。
四、AI的未來挑戰(zhàn):打造可信賴技術(shù),建立親密和個(gè)性化體驗(yàn)
主持人:在實(shí)現(xiàn)你所描述的人工智能未來的過程中,你面臨的最大挑戰(zhàn)是什么?
穆斯塔法蘇萊曼:最大的挑戰(zhàn)是找出如何打造可信的技術(shù),因?yàn)檫@將是一種非常親密和個(gè)人的體驗(yàn)。當(dāng)然我們必須做好安全和隱私的部分。但我認(rèn)為真正的關(guān)鍵在于設(shè)計(jì)對(duì)話,使AI伙伴能夠明確邊界,能夠說出“這是我不準(zhǔn)備參與的事情”。
如果我們能做到這一點(diǎn),那就是建立可信體驗(yàn)的基礎(chǔ),然后我認(rèn)為我們可以真正進(jìn)入復(fù)雜的領(lǐng)域,例如如何讓它代表你購買東西、代表你談判、代表你簽訂合同,或者為你規(guī)劃一個(gè)周六下午涉及三四個(gè)不同站點(diǎn)的日程。你會(huì)說,我相信你,Copilot,你能搞定,對(duì)嗎?這正是我們正在努力實(shí)現(xiàn)的目標(biāo)。
來源:微軟,WIRED