展會(huì)信息港展會(huì)大全

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機(jī)器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-14 14:14:44   瀏覽:67次  

導(dǎo)讀:“機(jī)器人是人工智能和物理世界交互的最優(yōu)化選擇之一,能夠復(fù)現(xiàn)人工智能積累的信息和數(shù)據(jù),在生產(chǎn)、教育、裝配、交互及危險(xiǎn)場(chǎng)景等領(lǐng)域發(fā)揮作用!鄙虾=煌ù髮W(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家、上海智元新創(chuàng)技術(shù)有限公司聯(lián)合創(chuàng)始人閆維新在“2024(第五屆)科創(chuàng)先鋒大會(huì)暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會(huì)議”上表示。上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科 ......

“機(jī)器人是人工智能和物理世界交互的最優(yōu)化選擇之一,能夠復(fù)現(xiàn)人工智能積累的信息和數(shù)據(jù),在生產(chǎn)、教育、裝配、交互及危險(xiǎn)場(chǎng)景等領(lǐng)域發(fā)揮作用!鄙虾=煌ù髮W(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家、上海智元新創(chuàng)技術(shù)有限公司聯(lián)合創(chuàng)始人閆維新在“2024(第五屆)科創(chuàng)先鋒大會(huì)暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會(huì)議”上表示。

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機(jī)器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革

上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家閆維新

11月13日,2024澎湃科創(chuàng)先鋒大會(huì)暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會(huì)議在上海成功舉辦。本次大會(huì)由澎湃新聞主辦,南通市科技局、南通報(bào)業(yè)傳媒集團(tuán)協(xié)辦,上海臨港集團(tuán)、江蘇啟東呂四港經(jīng)濟(jì)開發(fā)區(qū)特別支持,同時(shí)特別鳴謝陽(yáng)光保險(xiǎn)集團(tuán)的支持。大會(huì)以“科創(chuàng)向新,共促提質(zhì)”為主題,旨在匯聚政府領(lǐng)導(dǎo)、產(chǎn)業(yè)領(lǐng)袖、學(xué)術(shù)專家及科創(chuàng)生態(tài)鏈的知名人物,共同探討科技創(chuàng)新與產(chǎn)業(yè)協(xié)同發(fā)展的新路徑,為推動(dòng)經(jīng)濟(jì)社會(huì)的高質(zhì)量發(fā)展貢獻(xiàn)力量。

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機(jī)器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革

在論壇上,閆維新展示了人工智能技術(shù)的巨大潛力,分享了通用人工智能技術(shù)在機(jī)器人領(lǐng)域的最新應(yīng)用成果,并探討了未來機(jī)器人產(chǎn)業(yè)的發(fā)展趨勢(shì)。他提到,人形機(jī)器人將具備人類的形態(tài),對(duì)智能化要求更高,并且是多交叉融合的行為,對(duì)人形機(jī)器人而言或者對(duì)機(jī)器人而言涉及電子、機(jī)械、硬件、軟件、人工智能等。而基于此,未來機(jī)器人產(chǎn)業(yè)的發(fā)展將會(huì)帶來產(chǎn)業(yè)的變革。

以下是演講全文:

我給大家進(jìn)行一次交流,關(guān)于人工智能和機(jī)器人,機(jī)器人是建立人工智能和整個(gè)物理世界的一個(gè)最優(yōu)化的選擇之一,可以將之前的人工智能所積累的知識(shí),通過機(jī)器人來復(fù)現(xiàn),處理在生產(chǎn)、教育、裝配、交互,特別是危險(xiǎn)場(chǎng)景中很多人不太喜歡的、在危險(xiǎn)環(huán)境中難以勝任的一些事情。

下面是我本人博士、博士生導(dǎo)師在機(jī)器人應(yīng)用領(lǐng)域涉及過的若干項(xiàng)目。這是一個(gè)最早做的跟烹飪相關(guān)的機(jī)器人作業(yè)單元,是做漢堡包的。它通過軌跡規(guī)劃完成整個(gè)工藝流程,在整個(gè)過程中對(duì)整個(gè)烹飪工藝進(jìn)行解析,解析完之后凝練出做若干個(gè)動(dòng)作的元素,通過機(jī)器人復(fù)現(xiàn),20秒鐘左右一個(gè)漢堡包可以做出來。冬季奧運(yùn)會(huì)的機(jī)器人餐廳就是類似的方案,當(dāng)時(shí)的漢堡包、炒、蒸、燒等烹飪機(jī)器人方案都是我參與設(shè)計(jì)的。當(dāng)時(shí)根據(jù)表面的情況判斷烹飪情況,這也是用傳統(tǒng)工具來做炸薯?xiàng)l,就像人一樣,原材料出來之后就直接倒進(jìn)油鍋,它沒有辦法應(yīng)對(duì)突發(fā)情況,早先的人工智能還沒有參與機(jī)器人餐飲領(lǐng)域,當(dāng)時(shí)的機(jī)器人泛化性有限,魯棒性有限,很多突發(fā)情況做不了。

人工智能實(shí)際上推動(dòng)了人形機(jī)器人產(chǎn)業(yè),為什么會(huì)有人形機(jī)器人這么火爆?一個(gè)是工業(yè)機(jī)器人和協(xié)作機(jī)器人夯實(shí)了關(guān)鍵零部件的基礎(chǔ)。第二個(gè)是大語言模型的出現(xiàn)讓人機(jī)交互成為可能,同時(shí)這種思路為大樣本、大算力情況下的具身智能垂類模型的出現(xiàn)奠定了基礎(chǔ),可以將人形機(jī)器人完成早先難以完成的、具備一些自主決策的工作,它將是未來產(chǎn)業(yè)再造基礎(chǔ)的牽引,我思考過一件事情,就是新能源汽車的存在,是對(duì)原有的汽車的一個(gè)增量、升級(jí),而人形機(jī)器人是有望重塑整個(gè)產(chǎn)業(yè)鏈布局。

第一個(gè)是柔性制造方向,包括焊接、噴涂等,都可以在工業(yè)機(jī)器人上做,但是很多是與裝配類、柔性相關(guān)的,枯燥乏味的場(chǎng)景還有很大的空間。第二是特種替身方面,這是我最看好的。我去了一趟廣州南方電網(wǎng)的盾構(gòu)機(jī)現(xiàn)場(chǎng),廣東不像上海,上海沖積平原,地質(zhì)比較單一,但是到了廣東,當(dāng)通過人口更換刀頭的時(shí)候,一旦造成失衡,很容易造成人員傷亡,危險(xiǎn)場(chǎng)景替代是現(xiàn)有人形機(jī)器人或者現(xiàn)有機(jī)器人具身智能或者遠(yuǎn)程操作最有機(jī)會(huì)的情況。第三個(gè)是教學(xué)科研。

現(xiàn)在是第四代機(jī)器人,第四代通用機(jī)器人相當(dāng)于是一個(gè)機(jī)器人本體能夠在某些領(lǐng)域完成比較通用的泛化能力,人也是不一樣的,有的人像劉翔可以跑得特別快,有的人腦袋特別好,機(jī)器人本體也是不同的構(gòu)型,只是在某一大類上面可以做到通用性。第二個(gè)觀點(diǎn),人形機(jī)器人今后下工廠,而工業(yè)和協(xié)作機(jī)器人在已有工廠上的智能化升級(jí)比人形機(jī)器人落地更早,因?yàn)檫@種情況下只用在原先的基礎(chǔ)上增加了感知、算法、算力之后,其實(shí)能夠完成很多以前難以完成的工作,所以通用人形機(jī)器人、通用人工智能不是只賦予人形機(jī)器人,而是對(duì)所有具備操作能力的機(jī)器人賦予一定的自主規(guī)劃、自主決策、自主執(zhí)行能力。

到2028年之后,第四代機(jī)器人將會(huì)有比較大的發(fā)展,去年是人形機(jī)器人的元年,今年是小批量的應(yīng)用落地,我們也在做若干的試驗(yàn),包括分揀、PTC工作,在我們的更高算力的情況下,在樣本空間更大的情況下,在整個(gè)應(yīng)用利用垂類模型更豐富的情況下,我們將會(huì)在2028年之后邁向第四代整個(gè)機(jī)器人的時(shí)代。

整個(gè)國(guó)內(nèi)外機(jī)器人化的發(fā)展情況,我們國(guó)內(nèi)做得很早。最早是我們覺得人形機(jī)器人是科研領(lǐng)域用的,后來發(fā)現(xiàn),用兩三萬美金完成一個(gè)人形機(jī)器人及其背后的具身智能處理能力是可行的。江浙滬地區(qū)基本可以找到機(jī)器人所需要的零部件,但在算力部分我們是有差距的,同時(shí)國(guó)內(nèi)也有公司在做相應(yīng)的算力部署,在樣本方面我覺得是我們最大的優(yōu)勢(shì),海量的應(yīng)用空間,尤其是江浙滬長(zhǎng)三角這邊應(yīng)用的整個(gè)包羅性可以為機(jī)器人應(yīng)用落地提供大量的機(jī)會(huì)。

人形機(jī)器人將具備人類的形態(tài),對(duì)智能化要求更高,并且是多交叉融合的行為,對(duì)人形機(jī)器人而言或者對(duì)機(jī)器人而言涉及電子、機(jī)械、硬件、軟件、人工智能,其實(shí)這個(gè)事情今后的發(fā)展情況會(huì)帶來產(chǎn)業(yè)的變革,產(chǎn)業(yè)變革會(huì)分為幾個(gè)方面。

第一是可認(rèn)知能力,它會(huì)越來越聰明,另外是辨識(shí),高效高速開發(fā)能力,增強(qiáng)迭代能力、大量的制造能力和超低成本的國(guó)產(chǎn)化制造能力,在五個(gè)技術(shù)方面進(jìn)行重大突破,計(jì)算、運(yùn)控、能源、驅(qū)動(dòng)和整個(gè)結(jié)構(gòu),尤其是我的本體。

目前來說,to B汽車產(chǎn)業(yè)為例,在一些復(fù)雜場(chǎng)景中還是由人工完成,而現(xiàn)有的工業(yè)機(jī)器人基本上不具備這種能力,包括整個(gè)機(jī)器人的自主決策能力、觸覺和視覺的交叉融合感知下的任務(wù)執(zhí)行能力,對(duì)于這種情況下,車廠大量需求這樣的工種,對(duì)于人形機(jī)器人而言,它會(huì)有一定的空間。

有一個(gè)想法,大家一直覺得我們的腿真的是很完美的嗎?其實(shí)除了腿以外,輪子其實(shí)也是很完美的,針對(duì)足式來說,在外高動(dòng)態(tài)特性以及比較需要強(qiáng)的負(fù)載下的抗擾動(dòng)力強(qiáng)的情況下,需要?jiǎng)側(cè)狁詈系脑O(shè)計(jì),最后完成機(jī)器人腦的布局,小腦、腦干、大腦,腦干是做每個(gè)關(guān)節(jié)速度環(huán)、電流環(huán)以及扭矩環(huán)的控制,小腦是做運(yùn)動(dòng)控制、步態(tài)控制、上肢的運(yùn)動(dòng)控制,大腦是做感知決策相關(guān)的。有了這個(gè)設(shè)計(jì)之后,需要一個(gè)端側(cè)算力底座,目前來說國(guó)內(nèi)還是比較欠缺的,我們現(xiàn)在還需要努力完成,這種卡脖子卡得非常難受。

人形機(jī)器人算力包括,電關(guān)節(jié)、AI計(jì)算和超算中心,這是整個(gè)產(chǎn)業(yè)鏈新的布局。這個(gè)新的布局之后,我進(jìn)行了深入思考,目前人形機(jī)器人如何被我的人工智能賦予?一個(gè)是靈巧操作能力,現(xiàn)在的人形機(jī)器人看起來只是走來走去,它們實(shí)際上能做什么呢?它要干活,靈巧操作能力和具身智能的整個(gè)平臺(tái)搭建,而對(duì)于整個(gè)靈巧操作能力來說,靈巧手做了很多年,現(xiàn)在的靈巧手關(guān)鍵在于特定構(gòu)型。

后面我做了一個(gè)清單,包括任務(wù)清單,以居家服務(wù)機(jī)器人為主,并且包括提拉端抓按壓等若干個(gè)動(dòng)作進(jìn)行嘗試。之后我再把我的具身智能算法進(jìn)行賦能,完成我的整個(gè)感知,加了很多傳感器,而且它能夠做出若干超人的動(dòng)作,我們?nèi)酥荒茏龅?00到760納米的可視范圍,而機(jī)器人可以在紅外、紫外光譜下進(jìn)行感知。第二個(gè)事情是可以像我們的背后也可以加攝像頭,所以這樣的情況下可以做全場(chǎng)景的感知,有可能完成在感知方面超越人的能力,同時(shí)在運(yùn)動(dòng)執(zhí)行方面超越人的能力。

然后我做了一個(gè)廚子,我們完成了智能餐廳,把常規(guī)類的烹飪結(jié)合在一起,進(jìn)行一個(gè)人形機(jī)器人的應(yīng)用場(chǎng)景搭建,完成了幾個(gè)烹飪工藝,之后還有清潔部分,左邊是我們整個(gè)對(duì)烹飪相關(guān)工具類和整個(gè)操作的清單,逐一完成。有了這個(gè)之后,我們就要做具身智能,具身智能要完成碳基生命和硅基生命的結(jié)合,它的結(jié)合就是人機(jī)共融模式,用具身智能來賦能人形機(jī)器人,而這個(gè)時(shí)候需要我們有一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)采集平臺(tái),之后有整個(gè)訓(xùn)練集,采集人的動(dòng)作、環(huán)節(jié)動(dòng)作,作為樣本、作為模型的建立,建立完之后復(fù)現(xiàn)出來。我們現(xiàn)在發(fā)現(xiàn)一件事情,在一些特定工作訓(xùn)練的時(shí)候,萬級(jí)以上的數(shù)據(jù)可以大大提高任務(wù)完成的成功率,可以達(dá)到98%,然而長(zhǎng)程動(dòng)作還在攻克過程中。

在建立數(shù)據(jù)采集平臺(tái)之后,我們可以展望通用人工智能與通用機(jī)器人的結(jié)合,包括我個(gè)人、我參與的公司,包括在上海交通大學(xué)個(gè)人想做的事情。第一個(gè),我會(huì)做一個(gè)數(shù)據(jù)采集平臺(tái),并不簡(jiǎn)簡(jiǎn)單單是一個(gè)遠(yuǎn)程遙操作,而是把機(jī)器人抓取到的物體的力反饋到人類。第二是20度以上的靈巧手,第三是針對(duì)人形機(jī)器人做特定的關(guān)節(jié)模組,之后我會(huì)做一些串并聯(lián)的混合,包括跟人的姿態(tài)不太一樣的機(jī)器人。其實(shí)已經(jīng)開始了,明年年后大家可以看到,我的研究方向還包括開放型場(chǎng)景的具身智能研究,很多特種行業(yè),包括危險(xiǎn)場(chǎng)景處置,主被動(dòng)液電混合模式復(fù)雜地形應(yīng)用。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港