展會信息港展會大全

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-14 14:14:44   瀏覽:0次  

導(dǎo)讀:“機器人是人工智能和物理世界交互的最優(yōu)化選擇之一,能夠復(fù)現(xiàn)人工智能積累的信息和數(shù)據(jù),在生產(chǎn)、教育、裝配、交互及危險場景等領(lǐng)域發(fā)揮作用。”上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家、上海智元新創(chuàng)技術(shù)有限公司聯(lián)合創(chuàng)始人閆維新在“2024(第五屆)科創(chuàng)先鋒大會暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會議”上表示。上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科 ......

“機器人是人工智能和物理世界交互的最優(yōu)化選擇之一,能夠復(fù)現(xiàn)人工智能積累的信息和數(shù)據(jù),在生產(chǎn)、教育、裝配、交互及危險場景等領(lǐng)域發(fā)揮作用!鄙虾=煌ù髮W(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家、上海智元新創(chuàng)技術(shù)有限公司聯(lián)合創(chuàng)始人閆維新在“2024(第五屆)科創(chuàng)先鋒大會暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會議”上表示。

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革

上海交通大學(xué)博士生導(dǎo)師、上海人工智能研究院首席科學(xué)家閆維新

11月13日,2024澎湃科創(chuàng)先鋒大會暨產(chǎn)業(yè)創(chuàng)新跨區(qū)域協(xié)同發(fā)展圓桌會議在上海成功舉辦。本次大會由澎湃新聞主辦,南通市科技局、南通報業(yè)傳媒集團協(xié)辦,上海臨港集團、江蘇啟東呂四港經(jīng)濟開發(fā)區(qū)特別支持,同時特別鳴謝陽光保險集團的支持。大會以“科創(chuàng)向新,共促提質(zhì)”為主題,旨在匯聚政府領(lǐng)導(dǎo)、產(chǎn)業(yè)領(lǐng)袖、學(xué)術(shù)專家及科創(chuàng)生態(tài)鏈的知名人物,共同探討科技創(chuàng)新與產(chǎn)業(yè)協(xié)同發(fā)展的新路徑,為推動經(jīng)濟社會的高質(zhì)量發(fā)展貢獻力量。

2024澎湃科創(chuàng)先鋒|閆維新:通用AI與機器人結(jié)合引領(lǐng)產(chǎn)業(yè)變革

在論壇上,閆維新展示了人工智能技術(shù)的巨大潛力,分享了通用人工智能技術(shù)在機器人領(lǐng)域的最新應(yīng)用成果,并探討了未來機器人產(chǎn)業(yè)的發(fā)展趨勢。他提到,人形機器人將具備人類的形態(tài),對智能化要求更高,并且是多交叉融合的行為,對人形機器人而言或者對機器人而言涉及電子、機械、硬件、軟件、人工智能等。而基于此,未來機器人產(chǎn)業(yè)的發(fā)展將會帶來產(chǎn)業(yè)的變革。

以下是演講全文:

我給大家進行一次交流,關(guān)于人工智能和機器人,機器人是建立人工智能和整個物理世界的一個最優(yōu)化的選擇之一,可以將之前的人工智能所積累的知識,通過機器人來復(fù)現(xiàn),處理在生產(chǎn)、教育、裝配、交互,特別是危險場景中很多人不太喜歡的、在危險環(huán)境中難以勝任的一些事情。

下面是我本人博士、博士生導(dǎo)師在機器人應(yīng)用領(lǐng)域涉及過的若干項目。這是一個最早做的跟烹飪相關(guān)的機器人作業(yè)單元,是做漢堡包的。它通過軌跡規(guī)劃完成整個工藝流程,在整個過程中對整個烹飪工藝進行解析,解析完之后凝練出做若干個動作的元素,通過機器人復(fù)現(xiàn),20秒鐘左右一個漢堡包可以做出來。冬季奧運會的機器人餐廳就是類似的方案,當(dāng)時的漢堡包、炒、蒸、燒等烹飪機器人方案都是我參與設(shè)計的。當(dāng)時根據(jù)表面的情況判斷烹飪情況,這也是用傳統(tǒng)工具來做炸薯條,就像人一樣,原材料出來之后就直接倒進油鍋,它沒有辦法應(yīng)對突發(fā)情況,早先的人工智能還沒有參與機器人餐飲領(lǐng)域,當(dāng)時的機器人泛化性有限,魯棒性有限,很多突發(fā)情況做不了。

人工智能實際上推動了人形機器人產(chǎn)業(yè),為什么會有人形機器人這么火爆?一個是工業(yè)機器人和協(xié)作機器人夯實了關(guān)鍵零部件的基礎(chǔ)。第二個是大語言模型的出現(xiàn)讓人機交互成為可能,同時這種思路為大樣本、大算力情況下的具身智能垂類模型的出現(xiàn)奠定了基礎(chǔ),可以將人形機器人完成早先難以完成的、具備一些自主決策的工作,它將是未來產(chǎn)業(yè)再造基礎(chǔ)的牽引,我思考過一件事情,就是新能源汽車的存在,是對原有的汽車的一個增量、升級,而人形機器人是有望重塑整個產(chǎn)業(yè)鏈布局。

第一個是柔性制造方向,包括焊接、噴涂等,都可以在工業(yè)機器人上做,但是很多是與裝配類、柔性相關(guān)的,枯燥乏味的場景還有很大的空間。第二是特種替身方面,這是我最看好的。我去了一趟廣州南方電網(wǎng)的盾構(gòu)機現(xiàn)場,廣東不像上海,上海沖積平原,地質(zhì)比較單一,但是到了廣東,當(dāng)通過人口更換刀頭的時候,一旦造成失衡,很容易造成人員傷亡,危險場景替代是現(xiàn)有人形機器人或者現(xiàn)有機器人具身智能或者遠程操作最有機會的情況。第三個是教學(xué)科研。

現(xiàn)在是第四代機器人,第四代通用機器人相當(dāng)于是一個機器人本體能夠在某些領(lǐng)域完成比較通用的泛化能力,人也是不一樣的,有的人像劉翔可以跑得特別快,有的人腦袋特別好,機器人本體也是不同的構(gòu)型,只是在某一大類上面可以做到通用性。第二個觀點,人形機器人今后下工廠,而工業(yè)和協(xié)作機器人在已有工廠上的智能化升級比人形機器人落地更早,因為這種情況下只用在原先的基礎(chǔ)上增加了感知、算法、算力之后,其實能夠完成很多以前難以完成的工作,所以通用人形機器人、通用人工智能不是只賦予人形機器人,而是對所有具備操作能力的機器人賦予一定的自主規(guī)劃、自主決策、自主執(zhí)行能力。

到2028年之后,第四代機器人將會有比較大的發(fā)展,去年是人形機器人的元年,今年是小批量的應(yīng)用落地,我們也在做若干的試驗,包括分揀、PTC工作,在我們的更高算力的情況下,在樣本空間更大的情況下,在整個應(yīng)用利用垂類模型更豐富的情況下,我們將會在2028年之后邁向第四代整個機器人的時代。

整個國內(nèi)外機器人化的發(fā)展情況,我們國內(nèi)做得很早。最早是我們覺得人形機器人是科研領(lǐng)域用的,后來發(fā)現(xiàn),用兩三萬美金完成一個人形機器人及其背后的具身智能處理能力是可行的。江浙滬地區(qū)基本可以找到機器人所需要的零部件,但在算力部分我們是有差距的,同時國內(nèi)也有公司在做相應(yīng)的算力部署,在樣本方面我覺得是我們最大的優(yōu)勢,海量的應(yīng)用空間,尤其是江浙滬長三角這邊應(yīng)用的整個包羅性可以為機器人應(yīng)用落地提供大量的機會。

人形機器人將具備人類的形態(tài),對智能化要求更高,并且是多交叉融合的行為,對人形機器人而言或者對機器人而言涉及電子、機械、硬件、軟件、人工智能,其實這個事情今后的發(fā)展情況會帶來產(chǎn)業(yè)的變革,產(chǎn)業(yè)變革會分為幾個方面。

第一是可認(rèn)知能力,它會越來越聰明,另外是辨識,高效高速開發(fā)能力,增強迭代能力、大量的制造能力和超低成本的國產(chǎn)化制造能力,在五個技術(shù)方面進行重大突破,計算、運控、能源、驅(qū)動和整個結(jié)構(gòu),尤其是我的本體。

目前來說,to B汽車產(chǎn)業(yè)為例,在一些復(fù)雜場景中還是由人工完成,而現(xiàn)有的工業(yè)機器人基本上不具備這種能力,包括整個機器人的自主決策能力、觸覺和視覺的交叉融合感知下的任務(wù)執(zhí)行能力,對于這種情況下,車廠大量需求這樣的工種,對于人形機器人而言,它會有一定的空間。

有一個想法,大家一直覺得我們的腿真的是很完美的嗎?其實除了腿以外,輪子其實也是很完美的,針對足式來說,在外高動態(tài)特性以及比較需要強的負載下的抗擾動力強的情況下,需要剛?cè)狁詈系脑O(shè)計,最后完成機器人腦的布局,小腦、腦干、大腦,腦干是做每個關(guān)節(jié)速度環(huán)、電流環(huán)以及扭矩環(huán)的控制,小腦是做運動控制、步態(tài)控制、上肢的運動控制,大腦是做感知決策相關(guān)的。有了這個設(shè)計之后,需要一個端側(cè)算力底座,目前來說國內(nèi)還是比較欠缺的,我們現(xiàn)在還需要努力完成,這種卡脖子卡得非常難受。

人形機器人算力包括,電關(guān)節(jié)、AI計算和超算中心,這是整個產(chǎn)業(yè)鏈新的布局。這個新的布局之后,我進行了深入思考,目前人形機器人如何被我的人工智能賦予?一個是靈巧操作能力,現(xiàn)在的人形機器人看起來只是走來走去,它們實際上能做什么呢?它要干活,靈巧操作能力和具身智能的整個平臺搭建,而對于整個靈巧操作能力來說,靈巧手做了很多年,現(xiàn)在的靈巧手關(guān)鍵在于特定構(gòu)型。

后面我做了一個清單,包括任務(wù)清單,以居家服務(wù)機器人為主,并且包括提拉端抓按壓等若干個動作進行嘗試。之后我再把我的具身智能算法進行賦能,完成我的整個感知,加了很多傳感器,而且它能夠做出若干超人的動作,我們?nèi)酥荒茏龅?00到760納米的可視范圍,而機器人可以在紅外、紫外光譜下進行感知。第二個事情是可以像我們的背后也可以加攝像頭,所以這樣的情況下可以做全場景的感知,有可能完成在感知方面超越人的能力,同時在運動執(zhí)行方面超越人的能力。

然后我做了一個廚子,我們完成了智能餐廳,把常規(guī)類的烹飪結(jié)合在一起,進行一個人形機器人的應(yīng)用場景搭建,完成了幾個烹飪工藝,之后還有清潔部分,左邊是我們整個對烹飪相關(guān)工具類和整個操作的清單,逐一完成。有了這個之后,我們就要做具身智能,具身智能要完成碳基生命和硅基生命的結(jié)合,它的結(jié)合就是人機共融模式,用具身智能來賦能人形機器人,而這個時候需要我們有一個標(biāo)準(zhǔn)的數(shù)據(jù)采集平臺,之后有整個訓(xùn)練集,采集人的動作、環(huán)節(jié)動作,作為樣本、作為模型的建立,建立完之后復(fù)現(xiàn)出來。我們現(xiàn)在發(fā)現(xiàn)一件事情,在一些特定工作訓(xùn)練的時候,萬級以上的數(shù)據(jù)可以大大提高任務(wù)完成的成功率,可以達到98%,然而長程動作還在攻克過程中。

在建立數(shù)據(jù)采集平臺之后,我們可以展望通用人工智能與通用機器人的結(jié)合,包括我個人、我參與的公司,包括在上海交通大學(xué)個人想做的事情。第一個,我會做一個數(shù)據(jù)采集平臺,并不簡簡單單是一個遠程遙操作,而是把機器人抓取到的物體的力反饋到人類。第二是20度以上的靈巧手,第三是針對人形機器人做特定的關(guān)節(jié)模組,之后我會做一些串并聯(lián)的混合,包括跟人的姿態(tài)不太一樣的機器人。其實已經(jīng)開始了,明年年后大家可以看到,我的研究方向還包括開放型場景的具身智能研究,很多特種行業(yè),包括危險場景處置,主被動液電混合模式復(fù)雜地形應(yīng)用。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港