本文作者:李丹
來源:硬AI
人形機器人開發(fā)有望迎來新突破,會跳舞的機器人Atlas將得到先進的人工智能(AI)系統(tǒng)加持。
美東時間10月16日周三,韓國現(xiàn)代汽車旗下機器人技術(shù)公司波士頓動力(Boston Dynamics)和豐田汽車在美國的高級研究機構(gòu)豐田研究所(TRI)聯(lián)合公布,兩家AI和機器人領(lǐng)域的機構(gòu)將在波士頓展開研究合作,旨在運用TRI的的大型行為模型(Large Behavior Model)和波士頓動力的Atlas機器人,加快通用人形機器人的開發(fā)。
大型行為模型簡稱LBM,是一種復(fù)雜的AI系統(tǒng)。通過對大量人類互動數(shù)據(jù)集的學習,它能理解和生成類似人類的行為,從而復(fù)制人類在溝通和決策中的復(fù)雜細微差別。LBM通常用于機器人和人機交互領(lǐng)域。比如讓機器人與人類的互動更自然,理解人類的手勢并作出適當?shù)幕貞?yīng)。
與TRI的合作意味著,波士頓動力將進一步推動先進AI技術(shù)在Atlas的應(yīng)用。今年4月,該公司推出了Atlas的電動版本,并宣布已打造商用版本,最終將出售給制造業(yè)。波士頓動力稱,電動Atlas可舉起的物體重量超過人類的精英運動員,其發(fā)布的以下視頻顯示,它還能以人類無法做到的方式移動,例如向后彎曲膝蓋、將軀干旋轉(zhuǎn)360度。
本周三的聯(lián)合公告稱,最新一代 Atlas 是波士頓動力多年軟硬件協(xié)同設(shè)計的成果,旨在構(gòu)建最強大的人形機器人平臺,無論是在物理能力方面,還是在用于編寫全身行為的軟件方面。因此,Atlas成為推進給予AI操控技能科學的理想平臺。
TRI是目前在研發(fā)機器人LBM方面得到廣泛認可的佼佼者。TRI在擴散策略方面的開創(chuàng)性工作讓生成式AI成功應(yīng)用于機器人靈巧操控的能力。TRI 還在開源機器人AI模型和數(shù)據(jù)集的開發(fā)中發(fā)揮了主導(dǎo)作用。TRI 利用計算機視覺和大語言模型訓練(LLM)方面的額外優(yōu)勢,TRI的LBM研發(fā)旨在實現(xiàn)多任務(wù)、視覺和語言相結(jié)合條件的靈巧操控基礎(chǔ)模型。
波士頓動力公司的CEO Robert Playter高度評價與TRI的合作,稱“機器人行業(yè)從未有過如此激動人心的時刻”,此次合作是一個典范,將展示兩家擁有強大研發(fā)基礎(chǔ)的公司如何攜手應(yīng)對許多復(fù)雜挑戰(zhàn),并打造能解決現(xiàn)實問題的有用機器人。
豐田的首席科學家兼TRI的CEO Gill Pratt稱,AI和機器學習領(lǐng)域最近的進展具有推進物理智能的巨大潛力。在波士頓動力的硬件上采用TRI最先進的AI技術(shù)對兩家機構(gòu)來說都是可以“改變游戲規(guī)則”的機遇。
科技媒體TechCrunch評論稱,波士頓動力在人形機器人領(lǐng)域的主要競爭對手是Agility、Figure 和特斯拉,他們主要選擇在公司內(nèi)部組建 AI 團隊。相比之下,波士頓動力與TRI 的合作顯得特別有意思,因為兩家機構(gòu)分屬由現(xiàn)代和豐田,也就是兩家是汽車領(lǐng)域的老對手。