具身智能的三維生存挑戰(zhàn)
作者/IT時報記者沈毅斌
編輯/郝俊慧孫妍
Sora正式上線后,另一條火熱的科技賽道具身智能,近期也迎來商業(yè)化“前夜”。
12月16日,“華為天才少年”“稚暉君”(彭志輝)創(chuàng)辦的智元機器人宣布,開啟通用機器人商用量產,此時距離智元機器人發(fā)布“遠征”與“靈犀”兩大家族五款商用人形機器人新品,僅過了四個月。
幾乎同時,比亞迪官微發(fā)布了一則具身智能方向的招聘信息,面向2025屆全球高校碩士、博士畢業(yè)生招聘具身智能研究團隊,推進具身智能在工業(yè)領域的落地應用。小米集團核心創(chuàng)始團隊創(chuàng)辦的大模型機器人公司小雨智造,近日也完成新一輪融資,用于加大研發(fā)力度,推動具身智能產品創(chuàng)新。
再往回看,今年各類展會都是具身智能“秀肌肉”的舞臺,人們在一幅幅人機共存的場景中暢想未來。然而,回到現(xiàn)實,商業(yè)化來臨之際,相較人機交互的LLM大模型,具身智能要面對更多來自三維世界的挑戰(zhàn)。
數(shù)據(jù)
從“好看的皮囊”到“有用的載體”
展會上,人形機器人現(xiàn)場跳舞、交互、分揀物品、擦桌子等操作,已經成為吸引觀眾的“秘密武器”。如果將大模型比作“有趣的靈魂”,具身智能則是“好看的皮囊”。但離開展會,真正實現(xiàn)具身智能落地的場景并不多見,如何讓具身智能實現(xiàn)從“好看的皮囊”向“有用的載體”跨越,數(shù)據(jù)是核心。
“我們發(fā)現(xiàn)具身智能和多模態(tài)大模型發(fā)展最不一樣的點,就是機器人數(shù)據(jù)的稀缺性。”智元新創(chuàng)具身業(yè)務部總裁姚卯青在浦江AI學術年會具身智能專題論壇上表示,相較于大模型可以免費獲取互聯(lián)網(wǎng)數(shù)據(jù),機器人能用的高質量、帶標簽數(shù)據(jù),一個數(shù)據(jù)集中最多只有幾百萬條,并且這些數(shù)據(jù)集屬于多種格式的混合體,質量參差不齊,“所以大家最常看到的演示只有人形機器人的桌面操作,比如把水果、積木搬來搬去”。
智元機器人
“可用的物理世界數(shù)據(jù)集還遠遠不夠,具身智能還在非常初級的階段!鄙虾8道~副總裁周斌補充道,人工遙操是目前主流的機器人數(shù)據(jù)采集方法,其核心目標是使機器人本體操作盡可能接近人類的行為模式。但這一方法需要花費大量人力和時間。