大模型正在轉(zhuǎn)向?qū)ξ锢碇悄艿奶剿鳎绕涫侨诵螜C(jī)器人,正在等待自己的ChatGPT時(shí)刻。2025年開(kāi)年,黃仁勛就在CES上給它添了一把火。最大的亮點(diǎn)是英偉達(dá)公布了Cosmos世界基礎(chǔ)模型(WFM)系列,包括Nano、Super與Ultra。它的訓(xùn)練數(shù)據(jù)來(lái)自真實(shí)世界中的物理互動(dòng),2000萬(wàn)個(gè)小時(shí),9000 萬(wàn)億個(gè) token。英偉達(dá)團(tuán)隊(duì)的論文透露,他們用1萬(wàn)張H100預(yù)訓(xùn)練了三個(gè)月。黃仁勛將它描述為一個(gè)平臺(tái),可以生成物理上合理的未來(lái)場(chǎng)景,定制化訓(xùn)練人形機(jī)器人。人形機(jī)器人企業(yè)1X、Agility和小鵬(XPENG)已經(jīng)在試用Cosmos了。此外,英偉達(dá)還更新了面向機(jī)器人的Isaac GR00T框架等,實(shí)現(xiàn)了對(duì)人形機(jī)器人在數(shù)據(jù)、訓(xùn)練、模擬與推理上的研發(fā)環(huán)節(jié)的全覆蓋。這幾天,臺(tái)灣媒體還放風(fēng)稱(chēng),英偉達(dá)與鴻海走得很近,后者曾投資、代工過(guò)機(jī)器人。與去年一樣,黃仁勛邀請(qǐng)合作伙伴的人形機(jī)器人出席,與他站在一起。來(lái)自中國(guó)的人形機(jī)器人嘉賓有6位,包括星動(dòng)紀(jì)元(Robotera)的Star1、智元(Agibot)的A2、傅利葉(Fourier)的GR-2、銀河通用(Galbot)的G1、宇樹(shù)(Unitree)的H1與小鵬的Iron,多于來(lái)自美國(guó)的3位,來(lái)自韓國(guó)、挪威、德國(guó)、以色列與加拿大的各1位。黃仁勛稱(chēng),機(jī)器人的ChatGPT時(shí)刻正在到來(lái)。越來(lái)越多企業(yè)宣布旗下人形機(jī)器人已經(jīng)上崗實(shí)習(xí)。但它們還不是量產(chǎn)的未來(lái)。通往新工業(yè)革命,人形機(jī)器人必須具備與所處環(huán)境的交互能力,具身智能要實(shí)現(xiàn)對(duì)物理世界的映射,同時(shí)滿足泛化任務(wù)、精準(zhǔn)交互與低廉成本的要求。未來(lái)很可能是大型世界模型的。目前汽車(chē)與物流廠商是實(shí)習(xí)最大雇主。擎天柱為特斯拉分揀電池,馬斯克說(shuō)它能力擴(kuò)展迅速,2025年千臺(tái)規(guī)模,再過(guò)一年對(duì)外銷(xiāo)售。小鵬與小米的也出現(xiàn)在自家汽車(chē)工廠;寶馬與奔馳各自找了FigureAI與Apptronik。Agility宣稱(chēng)全球首家商業(yè)部署,已在亞馬遜實(shí)習(xí)一年,去年底又接到了舍弗勒的訂單。但壞消息是,DHL認(rèn)為它們都又貴又慢,還不適合工作。它們更像是研究對(duì)象,活躍于實(shí)驗(yàn)室。部分企業(yè)去年宣布售出數(shù)百臺(tái),不少就流向大模型廠商。宇樹(shù)科技量產(chǎn)版G1,定位經(jīng)濟(jì)型人形機(jī)器人研發(fā)平臺(tái),低至10萬(wàn)元人民幣。英偉達(dá)研究自適應(yīng)導(dǎo)航模型就用到了它。智元機(jī)器人量產(chǎn)工廠去年10月投產(chǎn),就在今天,第1000臺(tái)人形機(jī)器人走下流水線,它們中的很多進(jìn)入了4000平米的具身數(shù)采工廠,為產(chǎn)品迭代生產(chǎn)著數(shù)據(jù)。去年底至今,宇樹(shù)與智元分別開(kāi)源了人形機(jī)器人在物理世界交互的行為數(shù)據(jù)集。中國(guó)與美國(guó)都視人形機(jī)器人為新工業(yè)革命關(guān)鍵。在信息技術(shù)時(shí)代到來(lái)前,工廠一直是創(chuàng)新先驅(qū),如今,人工智能與機(jī)器人融合在一起重塑這個(gè)行業(yè)。在未來(lái),每個(gè)人都應(yīng)該有一臺(tái)人形機(jī)器人。馬斯克稱(chēng)到2040年全球?qū)⒂?00億個(gè)人形機(jī)器人。人形機(jī)器人是“具身”的通用人工智能。它既能泛化任務(wù),也能泛化環(huán)境與本體。人工智能面臨的挑戰(zhàn)它也要克服,包括算法、數(shù)據(jù)、算力,但更大的挑戰(zhàn)是對(duì)硬件的靈活控制,也包括突破續(xù)航的制約。目前,人形機(jī)器人的算法與硬件路線尚未統(tǒng)一,兩者緊密耦合。不同的硬件設(shè)計(jì)影響著模型的泛化能力;無(wú)法從模型開(kāi)源與供應(yīng)鏈復(fù)用中最大化獲益。還沒(méi)有人確立主導(dǎo)。美國(guó)科技巨頭與初創(chuàng)企業(yè)在探索通用人工智能上占據(jù)優(yōu)勢(shì),中國(guó)正在成為“具身”的世界工廠。中國(guó)的機(jī)器人密度已經(jīng)趕超了日本與德國(guó),把美國(guó)甩在了后面。工業(yè)機(jī)器人本土供應(yīng)鏈占比提升至47%。電動(dòng)車(chē)與機(jī)器人產(chǎn)業(yè)高速發(fā)展,不少供應(yīng)鏈可以復(fù)用;地平線、小米與華為等核心高管正轉(zhuǎn)投這一領(lǐng)域。傅里葉GR-1型人形機(jī)器人從芯片到零部件的國(guó)產(chǎn)化率已經(jīng)超過(guò)90%。
硬件決定了能力上限,但具身智能成熟度相對(duì)滯后,是現(xiàn)階段人形機(jī)器人規(guī);虡I(yè)化的瓶頸。中國(guó)的貢獻(xiàn)之一就是降低了硬件成本。目前硬件已經(jīng)勉強(qiáng)滿足當(dāng)下對(duì)具身智能技術(shù)探索與落地驗(yàn)證的最低門(mén)檻。高盛預(yù)計(jì)每年下降15%,實(shí)際去年下降40%。宇樹(shù)科技認(rèn)為很快人形機(jī)器人的硬件成本可能不超過(guò)2萬(wàn)元人民幣。FigureAI相信大部分問(wèn)題會(huì)隨時(shí)間推移變成軟件問(wèn)題。物理智能與世界模型是通往AGI的關(guān)鍵,也是具身智能通用化的基礎(chǔ)。自從去年開(kāi)始,不少人形機(jī)器人企業(yè)專(zhuān)攻“通用大腦”。PI(Physical Intelligence)致力于“將通用人工智能帶入物理世界”,Skild AI致力于“開(kāi)發(fā)扎根于物理世界的通用人工智能”,都試圖打通模型底層架構(gòu),控制任何機(jī)器人執(zhí)行任何任務(wù),成立不足1年就都躋身獨(dú)角獸。穹徹智能等中國(guó)企業(yè)也緊跟不舍。大模型巨頭要實(shí)現(xiàn)AGI,就無(wú)法缺席對(duì)世界模型的探索。OpenAI的Sora,谷歌的Genie2,以及World Labs的世界模型,都不只是在生成視頻。它們?cè)谝愿髯缘姆绞,生成一個(gè)既符合物理規(guī)律,又能實(shí)時(shí)響應(yīng)交互的世界。OpenAI重啟機(jī)器人研究后投資了PI與1X;谷歌機(jī)器人系列模型升級(jí)到了RT-H,還改進(jìn)了Sim2Real技術(shù),將模擬中的訓(xùn)練策略高效,低損地轉(zhuǎn)移到真實(shí)場(chǎng)景。探索仍處于發(fā)散階段,一如BERT與GPT,需要一個(gè)ChatGPT時(shí)刻。它很可能就在2025年。算力基礎(chǔ)設(shè)施巨頭迅速進(jìn)入市場(chǎng),黃仁勛宣告物理人工智能即將到來(lái)。去年,英偉達(dá)成立了GEAR團(tuán)隊(duì),覆蓋訓(xùn)練、模擬、推理;GR00T被稱(chēng)為人形機(jī)器人的Llama 3;端側(cè)算力Jetson Thor今年上市。馬斯克開(kāi)始催臺(tái)積電趕緊供貨Dojo芯片。這次黃仁勛在CES上的演講,透露了英偉達(dá)描繪的藍(lán)圖。人形機(jī)器人廠商可以通過(guò)Isaac平臺(tái),捕捉人類(lèi)行為,模擬并記錄為對(duì)應(yīng)數(shù)字孿生的機(jī)器人行為;Nemo工具庫(kù)加速數(shù)據(jù)處理,GR00T生成機(jī)器人工作流,通過(guò)Cosmos合成物理世界,在Omniverse上運(yùn)行。機(jī)器人在數(shù)字世界的交互,包括數(shù)據(jù)合成與處理、模型訓(xùn)練與微調(diào),都在英偉達(dá)服務(wù)器AI芯片上;機(jī)器人與物理世界的交互,都在英偉達(dá)端側(cè)AI芯片上。不過(guò),英偉達(dá)團(tuán)隊(duì)的論文也很遺憾地透露,Cosmos在面對(duì)重力、光相互作用和流體動(dòng)力學(xué)時(shí),并不能總是合成出正確的物理規(guī)律。用大型模型復(fù)現(xiàn)物理世界,仍然需要更多高質(zhì)量的多樣性的數(shù)據(jù)。中國(guó)工業(yè)數(shù)據(jù)儲(chǔ)量豐富,尚待利用。全球超過(guò)40%的工業(yè)機(jī)器人活躍于中國(guó)工廠;中國(guó)工廠70%的制造任務(wù)由機(jī)械完成。與靜態(tài)低維的多模態(tài)數(shù)據(jù)不同,物理世界的工業(yè)數(shù)據(jù)蘊(yùn)藏更豐富的細(xì)節(jié)。為此,波士頓動(dòng)力最近選擇與豐田研究所合作。為解決工業(yè)數(shù)據(jù)分散、隱私與標(biāo)準(zhǔn)不一的治理困境,中國(guó)倡議共建具身智能語(yǔ)料數(shù)據(jù)生態(tài),上海牽頭多地聯(lián)動(dòng),建設(shè)虛實(shí)融合具身智能訓(xùn)練場(chǎng)。
最終一切會(huì)回到硬件上。馬斯克認(rèn)為量產(chǎn)最困難的部分是改進(jìn)設(shè)計(jì),使其易于制造和構(gòu)建供應(yīng)鏈。DeepMind承認(rèn),“大腦”學(xué)會(huì)了系鞋帶也不等于機(jī)器人就能系緊鞋帶。很多任務(wù)都需要一雙靈巧手,甚至同時(shí)滿足快速、精準(zhǔn)地處理柔性材料。相比供應(yīng)鏈復(fù)用,相關(guān)供應(yīng)鏈的設(shè)計(jì)與制造的外溢與復(fù)用,是更具杠桿效應(yīng)的中國(guó)優(yōu)勢(shì)。中國(guó)與美國(guó)聯(lián)手,能解決大型世界模型探索的很多問(wèn)題。去年底,美國(guó)PI的π0模型搭載在中國(guó)星塵智能的S1機(jī)器人上。硅谷機(jī)器人公司K-Scale希望世界是緊密聯(lián)系的大市場(chǎng)。本文參考《看DAO 2025》“終極智能體”,增補(bǔ)了最新信息。完整報(bào)告下載方式點(diǎn)擊下方鏈接