導(dǎo)語:如果英偉達(dá)想要在科技界的頂尖地位得以長久保持,黃仁勛就需要讓機(jī)器人市場足夠龐大。
穿著他標(biāo)志性的黑色皮夾克,黃仁勛(Jensen Huang)伸開雙臂,示意站在他身旁的類人機(jī)器人,臺下的觀眾報(bào)以熱烈的掌聲!安畈欢嗍俏业纳砀,”他在2024年6月的臺北國際電腦展(Computex2024)舞臺上開玩笑道。
“機(jī)器人時(shí)代來了,物理AI時(shí)代來了,這不是科幻電影。”他說道。然而,盡管黃仁勛如此宣告,站在舞臺上的機(jī)器人卻并非真正的類人機(jī)器人,而是一些類似送貨機(jī)器人的輪式設(shè)備,它們僅僅在大屏幕上呈現(xiàn)出類人機(jī)器人的形態(tài)。
機(jī)器人是黃仁勛(JensenHuang)未來愿景的重要組成部分,這一愿景也得到了包括埃隆馬斯克(Elon Musk)在內(nèi)的其他科技巨頭的認(rèn)同。除了在臺北國際電腦展(Computex)上的展示外,類人機(jī)器人還在英偉達(dá)最近的兩次財(cái)報(bào)電話會(huì)議中被提及。
大多數(shù)分析師認(rèn)為,英偉達(dá)未來幾年的命運(yùn)幾乎已經(jīng)注定。圖形處理單元(GPU)的需求推動(dòng)了英偉達(dá)市值飆升,最高曾一度突破3萬億美元。然而,半導(dǎo)體行業(yè)的競爭異常激烈。英偉達(dá)87%的收入來源于數(shù)據(jù)中心,而數(shù)據(jù)中心的投資往往是周期性的,既有高潮也有低谷。因此,英偉達(dá)亟需開辟另一個(gè)大市場。
在臺北國際電腦展上,黃仁勛表示,未來將有兩款“高產(chǎn)量”的機(jī)器人產(chǎn)品。第一個(gè)是自動(dòng)駕駛汽車,第二個(gè)很可能就是類人機(jī)器人。隨著機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這些技術(shù)正在不斷融合。
這兩種機(jī)器都需要具有人類般的感知能力,能夠應(yīng)對快速變化的環(huán)境,并在幾乎沒有容錯(cuò)的情況下做出即時(shí)反應(yīng)。它們還都需要巨量的計(jì)算能力,而這正是黃仁勛(Jensen Huang)所提供的:AI計(jì)算力。然而,目前機(jī)器人技術(shù)在英偉達(dá)的收入中只占很小一部分,而且要讓這一市場快速增長,絕非單純依靠時(shí)間的推移。
如果英偉達(dá)想要在科技界的頂尖地位得以長久保持,黃仁勛就需要讓機(jī)器人市場足夠龐大。雖然英偉達(dá)過去幾年的成功故事充滿了卓越的工程技術(shù)、前瞻性眼光和精準(zhǔn)的時(shí)機(jī)把握,但要將機(jī)器人從概念推向現(xiàn)實(shí),面臨的挑戰(zhàn)可能比以往任何時(shí)候都要艱巨。
那么,英偉達(dá)如何才能實(shí)現(xiàn)機(jī)器人愿景呢?
人工智能無疑為機(jī)器人技術(shù)開辟了巨大的發(fā)展空間,但要讓機(jī)器人技術(shù)大規(guī)模應(yīng)用,必須讓這一領(lǐng)域的工程技術(shù)和構(gòu)建過程變得更加易于獲取和實(shí)現(xiàn)。這意味著英偉達(dá)不僅要提供強(qiáng)大的計(jì)算平臺,還需要推動(dòng)機(jī)器人技術(shù)的普及和簡化,使其能夠進(jìn)入更多的行業(yè)并應(yīng)用到實(shí)際場景中。
“機(jī)器人AI是最復(fù)雜的,因?yàn)榇笳Z言模型只是軟件,而機(jī)器人既是機(jī)械工程問題,又是軟件問題,還是物理學(xué)問題。這要復(fù)雜得多,”數(shù)據(jù)中心運(yùn)營商DataBank的CEO Raul Martynek說道。
目前從事機(jī)器人技術(shù)的多數(shù)人都是機(jī)器人領(lǐng)域的專家,他們通常擁有博士學(xué)位,因?yàn)檫@項(xiàng)工作要求如此。十年前,語言基礎(chǔ)AI領(lǐng)域的情況也類似。然而,隨著基礎(chǔ)模型和支持它們的計(jì)算資源變得廣泛可用,今天,構(gòu)建AI應(yīng)用不再需要博士學(xué)位。
如今,層層的軟件和龐大的語言與圖像庫被設(shè)計(jì)用來提升用戶粘性,降低入門門檻,讓幾乎任何人都能開發(fā)和使用AI技術(shù)。這種趨勢大大推動(dòng)了AI應(yīng)用的普及,并使得更多的開發(fā)者能夠參與到這一領(lǐng)域中,推動(dòng)技術(shù)的不斷創(chuàng)新和應(yīng)用場景的拓展。
英偉達(dá)的機(jī)器人技術(shù)棧也需要實(shí)現(xiàn)類似的目標(biāo),但由于在物理空間中應(yīng)用AI更具挑戰(zhàn)性,因此要讓普通人也能使用這一技術(shù),難度也隨之增加。
英偉達(dá)的機(jī)器人技術(shù)棧相對復(fù)雜,需要一定的學(xué)習(xí)和適應(yīng)。它由眾多平臺、庫和工具組成,名稱繁多,讓人有些眼花繚亂。
其中,Omniverse 是一個(gè)仿真平臺,提供了一個(gè)虛擬世界,開發(fā)者可以在其中定制并測試機(jī)器人的仿真效果。而 Isaac 則是英偉達(dá)在Omniverse基礎(chǔ)上構(gòu)建的“訓(xùn)練場”。
通過Isaac,開發(fā)者可以將機(jī)器人放入一個(gè)虛擬環(huán)境中,并讓其練習(xí)各種任務(wù)。這一套系統(tǒng)旨在幫助開發(fā)者為機(jī)器人創(chuàng)建和優(yōu)化操作情境,進(jìn)而提高機(jī)器人的工作效率和適應(yīng)能力。
盡管這些平臺為開發(fā)者提供了強(qiáng)大的工具,但要讓這些技術(shù)變得更易用、便于非專業(yè)人士使用,依然面臨許多挑戰(zhàn)。
Jetson Thor 是英偉達(dá)為機(jī)器人提供動(dòng)力的芯片,而 Project Groot 則是公司稱之為“月球計(jì)劃”的一項(xiàng)雄心勃勃的項(xiàng)目,旨在打造類人機(jī)器人所需的基礎(chǔ)模型。今年7月,英偉達(dá)還推出了一項(xiàng)合成數(shù)據(jù)生成服務(wù),并推出了 Osmo,這一軟件層將所有技術(shù)整合在一起。
黃仁勛常說,類人機(jī)器人更容易構(gòu)建,因?yàn)槭澜缫呀?jīng)為人類打造好了。
他在臺北國際電腦展(Computex)上表示:“世界上最容易適應(yīng)的機(jī)器人就是類人機(jī)器人,因?yàn)槲覀円呀?jīng)為人類建造了這個(gè)世界。”他還補(bǔ)充道:“我們擁有相同的身體結(jié)構(gòu),所以有更多的數(shù)據(jù)來訓(xùn)練這些機(jī)器人!
黃仁勛的觀點(diǎn)反映了類人機(jī)器人設(shè)計(jì)中的一個(gè)關(guān)鍵優(yōu)勢人類世界的設(shè)計(jì)本身就為類人機(jī)器人提供了更自然的適應(yīng)性。例如,現(xiàn)有的建筑、家具、交通工具等都是基于人類的需求和身形設(shè)計(jì)的,這使得類人機(jī)器人在這些環(huán)境中的應(yīng)用變得相對簡單。
收集有關(guān)我們?nèi)绾我苿?dòng)的數(shù)據(jù)仍然需要時(shí)間、努力和資金。例如,特斯拉正在支付每小時(shí)48美元的報(bào)酬,讓人們穿上特殊的套裝執(zhí)行任務(wù),以訓(xùn)練其類人機(jī)器人Optimus。
“這一直是機(jī)器人技術(shù)中最大的難題需要多少數(shù)據(jù)才能讓這些基礎(chǔ)模型理解世界并進(jìn)行調(diào)整,”曾在蘋果、谷歌和微軟工作的AI專家Sophia Velastegui說道。
盡管如此,分析師們看到了其中的潛力。研究公司W(wǎng)illiam Blair的分析師最近表示:“英偉達(dá)在機(jī)器人技術(shù)和數(shù)字雙胞胎(通過Omniverse)方面的能力,具有擴(kuò)展為龐大商業(yè)的潛力。”分析師們還表示,他們預(yù)計(jì)英偉達(dá)的汽車業(yè)務(wù)將在2027年前實(shí)現(xiàn)年均20%的增長。
英偉達(dá)宣布,寶馬(BMW)正在使用 Isaac 和 Omniverse 來訓(xùn)練工廠機(jī)器人。
波士頓動(dòng)力(Boston Dynamics)、比亞迪電子(BYD Electronics)、Figure、Intrinsic、西門子(Siemens)和特拉達(dá)因機(jī)器人(Teradyne Robotics)等公司也在使用英偉達(dá)的技術(shù)棧,來構(gòu)建機(jī)器人手臂、類人機(jī)器人以及其他類型的機(jī)器人。
然而,三位機(jī)器人領(lǐng)域的專家在接受BI采訪時(shí)表示,迄今為止,英偉達(dá)在降低普通開發(fā)者進(jìn)入機(jī)器人領(lǐng)域的門檻方面,未能像在語言和圖像AI領(lǐng)域那樣取得類似的成功。競爭對手正試圖在英偉達(dá)主導(dǎo)機(jī)器人技術(shù)之前,搶先打造出理想的機(jī)器人技術(shù)棧。
英偉達(dá)的一位發(fā)言人通過電子郵件對BI表示:“我們認(rèn)識到,開發(fā)能夠與物理世界互動(dòng)的AI是極具挑戰(zhàn)性的,這也是我們開發(fā)一個(gè)完整平臺,幫助企業(yè)訓(xùn)練和部署機(jī)器人!
今年7月,英偉達(dá)推出了一個(gè)類人機(jī)器人開發(fā)者計(jì)劃。成功提交申請的開發(fā)者將可以訪問該公司提供的所有工具。
英偉達(dá)無法單打獨(dú)斗
Ashish Kapoor 深知機(jī)器人領(lǐng)域仍然面臨巨大的發(fā)展空間。Kapoor曾在微軟(Microsoft)機(jī)器人研究部門工作17年,并在此期間幫助開發(fā)了 AirSim,一個(gè)計(jì)算機(jī)視覺仿真平臺,該平臺于2017年推出,并于去年停用。
隨著AirSim的關(guān)閉,Kapoor決定創(chuàng)建自己的平臺。去年,他成立了 Scaled Foundations,并推出了 Grid,一個(gè)為有志成為機(jī)器人開發(fā)者的人設(shè)計(jì)的機(jī)器人開發(fā)平臺。
通過Grid,Kapoor希望為更多的開發(fā)者提供一個(gè)更易接入、更具靈活性的工具和資源,助力機(jī)器人技術(shù)的創(chuàng)新和應(yīng)用普及。
Kapoor表示,沒有任何一家公司能夠單獨(dú)解決機(jī)器人技術(shù)中的那些棘手問題。
“在我看來,AI領(lǐng)域的實(shí)際解決方案是由社區(qū)共同努力實(shí)現(xiàn)的,”Kapoor說道!澳菚r(shí)候,真正的突破發(fā)生了,現(xiàn)在機(jī)器人領(lǐng)域也需要這種合作!
Kapoor指出,目前看起來,所有致力于類人機(jī)器人開發(fā)的公司似乎各自為戰(zhàn)。然而,機(jī)器人初創(chuàng)公司倒閉的現(xiàn)象并非沒有原因。“機(jī)器人進(jìn)入真實(shí)世界場景后,常常表現(xiàn)得不夠好?蛻粼谒鼈冞沒有改進(jìn)之前就放棄了它們!
這種情況讓Kapoor深感憂慮,他認(rèn)為,只有通過開放合作,匯聚各方力量,才能真正推動(dòng)機(jī)器人技術(shù)的發(fā)展,并解決當(dāng)前技術(shù)面臨的種種挑戰(zhàn)。
“常開的玩笑是,每個(gè)機(jī)器人背后都有一支由10人組成的團(tuán)隊(duì)在試圖讓它運(yùn)行,”Kapoor說道。
Grid 提供了免費(fèi)版本和一個(gè)托管服務(wù)版本,后者提供更多的幫助。ScaledFoundations 正在構(gòu)建自己的機(jī)器人基礎(chǔ)模型,但同時(shí)也鼓勵(lì)用戶自己開發(fā)基礎(chǔ)模型。
英偉達(dá)的部分機(jī)器人技術(shù)棧是開源的。黃仁勛常常表示,英偉達(dá)正在與全球所有的機(jī)器人和AI公司合作,但一些開發(fā)者擔(dān)心,英偉達(dá)這個(gè)龐然大物可能會(huì)先保護(hù)自己的成功,而把對整個(gè)生態(tài)系統(tǒng)的支持放在第二位。
這種擔(dān)憂反映了英偉達(dá)在推動(dòng)技術(shù)創(chuàng)新的同時(shí),可能面臨的一種“控制力”問題。雖然開源和合作看似是推動(dòng)整個(gè)行業(yè)發(fā)展的關(guān)鍵,但開發(fā)者仍擔(dān)心英偉達(dá)可能優(yōu)先確保自身利益,影響到生態(tài)系統(tǒng)中其他參與者的平等競爭。
“他們在做蘋果效應(yīng)。對我來說,他們是在盡可能把你鎖進(jìn)自己的生態(tài)系統(tǒng),”計(jì)算機(jī)視覺公司 EveryPoint 的首席開發(fā)者倡導(dǎo)者 Jonathan Stephens 說道。
對此,英偉達(dá)的一位發(fā)言人向BI表示,這種看法并不準(zhǔn)確。公司表示:“我們與機(jī)器人和類人開發(fā)者生態(tài)系統(tǒng)中的大多數(shù)領(lǐng)先企業(yè)進(jìn)行合作,幫助他們更快地部署機(jī)器人。我們的成功來源于這個(gè)生態(tài)系統(tǒng)。”
然而,Scaled Foundations 和英偉達(dá)并不是唯一致力于構(gòu)建機(jī)器人基礎(chǔ)模型的公司。SkildAI 在7月籌集了3億美元,用于打造自己的機(jī)器人基礎(chǔ)模型版本。
什么造就了類人機(jī)器人?
仿真器是通向類人機(jī)器人之路的一個(gè)重要環(huán)節(jié),但它們并不一定能夠?qū)崿F(xiàn)人類般的感知能力。
在臺北國際電腦展(Computex)上,黃仁勛描述了一款機(jī)器人手臂時(shí)表示,英偉達(dá)提供了“計(jì)算機(jī)、加速層以及預(yù)訓(xùn)練的AI模型”,這些都是將AI機(jī)器人投入AI工廠所必需的。
大規(guī)模使用機(jī)器人手臂在工廠中的目標(biāo)已經(jīng)存在了幾十年。自1961年起,機(jī)器人手臂就開始參與汽車生產(chǎn)。但黃仁勛談?wù)摰膮s是AI機(jī)器人一種智能機(jī)器人。
與此不同的是,用于制造汽車的機(jī)器人手臂大多并不具備智能。它們通常是被編程來執(zhí)行重復(fù)的任務(wù),并且依賴傳感器而非攝像頭來進(jìn)行“視覺”感知。
這些手臂雖然高效,但缺乏自主決策和復(fù)雜任務(wù)的能力。而類人機(jī)器人則需要具備更復(fù)雜的感知、理解和決策能力,這才是它們區(qū)別于傳統(tǒng)工業(yè)機(jī)器人的關(guān)鍵所在。
一款支持AI的機(jī)器人手臂將能夠處理多樣化的任務(wù)拾取不同的物品,并將它們放置到不同的地方,確保物品不被損壞,甚至可能在移動(dòng)中完成這些操作。
它們需要具備感知物體和護(hù)欄的能力,并能夠按合理的順序進(jìn)行操作。然而,類人機(jī)器人與即使是最有用的非類人機(jī)器人相比,依然有著巨大的差距。一些機(jī)器人專家懷疑,類人機(jī)器人是否真的是一個(gè)值得追求的目標(biāo)。
“一點(diǎn)也不樂觀,”一位曾在英偉達(dá)從事機(jī)器人領(lǐng)域工作的專家表示,他在該領(lǐng)域已有超過15年的經(jīng)驗(yàn),并因保護(hù)行業(yè)關(guān)系要求匿名!爸圃煲粋(gè)類人機(jī)器人并讓它具備多功能的成本,肯定會(huì)比制造一個(gè)外形不像人類且只會(huì)做單一任務(wù)但能夠快速高效完成任務(wù)的機(jī)器人要高。”
然而,黃仁勛對此卻全力投入。他堅(jiān)信,類人機(jī)器人代表著未來的方向,不僅是技術(shù)的挑戰(zhàn),更是英偉達(dá)在AI領(lǐng)域全面布局的關(guān)鍵一步。
“我認(rèn)為黃仁勛對機(jī)器人有一種執(zhí)著,最終,他想做的是創(chuàng)造未來,”Martynek說道。
自動(dòng)駕駛汽車和機(jī)器人技術(shù)是英偉達(dá)未來戰(zhàn)略的重要組成部分。公司向BI表示,他們預(yù)計(jì),未來一切都將實(shí)現(xiàn)自主化,從機(jī)器人手臂和車輛開始,最終擴(kuò)展到建筑乃至整個(gè)城市。
“我在蘋果(Apple)工作時(shí),我們開發(fā)了iPad,它的靈感來自《星際迷航》和其他電影中的未來世界,”Velastegui說道,并補(bǔ)充道,“機(jī)器人技術(shù)激發(fā)了我們的想象力。”
這番話反映了機(jī)器人技術(shù)不僅僅是工程問題,更是一次技術(shù)與科幻夢想的結(jié)合。它觸動(dòng)了人類對未來的無限憧憬和探索,成為當(dāng)今科技行業(yè)中的一大前沿。(BI)