劃重點(diǎn)
01前華為美研CTO胡魯輝回國創(chuàng)業(yè),創(chuàng)辦智澄AI,旨在讓人工智能直接感知、理解物理世界并進(jìn)行交互。
02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔(dān)任高管,擁有30+專利。
03智澄AI推出低成本通用人工智能機(jī)器人學(xué)習(xí)框架GRLF,使機(jī)械臂具備視覺能力和感知能力。
04然而,通用人工智能仍面臨諸多挑戰(zhàn),如算力、數(shù)據(jù)量等方面的差距。
05胡魯輝預(yù)計(jì),通用人工智能實(shí)現(xiàn)還需3到5年,屆時(shí)將重新定義人們的生活方式。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
機(jī)器人前瞻(公眾號(hào):robot_pro)
作者 | 許麗思
編輯 |漠影
在柏拉圖的洞穴隱喻里,一群一輩子沒出過山洞的人,對(duì)外界唯一的感知來源是投射在洞里墻壁上的影子。他們可以借助影子了解到外界的一些情況,但影子對(duì)真實(shí)世界的投射不一定是完全真實(shí)的。
現(xiàn)在的人工智能,也像處于“洞穴”之中,它對(duì)外界的理解來自于人為提供的二手信息,還沒辦法直接去感受真實(shí)世界、獲取一手信息。
而對(duì)胡魯輝來說,他想做的就是讓人工智能可以直接感知、理解物理世界,然后進(jìn)行交互,從而逐步接近通用人工智能。
在清華大學(xué)、美國留學(xué)深造后,進(jìn)入微軟、亞馬遜、華為美國研究院、Meta這樣的頂尖科技巨頭擔(dān)任高管,胡魯輝的履歷堪稱優(yōu)秀。
前年年底,他萌發(fā)了“理解物理世界”的想法。今年,他下決心回國再創(chuàng)業(yè),創(chuàng)辦了智澄AI,“澄”的意思就是逐步走向真正的智能。“目前,國內(nèi)還沒有類似企業(yè)。我們對(duì)標(biāo)的是美國李飛飛老師創(chuàng)辦的空間智能公司。”胡魯輝說。
AI 2.0時(shí)代的到來意味著什么?給機(jī)器人裝上模型就可以讓它實(shí)現(xiàn)具身智能?通用人工智能將會(huì)創(chuàng)造出機(jī)器人的“iPhone時(shí)刻”?最近,機(jī)器人前瞻和智澄AI創(chuàng)始人胡魯輝進(jìn)行了一場深入交談,從他毅然轉(zhuǎn)向的事業(yè)發(fā)展路徑背后,看到了從多模態(tài)大模型到物理智能,實(shí)現(xiàn)通用人工智能的新答案。
▲前Meta首席工程師、智澄AI創(chuàng)始人 胡魯輝
一、擔(dān)任過多家科技巨頭高管,手握30+專利
早年在清華大學(xué)畢業(yè)后胡魯輝就收到了美國西北大學(xué)等多所高校博士錄取通知,赴美深造。畢業(yè)后,他選擇留在西雅圖,在這樣一座匯集了一眾世界頂尖科技巨頭的城市工作。
他先是在微軟和亞馬遜總部工作了十來年,后面又加入華為美國研究院擔(dān)任首席架構(gòu)師兼首席技術(shù)官,最近的一段經(jīng)歷是在Meta擔(dān)任首席工程負(fù)責(zé)人,負(fù)責(zé)數(shù)據(jù)人工智能方面的工作。
除了各大科技巨頭的高管頭銜,他的從業(yè)生涯中濃墨重彩的一筆,是在美國獲得的三十多項(xiàng)發(fā)明專利及申請(qǐng)。在這些專利里,胡魯輝作為主要負(fù)責(zé)人,基本都是第一作者。
胡魯輝回憶起在2010年前后,負(fù)責(zé)了一個(gè)亞馬遜線下零售的項(xiàng)目。原本亞馬遜主攻線上業(yè)務(wù),后來想要拓展以無人店為代表的線下業(yè)務(wù)。但管理線下的商品銷售就需要人工流程,這可能會(huì)耗費(fèi)時(shí)間和成本,并且可能難以準(zhǔn)確地做出商業(yè)決策。
最初,他選擇用軟件處理這種問題。后來,他開始研發(fā)人工智能,還獲得了一個(gè)“用于線下零售業(yè)務(wù)的數(shù)據(jù)驅(qū)動(dòng)和自適應(yīng)機(jī)器學(xué)習(xí)(ML)平臺(tái)和技術(shù)”的專利,可以讓多個(gè)機(jī)器學(xué)習(xí)算法為線下零售提供多樣化的支持。
這是胡魯輝第一個(gè)與AI相關(guān)的專利發(fā)明,也是從這里開始,他可以說是真正對(duì)AI領(lǐng)域產(chǎn)生了濃厚的興趣。那個(gè)時(shí)候,AI尚未到火爆、備受關(guān)注的程度。
▲胡魯輝第一個(gè)與AI相關(guān)的專利
二、瞄準(zhǔn)AI 2.0的機(jī)會(huì),再次投身創(chuàng)業(yè)浪潮
2015年,以CNN卷積神經(jīng)網(wǎng)絡(luò)模型為核心的計(jì)算機(jī)視覺技術(shù),正式拉開了AI 1.0感知智能時(shí)代的序幕。2016年,AlphaGo擊敗圍棋世界冠軍李世石,AI迎來了重要的高光時(shí)刻,受到廣泛關(guān)注。
在AI 1.0時(shí)代,胡魯輝看中了其中的機(jī)遇,選擇在2018年回國,奔赴上海、北京兩地創(chuàng)業(yè)。
“那次創(chuàng)業(yè),主要聚焦在智慧零售方面的人工智能技術(shù)的應(yīng)用,”胡魯輝說,“當(dāng)時(shí)AI技術(shù)的特點(diǎn)是垂直性特別強(qiáng),需要在垂直領(lǐng)域進(jìn)行應(yīng)用,也和永輝、京東、騰訊等平臺(tái)進(jìn)行了合作。”
而現(xiàn)在,當(dāng)AI已經(jīng)邁入2.0時(shí)代,帶來了平臺(tái)式的變革。
在胡魯輝看來,AI 2.0時(shí)代蘊(yùn)藏著比上一個(gè)時(shí)代更多的機(jī)會(huì),會(huì)對(duì)人類的生活、工作、產(chǎn)業(yè)等產(chǎn)生更大的影響,并且還更容易落地。
所以,他的第二次創(chuàng)業(yè)開始了。他找到了之前在微軟、華為、Meta的一些同事,組成了公司的核心創(chuàng)始團(tuán)隊(duì),公司的研發(fā)團(tuán)隊(duì)也基本都是畢業(yè)于國內(nèi)外知名高校的碩士、博士、博士后。
面對(duì)深圳、上海等地發(fā)出的落地邀約,老家在浙江寧波的胡魯輝最終決定將公司設(shè)立在杭州的菜鳥智谷產(chǎn)業(yè)園。
智澄AI的成立,還得到了投資界、政府部門等多方面的支持。
胡魯輝表示,公司在成立前就已成功融資,不久后投資人還繼續(xù)追加投資。同時(shí)當(dāng)?shù)卣块T也很重視,把智澄評(píng)為AI杭州市余杭區(qū)海外高層次領(lǐng)軍人才項(xiàng)目,還在資金等多方面給予大力支持。
▲今年7月,智澄AI在杭州開業(yè)
三、低成本機(jī)械臂,也能實(shí)現(xiàn)具身智能
在AI 2.0時(shí)代,下一個(gè)爆發(fā)點(diǎn)及落地大方向?qū)⑹茿I for Robotics,而智澄AI正是瞄準(zhǔn)了這一點(diǎn)。
“我們是一家通用人工智能公司,核心技術(shù)是理解物理世界的模型,”胡魯輝解釋道,“但是我們的產(chǎn)品并非是模型,而是具身智能,也就是人工智能機(jī)器人。”
從前年年底,胡魯輝就誕生了讓人工智能理解物理世界的想法,并開始思考如何實(shí)施。這就要求模型不僅理解編程或語言處理,更要深入到物理世界的具體應(yīng)用中去。
今年5月開始,智澄AI的人工智能機(jī)器人原型一(TR1)、原型二(TR2)基本完成,已經(jīng)進(jìn)入了生產(chǎn)環(huán)節(jié),并且和一些企業(yè)達(dá)成了合作,開始了商業(yè)化之路。胡魯輝將智澄AI的人工智能機(jī)器人命名為TR,即TransformingRobot。
“雖然模型研發(fā)的時(shí)間比較長,但是集成智能本體的時(shí)間較短,迭代速度也很快,現(xiàn)在基本上兩個(gè)月就實(shí)現(xiàn)了一次迭代。”胡魯輝說。
▲智澄AI的TR2雙臂機(jī)器人
不久前,智澄AI聯(lián)合了來自哈佛大學(xué)、清華大學(xué)的人工智能專家,推出了一種低成本的通用人工智能機(jī)器人學(xué)習(xí)框架(GRLF)。
把這個(gè)框架裝在機(jī)械臂上,機(jī)械臂仿佛變成了具有視覺能力、感知能力的個(gè)體,能夠像人一樣去執(zhí)行精細(xì)的模仿學(xué)習(xí)任務(wù)。
它可以完全擺脫對(duì)仿真環(huán)境的依賴,實(shí)現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練到模型部署的端到端實(shí)景操作,還可以對(duì)多種物體進(jìn)行放置、排序、操縱,具備了一定的通用能力。
▲裝上了通用人工智能機(jī)器人學(xué)習(xí)框架的機(jī)械臂正在執(zhí)行不同的任務(wù)
縱觀目前的機(jī)器人行業(yè),胡魯輝覺得,許多企業(yè)的產(chǎn)品還處于演示、研究和教育的階段,難以實(shí)現(xiàn)機(jī)器人真正的應(yīng)用。機(jī)器人行業(yè)不僅面臨著成本高、價(jià)格高的挑戰(zhàn),還存在泛化能力不足的問題,機(jī)器人難以適應(yīng)不同場景需求和環(huán)境。
所以,他希望智澄AI能夠?qū)⑼ㄓ萌斯ぶ悄苷嬲龖?yīng)用到大眾的工作和生活中,讓機(jī)器人實(shí)現(xiàn)像人一樣的智能。
“很多公司都專注于制造機(jī)器人,讓機(jī)器人能夠完成某項(xiàng)工作。但我們想做的是能夠感知、理解物理世界的機(jī)器人,它具有推理和思考能力,能夠與外界進(jìn)行智能的交互,而目前國內(nèi)還沒有這類企業(yè)。”胡魯輝說。
在他的計(jì)劃里,智澄AI會(huì)繼續(xù)圍繞實(shí)際應(yīng)用場景、通過技術(shù)創(chuàng)新和突破來加快產(chǎn)品的迭代,并且繼續(xù)推進(jìn)和不同企業(yè)的合作,讓產(chǎn)品的應(yīng)用落到實(shí)地。
四、對(duì)標(biāo)李飛飛,讓AI走出“洞穴”
要讓AI走出“洞穴”,就需要AI直接接觸真實(shí)的物理世界。
今年4月,“AI教母”李飛飛創(chuàng)辦了一家“致力于構(gòu)建能夠感知、生成并與 3D 世界互動(dòng)的大型世界模型的空間智能公司”World Labs 。
“我們現(xiàn)在看到的大型語言模型和多模態(tài)語言模型,它們是底層表達(dá)其實(shí)是一種一維表示,”李飛飛在此前接受的公開采訪中曾說道,“而空間智能是對(duì)世界的三維表達(dá),從算法的角度來看,這是在用不同方式處理數(shù)據(jù)并從中獲得不同類型的輸出,最后解決不同的問題。”
簡單來說,李飛飛的空間智能就是要讓人工智能直接繞過一切中間障礙,直接地感受、理解所身處的三維世界,然后采取一些行動(dòng)。
而胡魯輝的想法,剛好和李飛飛不謀而合。
前年年底,他萌生出了“理解物理世界”的想法。“最初,我們關(guān)于物理智能的想法其實(shí)沒有多少人接受,畢竟這是比較有挑戰(zhàn)性的,”胡魯輝說,“通用人工智能有不同的實(shí)現(xiàn)方式,很多人都在探索,但通常都會(huì)采用大模型的方式。”
但是他認(rèn)為,現(xiàn)有的多模態(tài)大模型只能局限于訓(xùn)練的范圍中,對(duì)外界的理解還是有很大局限性。只有讓人工智能做真正理解物理世界,才能實(shí)現(xiàn)通用。
這也正是胡魯輝創(chuàng)辦智澄AI的愿景所在。
不過,在走向通用人工智能的路上,還是面臨著不少的阻礙,不僅包括在算力、數(shù)據(jù)、算法方面,也包括在真正的實(shí)際應(yīng)用落地上。胡魯輝歸納出了“兩個(gè)20”來概括當(dāng)前人工智能發(fā)展的差距:
第一個(gè)“20”是從算力的角度,他提到如果讓AI和人同時(shí)創(chuàng)作一首詩或一幅畫,人可能只需要要20瓦的電量,而AI需要耗費(fèi)巨大的電量,并且像OpenAI大模型的訓(xùn)練經(jīng)常需要耗費(fèi)數(shù)億美元。
第二個(gè)“20”是從數(shù)據(jù)量的角度,人類可能花費(fèi)20小時(shí)就能掌握很復(fù)雜的事情,例如學(xué)車,但是AI可能要花費(fèi)數(shù)億個(gè)小時(shí)的數(shù)據(jù)進(jìn)行訓(xùn)練。
要實(shí)現(xiàn)通用人工智能,還是道阻且長。
五、結(jié)語:AGI的到來,會(huì)是機(jī)器人的“iPhone”時(shí)刻”
通用人工智能,到底還需要多久才會(huì)到來呢?
沿著物理智能的路徑,胡魯輝覺得,可能還需要3到5年左右。而等到通用人工智能實(shí)現(xiàn)的那一刻的到來,也將會(huì)給機(jī)器人領(lǐng)域帶來顛覆性的變革。
這是機(jī)器人“iPhone 時(shí)刻”。就如同當(dāng)年iPhone的橫空出世,它作為一個(gè)突破性的硬件平臺(tái),帶動(dòng)了整個(gè)軟件應(yīng)用生態(tài)的發(fā)展一樣,通用人工智能也會(huì)創(chuàng)造出一個(gè)蘊(yùn)含著巨大價(jià)值的生態(tài)。
它作為一個(gè)相對(duì)標(biāo)準(zhǔn)化的模型、軟件,會(huì)走向平臺(tái)化,可以廣泛地應(yīng)用到不同的機(jī)器人上,重新定義人們的生活方式。
那個(gè)時(shí)候,機(jī)器人會(huì)成為一個(gè)更為廣泛的概念,不止是我們現(xiàn)在所熟悉的人形機(jī)器人,而是一切都會(huì)走向機(jī)器人化,重新定義每個(gè)人的生活方式。
這個(gè)時(shí)刻的曙光,已經(jīng)逐漸顯現(xiàn)了。