智元的使命是“以智能機器創(chuàng)造無限生產(chǎn)力”。
本文為IPO早知道原創(chuàng)
作者|Stone Jin
3月11日,在B站停更視頻近兩年的“稚暉君”(注:智元機器人聯(lián)合創(chuàng)始人彭志輝)發(fā)布了一則視頻,智元最新研發(fā)的全能探索機器人「靈犀X2」正式亮相。
稚暉君在發(fā)布視頻中表示,靈犀X2是智元在人工智能和情感科技領域的重大突破,其具備完善的運動、交互及作業(yè)能力,展示了人工智能與人形機器人技術的完美融合;未來,智元將繼續(xù)探索人形機器人在更多場景中的應用。
而在一天前的3月10日,智元機器人還正式發(fā)布了首個通用具身基座大模型智元啟元大模型(Genie Operator-1),并開創(chuàng)性地提出了Vision-Language-Latent-Action (ViLLA) 架構(由VLM(多模態(tài)大模型) + MoE(混合專家)組成)。
某種程度上而言,智元通用具身基座大模型GO-1的推出,標志著具身智能向通用化、開放化、智能化方向快速邁進:
1、從單一任務到多種任務:機器人能夠在不同場景中執(zhí)行多種任務,而不需要針對每個新任務重新訓練。
2、從封閉環(huán)境到開放世界:機器人不再局限于實驗室,而是可以適應多變的真實世界環(huán)境。
3、從預設程序到指令泛化:機器人能夠理解自然語言指令,并根據(jù)語義進行組合推理,而不再局限于預設程序。
進一步來講,GO-1大模型將加速具身智能的普及,機器人將從依賴特定任務的工具,向著具備通用智能的自主體發(fā)展,在商業(yè)、工業(yè)、家庭等多領域發(fā)揮更大的作用,通向更加通用全能的智能未來。
在GO-1通用具身基座大模型亮相之際,智元合伙人、具身業(yè)務部總裁、研究院執(zhí)行院長姚卯青以及智元具身研究中心常務主任任廣輝向「IPO早知道」等分享了智元對于具身智能、尤其是軟硬結合的最新思考。
值得注意的是,同樣在3月10日,智元機器人與上海國投公司簽署戰(zhàn)略合作協(xié)議,智元人形機器人產(chǎn)品也將有望加速進入家庭、工廠和商超等場所。根據(jù)協(xié)議,兩家企業(yè)將積極開展戰(zhàn)略投資及基金業(yè)務合作,聚焦人形機器人上下游產(chǎn)業(yè)鏈、具身智能關鍵技術等領域,以資本賦能具身智能上下游產(chǎn)業(yè)及關鍵技術。同時,雙方將發(fā)揮各自的資源優(yōu)勢,協(xié)同構建“產(chǎn)業(yè)鏈+應用場景”生態(tài)體系,拓展技術應用場景,推動投資生態(tài)內(nèi)的產(chǎn)、學、研深度合作,探索打造高水平創(chuàng)新聯(lián)合體。
以下系對話精選:
Q:為何要推出自己的通用具身基座大模型?
A:我們智元的使命是“以智能機器創(chuàng)造無限生產(chǎn)力”,我們一直認為機器人只有硬件本體是遠遠不夠的。
近期,一些國外的機構或者公司評價中國人形機器人公司的時候也談到,“可能硬件做得比較好,但AI能力還沒有看到一些顯著的進展”。
在智元看來,AI能力將來一定是區(qū)分機器人產(chǎn)品競爭力的核心環(huán)節(jié)。就像今天的新能源汽車和手機一樣,在硬件端大家都會有一些類似的方案逐漸收斂,供應鏈也會高度整合,那么最后大家比拼的一定是AI能力。對于機器人來講,AI能力一定是更為重要的因為機器人如果沒有自主作業(yè)的能力,那它的價值就會非常有限。
所以我們把具身智能的AI研發(fā)作為公司的戰(zhàn)略級的投入、最P0級的投入,我們也是第一個在行業(yè)內(nèi)走完了機器人的大規(guī)模量產(chǎn),然后用大規(guī)模量產(chǎn)的機器人編隊去采集百萬級的高質(zhì)量數(shù)據(jù),最后又能把這批數(shù)據(jù)用來自研大模型,進而把這個大模型部署在自己的硬件本體上,我們是第一個做到如此閉環(huán)的。
Q:硬件和軟件其實都很重要。
A:事實上,“偏科”的公司還是比較多的有一些公司特別擅長算法,包括像國外的一些公司,但他們沒有很好的機器人硬件、也沒有大規(guī)模的機器人本體,這其實會嚴重限制他們對算法開發(fā)的驗證。反過來,也有大量的機器人本體公司,我們看到他們在AI上的投入是比較受限的。所以我們希望能夠看到更多像智元這樣能夠具備從硬件、到、數(shù)據(jù)到算法,完整端到端研發(fā)能力的機器人公司涌現(xiàn)。
Q:AI的投入會非常大,后續(xù)會不會轉(zhuǎn)移到終端售價上。
A:不會。
在這個階段,智元還是堅定地認為需要以價值為導向,真正能夠實現(xiàn)機器人硬件和軟件的協(xié)同配合,以產(chǎn)生一個更好的效果,這樣才能給用戶創(chuàng)造價值,而不只是定位成一個大號的電動玩具,長期來講這個的商業(yè)價值不大。
對我們來講,投入AI研發(fā)是非常堅定的,但是我們也已經(jīng)開始規(guī);a(chǎn)和交付了,其實這方面的投入是可以被較好分攤掉的,自然也不會顯著地將一些AI 研發(fā)支出轉(zhuǎn)移到最終終端售價上去。
另外我想說的一點是,機器人行業(yè)的應用也不完全是一個純To C的市場,To B 市場同樣存在。在這里面,關于軟件、關于應用的開發(fā)模式就更多、也比較靈活。我們和我們的合作伙伴,包括用戶企業(yè),也包括中間的一些生態(tài)合作伙伴,是有一個聯(lián)合共創(chuàng)形式的,所以并不會簡單地將研發(fā)費用轉(zhuǎn)移成定價,現(xiàn)在不是這樣一個邏輯。
Q:智元剛剛成立滿2年,為何那些成立時間相對更久的企業(yè)沒能達到你們今天的成績?
A:那些成立時間較長的企業(yè)也許有一定的“歷史包袱”,組織上也沒法做一些特別大的調(diào)整,包括從資本的層面來講也會經(jīng)營得相對保守一些。
其實大家也都看到了,一些比較成功的大模型企業(yè)的團隊是非常年輕的;我們智元研發(fā)團隊的平均年齡其實也不到30歲。我們用兩年的時間,走完了別人可能八、九年都沒能走完的路,而且處于快速上升的趨勢中。
當然也不否認,雖然市場上的整體人才比較多,甚至我覺得中國的人才儲備大于國外,但隨著越來越多新的具身智能和機器人公司的出現(xiàn),人才競爭的確也是一個比較激烈的過程。我們具身智能的研發(fā)還在持續(xù)招聘,希望吸引更多優(yōu)秀的專家和青年才俊加入我們,打造國內(nèi)乃至全球范圍內(nèi)真正的第一梯隊研發(fā)隊伍。
Q:今年在商業(yè)化方面有何計劃?
A:營收層面:相較2024年能有一個數(shù)倍的增長;出貨量層面,能達到數(shù)千臺的規(guī)模;應用場景層面,除了大家都在做的科研、教育市場外,我們自己還在重點開拓一些工業(yè)、商業(yè)、服務業(yè)的市場。