展會信息港展會大全

專為機(jī)器人行業(yè)而設(shè)計!谷歌推出兩款新型AI模型
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-03-13 08:15:29   瀏覽:107次  

導(dǎo)讀:財聯(lián)社3月13日訊(編輯 牛占林)當(dāng)?shù)貢r間周三,谷歌宣布推出兩款基于Gemini 2.0的新型人工智能(AI)模型,旨在開發(fā)更靈活、可互動的機(jī)器人,有望推動機(jī)器人在更多場景中的應(yīng)用和普及。谷歌表示,最新的AI模型是為各種形狀的機(jī)器人設(shè)計的,包括人形機(jī)器人和工廠、倉庫中使用的其他類型的機(jī)器人。據(jù)谷歌介紹,其中一款名為Gemini Robotics,是一款視覺-語言-行動模型,能夠通過物 ......

財聯(lián)社3月13日訊(編輯 牛占林)當(dāng)?shù)貢r間周三,谷歌宣布推出兩款基于Gemini 2.0的新型人工智能(AI)模型,旨在開發(fā)更靈活、可互動的機(jī)器人,有望推動機(jī)器人在更多場景中的應(yīng)用和普及。

谷歌表示,最新的AI模型是為各種形狀的機(jī)器人設(shè)計的,包括人形機(jī)器人和工廠、倉庫中使用的其他類型的機(jī)器人。

專為機(jī)器人行業(yè)而設(shè)計!谷歌推出兩款新型AI模型

據(jù)谷歌介紹,其中一款名為Gemini Robotics,是一款視覺-語言-行動模型,能夠通過物理動作輸出結(jié)果,使機(jī)器人可以理解自然語言指令并執(zhí)行復(fù)雜任務(wù)。更簡單的說,Gemini Robotics可以聽懂人類的語言,然后執(zhí)行相應(yīng)的命令。

另一款名為Gemini Robotics-ER,是一個專注于空間推理的視覺-語言模型,能夠幫助機(jī)器人更好地理解周圍環(huán)境,并支持開發(fā)者利用其推理能力運行自己的程序。

谷歌DeepMind工程師Kanishka Rao表示,谷歌將Gemini模型應(yīng)用于機(jī)器人,正在推動機(jī)器人技術(shù)向更智能、更通用的方向發(fā)展!拔覀兊氖澜绶浅(fù)雜、動態(tài)且豐富,我認(rèn)為通用智能機(jī)器人需要能夠應(yīng)對這種復(fù)雜性!

與此同時,包括Meta、特斯拉和OpenAI等巨頭均加大了在機(jī)器人領(lǐng)域的研發(fā)工作,許多初創(chuàng)公司也在機(jī)器人領(lǐng)域嶄露頭角,例如,F(xiàn)igure AI和Skild AI等,它們的估值都達(dá)到了數(shù)十億美元。

在預(yù)先錄制的演示視頻中,谷歌研究人員展示了運行其技術(shù)的機(jī)器人如何響應(yīng)簡單指令。其中一臺機(jī)器人站在一堆字母拼圖前,在訓(xùn)練員要求它拼出一個單詞時,它拼出了“Ace”。

工程師們還在實驗室里搭建了一個迷你玩具籃球場,另一臺機(jī)器人在被要求完成扣籃動作時,將一個小塑料球按進(jìn)了籃筐。

Rao聲稱:“當(dāng)我們第一次看到機(jī)器人扣籃時,整個團(tuán)隊都非常興奮。這是因為機(jī)器人從來沒有見過任何與籃球有關(guān)的東西。它是通過Gemini理解了籃網(wǎng)的外觀以及‘扣籃’這個詞的含義,并能把它們聯(lián)系起來,然后在現(xiàn)實世界中完成這項任務(wù)!

不過,谷歌強調(diào)這項工作仍處于“早期探索”階段。DeepMind研究員Vikas Sindhwani表示,Gemini模型是在對物理環(huán)境中的“常識性安全”有深刻理解的基礎(chǔ)上開發(fā)的。

他還提到,谷歌計劃逐步部署這些機(jī)器人,最初將它們放置在與人類保持安全距離的位置,隨著時間推移,在安全性能不斷提升的情況下,逐漸增加其互動性和協(xié)作性。

(財聯(lián)社 牛占林)

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港