欧美尹人色综合天天久久天天,午夜亚洲AⅤ无码高潮片

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-22 14:50:39 瀏覽：111次

導(dǎo)讀：新智元報道編輯：靜音十二【新智元導(dǎo)讀】最近，Jim Fan參與的一項研究推出了自動化數(shù)據(jù)生成系統(tǒng)DexMimicGen。該系統(tǒng)可基于少量人類演示，合成類人機(jī)器人的靈巧手運(yùn)動軌跡，解決了訓(xùn)練數(shù)據(jù)集的獲取難題，而且還提升了實驗中機(jī)器人的表現(xiàn)。要知道，大規(guī)模、優(yōu)質(zhì)的機(jī)器人訓(xùn)練數(shù)據(jù)集的獲取往往非常有挑戰(zhàn)性。不過最近，來自英偉達(dá)、UT Austin和UCSD的研究人員推出了一種大規(guī)模自動 ......

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

新智元報道

編輯：靜音十二【新智元導(dǎo)讀】最近，Jim Fan參與的一項研究推出了自動化數(shù)據(jù)生成系統(tǒng)DexMimicGen。該系統(tǒng)可基于少量人類演示，合成類人機(jī)器人的靈巧手運(yùn)動軌跡，解決了訓(xùn)練數(shù)據(jù)集的獲取難題，而且還提升了實驗中機(jī)器人的表現(xiàn)。要知道，大規(guī)模、優(yōu)質(zhì)的機(jī)器人訓(xùn)練數(shù)據(jù)集的獲取往往非常有挑戰(zhàn)性。

不過最近，來自英偉達(dá)、UT Austin和UCSD的研究人員推出了一種大規(guī)模自動化數(shù)據(jù)生成系統(tǒng)DexMimicGen。

它可基于少量人類演示合成類人機(jī)器人的靈巧手運(yùn)動軌跡，幫助實現(xiàn)在更少人工干預(yù)下擴(kuò)大類人數(shù)據(jù)的采集。

也就是說，機(jī)器人訓(xùn)練數(shù)據(jù)集的獲取效率得到了大幅提升！

DexMimicGen的核心思想是利用一小組人類演示，并通過在物理仿真中進(jìn)行演示轉(zhuǎn)換和重放，自動生成大量適用于雙手靈巧操作場景中模仿學(xué)習(xí)的訓(xùn)練數(shù)據(jù)。

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

從僅5個源人類演示開始，DexMimicGen可以生成1000個雙手靈巧任務(wù)的演示。研究團(tuán)隊從60個源人類演示中總共生成了21000個演示，涵蓋了9種不同的任務(wù)。

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

DexMimicGen生成的大規(guī)模數(shù)據(jù)集可用于訓(xùn)練高性能的模仿學(xué)習(xí)策略，并用于不同策略的基準(zhǔn)測試。

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

研究團(tuán)隊發(fā)現(xiàn)，隨著DexMimicGen數(shù)據(jù)量的增加，策略的性能也隨之提升。

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

他們還使用DexMimicGen結(jié)合real2sim2real方法生成了真實世界的演示。

他們創(chuàng)建了一個現(xiàn)實世界罐子分類任務(wù)的數(shù)字孿生模型，通過在仿真環(huán)境中重放現(xiàn)實世界的人類演示，利用DexMimicGen生成軌跡，并將這些生成的軌跡轉(zhuǎn)移回現(xiàn)實世界，從而實現(xiàn)了一個成功率高達(dá)90%的視覺運(yùn)動策略，而單靠人類演示的成功率僅為0%！

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

解決機(jī)器人訓(xùn)練數(shù)據(jù)集的獲取難題

從人類演示中進(jìn)行模仿學(xué)習(xí)是一種有效的機(jī)器人操作技能教學(xué)方法。其中一種常見的方法是遠(yuǎn)程操作，即人類操作員通過控制機(jī)器人手臂來收集數(shù)據(jù)，這些數(shù)據(jù)用于訓(xùn)練機(jī)器人，使其能夠自主完成任務(wù)。

近期的研究通過多個操作員協(xié)作收集了大規(guī)模多樣化的數(shù)據(jù)集，結(jié)果表明，基于這些數(shù)據(jù)集訓(xùn)練的機(jī)器人表現(xiàn)出色，甚至能夠在不同環(huán)境中泛化。此外，近期的研究還關(guān)注將這一范式應(yīng)用于類人機(jī)器人。

然而，數(shù)據(jù)采集是這一方法更廣泛應(yīng)用的主要瓶頸。

在單臂機(jī)器人任務(wù)中，數(shù)據(jù)采集通常需要多個操作員、機(jī)器人以及數(shù)月的人力投入。針對類人機(jī)器人的數(shù)據(jù)采集則更具挑戰(zhàn)性，因為同時控制多只手臂和多指靈巧手的復(fù)雜性較高。

為了實現(xiàn)類人機(jī)器人的實時遠(yuǎn)程操作，研究人員開發(fā)了專門的遠(yuǎn)程操作界面，但這些界面的成本高昂，難以實現(xiàn)規(guī)模化。

類人機(jī)器人的任務(wù)復(fù)雜性也更高，因此數(shù)據(jù)需求更大，但由于操作員需同時控制多臂和多指手，工作負(fù)擔(dān)大幅增加，數(shù)據(jù)采集也更加困難。

相比之下，在仿真環(huán)境中利用自動化數(shù)據(jù)生成是一種引人注目的替代方案，并已證明在單臂機(jī)器人操作中非常有效。

受這一成功的啟發(fā)，DexMimicGen由此誕生，這是一個針對雙手靈巧機(jī)器人（如類人機(jī)器人）的大規(guī)模自動數(shù)據(jù)生成系統(tǒng)。

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

DexMimicGen方法介紹

基于MimicGen進(jìn)行改進(jìn)DexMimicGen所借鑒的MimicGen方法是一種適用于帶并行爪夾具的單臂機(jī)器人的流水線，而DexMimicGen克服了多個技術(shù)挑戰(zhàn)，使得這些原理可以應(yīng)用于我們的雙手操作場景。

MimicGen將每個任務(wù)分解為一系列子任務(wù)，分別軌跡后拼接在一起。而雙手靈巧操作涉及三種子任務(wù)類型，其中兩只手臂需要分別實現(xiàn)子目標(biāo)、協(xié)調(diào)配合，并按特定順序執(zhí)行。

然而，MimicGen依賴單一的子任務(wù)分割策略，難以應(yīng)對雙手任務(wù)中獨(dú)立和相互依賴的動作需求。

為了解決這些問題，DexMimicGen引入了一種靈活的單臂子任務(wù)分割策略，使每只手臂能夠獨(dú)立執(zhí)行其子任務(wù)，同時能夠適應(yīng)必要的協(xié)調(diào)階段。

DexMimicGen采用同步策略，以確保在協(xié)調(diào)子任務(wù)期間動作的精確對齊，并引入排序約束機(jī)制，以確保在順序子任務(wù)中動作的正確執(zhí)行順序。

子任務(wù)的分類法DexMimicGen生成用于雙手靈巧操作的數(shù)據(jù)這涉及比MimicGen更具挑戰(zhàn)性的三大關(guān)鍵問題。

首先，每個手臂必須能夠獨(dú)立于另一個手臂操作以實現(xiàn)不同的目標(biāo)；其次，手臂必須能夠協(xié)調(diào)以實現(xiàn)共同的目標(biāo)；最后，某些手臂目標(biāo)必須在其他目標(biāo)完成之前完成。

為了應(yīng)對這些挑戰(zhàn)，DexMimicGen引入了一種子任務(wù)類型的分類法包括并行子任務(wù)、協(xié)調(diào)子任務(wù)和順序子任務(wù)，并對數(shù)據(jù)生成過程進(jìn)行了相應(yīng)調(diào)整以適應(yīng)這些任務(wù)類型。

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍

并行子任務(wù)

在雙臂機(jī)器人設(shè)置中，每個機(jī)械臂需要具備獨(dú)立操作的能力，以便各自完成不同的任務(wù)目標(biāo)。比如，在裝配任務(wù)的初期階段，每個手臂都需要抓取不同的部件，而且這兩個抓取動作可能不會在同一時間發(fā)生。

為此，DexMimicGen引入了一種新的子任務(wù)類型并行子任務(wù)，它允許每個臂根據(jù)自己的任務(wù)列表獨(dú)立行動。

由于每個手臂的子任務(wù)是獨(dú)立定義的，它們的啟動和完成時間可能會有所不同。為了適應(yīng)這種非同步性，DexMimicGen引入了異步執(zhí)行策略。

在這種策略下，每個手臂都有自己的動作隊列，動作會從隊列中逐一出隊并行執(zhí)行。一旦某個手臂的隊列為空，它就會加載下一個子任務(wù)的轉(zhuǎn)換后操作段，確保即使沒有嚴(yán)格的子任務(wù)對齊，也能順利執(zhí)行兩個手臂的動作。

協(xié)調(diào)子任務(wù)

對于需要精確配合的任務(wù)，如「盒子清理」中的蓋子放置，兩個末端執(zhí)行器在執(zhí)行過程中的相對位置必須與源演示保持一致。

DexMimicGen通過確保兩個手臂以同步的方式執(zhí)行軌跡，并使用相同的變換來生成軌跡，從而實現(xiàn)這一點(diǎn)。

具體來說，為了達(dá)到時間上的同步，DexMimicGen在源演示分割時強(qiáng)制所有協(xié)調(diào)子任務(wù)在同一時間點(diǎn)結(jié)束。

在實際執(zhí)行中，則采用同步策略，即每個手臂會等待另一個手臂，直至兩者在協(xié)調(diào)子任務(wù)中剩余的步驟相同，這樣就能保證子任務(wù)的執(zhí)行結(jié)束與分割時的設(shè)定一致。

此外，DexMimicGen還提供了兩種源演示變換方案：「轉(zhuǎn)換」和「重演」。

前者基于首次協(xié)調(diào)時的對象位置計算變換矩陣，后者則直接使用原始軌跡，無需額外變換。

對于類似物品傳遞等需要保持在運(yùn)動學(xué)限制內(nèi)的協(xié)調(diào)任務(wù)，「重演」方案尤為有效。

順序子任務(wù)

在某些任務(wù)中，如「傾倒」任務(wù)，子任務(wù)的執(zhí)行順序至關(guān)重要。

例如，機(jī)器人首先需要用一只手將球倒入碗中，然后用另一只手將碗移到綠色墊子上。

相關(guān)熱詞： 機(jī)器人英偉達(dá) 類人機(jī)器人 dex 新智元 mg

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-22 14:50:39 瀏覽：111次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-22 14:50:39 瀏覽：111次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

機(jī)器人訓(xùn)練數(shù)據(jù)不缺了！英偉達(dá)團(tuán)隊推出DexMG：數(shù)據(jù)增強(qiáng)200倍
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-22 14:50:39 瀏覽：111次