新模擬平台「RoboCasa」將徹底改變AI智能訓練

在人工智慧(AI)技術迅速發展的過程中,資料集的規模和質量起著至關重要的作用。儘管自然語言處理(NLP)和電腦視覺算法的訓練數據集大量增加,但機器人控制和規劃算法的訓練數據依然稀缺。這主要是因為獲取此類數據相對複雜。為此,部分電腦科學家致力於創建更大的數據集和平台,用於訓練各種機器人應用的計算模型。

來自德克薩斯大學奧斯汀分校和NVIDIA研究的研究人員最近在預印本伺服器arXiv上發表了一篇論文,介紹了他們的新平台「RoboCasa」。這一平台將於2024年機器人科學與系統會議上進行展示。RoboCasa是一個大型模擬框架,用於訓練通用機器人完成各種日常任務。

「最近的AI進展主要源於在大量數據源上訓練大規模模型。」論文的主要作者Yuke Zhu說。「受到這些進展的啟發,我們希望開發出能夠執行各種日常任務的通用機器人基礎模型。RoboCasa旨在提供高質量的模擬數據,滿足此類機器人基礎模型的訓練需求。」

RoboCasa擴展自幾年前推出的模擬框架RoboSuite。研究團隊利用生成式AI工具創建了多樣化的物體資產、場景和任務,顯著提高了模擬世界的多樣性和真實性。RoboCasa支持各種機器人硬件平台,並提供包含超過10萬條軌跡的大型數據集,用於模型訓練。

RoboCasa平台包括數千個3D場景,包含超過150種不同類型的日常物品,以及數十種家具和電器。其高度真實的模擬由生成式AI工具進行豐富。Zhu及其同事設計了100個可供機器人算法訓練的任務,並為這些任務編寫了高質量的人類演示。該平台還包含生成有效軌跡和運動的方法,讓機器人完成這些任務。

將模擬數據與實際數據結合

RoboCasa 使用大型語言模型,如 GPT-4,來創建各種日常任務。圖片來源:Yuke Zhu
RoboCasa 使用大型語言模型,如 GPT-4,來創建各種日常任務。圖片來源:Yuke Zhu

Zhu表示:「兩個關鍵發現令我非常興奮。首先,我們展示了一個擴展趨勢:隨著(機器生成的)訓練數據集規模的增大,模型的性能穩步提升。其次,將模擬數據與實際數據結合,發現增強數據集提高了機器人在實際任務中的性能。」

RoboCasa利用大型語言模型(如GPT-4)創建多樣化的日常任務,展示了AI技術在提升機器人訓練數據質量和數量方面的巨大潛力。

這一新平台不僅能促進機器人技術的進一步發展,還能推動AI技術在更多領域的應用,從而為解決日常生活中的各種挑戰提供創新的解決方案。

更多科學與科技新聞都可以直接上 明日科學網 http://www.tomorrowsci.com

圖片來源:Yuke Zhu and Soroush Nasiriany cc By4.0

參考論文:
1.RoboCasa: Large-Scale Simulation of Everyday Tasks for Generalist RobotsarXiv

延伸閱讀:

1.AI在最新「能力測試」中展現突破進展,大幅超越人類