作為上海模塑申城語料普惠計劃中的一份子,智元機器人攜手上海人工智能實驗室、國家地方共建人形機器人創(chuàng)新中心以及上海庫帕思,今天重磅發(fā)布全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數據集開源項目AgiBot World。這一里程碑式的開源項目,標志著具身智能領域“ImageNet時刻”已到來。
這是智元機器人本年度開源的第三個項目,亦是對智元818發(fā)布會承諾的完美兌現(xiàn)。我們將按計劃在HuggingFace、Github以及agibot-world.com項目主頁上分批上傳數據,加速人類邁向通用人工智能的新時代。
項目開源地址
HuggingFace:
https://huggingface.co/agibot-world
Github:
https://github.com/OpenDriveLab/agibot-world
項目主頁:
https://agibot-world.com/
AgiBot World是全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數據集。相比 Google 開源的 Open X-Embodiment 數據集,AgiBot World 長程數據規(guī)模高出10倍,場景范圍覆蓋面擴大100倍,數據質量從實驗室級上升到工業(yè)級標準!在這個具身數據的世界里,機器人不再只是進行簡單的桌面任務,而是進入到人類日常生活的方方面面。
多樣任務 十八般武藝樣樣精通
AgiBot World數據集中涵蓋的場景具備多樣化和多元化特點,從抓取、放置、推、拉等基礎操作,到攪拌、折疊、熨燙等復雜動作,幾乎涵蓋了人類日常生活所需的絕大多數場景。比如,其中一個視頻展示的是機器人在電腦主機中內存條的過程,這需要機器人毫米級精細控制,稍有不慎就可能導致設備損壞,其如神經纖維般靈敏的末端觸覺傳感器,助力機器人實現(xiàn)了精準的對接;還有試圖教會機器人如何用洗碗機的視頻——在這條數據中,展現(xiàn)了廚房水池里勺筷碗盤層層堆疊,機器人將雜亂的餐具一一準確無誤地整理至洗碗機相應卡槽中,操作流程長且動作十分繁瑣。AgiBot World數據集中收錄了80多種日常生活中的多樣化技能視頻,讓機器人能夠“十八般武藝樣樣精通”。
全域場景 上得廳堂下得廚房
AgiBot World數據集誕生于智元自建的大規(guī)模數據采集工廠與應用實驗基地,空間總面積超過4000平方米,包含3000多種真實物品,一方面為機器人大規(guī)模數據訓練提供場地,另一方面真實復刻了家居、餐飲、工業(yè)、商超和辦公五大核心場景,全面覆蓋了機器人在生產、生活中的典型應用需求。
家居場景再現(xiàn)人類真實住宅布局,包括臥室、客廳、廚房、衛(wèi)生間等核心空間,可以實現(xiàn)機器人家務清潔、物品整理和廚房任務等。工業(yè)場景模擬分揀與物流自動化,復刻工業(yè)倉庫與生產線,包括分揀系統(tǒng)、打包設備、傳輸帶等,可以實現(xiàn)物料分揀、包裝打包、物流搬運等。通過多場景的高度還原與任務設計,AgiBot World為機器人研發(fā)和測試構建了實現(xiàn)具身智能的必要條件。
像這樣類似的真實場景AgiBot World百萬真機數據集中有100多種,家居占40%、餐飲20%、工業(yè)20%、商超10%以及辦公場景10%,其中80%的任務均為長程任務,任務時長集中在60s-150s之間,并且包含多個原子技能,長程數據是DROID和OpenX-Embodiment 的10倍以上,3000多種物品基本涵蓋了這五大場景,同時還在不斷豐富中。
場景和任務分布
各個場景物品分類
數據集時長分布
全能硬件 沒有金剛鉆難攬瓷器活
機器人能夠如此靈活智能、勝任多種任務和技能,也得益于智元對于機器人本體的迭代升級——我們?yōu)闄C器人安裝了8個環(huán)繞式布局的攝像頭,讓機器人可以實時360度全方位感知周圍環(huán)境的動態(tài)變化;配備6自由度靈巧手,保障動作精準且靈活,同時末端還增加了六維力傳感器和高精度觸覺傳感器,能夠感知力的微小變化,做到“拿捏有度”;機器人全身擁有32個主動自由度,能夠靈活應對多種復雜任務。
質量把控 嚴師出高徒
同時,數據集的質量,也是決定機器人能否快速學習的關鍵。AgiBot World中的數據,都需歷經一套嚴苛的流程與驗證鏈路。在項目之初,我們便邀請學界、工業(yè)界、消費者等多方介入提出建議,不斷迭代流程設計規(guī)劃;數據采集質量環(huán)節(jié),無論是采集員還是采集質量,均由完善的管理體系和專業(yè)的管理團隊全程保障;對于采集到的數據本身,將通過端、云兩側嚴格篩選,自動剔除不符合要求的數據,再由專業(yè)的審核員逐幀審核,確保每一個動作都符合任務標準;最后,這些數據還會通過算法進行二次驗證,全方位筑牢數據質量防線。
———————————————————————————————
高質量的數據集對于當下具身智能技術的發(fā)展尤為重要。現(xiàn)有開源數據集,或多或少都存在采集流程缺乏標準化、機器人構型過時、數據質量格式參差不齊等問題,在機器人策略學習的過程中甚至會帶來副作用。
谷歌OXE數據集,任務缺少真實生活場景,本體多樣,數據質量和格式參差不齊
智元在此刻開源全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數據集AgiBot World,是具身智能技術發(fā)展的重大突破和里程碑事件,更是推進具身智能通用人工智能(AGI)實現(xiàn)的重要加速器。我們通過匯聚頂尖資源與技術力量,將共同推動具身智能發(fā)展新范式,加速人類邁向通用人工智能的新時代,在全球范圍內奠定中國在這一前沿領域的領導地位。
未來,智元機器人將陸續(xù)開源千萬仿真數據,以支持更泛化和更通用的大模型訓練;將發(fā)布具身基座大模型,可支持模型微調,賦能千行百業(yè);發(fā)布全套工具鏈,實現(xiàn)采集、訓練和評測完美閉環(huán);為激發(fā)創(chuàng)新的無限潛能,我們還將舉辦一系列AgiBot World Challenge,歡迎科技愛好者加入我們!
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 捷途怎么就火了?
- 聚焦行業(yè)前沿,共享無限商機,2025九州汽車生態(tài)博覽會全面啟動!
- 倒計時7天--“2025第四屆東盟軌道交通國際峰會”最新情況公布|Only 7 Days Away--The 4th ASEAN Rail Summit 2025
- 再上新階 CDCE2024國際數據中心及云計算展圓滿閉幕 2025年11月上海再相聚
- 2025中國智能電動汽車科技與供應鏈展覽會 邀請函
- 2025戶外&鞋服箱包營銷創(chuàng)新論壇定檔3月上海舉辦
- 智能無界,勇敢生長!2024年中國物聯(lián)網產業(yè)大會暨第21屆慧聰品牌盛會盛大召開!
- 2024 商會會長大會圓滿收官:聚焦新質與數字融合發(fā)展
- 智元開源百萬真機數據集!具身智能領域的ImageNet時刻已到來!
- 2025ChinaJoy智能娛樂硬件展區(qū)招商全面啟動!
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。