理想發(fā)布下一代自動駕駛架構(gòu) 李想:通往L4 上最重要的一步

3月18日消息,今日,理想汽車發(fā)布下一代自動駕駛架構(gòu)MindVLA。

理想汽車 CEO 李想在微博表示,它將空間智能、語言智能和行為智能統(tǒng)一在一個模型里,讓自動駕駛擁有感知、思考和適應(yīng)環(huán)境的能力,是我們通往L4路上最重要的一步。

MindVLA能為自動駕駛賦予類似人類的駕駛能力,就像iPhone 4重新定義了手機,MindVLA也將重新定義自動駕駛。

理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬表示:“MindVLA是機器人大模型,它成功整合了空間智能、語言智能和行為智能,一旦跑通物理世界和數(shù)字世界結(jié)合的范式后,將有望賦能更多行業(yè)。MindVLA將把汽車從單純的運輸工具轉(zhuǎn)變?yōu)橘N心的專職司機,它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認(rèn)知和適應(yīng)能力,將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w?!?/p>

據(jù)了解,MindVLA不是簡單地將端到端模型和VLM模型結(jié)合在一起,所有模塊都是全新設(shè)計。3D空間編碼器通過語言模型,和邏輯推理結(jié)合在一起后,給出合理的駕駛決策,并輸出一組Action Token(動作詞元),Action Token指的是對周圍環(huán)境和自車駕駛行為的編碼,并通過Diffusion(擴散模型)進一步優(yōu)化出最佳的駕駛軌跡,整個推理過程都要發(fā)生在車端,并且要做到實時運行。

MindVLA將為用戶帶來全新的產(chǎn)品形態(tài)和產(chǎn)品體驗,有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機。

“聽得懂”是用戶可以通過語音指令改變車輛的路線和行為,例如用戶在陌生園區(qū)尋找超市,只需要通過理想同學(xué)對車輛說:“帶我去找超市”,車輛將在沒有導(dǎo)航信息的情況下,自主漫游找到目的地;車輛行駛過程中,用戶還可以跟理想同學(xué)說:“開太快了”“應(yīng)該走左邊這條路”等,MindVLA能夠理解并執(zhí)行這些指令。

“看得見”是指MindVLA具備強大的通識能力,不僅能夠認(rèn)識星巴克、肯德基等不同的商店招牌,當(dāng)用戶在陌生地點找不到車輛時,可以拍一張附近環(huán)境的照片發(fā)送給車輛,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動找到用戶。

“找得到”意味著車輛可以自主地在地庫、園區(qū)和公共道路上漫游,其中典型應(yīng)用場景是用戶在商場地庫找不到車位時,可以跟車輛說:“去找個車位停好”,車輛就會利用強大的空間推理能力自主尋找車位,即便遇到死胡同,車輛也會自如地倒車,重新尋找合適的車位停下,整個過程不依賴地圖或?qū)Ш叫畔?,完全依賴MindVLA的空間理解和邏輯推理能力。

總結(jié)來說,對于用戶而言,有MindVLA賦能的車不再只是一個駕駛工具,而是一個能與用戶溝通、理解用戶意圖的智能體。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-03-18
理想發(fā)布下一代自動駕駛架構(gòu) 李想:通往L4 上最重要的一步
今日,理想汽車發(fā)布下一代自動駕駛架構(gòu)MindVLA。理想汽車 CEO 李想在微博表示,它將空間智能、語言智能和行為智能統(tǒng)一在一個模型里,讓自動駕駛擁有感知、思考和適應(yīng)環(huán)境的能力,是我們通往L4路上最重要的一步。MindVLA能為自動駕駛賦予類似人類的駕駛能力,就像iPhone 4重新定義了手機,MindVLA也將重新定義自動駕駛??偨Y(jié)來說,對于用戶而言,有MindVLA賦能的車不再只是一個駕駛工具,而是一個能與用戶溝通、理解用戶意圖的智能體。

長按掃碼 閱讀全文