清華大學(xué)研究成果:如何解決自動駕駛會車決策問題?

清華大學(xué)研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

雷鋒網(wǎng)新智駕按:4月24日,雷鋒網(wǎng)新智駕聯(lián)合MMC在2017年上海車展舉辦“構(gòu)建智能駕駛的關(guān)鍵”主題沙龍,本文來自清華大學(xué)自動化系統(tǒng)工程研究所教授姚丹亞的分享。本文講述了V2X技術(shù)在自動駕駛中的一個重要應(yīng)用場景,即自動駕駛汽車在路口會車時的通行決策問題。

清華大學(xué)研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

*清華大學(xué)自動化系統(tǒng)工程研究所教授姚丹亞在上海車展新智駕&MMC沙龍現(xiàn)場

有一篇來自清華大學(xué)的論文名叫《基于完全信息動態(tài)博弈的無燈控交叉口的車輛協(xié)同駕駛模型》(作者:楊卓,姚丹亞),它試著解決了一個可能很多人都想過但還沒有解決的問題,那就是使自動駕駛汽車在路口會車時相互協(xié)調(diào),最終彼此配合完成通行決策。

你可以將它看作V2X助力自動駕駛決策的應(yīng)用之一。對于V2X對自動駕駛的作用,人們談得更多的是V2X在環(huán)境感知中的作用,即除汽車自身的傳感器感知外,借助V2X完成更大范圍的環(huán)境感知。

但V2X還有一個重要作用,就是協(xié)同決策。目前我們能做到在自主感知的基礎(chǔ)上決策,但V2X環(huán)境使“群決策”成為可能,在可能在未來會是自動駕駛中的一個重要應(yīng)用。

如何基于V2X實現(xiàn)群決策?

以一個具體的場景為例,即無信號交叉路口的車車協(xié)同。兩輛車抵達路口,在沒有控制中心的情況下,聽誰的?它們之間是一個博弈的關(guān)系,要通過博弈,保證雙方安全又順利地通過交叉路口。

首先,做一個簡單的場景描述。

1、存在參與車輛,左邊駛來一輛車,下方駛來一輛車,已知彼此的速度、加速度和位置,以及達到路口會車點的距離。

2、路口為無信號交叉路口,即在沒有信號燈控制。

3、存在V2X環(huán)境,車車間可以進行交互。

以上是前提假設(shè)。接下來將問題拆分。

第一,判斷車輛間是否存在沖突。我們選擇一個指標(biāo)來描述這個沖突,這個指標(biāo)就叫作“沖突時間差”,即兩輛車到達沖突點的時間差值。該差值越小,就越有可能相撞,如為零則相撞,如差值很大,則代表在完全不同的時刻通過交叉點,定不會相撞。

第二,如果存在沖突,如何提前避免。在這個部分要考慮的因素很多,為了保證安全,當(dāng)兩輛車存在沖突時,需要用一個算法保證它們最后不相撞。因此,二者通過路口可以看成一個博弈問題。博弈包括三個要素。

要素一:對象,要存在博弈雙方,此處的對象是車輛。

要素二:策略,忽略具體的油門、剎車等不同操作,用一個“加速度”來作為各種操作的表現(xiàn)形式,加速度構(gòu)成了策略。

要素三:收益,需要定義博弈的收益。我們在模型里定義了三種收益,即安全、快速、舒適。安全是首要需求,即不能撞車;快速指的是使車輛盡快通過路口;舒適指符合人的駕駛習(xí)慣,不能過度加速和減速,保證駕駛舒適。

以上就是一些決策的基本場景假設(shè)。

基于此,兩輛車的路口博弈在數(shù)學(xué)上可以看作一個有約束的多目標(biāo)規(guī)劃問題。即,將不同加速度組合的情況下,使獲得的收益“Ω”達到最大。其中涉及一些數(shù)學(xué)問題,如多重納什均衡、求最優(yōu)解等,我們在這個模型中是用遺傳算法求取最優(yōu)解。

下面就具體地來計算這個問題。

對于兩輛車,首先要判斷其是否進入沖突區(qū)。博弈系統(tǒng)的實例模型如下所示,紅點表示沖突點(碰撞的點),通過車輛到達沖突點的時間差判斷是否進入沖突區(qū)域。

清華大學(xué)研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

*出自該模型作者曾發(fā)表的論文

若兩輛車并未進入沖突區(qū),則不需要博弈,正常行駛即可。一旦進入沖突區(qū),博弈即開始,通過博弈使得收益最大。前面講到三個收益指標(biāo)(安全、快速、舒適),此時就要具體定義這三個指標(biāo)。

1、安全性指標(biāo)。安全性指標(biāo)指已到達沖突點的時間差,在這個模型中,該差值一定要大于某個給定的閾值,才能確保安全。這個公式比較簡單,基本是中學(xué)時候關(guān)于距離、速度、時間的簡單公式。

2、快速性指標(biāo)。指的是兩個周期內(nèi)速度的變化,是當(dāng)前時刻加速度值的直接反應(yīng)。

3、舒適性指標(biāo)。舒適性指標(biāo)其實可以直接用加速度的絕對值來表示,絕對值越大,舒適型越差,在這個模型中我們基本選擇0.25g加速度指標(biāo)來進行博弈。當(dāng)然,前提還是要安全,如果要發(fā)生碰撞了,那么舒適性指標(biāo)是可以犧牲的。此外,舒適性指標(biāo)也定義了一些不良加速度行為,如加速度增幅達到200%,或是該加速時變成反向加速度等。

對于以上三個收益值,需要做一個標(biāo)準(zhǔn)化的工作。三種數(shù)據(jù)的量綱不同,有的是時間,有的是加速度,如何求和呢?這其中就涉及到標(biāo)準(zhǔn)化問題。這里不具體解釋,基本的計算方法是將當(dāng)前值減去期望值除以標(biāo)準(zhǔn)差。最后,需要用到遺傳算法,盡可能得到全局最優(yōu)解。

仿真實驗

對于這套理論,我們還沒有用在實車控制中,只是進行了仿真實驗。這是個具體的仿真例子。兩輛車初始速度分別為60km/h和50km/h,距離沖突點的距離分別為250米和150米,設(shè)定約束條件:最大速度不能超過70km/h,最小速度是零(即停車),加速度值控制在±0.3g之間。用于求解的遺傳算法在此不贅述,它主要用于獲得最優(yōu)解的。下圖,是兩車路口會車的仿真實驗結(jié)合曲線圖。

清華大學(xué)研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

*出自該模型作者曾發(fā)表的論文

從上圖可以看出,這次仿真實驗得到了蠻有意思的結(jié)果。在這個場景下,兩輛車出現(xiàn)了兩次博弈的過程。第一次,計算得出到?jīng)_突點的時間差小于給定閾值,進行了一輪博弈后,沖突危險解除,判斷安全后又開始自由駕駛;自由駕駛一段時間以后又進入了一次博弈過程,最后直到車輛安全通過路口。

上面的圖給出了許多博弈曲線。第一排曲線是收益曲線,紅色、藍(lán)色代表兩輛車分別的收益,綠色表示兩輛車的總收益。第二排是加速度曲線,拿加速度曲線來說,博弈的效果不是特別好,因為跳動很大,博弈算法還有些需要完善的地方。第三排是速度曲線。

最后一排的碰撞時間差(TDTC)。我們?yōu)門DTC設(shè)置一個閾值,當(dāng)TDTC小于閾值的時候,就會告知存在碰撞風(fēng)險,開始博弈。而這個過程是變化的,一旦TDTC超出閾值,就證明沒有風(fēng)險,雙方就可以自由駕駛。最后車輛安全駛離交通路口,這是一個完整的博弈過程。

在一些具體參數(shù)上,主要考慮三點。

第一,收益。如圖,對于第一輛車而言,它得到的是負(fù)收益,第二輛車是正收益,我們的博弈規(guī)則,是將二者相加,盡量使得整體收益最大。

第二,高速度占比和不良加速度。

第三,收益函數(shù)的系數(shù)。這是一個很重要的參數(shù),這個系數(shù)會直接影響最后博弈的效果。具體的確定的方法,我認(rèn)為是值得研究的。比如,α大是更強調(diào)安全,β大是強調(diào)快速性,γ大是強調(diào)舒適性,看你如何選擇評估方式。

總結(jié)

該模型的研究,考慮到了駕駛安全、舒適等指標(biāo)之間的博弈和決策,避免碰撞是最重要的部分,同時也要盡可能避免那些降低舒適性的操作。未來,通過豐富策略集,可以在模型的基礎(chǔ)上,有更多方向、更多方式的相關(guān)研究。

同時,群決策算法是一個亮點。剛才只是兩輛車的模型,我們的博士生還在研究路口多車博弈的通用模型。

當(dāng)然,我們現(xiàn)在的實驗還在仿真基礎(chǔ)上,不過也在做一些實用的產(chǎn)品。我們課題組和一個叫作星云互聯(lián)的公司合作,開發(fā)了一些V2X的產(chǎn)品,如智能車載終端、路側(cè)通信機、路側(cè)主機等,其中內(nèi)置了多種通信模塊,支持多種通信方式接入,完成車車、車路之間的數(shù)據(jù)交互。目前我們的產(chǎn)品,主要應(yīng)用在各種自動駕駛和智能駕駛測試場,同時,還推出了了一些實際應(yīng)用。例如我們在校園公交系統(tǒng)中裝入了路側(cè)系統(tǒng)、校園公交車上安裝了車載裝置,用以測試和積累數(shù)據(jù)。此外,我們還在蕪湖交警支隊的支持下,在中心城區(qū)路口建設(shè)了V2X基礎(chǔ)設(shè)施。之后,我們還和很多的企業(yè)和測試場開展更多的合作,在實際的項目中進行測試。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-04-28
清華大學(xué)研究成果:如何解決自動駕駛會車決策問題?
雷鋒網(wǎng)新智駕聯(lián)合MMC在2017年上海車展舉辦“構(gòu)建智能駕駛的關(guān)鍵”主題沙龍,本文來自清華大學(xué)自動化系統(tǒng)工程研究所教授姚丹亞的分享。本文講述了V2X技術(shù)在自動駕

長按掃碼 閱讀全文