国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對抗深度強化學習為自動駕駛汽車保駕護航

2018-06-11 09:32AidinFerdowsiUrsulaChallitaWalidSaadNarayanMandayam
機器人產業(yè) 2018年3期
關鍵詞:魯棒性攻擊者偏差

□文/ Aidin Ferdowsi、 Ursula Challita、Walid Saad、Narayan B. Mandayam

對于自動駕駛汽車(AV)而言,要想在未來的智能交通系統(tǒng)中以真正自主的方式運行,它必須能夠處理通過大量傳感器和通信鏈路所收集的數(shù)據(jù)。這對于減少車輛碰撞的可能性和改善道路上的車流量至關重要。然而,這種對通信和數(shù)據(jù)處理的依賴性使得AV很容易受到網(wǎng)絡物理攻擊。最近,美國弗吉尼亞理工大學電氣與計算機工程系的Aidin Ferdowsi和Walid Saad教授、瑞典愛立信研究院的Ursula Challita教授,以及美國羅格斯大學的Narayan B. Mandayam教授,針對自動駕駛汽車系統(tǒng)中的“安全性”問題,提出了一種新型對抗深度強化學習(RL)框架,以解決自動駕駛汽車的安全性問題。

可以這樣說,為了能夠在未來的智能城市中有效地運行,自動駕駛汽車(AV)必須依靠車內傳感器,如攝像頭和雷達,以及車輛間的通信。這種對于傳感器和通信鏈路的依賴使得AV暴露于攻擊者的網(wǎng)絡物理(CP)攻擊之下,他們試圖通過操縱它們的數(shù)據(jù)來控制AV。因此,為了確保安全和最佳的AV動力學控制,AV中的數(shù)據(jù)處理功能必須針對這種CP攻擊具有強大的魯棒性。為此,本文分析了在存在CP攻擊情況下監(jiān)視AV動力學的狀態(tài)估計過程,并提出了一種新的對抗深度強化學習(RL)算法,以最大化AV動力學控制針對CP攻擊的魯棒性。我們在博弈論框架中對攻擊者的行為和AV對CP攻擊的反應進行了研究。在制定的游戲中,攻擊者試圖向AV傳感器讀數(shù)中注入錯誤數(shù)據(jù),以操縱車輛間的最佳安全間距,并潛在地增加AV事故的風險或減少道路上的車流量。與此同時,AV作為一名防守者,試圖將間距的偏差最小化,以確保具有針對攻擊者行為的魯棒性。由于AV沒有關于攻擊者行為的信息,并且由于數(shù)據(jù)值操作的無限可能性,因此玩家以往交互的結果被輸入到長短期記憶網(wǎng)絡(LSTM)塊中。每個玩家的LSTM塊學習由其自身行為產生預期間距偏差,并將它們饋送給其RL算法。然后,攻擊者的RL算法選擇能夠最大化間距偏差的動作,而AV的RL算法試圖找到最小化這種偏差的最佳動作。模擬結果表明,我們所提出的對抗深度RL算法可以提高AV動力學控制的魯棒性,因為它可以最小化AV間的間距偏差。

圖1:文中所提出的對抗深度強化學習算法的體系結構

智能交通系統(tǒng)(ITS)將包括自動駕駛汽車(AV)、路邊智能傳感器(RSS)、車輛通信,甚至是無人機。為了在未來的ITS中能夠以真正自主的方式運行,AV必須能夠處理通過大量傳感器和通信鏈路所收集的大量ITS數(shù)據(jù)。這些數(shù)據(jù)的可靠性對于減少車輛碰撞的可能性和改善道路上的車流量至關重要。然而,這種對通信和數(shù)據(jù)處理的依賴性使得AV很容易受到網(wǎng)絡物理攻擊。特別是,攻擊者可能會在AV數(shù)據(jù)處理階段進行插入,通過注入錯誤數(shù)據(jù)來降低測量的可靠性,并最終導致事故或危及ITS中的交通流量。這樣的流量中斷還可以波及到其他相互依賴的關鍵基礎設施,例如為ITS提供服務的電網(wǎng)或蜂窩通信系統(tǒng)。

最近,科學家們已經(jīng)提出了一些解決車輛內部安全問題的安全性解決方案。P.Kleberger、T. Olovsson和E. Jonsson在他們所著的《聯(lián)網(wǎng)汽車車載網(wǎng)絡的安全問題》中,確定了車輛控制器的關鍵漏洞所在,并提出了許多入侵檢測算法用以保護該控制器。此外,在《對聯(lián)網(wǎng)汽車的實際無線攻擊和車輛內部的安全協(xié)議》中,作者指出,AVs當前安全協(xié)議中的遠程無線攻擊可能會中斷其控制器區(qū)域網(wǎng)絡。他們分析了AVs車輛內部網(wǎng)絡對局外無線攻擊的脆弱性。同時,《插入式車輛的安全性問題》的作者解決了插電式電動汽車的安全性挑戰(zhàn),同時考慮了它們對電力系統(tǒng)的影響。此外,在《關于嵌入式汽車網(wǎng)絡安全威脅和保護機制的調查》中介紹了嵌入式汽車網(wǎng)絡安全威脅和保護機制的調查。

此外,科學家們還研究了車輛通信安全挑戰(zhàn)和解決方案,分析了當前車輛通信體系架構的安全漏洞。另外,科學家們發(fā)現(xiàn),通過使用短期認證方案和合作車輛計算架構,可以減輕由信標加密引起的計算開銷。

圖2:在攻擊者只攻擊信標信息的情況下,AV和攻擊者的行為、regret以及我們提出的算法的偏差。

然而,在設計安全解決方案時,以往的一些研究成果中的體系構架和解決方案沒有兼顧AV 的網(wǎng)絡層與物理層之間的相互依賴性。此外,現(xiàn)有的研究沒有對攻擊者的行為和目標進行合理的建模。在這種情況下,攻擊者的行為和目標的這種網(wǎng)絡物理依賴性將有助于提供更好的安全解決方案。另外,在一些以往的研究成果中,現(xiàn)有技術沒有提供能夠增強AV動力學控制應對攻擊的魯棒性的解決方案。然而,設計一個最佳且安全的ITS需要對車輛間傳感器和車輛間通信的攻擊具有魯棒性。而且,現(xiàn)有的ITS安全性研究往往假設攻擊者的行為處于穩(wěn)定狀態(tài),然而在許多真實情況下,攻擊者可能會自適應地改變其策略以增強攻擊對ITS的影響。

因此,本文提出了一種新型對抗式深度強化學習(RL)框架,旨在提供具有魯棒性的AV控制。特別要強調的是,我們提出了一種車輛跟隨模型(car following model),在該模型中,我們將關注的重點放在緊跟在另一個AV后的一個AV的控制上。這樣的模型是恰當?shù)?,因為它會捕捉AV的動力學控制,同時記錄AV的傳感器讀數(shù)和信標。我們考慮通過車內傳感器(例如攝像頭、雷達、RSS、車內信標)收集領先AV的四個信息源。我們認為攻擊者可以向這些信息中心注入不良數(shù)據(jù),并試圖增加事故風險或減少車流量。相比之下,AV的目標是保持對攻擊者的數(shù)據(jù)注入攻擊(data injection attacks)具有魯棒性的同時,最大限度地控制其速度。為了分析AV和攻擊者之間的交互,我們提出了一個博弈問題,并分析了它的納什均衡(NE)。然而,我們注意到,由于存在連續(xù)的攻擊者和AV動作集以及連續(xù)的AV速度和間隔,使得在NE處獲得AV和攻擊者動作具有挑戰(zhàn)性。為了解決這一問題,我們提出了兩個基于長短期記憶網(wǎng)絡(long-short term memory)(LSTM)塊的深度神經(jīng)網(wǎng)絡(DNN),針對AV和攻擊者,提取過去AV動態(tài)的總結,并將這些總結反饋給每個玩家的RL算法。一方面,AV的RL算法試圖通過結合傳感器讀數(shù)來從領先的AV速度中學習最佳估計。另一方面,攻擊者的RL算法試圖欺騙AV,并偏離車輛間的最佳安全距離。模擬結果表明,所提出的深度RL算法收斂于混合策略的納什均衡點,可以顯著提高AV針對數(shù)據(jù)注入攻擊的魯棒性。結果還表明,AV可以利用所提出的深度RL算法來有效學習傳感器融合規(guī)則,最大限度地減小速度估計誤差,從而減小了與最優(yōu)安全間距的偏差。

圖3:在攻擊者攻擊所有傳感器的情況下,AV和攻擊者的行為、regret和偏差。

本文提出的新型深度RL方法,該方法能夠在傳感器讀數(shù)受到數(shù)據(jù)注入攻擊的情況下,實現(xiàn)對AV的具有魯棒性的動力學控制(robust dynamics control)。為了分析攻擊者攻擊AV數(shù)據(jù)的動機,同時了解AV對這類攻擊的反應,我們提出了攻擊者與AV之間的博弈問題。我們已經(jīng)表明,在納什均衡(the mixed strategies at Nash equilibrium)中推導出混合策略,從分析角度而言是具有挑戰(zhàn)性的。因此,我們使用我們提出的深度RL算法學習AV在每個時間步長中的最優(yōu)傳感器融合。在所提出的深度RL算法中,我們使用了LSTM塊,它可以提取AV和攻擊者動作及偏差值之間的時間特征與依懶性,并將其反饋給強化學習算法。模擬結果表明,利用所提出的深度RL算法,AV可以緩解數(shù)據(jù)注入攻擊對傳感器數(shù)據(jù)的影響,從而保持對這些攻擊的魯棒性。

猜你喜歡
魯棒性攻擊者偏差
基于貝葉斯博弈的防御資源調配模型研究
50種認知性偏差
武漢軌道交通重點車站識別及網(wǎng)絡魯棒性研究
如何走出文章立意偏差的誤區(qū)
加固轟炸機
正面迎接批判
正面迎接批判
真相
一種基于三維小波變換的魯棒視頻水印方案
電子節(jié)氣門非線性控制策略
天峻县| 保亭| 德兴市| 青神县| 增城市| 吴川市| 义马市| 赣榆县| 柞水县| 呼玛县| 成都市| 大港区| 福建省| 华阴市| 离岛区| 大田县| 龙州县| 永济市| 周至县| 黄陵县| 高阳县| 文水县| 桦甸市| 巴林右旗| 新密市| 宁都县| 金山区| 静乐县| 新民市| 腾冲县| 依安县| 牟定县| 平武县| 永泰县| 石屏县| 镇沅| 依安县| 开江县| 台东市| 武清区| 凌源市|