撒浩杰,齊志媛,周雅雯,高宏偉
(沈陽理工大學(xué) 自動化與電氣工程學(xué)院,遼寧沈陽,110159)
近年來道路中經(jīng)常會出現(xiàn)由于車流量過大而產(chǎn)生交通堵塞的問題。一旦出現(xiàn)緊急突發(fā)情況時需要車輛人員的出動去解決事件,如果這時道路上出現(xiàn)交通堵塞現(xiàn)象,車輛可能無法準時到達現(xiàn)場。這就錯使緊急情況無法在第一時間得到解決,進而導(dǎo)致無法估量的損失。
Normark Daniel 提到[1]:在上世紀60 年代,國外為了解決不斷惡化的交通狀況,開始研究并提出了智能交通系統(tǒng)(ITS)該系統(tǒng),該系統(tǒng)將先進信息技術(shù)、通訊技術(shù)、計算機技術(shù)、傳感技術(shù)、控制技術(shù)等多個技術(shù)融合在一起組成整個交通運輸管理系統(tǒng)。而這項項目被許多發(fā)達國家爭先恐后地進行投資并研究。但由于其具高昂的傳感設(shè)備成本導(dǎo)致無法批量生產(chǎn)并部署與交通道路中,導(dǎo)致信息采集點少,無法動態(tài)地、全局地巡查路況。
近年來,隨著我國國民經(jīng)濟的發(fā)展,車輛的數(shù)量在日益增加,為了能及時了解路況,我們利用安裝大規(guī)模的攝像頭來形成道路監(jiān)控系統(tǒng),但由于攝像頭的監(jiān)控范圍受限,導(dǎo)致無法判斷視野盲區(qū)中的路況。
為了解決以上兩個問題,設(shè)計了一款四軸巡檢無人機的基于道路監(jiān)控系統(tǒng),相比于傳統(tǒng)的道路監(jiān)控系統(tǒng)它更具有靈活性,能精確選擇視野范圍,用于實時觀察路況,識別道路中的車輛和行人,在出現(xiàn)緊急突發(fā)情況時能判斷路況的好壞,尋找最佳道路,減少車輛在道路中的行駛時間,使突發(fā)事件達到最佳解決效果。
隨著無人機技術(shù)[2]的迅速發(fā)展,在姿態(tài)控制和穩(wěn)定性兩方面有了較好的效果,目前無人機姿態(tài)控制主要是收集陀螺儀數(shù)據(jù)和氣壓計數(shù)據(jù),通過PID 算法對無人機實現(xiàn)了定高定點的穩(wěn)定控制,在控制中,要保證陀螺儀和氣壓計數(shù)據(jù)的穩(wěn)定性及反饋的及時性,這樣可以確保無人機控制效果的穩(wěn)定并做出快速反應(yīng)。目前陀螺儀的數(shù)據(jù)解算主要包括DMP、四元數(shù)[3]和卡爾曼解算[4]。DMP 數(shù)據(jù)雖然穩(wěn)定準確但耗費時間長;卡爾曼解算雖用時短,但每次只能解算一個軸的數(shù)據(jù);四元數(shù)解算雖然比卡爾曼解算用時稍多,但是一次可以解算出三軸的數(shù)據(jù)。在無人機飛行檢測中,由于使用的是微處理器,我們需要將線下訓(xùn)練的模型文件加載到微處理器中,實現(xiàn)線上檢測。知識蒸餾的概念中,通過引入與教師網(wǎng)絡(luò)有關(guān)的軟目標作為Total loss 的一部分,以引導(dǎo)學(xué)生網(wǎng)絡(luò)進行訓(xùn)練,實現(xiàn)知識遷移。
本文主要是通過四元數(shù)解算陀螺儀數(shù)據(jù)并反饋給微處理器后,通過PID 算法對無人機進行姿態(tài)控制,我們利用知識蒸餾模式將航空訓(xùn)練集的大量數(shù)據(jù)進行訓(xùn)練,減輕了訓(xùn)練的負擔,并簡易地完成了訓(xùn)練目標,從而實現(xiàn)無人機能夠在道路中穩(wěn)定飛行并且實現(xiàn)監(jiān)控功能。
本系統(tǒng)包含動力系統(tǒng),ARM,信息采集系統(tǒng),電源管理這四部分,其中信息采集系統(tǒng)包含攝像頭模塊,GPS 模塊,MPU6050,NRF2401 主要是對信息進行采集。在系統(tǒng)中,電源管理模塊主要承擔動力執(zhí)行單元、智能控制單元的和信息采集系統(tǒng)的供電,使其能正常工作智能控制單元和信息采集單元系統(tǒng)是相互的,ARM 既控制信息采集系統(tǒng),又能收集它的信息。將收集的信息在ARM 中進行處理,將GPS,MPU 數(shù)據(jù)作為控制無人機姿態(tài)控制PID 的輸入?yún)?shù),進而通過ARM 去控制動力執(zhí)行單元。使其無人機能正常飛行和定點懸停。通過信息采集單元的攝像頭頭數(shù)據(jù)在ARM進行處理并識別。系統(tǒng)框圖如圖1 所示。
圖1 系統(tǒng)框圖
PID[5,6]作為現(xiàn)在最主流的閉環(huán)控制算法,它的的原理簡單,實現(xiàn)方便,適應(yīng)性比較好能快速,準確的使系統(tǒng)達到穩(wěn)定狀態(tài)。PID 控制系統(tǒng)框圖如圖2 所示。
圖2 PID 控制系統(tǒng)框圖
四旋翼無人機[7]應(yīng)用場景日益廣泛。常用于航拍、攝像,農(nóng)業(yè)灌溉等場景。但是由于在飛行過程中受到風等一些不可控因素的影響,使得無人機穩(wěn)定性變差。而PID 可以去解決這個問題。目前PID 主要有兩大種類,增量式PID 和位置式PID。在四軸無人機中我們需要三個串級PID,去保證姿態(tài)的穩(wěn)定。在串級PID 的外環(huán)的真實值分別IMU 解算三軸PITCH、ROLL、YAW 的角度。用位置式PID 去調(diào)節(jié)。而內(nèi)環(huán)的真實值分別為IMU 三軸的角速度,用增量式去調(diào)節(jié)。
即PID 控制器,連續(xù)的控制方程如式(1)所示:
err(t)為偏差量。
由于ARM 處理是數(shù)字量,所以將控制方程離散化如式(2)所示:
在外環(huán)中u(k)的輸出量為外環(huán)的設(shè)定值。外外環(huán)中u(k)的輸出量為為四個電機PWM 值。圖3 為四軸姿態(tài)控制串級PID 控制系統(tǒng)框圖。
圖3 四軸姿態(tài)控制串級PID 控制系統(tǒng)框圖
最小系統(tǒng)版包含SSD203D 芯片,復(fù)位電路,振蕩電路,SWD 下載這四部分,其 中SSD203D 芯 片,具 有Cortex—A7[8,9]內(nèi)核,其特性和功能如表1 所示。其使用SWD 的下載方式,它的下載速度不僅和JTAG 下載方式一樣,并且調(diào)試的過程中需要的線序很少。其中復(fù)位電路的原理是當微處理器(MCU)中RST 引腳收到一個電平信號并且時間大于2μs,即為微處理器(MCU)的復(fù)位,當復(fù)位鍵被按下時,這時候電容會處于短路中,同時釋放出所有的電能。振蕩電路主要提供一個8MHz 的晶振。電路的輸入電壓為24V。最小系統(tǒng)的原理圖如圖4 所示。
表1 SSD203D的電氣特性表
表2 參數(shù)對比表
圖4 最小系統(tǒng)原理圖
在現(xiàn)有的電路中包含線性穩(wěn)壓,電荷泵,開關(guān)電源[10],其中線性穩(wěn)壓電路具有變換效率較低,尤其是在輸入輸出電壓差較大的情況下。當輸出電流較大時,有明顯的發(fā)熱現(xiàn)象,甚至可能燒壞穩(wěn)壓器。該電源具有輸出紋波電壓高、噪聲大、電壓調(diào)整率差的特點,特別是給模擬電路供電時。電荷泵電路很難大功率。電容是串聯(lián)放電,紋波大的弊端。
本電路采用開關(guān)電源DC-DC buck 電路,采用TPS5430DDAR[11]芯片將外接電源24V 將到5V。該芯片具有高電流輸出,最大4A,5.5~36V 高速電壓輸入,高效轉(zhuǎn)換,最大可降至95%,輸出功率1.221V,具有過流保護和熱關(guān)斷的特點。在電路中輸出如式(3)所示。
即電路中R1=R9,R2=R10。之后將輸出的5V 通過AMS1117 穩(wěn)壓芯片將電路到3.3V。該芯片為低漏失電壓調(diào)節(jié)器,穩(wěn)壓調(diào)節(jié)管由一個管構(gòu)成,漏損電壓的定義如式(4)。
提供電流限制和熱保護,以防環(huán)境溫度造成過高的結(jié)晶。電路C10 和C8 為輸出濾波電容器,作用為抑制自激振蕩。如果這兩個電容斷開,線性調(diào)節(jié)器的輸出通常是振蕩波形。C7 和C9 是輸入電容。對于交流電壓整流輸入,它們的首要作用是將單向脈動電壓轉(zhuǎn)換成DC 電壓。在這個圖中,輸入已經(jīng)是5V 的DC電源,它們的作用是防止斷電后電壓反轉(zhuǎn),所以輸入電容的容量往往大于輸出電容的容量。原理圖如圖5所示。
圖5 降壓電路圖
GPS 采用ATGM336H 模塊,此模塊支持北斗/GPS/GLONASS 衛(wèi)星系統(tǒng),并可以3.3V 和5V 供電。板載可充電電子,可加速熱啟動搜星過程。其默認波特率為9600,可自行設(shè)置。具有高靈敏度、低功耗、低成本的特點。其電路圖如圖6 所示。
圖6 GPS 電路圖
MPU6050 是一個六軸傳感器,采用I2C 獲取原始數(shù)據(jù)加速度和角速度。自帶1024 字節(jié)的FIFO,有助于降低系統(tǒng)功耗。I2C 通信高達400kHz。去除加速度與陀螺儀軸之間的敏感性,減少設(shè)置和傳感器漂移的影響。工作電流為5mA,待機電流為5μA,加速度工作電流為500μA。其電路圖如圖7 所示。
圖7 MPU6050 電路圖
攝像頭模塊(ov7670)是一款圖像傳感器,具有體積小,自帶感紅外鏡頭,色彩鮮艷,可自動對焦,高靈敏度、工作電壓低,ov7670 是基于SCCB 總線控制,SCCB 總線的控制方法和I2C 總線基本相似,因此控制起來也比較簡單,可以輸入整幀、子采樣、取窗口等方式的各種分辨率8 位影像數(shù)據(jù)。其電路圖如圖8 所示。
圖8 攝像頭模塊電路圖
NRF24L01 是由NORDIC 生產(chǎn)工作,其采用SPI 通信,可以很方便的連接到MCU 上面。2.4G 全球開放的ISM 頻段,免許可證使用。最高工作速率2Mbps,高校的GFSK 調(diào)制,抗干擾能力強。126 個可選的頻道,滿足多點通信和調(diào)頻通信的需要。內(nèi)置CRC 檢錯和點對多點的通信地址控制??稍O(shè)置自動應(yīng)答,確保數(shù)據(jù)可靠傳輸。其電路圖如圖9 所示。
圖9 NRF2401 電路圖
知識蒸餾[12](Knowledge Distillation)是一種壓縮模型常用方法之一,不同于模型壓縮中的剪枝[13]和權(quán)值量化,知識蒸餾是通過構(gòu)建一個輕易化小模型,利用性能較好的大模型的監(jiān)督信息來訓(xùn)練小模型,以達到更好地性能和效果。
知識蒸餾可分為離線蒸餾、半監(jiān)督蒸餾、自監(jiān)督蒸餾。本次設(shè)計我們利用離線蒸餾的方法進行模型的訓(xùn)練即傳統(tǒng)的知識蒸餾。知識蒸餾,采用Teacher-Student 模型。如圖10 所示為離線蒸餾的網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖10 離線蒸餾的網(wǎng)絡(luò)結(jié)構(gòu)圖
RetinaNet[14]模型:RetinaNet 以ResNet[15]為特征提取網(wǎng)絡(luò),通過FPN 進行特征融合并輸出不同尺度的特征圖進行分類和邊界框回歸。RetinaNet 模型如圖11 所示。
圖11 RetinaNet 模型結(jié)構(gòu)圖
3.2.1 特征提取網(wǎng)絡(luò)
RetinaNet 一般以FPN[16]作為特征提取網(wǎng)絡(luò),F(xiàn)PN 不僅加深了網(wǎng)絡(luò)的結(jié)構(gòu),而且引入殘差結(jié)構(gòu)解決了梯度消失等問題。普通卷積層與殘差卷積層的對比如圖12 所示。
圖12 普通卷積層與殘差卷積層
即把F(X)改為F(X)+X,由公式(5)可知,在進行反向傳播時,殘差結(jié)構(gòu)可解決梯度消失問題。
3.2.2 特征融合網(wǎng)絡(luò)
RetinaNet 以FPN 作為特征融合網(wǎng)絡(luò),F(xiàn)PN 的網(wǎng)絡(luò)本質(zhì)上也是一個全卷積網(wǎng)絡(luò)結(jié)構(gòu)[17],F(xiàn)PN 構(gòu)造特征包括自下而上,自上而下以及橫向連接三個過程,自下而上即卷積網(wǎng)絡(luò)向前傳播的過程,自上而下的過程實質(zhì)上是通過把上層的特征進行尺度變換。來構(gòu)造新的特征圖。在尺度相同的前提下進行同層連接融合特征。
如圖13 所示為特征金字塔[18]的橫向連接結(jié)構(gòu)圖。
圖13 特征金字塔橫向連接結(jié)構(gòu)圖
3.2.3 損失函數(shù)
(1)分類損失
RetinaNet 以Focal Loss[19]作為分類損失,F(xiàn)ocal Loss是用來代替無法抗衡該問題的交叉熵損失。如下式(6)所示。
如下式(7)所示。
其中tα為權(quán)重系數(shù),γ為調(diào)制系數(shù) 。
(2)回歸損失
RetinaNet 以 SmoothL1 作為回歸損失,如下式(8)所示,其對離群點,異常值不敏感 ,梯度變化相對較小。
其中X是預(yù)測框與真實框之間逐元系的差距。
知識蒸餾作為輕化網(wǎng)絡(luò)常用方法,最早被用于分類任務(wù)中,但在目標檢測任務(wù)中,已含兩個階段:分類和回歸。因此在對RetinaNet 檢測器做知識蒸餾也應(yīng)包含兩個階段,即先進行分類蒸餾,再進行回歸蒸餾。
在分類過程中,我們主要是將卷積的深度,即通過channel 維度的調(diào)整進行網(wǎng)絡(luò)的調(diào)整。具體為將channel維度進行類別數(shù)的倍數(shù)的減少(向下取卷),從而實現(xiàn)參數(shù)量的減少,以便搭載微處理器(MCU)。
3.3.1 高溫蒸餾過程
目標函數(shù)由distill loss(soft target) 和student loss(hard target)加權(quán)得到。
而其中用Net-T 產(chǎn)生的softmax distribution 作為soft target。Net-S 在 相 同 溫 度 下 的soft target 的cross entropy 為Loss 函數(shù)的第一部分Lsoft。
Net-S 在溫度T=1 下的softmax 輸出和groud truth的cross entropy 為Loss 函數(shù)的第二部分Lhard,其作用為防止Net-T 出現(xiàn)錯誤,而使用ground truth 可以有效地較小對Net-s 傳播的錯誤率。
溫度系數(shù)T:溫度的高低改變的是Net-S 訓(xùn)練過程中對負標簽的關(guān)注程度。溫度系數(shù)T 的產(chǎn)生可以高效的進行知識遷移:使用softmax 層輸出的概率作為軟目標。原始的softmax 函數(shù)如下式(9)所示。
而知識蒸餾在原始基礎(chǔ)上添加了溫度參數(shù)T。
加入溫度參數(shù)后的softmax 函數(shù)如下式(10)所示。
溫度T 越大,軟化概率分布越平緩,教師網(wǎng)絡(luò)的預(yù)測貢獻越大,最終所用的學(xué)生網(wǎng)絡(luò)結(jié)果就更加準確。
在高溫蒸餾過程中目標函數(shù)如下式(11)(12)(13)所示。
3.3.2 回歸過程
對于每個地面真值盒,我們計算它和所有錨點之間的IOU,形成一個W×H×K IOU 映射m。這里W 和H 表示特征映射的寬度和高度, K表示K 預(yù)設(shè)錨定框。
然后我們找到最大的IOU 值M=max(m),乘以閾值因子ψ,得到一個濾波器閾值F=ψ*M。
對于F,我們過濾IOU 圖,保留那些大于F 的位置,并將它們與OR 運算結(jié)合,得到一個W×H 掩模。
循環(huán)遍歷所有地面的真實框,并結(jié)合掩模,我們得到最終的模仿掩模I。
模仿Loss 如下式(14)(15)(16)所示。
Loss 如下式(17)所示。
具體過程如圖14 所示。
圖14 回歸具體過程框圖
本次實驗結(jié)果的主要指標為map,將本文的知識蒸餾算法用在航天訓(xùn)練集上進行實驗,得到的實驗map 結(jié)果圖如圖15 所示。
圖15 map 結(jié)果圖
同時與原始網(wǎng)絡(luò)進行對比,可以看出本文提出的通過在原始網(wǎng)絡(luò)中減少參數(shù)使蒸餾成的學(xué)生網(wǎng)絡(luò)與原始網(wǎng)絡(luò)進行對比檢測精度在數(shù)據(jù)集上高出了3.86%,性能顯著提高。上層圖為教師模型,下層圖為學(xué)生模型;實驗結(jié)果對比圖如圖16 所示。
圖16 實驗結(jié)果對比圖
本文針對現(xiàn)在道路的突發(fā)擁擠情況,設(shè)計一種基于道路監(jiān)控的四軸巡檢無人機系統(tǒng),能實現(xiàn)巡查緊急情況,實時分析路況,尋找最佳道路的系統(tǒng)。通過信息采集單元,對傳感器的數(shù)據(jù)進行采集,并通過動執(zhí)行單元對無人機進行控制。在線下進行模型訓(xùn)練,并通過知識蒸餾的方法對模型進行壓縮到核心版上。可以使線上的實時監(jiān)控識別,區(qū)分路面的行人和車輛。實驗表明,該系統(tǒng)實現(xiàn)既定的功能??梢杂行崿F(xiàn)監(jiān)控道路的功能。