劉義晨,徐朝陽(yáng)
(中國(guó)船舶重工集團(tuán)公司第七二三研究所,江蘇 揚(yáng)州 225101)
由于多普勒雷達(dá)可以用于檢測(cè)運(yùn)動(dòng)目標(biāo)并抑制靜止目標(biāo)所產(chǎn)生的雜波,利用雷達(dá)的微多普勒進(jìn)行目標(biāo)分類和識(shí)別在公共安全及國(guó)防等領(lǐng)域內(nèi)應(yīng)用廣泛。對(duì)于特定的目標(biāo)識(shí)別問(wèn)題,可以從微動(dòng)引起的微多普勒信號(hào)中提取相應(yīng)的特征作為判定的依據(jù)。近年來(lái),隨著微多普勒研究的興起與發(fā)展,其在生物運(yùn)動(dòng)的探測(cè)與分類識(shí)別領(lǐng)域也得到了廣泛的研究。利用時(shí)頻分析工具,可以在聯(lián)合時(shí)頻域清楚地觀察到微多普勒的時(shí)變特性[1]。
在早期,基于微多普勒的目標(biāo)識(shí)別研究不依賴于時(shí)間信息,它僅利用具有不同特性的微多普勒頻偏作為識(shí)別依據(jù),這種方法具有明顯的缺陷且性能較差。然后,是利用譜圖人工提取微多普勒的時(shí)變特性,它是一種最為主流的方法。此外,經(jīng)驗(yàn)?zāi)B(tài)分解方法、主成分分析和線性判別分析等方法在目標(biāo)識(shí)別和特征提取上也有一些成功案例[2]。雖然上述方法在特定的問(wèn)題上獲得了較高的精度,但是它們的思想仍然停留在傳統(tǒng)的監(jiān)督式學(xué)習(xí)上,需要對(duì)原始微多普勒信號(hào)進(jìn)行預(yù)處理并設(shè)計(jì)分類算法所需要的有效特征,而且提取的特征受限于識(shí)別問(wèn)題本身難以擴(kuò)展至通用[3]。因此,可以考慮選取深度學(xué)習(xí)方法來(lái)克服這種限制。
由于深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)能夠直接在原始數(shù)據(jù)中學(xué)習(xí)和獲取有效特征并合理地確定分類邊界,DCNN在語(yǔ)音識(shí)別、圖像分類等問(wèn)題中獲得了很好的結(jié)果。根據(jù)目前的研究狀況,深度學(xué)習(xí)用于雷達(dá)目標(biāo)識(shí)別的應(yīng)用尚且不多[4]。因此,本文通過(guò)使用CNN來(lái)識(shí)別譜圖中的微多普勒,并用于人體目標(biāo)的探測(cè)與分類問(wèn)題,具體內(nèi)容如下:
(1) 通過(guò)多普勒雷達(dá)對(duì)人、狗、馬和車等地面目標(biāo)進(jìn)行觀測(cè),以譜圖作為CNN的信號(hào)輸入進(jìn)行模型的訓(xùn)練和分類。
(2) 通過(guò)多普勒雷達(dá)觀測(cè)到的7種不同人體活動(dòng),以譜圖作為CNN的信號(hào)輸入進(jìn)行模型的訓(xùn)練和分類。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支[5],近年來(lái)逐漸引起了人們的關(guān)注。深度學(xué)習(xí)通過(guò)堆疊了多層簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)不同層次的抽象特征提取,優(yōu)化特定的損失函數(shù)來(lái)尋找分類邊界。其中,深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)是一個(gè)最為成功的監(jiān)督式學(xué)習(xí)算法,它在圖像和語(yǔ)音識(shí)別等方面獲得了很好的識(shí)別結(jié)果[5]。受到人類大腦視覺(jué)皮層的啟發(fā),DCNN具有典型的多層次結(jié)構(gòu)。首先介紹它的基本組成:卷積神經(jīng)網(wǎng)絡(luò)(CNN),可以將它視作輸入層、隱含層和輸出層的簡(jiǎn)單組合。
首先考慮前向傳播的過(guò)程。在本文中,CNN的輸入層是不同目標(biāo)和運(yùn)動(dòng)的譜圖集合。隱含層主要由卷積層、非線性激活函數(shù)和池化層等構(gòu)成,通常也會(huì)進(jìn)行批量的歸一化處理。輸出層通常具有多層感知機(jī)(MLP)的形式,對(duì)于多分類任務(wù),需要將隱含層的全部輸出節(jié)點(diǎn)連接到輸出層的輸入節(jié)點(diǎn),這種操作也被稱作全連接。然后,加入Softmax函數(shù)得到每個(gè)類別的后驗(yàn)概率作為輸出結(jié)果。接下來(lái),將分別對(duì)隱含層和輸出層的組成進(jìn)行簡(jiǎn)要的介紹。在隱含層中,卷積和池化操作的示意如圖1所示。隱藏層中第1個(gè)組成成分是卷積層,它的實(shí)質(zhì)是1組可以并行工作的濾波器,通過(guò)滑動(dòng)窗口的方式對(duì)輸入數(shù)據(jù)進(jìn)行局部處理。通常情況下,卷積層尺寸的選取是固定的,且遠(yuǎn)小于輸入數(shù)據(jù)的尺寸。為了檢測(cè)特定的特征,一個(gè)卷積層中的卷積核個(gè)數(shù)通常為多個(gè)。第2個(gè)組成成分為非線性激活函數(shù),它通常連接在卷積層之后并對(duì)數(shù)據(jù)空間進(jìn)行非線性變換,可以使類之間的區(qū)分變得更加容易。最為常見(jiàn)的非線性激活函數(shù)有Sigmoid函數(shù)、tanh函數(shù)和ReLU函數(shù)等。第3個(gè)組成成分是池化層,它的實(shí)質(zhì)是對(duì)數(shù)據(jù)進(jìn)行下采樣操作來(lái)減小數(shù)據(jù)尺寸的濾波器。其中,以平均池化和最大值池化的使用最為常見(jiàn)。池化使用了特定位置的相鄰輸出的總體統(tǒng)計(jì)特征代替網(wǎng)絡(luò)在該位置的輸出,具有局部平移不變性,而不會(huì)明顯改變我們所關(guān)心的特征形式。圖2所示是一個(gè)簡(jiǎn)單的DCNN,它采用了2個(gè)卷積層、1個(gè)池化層和1個(gè)全連接層進(jìn)行神經(jīng)網(wǎng)絡(luò)的描述。
圖1 卷積和池化的示意圖
圖2 含2層卷積層的簡(jiǎn)單DCNN的示意圖
在監(jiān)督式學(xué)習(xí)的分類任務(wù)中,我們擁有輸入數(shù)據(jù)樣本所對(duì)應(yīng)的標(biāo)簽。最后考慮反向傳播的過(guò)程,它與輸出層所選定的代價(jià)函數(shù)有關(guān)。由于代價(jià)函數(shù)的構(gòu)建取決于Softmax函數(shù)所輸出的后驗(yàn)概率,它需要體現(xiàn)輸出結(jié)果與樣本標(biāo)簽的關(guān)聯(lián)程度。通常,代價(jià)函數(shù)是以交叉熵的形式進(jìn)行定義的,其收斂過(guò)程的求解可以視作是凸優(yōu)化問(wèn)題,可以采取梯度下降算法對(duì)權(quán)值進(jìn)行更新。在梯度下降算法中,最為經(jīng)典的是隨機(jī)梯度下降法(SGD),引入了動(dòng)量因子的隨機(jī)動(dòng)量梯度下降法(MSGD)和Adam方法可以明顯加快優(yōu)化過(guò)程,它們是比較常用的方法。此外,正則化的Dropout得到了廣泛應(yīng)用,它能有效加快模型的訓(xùn)練過(guò)程并防止過(guò)擬合現(xiàn)象。
更多的且更為詳細(xì)的知識(shí)可以在參考文獻(xiàn)[5]中得到了解,本文不進(jìn)行贅述。
對(duì)于特定的運(yùn)動(dòng)目標(biāo),若給定雷達(dá)的工作參數(shù),多普勒頻移的大小僅與方位角有關(guān)。因此,本文為了獲得更為明顯的觀測(cè)結(jié)果,雷達(dá)場(chǎng)景設(shè)定的觀測(cè)方向選取為雷達(dá)徑向且目標(biāo)朝向雷達(dá)運(yùn)動(dòng),雷達(dá)選取了工作波長(zhǎng)為0.4 cm的多普勒雷達(dá),如圖3所示。
圖3 多普勒雷達(dá)的示意圖和實(shí)物照片
在獲取了運(yùn)動(dòng)目標(biāo)的雷達(dá)回波后,將CNN用于以下任務(wù):
(1) 人體探測(cè)的分類任務(wù)
對(duì)于人體探測(cè)問(wèn)題選取了地面上的數(shù)種經(jīng)典目標(biāo):一個(gè)人,一只狗,一匹馬和一輛車,雷達(dá)場(chǎng)景設(shè)定于空曠的室外環(huán)境,如圖4所示。
圖4 人體探測(cè)分類任務(wù)中的運(yùn)動(dòng)目標(biāo)示意
(2) 人體活動(dòng)的分類任務(wù)
選取了7種人類活動(dòng),包括:跑步、正常行走、持槍行走、匍匐前進(jìn)、行走拳擊、原地拳擊、坐立,雷達(dá)場(chǎng)景設(shè)定于室內(nèi)環(huán)境,如圖5所示。
圖5 人體活動(dòng)分類任務(wù)中的運(yùn)動(dòng)目標(biāo)示意
(3) 人體探測(cè)的分類任務(wù)的實(shí)驗(yàn)與分析
在實(shí)驗(yàn)中,每種目標(biāo)都觀測(cè)了10次,設(shè)定短時(shí)傅里葉變換(STFT)選取256 ms的hamming窗,重疊時(shí)間16 ms,對(duì)回波進(jìn)行STFT后可以得到譜圖樣本。為了確保微動(dòng)周期性的獲取,每張譜圖的觀測(cè)時(shí)間至少為2 s,每種目標(biāo)都隨機(jī)選取了其中的4張譜圖。為了便于統(tǒng)一處理,將獲得的譜圖樣本的尺寸整形為100×100。這樣,我們可以獲取共計(jì)4×10×4=160張譜圖作為數(shù)據(jù)的樣本集,并將它們的80%作為訓(xùn)練集,20%作為驗(yàn)證集。各運(yùn)動(dòng)目標(biāo)的譜圖分別如圖6所示。
圖6 人體探測(cè)分類任務(wù)中的運(yùn)動(dòng)目標(biāo)譜圖
由于數(shù)據(jù)集比較小,通過(guò)構(gòu)建淺層的神經(jīng)網(wǎng)絡(luò)可以有效地避免過(guò)擬合并獲得良好的泛化效果。在實(shí)驗(yàn)中,簡(jiǎn)單采用了2個(gè)3×3的卷積層,其數(shù)目設(shè)定為8和16,步長(zhǎng)設(shè)定為1,2個(gè)2×2的最大池化層,其步長(zhǎng)設(shè)定為2,以及1個(gè)全連接層作為CNN的構(gòu)建,選取ReLU函數(shù)作為非線性激活函數(shù),最后用Softmax函數(shù)輸出特征向量作為判定依據(jù)并采取交叉熵構(gòu)建代價(jià)函數(shù)。具體的CNN模型示意如圖7所示。
圖7 人體探測(cè)分類任務(wù)中的CNN構(gòu)建示意
由于數(shù)據(jù)集及譜圖的尺寸較小,在Intel i5 2.27 GHz CPU和4 GB 內(nèi)存的環(huán)境下使用MatlabR2018b就可以進(jìn)行模型的訓(xùn)練。設(shè)定了epochs數(shù)目為100,而其他參數(shù)設(shè)定為默認(rèn)值。它所需的訓(xùn)練時(shí)間為127 s。各種目標(biāo)的分類準(zhǔn)確率分別如表1所示。
表1 人體探測(cè)分類任務(wù)的分類準(zhǔn)確率
(4) 人體活動(dòng)的分類任務(wù)的實(shí)驗(yàn)與分析
由于不同人體活動(dòng)的微多普勒較為獨(dú)特,為了確保微動(dòng)周期性的獲取,延長(zhǎng)雷達(dá)觀測(cè)時(shí)間的設(shè)定至3 s,保持其他參數(shù)設(shè)定不變。在實(shí)驗(yàn)中,一共對(duì)12位模特進(jìn)行了觀測(cè),且每位模特的每種活動(dòng)都測(cè)量了4次,每次測(cè)量都選取了3張譜圖作為樣本且每張譜圖的尺寸為150×150。這樣,我們可以獲取共計(jì)7×12×4×3=1 008張譜圖作為數(shù)據(jù)的樣本集,并將它們的75%作為訓(xùn)練集,25%作為驗(yàn)證集,各目標(biāo)的譜圖分別如圖8所示。
圖8 人體活動(dòng)分類任務(wù)中的譜圖,依次為
與(1)中CNN模型的構(gòu)建相比,(2)中的譜圖樣本尺寸和數(shù)據(jù)集要更大,在相同環(huán)境下的訓(xùn)練時(shí)間會(huì)相應(yīng)地增加。本文中,受限于硬件條件,仍在(1)中的環(huán)境下進(jìn)行模型的訓(xùn)練。經(jīng)過(guò)多次調(diào)試,(2)的CNN模型構(gòu)建在3層卷積層時(shí)的性能比較好。此時(shí),第一個(gè)卷積層含有20個(gè)特征圖,其尺寸大小為5×5,步長(zhǎng)為1。其他卷積層的尺寸和步長(zhǎng)設(shè)定都不變,特征圖數(shù)目設(shè)定分別為30和40。其中,第一個(gè)卷積層的可視化特征如圖9所示。
圖9 人體活動(dòng)分類任務(wù)中構(gòu)建DCCN的第一個(gè)卷積層提取特征的可視化結(jié)果
所有的池化層都采用了步長(zhǎng)設(shè)定為2×2的最大池化層,且步長(zhǎng)設(shè)定為1。具體的CNN模型示意如圖10所示。與圖7中CNN的構(gòu)建不同的是,它在全連接層fc_1的后面加入了Dropout層,概率參數(shù)設(shè)定為0.5。
由圖9可以發(fā)現(xiàn),卷積層的輸出特征比較抽象,它蘊(yùn)含著難以人工提取的特征。為了進(jìn)一步了解其他變量對(duì)性能的影響,通過(guò)對(duì)改變觀測(cè)時(shí)間或修改譜圖的Epochs數(shù)可以進(jìn)行相應(yīng)的驗(yàn)證。分別選取觀測(cè)時(shí)間為0.6 s、1.1 s、1.5 s、2.1 s、2.6和3.0 s,分別設(shè)定Epochs數(shù)為100、200、300和400,并單獨(dú)取出圖8(b),即人體行走時(shí)的譜圖進(jìn)行驗(yàn)證,分類性能的關(guān)系分別如圖11所示。
圖10 人體活動(dòng)分類任務(wù)中的CNN構(gòu)建示意
圖11 人體活動(dòng)分類任務(wù)的觀測(cè)時(shí)間、Epochs數(shù)和性能的關(guān)系
可以發(fā)現(xiàn),在更長(zhǎng)的觀測(cè)時(shí)間下,通??梢垣@得更好的分類性能。然而,在觀測(cè)時(shí)間設(shè)定為2.6 s時(shí),其性能要略優(yōu)于3.0 s時(shí)的結(jié)果。在Epochs數(shù)為100左右時(shí),觀測(cè)時(shí)間為2.6 s的結(jié)果要明顯高于其他情況,這種狀況一直保持到Epochs數(shù)為200左右。這種現(xiàn)象產(chǎn)生的原因可能是設(shè)定觀測(cè)時(shí)間為2.6 s時(shí),數(shù)據(jù)集的樣本數(shù)量較少而數(shù)據(jù)樣本間的差異性又較大所引起的。隨著訓(xùn)練過(guò)程的繼續(xù),這種樣本間差異性的影響將逐漸減小。當(dāng)Epochs數(shù)為300左右時(shí),各曲線開(kāi)始出現(xiàn)了收斂現(xiàn)象,而Epochs數(shù)到達(dá)400時(shí),各曲線已經(jīng)明顯收斂。此時(shí),設(shè)定觀測(cè)時(shí)間為3.0 s的性能將最好。
本實(shí)驗(yàn)中,設(shè)定mini-batch的大小為84,學(xué)習(xí)率為0.001,采用了動(dòng)量參數(shù)設(shè)定為0.9的隨機(jī)動(dòng)量梯度下降法進(jìn)行訓(xùn)練,設(shè)定epochs數(shù)目為400。最終所需的訓(xùn)練時(shí)間為1 680 s,具體的分類準(zhǔn)確率如表2所示。
表2 人體活動(dòng)分類任務(wù)的分類準(zhǔn)確率
本文基于能夠表現(xiàn)微多普勒特征的譜圖,將CNN用于實(shí)現(xiàn)人體探測(cè)和人類活動(dòng)分類任務(wù)。通過(guò)CNN的使用,可以進(jìn)一步地在譜圖的基礎(chǔ)上提取目標(biāo)的微多普勒特征。在人體探測(cè)任務(wù)中,在包含了狗、車和馬等地面目標(biāo)中可以獲得97.6%的準(zhǔn)確率。在包含了7種人類活動(dòng)的分類任務(wù)中,可以獲得90.0%的平均分類準(zhǔn)確率。雖然,將不同的譜圖作為CNN的數(shù)據(jù)樣本輸入,可以無(wú)需人工的依據(jù)微動(dòng)形式進(jìn)行特征提??;但是多層CNN的計(jì)算復(fù)雜度要高于常規(guī)機(jī)器學(xué)習(xí)算法的數(shù)據(jù)驅(qū)動(dòng)模型,在考慮任務(wù)實(shí)時(shí)性的情況下應(yīng)綜合使用。