龔承君 蒲宇清
(武漢市交管局科技管理處 武漢 430000)
目標(biāo)識(shí)別[1]問題是數(shù)據(jù)融合中的基本問題之一,將系統(tǒng)中多個(gè)數(shù)據(jù)源提供的目標(biāo)身份信息綜合處理,產(chǎn)生比系統(tǒng)中單一信源更有效、更精確的身份估計(jì)和分類判決。物理模型法主要有卡爾曼濾波[2~3]、最大似然估計(jì)、最小二乘法[4];基于特征的推理技術(shù)主要有貝葉斯推理[5]、D-S證據(jù)理論[6];基于知識(shí)表示技術(shù)[7]的方法主要有專家系統(tǒng)、模糊集合論[8]和邏輯模板[9]。在實(shí)際檢測(cè)中,傳感器數(shù)量大且種類繁多,返回量測(cè)數(shù)據(jù)各式各樣,傳統(tǒng)目標(biāo)識(shí)別方法計(jì)算較復(fù)雜且魯棒性較低。本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)[10]的智能識(shí)別技術(shù),利用卷積神經(jīng)網(wǎng)絡(luò)直接從大量復(fù)雜傳感器數(shù)據(jù)中提取特征進(jìn)行推理的能力,構(gòu)造固定大小的目標(biāo)識(shí)別決策矩陣,輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行身份判別。
目標(biāo)信息綜合了運(yùn)動(dòng)特征信息和輻射源特征信息,其中運(yùn)動(dòng)特征信息包括目標(biāo)高度、速度、加速度、最大爬升率,輻射源特征信息包括目標(biāo)載頻、重復(fù)頻率、脈沖寬度、天線掃描周期,共8 種可識(shí)別屬性,將其記為ai(i=1,2,…,8)。目標(biāo)待識(shí)別種類有防爆運(yùn)兵車、機(jī)要指揮車、通信指揮車、裝備輸送車、布障車、運(yùn)犬車、攀登突擊車以及防爆水炮車共8 類,記為bj(j=1,2,..,8)。目標(biāo)待識(shí)別的種類和屬性按上述順序排列,依次計(jì)算各個(gè)特征信息與身份向量的歐氏距離dxi,yj,根據(jù)匹配度計(jì)算公式計(jì)算匹配度:得到目標(biāo)識(shí)別決策矩陣i=1,...,8,j=1,...,8。
根據(jù)2.1 節(jié)建立的目標(biāo)識(shí)別問題模型,算法綜合不同類別的傳感器上傳的運(yùn)動(dòng)特征信息和輻射源信息,計(jì)算每種數(shù)據(jù)與每個(gè)待識(shí)別目標(biāo)的匹配度,形成目標(biāo)識(shí)別決策矩陣輸入卷積神經(jīng)網(wǎng)絡(luò),由卷積神經(jīng)網(wǎng)絡(luò)判別后輸出身份識(shí)別結(jié)果。算法流程如圖1所示。
圖1 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別方法流程
算法將系統(tǒng)接收到的同一運(yùn)動(dòng)特征信息與目標(biāo)身份的匹配度以及輻射源特征信息與目標(biāo)身份的匹配度合并為一個(gè)目標(biāo)識(shí)別決策矩陣。通過各個(gè)卷積核對(duì)目標(biāo)識(shí)別決策矩陣進(jìn)行特征提取,使用池化層對(duì)提取的特征圖進(jìn)行壓縮,使用全連接層將卷積核學(xué)到的特征映射到樣本標(biāo)記空間,然后交給Softmax 分類器獲得分類輸出?;诰矸e神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別算法分為訓(xùn)練和推理兩部分:1)訓(xùn)練階段:設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò),調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),以建立模型復(fù)雜度與識(shí)別問題復(fù)雜度匹配的網(wǎng)絡(luò)模型,引入Dropout策略[11]防止網(wǎng)絡(luò)出現(xiàn)過擬合,保存模型;2)推理階段:將待識(shí)別的傳感器數(shù)據(jù)輸入保存的網(wǎng)絡(luò)模型,輸出身份識(shí)別判決結(jié)果。
1)標(biāo)準(zhǔn)化處理:數(shù)據(jù)的標(biāo)準(zhǔn)化處理是將數(shù)據(jù)按比例縮放,將其轉(zhuǎn)化為無量綱的純數(shù)值,使得不同量級(jí)或單位的數(shù)據(jù)具有可比性。本文采用最大最小值標(biāo)準(zhǔn)化對(duì)仿真生成的數(shù)據(jù)進(jìn)行預(yù)處理,使其分布在區(qū)間[0,1]之間,其公式如下:
xi為待歸一化數(shù)據(jù),yi為歸一化后的輸出。
2)One-hot 編碼:基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別算法將識(shí)別問題轉(zhuǎn)化為分類問題,標(biāo)簽的類別(8類車輛)為離散型字符變量,在計(jì)算損失函數(shù)即神經(jīng)網(wǎng)絡(luò)輸出和真實(shí)標(biāo)簽值的相似度時(shí),需要通過one-hot 編碼將標(biāo)簽轉(zhuǎn)化為數(shù)值型變量,將離散特征的取值擴(kuò)展到歐氏空間。
本文使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖所示,對(duì)于本文構(gòu)造的目標(biāo)識(shí)別決策矩陣,每一列數(shù)據(jù)代表某一類待識(shí)別目標(biāo)的運(yùn)動(dòng)征和輻射源特征,這些數(shù)據(jù)本身存在一定的關(guān)聯(lián)性,因此目標(biāo)識(shí)別決策矩陣的基本特征比較少,所以我們選取網(wǎng)絡(luò)層數(shù)相對(duì)較少的Alexnet[12],參數(shù)量更少,網(wǎng)絡(luò)訓(xùn)練速度更快。
圖2 本文使用的CNN網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)的輸入為8×8 大小的目標(biāo)身份決策矩陣。第一層卷積層采用2×2 卷積核進(jìn)行特征提取,輸出特征數(shù)為8 個(gè)。使用Relu 激活函數(shù)[13]對(duì)輸出值引入非線性,強(qiáng)化特征表示能力。每一層卷積層后對(duì)輸出的特征圖進(jìn)行周邊補(bǔ)0(padding模式),使特征圖始終保持8×8 大小。通過多層卷積層進(jìn)行特征提取,最后輸出特征圖[14]數(shù)量為64。在第4層和第8 層,我們嘗試使用不同的池化方式來減少網(wǎng)絡(luò)參數(shù),加快訓(xùn)練速度。最后將提取的特征圖交由全連接層映射至樣本的標(biāo)記空間,最后由Softmax分類器輸出分類結(jié)果。再調(diào)整網(wǎng)絡(luò)的參數(shù)包括卷積核參數(shù),根據(jù)網(wǎng)絡(luò)在測(cè)試集上的識(shí)別準(zhǔn)確率對(duì)以上參數(shù)進(jìn)行優(yōu)化。
數(shù)據(jù)集由劇情仿真生成。對(duì)于運(yùn)動(dòng)特征信息,待識(shí)別目標(biāo)對(duì)應(yīng)的目標(biāo)高度、速度、加速度、最大爬升率如表1所示。
對(duì)于輻射源特征信息,假設(shè)存在4 種型號(hào)的雷達(dá),分別為雷達(dá)1、雷達(dá)2、雷達(dá)3、雷達(dá)4,其對(duì)應(yīng)的目標(biāo)載頻、重復(fù)頻率、脈沖寬度和天線掃描周期范圍如表2所示。
假設(shè)防爆運(yùn)兵車、攀登突擊車和防爆水炮車裝備輻射源為雷達(dá)1,布障車裝備輻射源為雷達(dá)2,裝備輸送車和運(yùn)犬車裝備輻射源為雷達(dá)3,通信指揮車裝備輻射源為雷達(dá)4。輻射源探測(cè)系統(tǒng)對(duì)目標(biāo)載頻的量測(cè)精度隨目標(biāo)載頻大小變化,取目標(biāo)載頻的量測(cè)精度一般值為5MHz,即載頻量測(cè)誤差的值由均值為0,標(biāo)準(zhǔn)差為5的正態(tài)分布隨機(jī)產(chǎn)生;對(duì)于目標(biāo)重復(fù)頻率,其量測(cè)誤差的值由正態(tài)分布產(chǎn)生,其中均值為0,標(biāo)準(zhǔn)差計(jì)算公式如下:
其中,PRF 為目標(biāo)重復(fù)頻率的值,σPRF為目標(biāo)重復(fù)頻率誤差的標(biāo)準(zhǔn)差。
對(duì)于目標(biāo)脈沖寬度,其量測(cè)誤差值由正態(tài)分布產(chǎn)生,其中均值為0,標(biāo)準(zhǔn)差計(jì)算公式如下:
其中,PW 為目標(biāo)脈沖寬度的值,σPW為目標(biāo)脈沖寬度誤差的標(biāo)準(zhǔn)差。
假設(shè)其誤差分布滿足區(qū)間[-0.1T,0.1T]上的均勻分布,其中T 為天線掃描周期的真實(shí)值。仿真時(shí)每次生成一個(gè)目標(biāo)的運(yùn)動(dòng)特征與輻射源特征的量測(cè)信息,運(yùn)動(dòng)特征信息中最大高度在20m~10000m,最大速度在0~3000km/h,最大加速度在0~90m/s2,最大爬升率在0~500m/s 內(nèi)隨機(jī)生成,隨機(jī)分布模型采用均勻分布。輻射源特征信息中,載頻、重復(fù)頻率、脈沖寬度和天線掃描周期由表中的真實(shí)值和誤差相加而成。計(jì)算所有特征信息的值與各待識(shí)別目標(biāo)的特征真實(shí)值的匹配度pij,其中i=1,2,…,8,j=1,2,…,8,獲得一個(gè)目標(biāo)識(shí)別決策矩陣。通過以上仿真劇情產(chǎn)生樣本集,并劃分訓(xùn)練集和測(cè)試集,其中訓(xùn)練集數(shù)據(jù)與測(cè)試集數(shù)據(jù)比例為4∶1,訓(xùn)練集數(shù)據(jù)共16w 組,測(cè)試集數(shù)據(jù)共4w組,每一類待識(shí)別目標(biāo)各占樣本總數(shù)的1/8。
在卷積神經(jīng)網(wǎng)絡(luò)中,池化層[15]的作用主要是通過降低特征圖的大小以減少計(jì)算量,同時(shí)保留主要的特征來防止過擬合。以下主要討論兩種池化方法以及不使用池化對(duì)算法性能的影響。圖3 為在使用dropout 比例為0.5 時(shí),分別使用平均池化、最大池化以及不使用池化采樣時(shí)測(cè)試集準(zhǔn)確率變化趨勢(shì)對(duì)比。
圖3 平均池化、最大池化以及無池化采樣時(shí)的測(cè)試集準(zhǔn)確率對(duì)比
采用平均池化還是最大池化采樣表現(xiàn)較不采用池化時(shí)均有下降。表3 為性能對(duì)比。由于使用2×2 池化降低需要訓(xùn)練的參數(shù)量,平均單步訓(xùn)練時(shí)間較無池化采樣時(shí)低,池化丟失了部分特征使得網(wǎng)絡(luò)收斂速度以及最終的測(cè)試集表現(xiàn)都較無池化采樣低,故使用網(wǎng)絡(luò)模型在原有基礎(chǔ)上去掉池化層。
表3 無池化、平均池化以及最大池化性能對(duì)比
Dropout 可以起到防止過擬合的作用,本節(jié)主要討論選擇不同比例p 時(shí)對(duì)網(wǎng)絡(luò)表現(xiàn)的影響,以選擇較優(yōu)的p 值。圖4 為p 值分別為0.1、0.3、0.5、0.8和1(p=1 表示不使用dropout)時(shí),測(cè)試集準(zhǔn)確率變化趨勢(shì)對(duì)比。
圖4 p值分別為0.1、0.3、0.5、0.8以及1時(shí)的測(cè)試集平均準(zhǔn)確率變化趨勢(shì)對(duì)比
表4 為使用不同dropout 比例時(shí)的測(cè)試集平均準(zhǔn)確率對(duì)比,對(duì)于使用的神經(jīng)網(wǎng)絡(luò)而言,當(dāng)p=0.1即每次僅使用10%的全連接層節(jié)點(diǎn)用于參數(shù)更新時(shí),網(wǎng)絡(luò)難以充分訓(xùn)練,使得模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)較差。p=0.5 時(shí),網(wǎng)絡(luò)在測(cè)試集上的表現(xiàn)最佳。最終的模型參數(shù)選取隨機(jī)失活比例為0.5,其識(shí)別準(zhǔn)確率可達(dá)86.71%。
表4 使用不同dropout比例時(shí)的測(cè)試集最大準(zhǔn)確率對(duì)比
本文對(duì)目標(biāo)識(shí)別問題進(jìn)行建模分析,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別方法。通過計(jì)算特征信息與目標(biāo)身份向量的匹配度構(gòu)造固定大小的目標(biāo)身份決策矩陣,作為卷積神經(jīng)網(wǎng)絡(luò)輸入,并針對(duì)該矩陣的特性修改了網(wǎng)絡(luò)結(jié)構(gòu)。仿真產(chǎn)生目標(biāo)識(shí)別算法的樣本集,在樣本集上設(shè)計(jì)仿真對(duì)比試驗(yàn)優(yōu)化了池化方式以及隨機(jī)失活比例等參數(shù)。當(dāng)傳感器量測(cè)誤差在一定范圍內(nèi)隨機(jī)變化時(shí),基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別算法在該數(shù)據(jù)集的識(shí)別準(zhǔn)確率達(dá)到86.71%,證明了算法的有效性。