姜衛(wèi)東 薛玲艷 張新禹
(國防科技大學(xué)電子科學(xué)學(xué)院 長沙 410073)
測試和評估是目標(biāo)識別模型中重要的組成部分,是衡量模型性能的重要手段[1],識別評估方法相對識別模型的研究滯后[2],這在一定程度上限制了目標(biāo)識別模型實用化發(fā)展。目前在評估階段,研究學(xué)者更傾向于在特定數(shù)據(jù)集上給出識別準(zhǔn)確性指標(biāo)來評價所提模型的性能優(yōu)勢[3]。該方法僅從識別率一個方面評價了模型性能,無法反映在輸入數(shù)據(jù)發(fā)生變化時識別模型的泛化能力[4,5]。其原因是面向模型的準(zhǔn)確性評估指標(biāo)無差別地對待了每一個數(shù)據(jù)集,忽略了數(shù)據(jù)集可分性對識別性能造成的影響[6]。識別性能與數(shù)據(jù)可分性密切相關(guān),識別性能的評估應(yīng)當(dāng)結(jié)合對數(shù)據(jù)特性的評估,以滿足對模型泛化性能的評估需求。考慮到真實雷達目標(biāo)識別場景的多樣復(fù)雜與動態(tài)變化特性,要求實用化的目標(biāo)識別模型應(yīng)當(dāng)具備一定的泛化能力。因此針對某個特定的識別任務(wù),如基于雷達散射截面積 (Radar Cross Section,RCS)、基于高分辨距離像 (High-Resolution Range Profile,HRRP)或基于逆合成孔徑雷達 (Inverse Synthetic Aperture Radar,ISAR)像的目標(biāo)識別任務(wù),需要在不同觀測條件的數(shù)據(jù)上測試模型以評估其應(yīng)對復(fù)雜目標(biāo)識別環(huán)境的泛化性能。而評估模型泛化性能離不開對識別場景的描述,因此提出數(shù)據(jù)可分性度量量化模型所處識別條件。
數(shù)據(jù)可分性是在給定標(biāo)簽條件下,描述數(shù)據(jù)中屬于不同類別的樣本間混合程度的一種固有屬性[7]。在已知數(shù)據(jù)標(biāo)簽條件下,可以以具體的識別任務(wù)為導(dǎo)向,確定樣本依其類別在特征空間的分布,數(shù)據(jù)整體分布的擴展率與類別子空間類內(nèi)分布的壓縮率共同構(gòu)成數(shù)據(jù)可分性的衡量指標(biāo)??煞中暂^好的數(shù)據(jù)具有較大的整體分布散度與較小的類內(nèi)分布散度,表明類間樣本相關(guān)性弱而類內(nèi)樣本相關(guān)性強。精確描述數(shù)據(jù)可分性有利于探究模型識別性能邊界,能夠預(yù)先為識別結(jié)果提供參考基準(zhǔn),為模型性能評估與改進提供支撐。
數(shù)據(jù)可分性度量為建立具有一定難度梯度的標(biāo)準(zhǔn)測試數(shù)據(jù)庫提供依據(jù),為實現(xiàn)層次化、輕量級的模型泛化性能評估過程打下基礎(chǔ)。雷達目標(biāo)識別數(shù)據(jù)集的可分特性受到目標(biāo)所處環(huán)境、傳感器狀態(tài)等因素的影響,待識別的任務(wù)是在不同信噪比、不同信雜比、不同分辨率、不同觀測角或不同頻段下的目標(biāo)散射特性信息集合。若將模型同時測試在上述所有狀態(tài)的數(shù)據(jù)集上,不僅耗費時間成本,并且無法得出指導(dǎo)性的評估結(jié)論,因此考慮一種更為輕量高效的層級式模型性能測試方法。如圖1,層級式模型識別性能評估中,模型由易到難每次測試在一個難度級別的數(shù)據(jù)集上,通過設(shè)置一定的識別率門限作為模型通過某層數(shù)據(jù)集測試的條件,模型在最終未通過測試的數(shù)據(jù)層所表現(xiàn)出的識別率代表了模型的性能上限,而模型通過測試的各數(shù)據(jù)層則體現(xiàn)模型性能的泛化范圍。上述測試方法的實施建立在對大規(guī)模數(shù)據(jù)按照其識別的難易程度進行分層的整理和歸納的基礎(chǔ)上,量化的數(shù)據(jù)可分性數(shù)值標(biāo)定了數(shù)據(jù)的識別難度,為數(shù)據(jù)分層提供科學(xué)的依據(jù)。
圖1 層級式模型識別性能評估示意圖Fig.1 Hierarchical model recognition performance evaluation schematic
數(shù)據(jù)復(fù)雜度標(biāo)定了識別任務(wù)難度[8],決定了模型識別性能上限[9,10]。文獻[11]將數(shù)據(jù)空間的結(jié)構(gòu)與特性分析列為人工智能的重大數(shù)理基礎(chǔ)問題之一。文獻[12]研究表明可分性因素的分析有利于輔助預(yù)測識別模型的性能。文獻[13]認為可分性度量可以應(yīng)用于識別模型選擇、特征挑選算法、聚類算法、生成對抗網(wǎng)絡(luò)性能的評估,以評估挑選的特征、新聚類的數(shù)據(jù)及新生成樣本的可分性。文獻[14]依據(jù)分類復(fù)雜度設(shè)計了動態(tài)多分類器決策方法。文獻[15]將可分性度量結(jié)合到自編碼器網(wǎng)絡(luò)損失函數(shù)的迭代過程中,實現(xiàn)了對數(shù)據(jù)更可分低維特征的提取,將提取的隱藏層特征應(yīng)用在下游識別任務(wù)中,提升了識別性能,并在評估階段將特征可分性作為網(wǎng)絡(luò)性能評估的指標(biāo)之一。因此將數(shù)據(jù)可分性度量結(jié)合進雷達目標(biāo)識別評估過程,對解釋、指導(dǎo)模型性能改進具有重要實際應(yīng)用意義。
現(xiàn)有數(shù)據(jù)可分性度量方法大都基于對數(shù)據(jù)簡單統(tǒng)計特性或?qū)颖鹃g距離的分析。文獻[16]從數(shù)據(jù)可分性角度總結(jié)了現(xiàn)有分類復(fù)雜度的度量方法,該文獻將數(shù)據(jù)復(fù)雜性度量歸為6類。其中,基于統(tǒng)計特征的分析方法僅利用了數(shù)據(jù)的均值和方差特性;線性度量方法主要依賴于線性分類器的識別結(jié)果;近鄰度量方法更側(cè)重于分析數(shù)據(jù)的局部距離信息;網(wǎng)圖度量方法主要衡量樣本點依據(jù)一定準(zhǔn)則所構(gòu)成的圖結(jié)構(gòu)密度;樣本數(shù)與維度數(shù)指標(biāo)主要用于描述類不平衡性及降維復(fù)雜度。上述方法僅反映了數(shù)據(jù)的局部特性,其有效性大多基于數(shù)據(jù)的線性可分假設(shè),無法區(qū)分具備非線性劃分結(jié)構(gòu)的特征族可分性差異[17]。文獻[13]驗證了基于統(tǒng)計特征、線性分類器、樣本數(shù)與維度數(shù)的度量方法無法有效衡量數(shù)據(jù)可分性;而基于鄰域和網(wǎng)圖的距離度量方法則具有較大的計算量,并且在衡量類間重疊度的實驗中不再適用。
為解決上述度量失效問題,本文考慮從概率論的角度解釋數(shù)據(jù)可分性。根據(jù)貝葉斯準(zhǔn)則,假設(shè)每個類別出現(xiàn)的概率相等,則樣本分類的結(jié)果取決于每個類別相對應(yīng)的似然函數(shù)大小[18]。此時各類別的似然函數(shù)差距越大,數(shù)據(jù)就越容易劃分開。然而由于高維數(shù)據(jù)的復(fù)雜性,似然函數(shù)建模比較困難。文獻[19]表明最小化數(shù)據(jù)編碼率的過程等價于求解似然函數(shù)的最優(yōu)解,即數(shù)據(jù)編碼速率和參數(shù)估計性能具有強一致性[20]。這意味著如果按類別編碼后的數(shù)據(jù)可以用更好的概率分布模型擬合,則該數(shù)據(jù)在給定失真率下具有較小的編碼量。文獻[21]認為,率失真函數(shù)為實值混合數(shù)據(jù)的分割優(yōu)度提供了一種自然的衡量標(biāo)準(zhǔn)。在最近的研究中,率失真理論被用于解釋神經(jīng)網(wǎng)絡(luò)模型[22]、優(yōu)化特征學(xué)習(xí)方法[23,24]等。
本文的主要貢獻在于基于率失真理論量化數(shù)據(jù)整體分布散度與類內(nèi)分布散度,通過構(gòu)造兩種分布散度的比例關(guān)系提出了一個新的數(shù)據(jù)可分性度量,該度量綜合了數(shù)據(jù)經(jīng)奇異值分解后各個正交特征維度上的可分性信息,能夠評估多維高斯分布數(shù)據(jù)的可分性優(yōu)劣;結(jié)合高斯混合模型,該度量能夠衡量非高斯分布數(shù)據(jù)的類間重疊度,度量效果相對現(xiàn)有方法具有明顯優(yōu)勢。在仿真數(shù)據(jù)上對所提方法進行了測試,結(jié)果表明由所提方法計算的可分性度量值在二維數(shù)據(jù)上與特征散點圖可分性的直觀判定結(jié)果對應(yīng),并且能夠衡量加噪數(shù)據(jù)的可分性優(yōu)劣;在高維實測數(shù)據(jù)[25]上的識別難度評估實驗表明所提度量與模型統(tǒng)計得到的平均識別率具有強相關(guān)性,其能夠以獨立于識別過程的方式量化數(shù)據(jù)識別難度,預(yù)先為識別結(jié)果提供評判基準(zhǔn);最后本文將所提度量應(yīng)用在識別網(wǎng)絡(luò)特征質(zhì)量評估中,在測試階段量化分析了網(wǎng)絡(luò)提取特征的可分性變化趨勢,在訓(xùn)練階段將特征可分性作為損失函數(shù)的一部分來同時優(yōu)化特征質(zhì)量,從特征可分性的角度為網(wǎng)絡(luò)識別性能的評估與提升提供新思路。
本節(jié)總結(jié)本文所用到的對比方法,其特點是利用樣本間的距離信息構(gòu)造可分性度量。文獻[26]總結(jié)了一系列近鄰方法,如描述類內(nèi)距與類間距相對比值的方法(Ratio of Intra/Extra Class Nearest Neighbor Distance,N2)以及一種統(tǒng)計局部近鄰數(shù)量的方法[27](Local Set Average Cardinality,LSC);基于網(wǎng)圖的方法如網(wǎng)圖平均密度法(Average Density of the Network,Density)[28]主要描述依據(jù)一定距離判決準(zhǔn)則所構(gòu)造的網(wǎng)圖鄰接邊數(shù)量;此外文獻[13]提出基于距離的可分性度量指標(biāo)(Distance-based Separability Index,DSI),其主要利用類內(nèi)距與類間距分布之間的差異信息。下面介紹上述度量方法的計算原理及特性。
(1) N2
N2度量方法設(shè)數(shù)據(jù)X=[x1,x2,...,xm]∈Rn×m由具有n維特征的m個樣本構(gòu)成,計算樣本xi到其最近鄰?fù)悩颖?NN(xi)距離d(xi,NN(xi))及xi到其最近鄰異類樣本 NE(xi) 的距離d(xi,NE(xi)),取m個樣本的d(xi,NN(xi)) 之 和與d(xi,NE(xi))之 和的比值即為度量N 2。由于N 2 的數(shù)值范圍取N2∈[0,∞),因此通過數(shù)值轉(zhuǎn)換將其規(guī)范到0~1之間,且值越大,表明數(shù)據(jù)越不可分,如式(1)
式(1)表明度量N2利用的是樣本與其近鄰樣本的距離信息,關(guān)注的是樣本周圍的可分性,每個樣本的可分性都僅與距離其最近的樣本相關(guān),因此該度量只能反映數(shù)據(jù)的局部結(jié)構(gòu)特性,對于距離各個類別較遠的離群樣本,度量N2將無法刻畫其可分性。
(2) LSC
LSC度量方法設(shè)樣本xi與xj的距離為d(xi,xj)(i≠j),xi到其最近鄰異類樣本N E(xi)的距離 為d(xi,NE(xi)),則| LS(xi)|定義為滿足條件d(xi,xj) 式(2)表明LSC賦予距離異類樣本更近的樣本更大的值,意味著其認為處于異類樣本分布中或處于決策邊界附近的樣本點導(dǎo)致可分性的惡化,因此更適用于度量決策邊界的復(fù)雜度。雖然LSC相對N2更多考慮了同類樣本距離信息,但對于異類樣本距離信息的利用僅限于最近鄰的異類樣本,異類樣本距離信息的缺失使得LSC度量僅是對數(shù)據(jù)可分結(jié)構(gòu)的局部表征量。 (3) Density Density度量方法首先將數(shù)據(jù)表示成網(wǎng)圖G=(V,E)的形式,網(wǎng)圖G中的V表示樣本,有節(jié)點數(shù)|V|=m,E表示樣本連接邊數(shù),滿足0≤|E|≤m(m-1)/2,同類樣本xi與xj兩兩連接的條件是二者的距離小于給定閾值t,即d(xi,xj) 式(3)表明Density數(shù)值取決于網(wǎng)圖G中保留的邊數(shù)|E|,值越大表明數(shù)據(jù)越不可分。|E|的大小受到設(shè)定閾值t的影響,過大的t會產(chǎn)生近乎全連接結(jié)構(gòu)的網(wǎng)圖,過小的t將產(chǎn)生稀疏結(jié)構(gòu)的網(wǎng)圖,二者都將導(dǎo)致數(shù)據(jù)可分性判定的模糊。此外度量Density只利用了同類樣本的距離信息,其表示同類樣本緊密度,忽略了異類樣本距離對數(shù)據(jù)可分性的影響,因而對異類樣本距離變化不敏感。 (4) DSI 式(4)表明度量DSI充分利用了同類及異類樣本的距離信息,其對數(shù)據(jù)可分結(jié)構(gòu)的描述更加全面,但文獻[13]的實驗表明該度量無法衡量決策邊界的復(fù)雜度。 上述方法存在統(tǒng)一的缺陷,即其都基于對樣本距離的計算,因此度量性能將會受到所選擇的距離函數(shù)的影響[29]。例如歐氏距離不適用于衡量高維數(shù)據(jù)的距離,這將導(dǎo)致基于歐氏距離計算的度量值無法比較具備不同維度的數(shù)據(jù)集可分性優(yōu)劣。最后需要說明的是為了方便比較,各度量經(jīng)數(shù)值轉(zhuǎn)換后的取值范圍都在0~1之間,且數(shù)值越小,表明數(shù)據(jù)的可分度越高。 率失真函數(shù)源于信息論中的編碼理論,它描述了在限定編碼誤差下對數(shù)據(jù)的最小編碼率[19]。當(dāng)編碼誤差服從高斯分布時,零均值數(shù)據(jù)的最小編碼率具有易于計算的表達式[20]。率失真函數(shù)為 其中,數(shù)據(jù)X=[x1,x2,...,xm]∈Rn×m由具有n維特征的m個樣本構(gòu)成;ε為給定的編碼誤差量;最小編碼率R(X)是關(guān)于數(shù)據(jù)X的率失真函數(shù),具體表現(xiàn)為與X的協(xié)方差陣有關(guān)的對數(shù)行列式log2det(·)的形式,n階單位陣In×n的引入保證了方陣滿秩,其行列式不為零。log2det(·)的凹函數(shù)性質(zhì)使得R(X)具有良好的優(yōu)化特性。 此外,式(5)同時具有較好的幾何可解釋性,可以作為數(shù)據(jù)所在特征空間的緊性度量。原始數(shù)據(jù)X在其特征空間的容量 vol(X),正比于其正交的奇異向量組[σ1e1,σ2e2,...,σnen]所張成空間的體積,在數(shù)值上轉(zhuǎn)化為數(shù)據(jù)奇異值σj的乘積,又等價于其協(xié)方差陣XXT的特征值λj的開方的乘積,如式(6) 式(8)反映了率失真函數(shù)的幾何意義,即數(shù)據(jù)的奇異向量所張成空間的體積可以由多維高斯分布單元填充的數(shù)量表示,二維數(shù)據(jù)的率失真編碼示意圖如圖2所示,其中高斯分布單元的半徑應(yīng)當(dāng)小于數(shù)據(jù)的最短主軸,有 圖2 二維數(shù)據(jù)的率失真編碼示意圖Fig.2 Schematic of 2D data’s rate distortion coding 圖3 不同奇異值下的數(shù)據(jù)可分性示意圖Fig.3 Schematic of data separability under different singular values 將單一維度的數(shù)據(jù)可分性分析判別式向原始多維數(shù)據(jù)擴展,一個簡單的思路就是將各個維度的可分性分析過程級聯(lián),由于數(shù)據(jù)的奇異向量相互正交,因此各個維度的可分性信息互不串?dāng)_,多維正交基下的數(shù)據(jù)可分性度量構(gòu)建流程如圖4所示。 由 log det(·)的凹函數(shù)特性,可以證明度量M的取值邊界,其達到上界的充要條件為各類別的中心化數(shù)據(jù)具有完全相同的協(xié)方差陣,有定理1。 對于零均值多維高斯分布數(shù)據(jù),當(dāng)且僅當(dāng)各類別協(xié)方差陣相等時,此時各類別數(shù)據(jù)具有完全相同的分布,數(shù)據(jù)處于完全不可分的狀態(tài),度量M越趨近于1,數(shù)據(jù)越不可分。 由4.1節(jié)及4.2節(jié),定義數(shù)據(jù)可分性度量的數(shù)學(xué)模型 文獻[30]在運用主動學(xué)習(xí)方法識別合成孔徑雷達目標(biāo)數(shù)據(jù)集時,首先給出了如圖5原始數(shù)據(jù)X所示的樣例。原始數(shù)據(jù)X中,目標(biāo)X1與X2在總的特征分布上具有較高的相似性,對于僅能產(chǎn)生線性超平面的分類器,該數(shù)據(jù)是完全不可分的數(shù)據(jù)集,運用上述度量也將相應(yīng)得出M ≈1的結(jié)論。但數(shù)據(jù)X中,不同類樣本間的特征互不交疊且具有清晰的分隔邊界,這意味著數(shù)據(jù)是局部可分的,對于能產(chǎn)生非線性分隔平面的分類器,該數(shù)據(jù)是完全可分的數(shù)據(jù)集,因此數(shù)據(jù)的局部可分特性影響了非線性分類器的識別性能上限。本文提出非高斯分布數(shù)據(jù)可分性度量方法,考慮了數(shù)據(jù)局部可分特性,能夠真實地反映數(shù)據(jù)特征的重疊度,圖5為在仿真樣例的可分性度量模型構(gòu)建示意圖。 圖5 非高斯分布數(shù)據(jù)可分性度量構(gòu)建示意圖Fig.5 Construction schematic of data separability measure under non-Gaussian condition 對于具有任意類別數(shù)的數(shù)據(jù)集可分性度量過程總結(jié)如算法1所示。特別地,當(dāng)高斯聚類數(shù)k=1時,算法的子過程退化為典型二分類高斯分布數(shù)據(jù)的可分性分析情形,此時多分類數(shù)據(jù)的可分性度量值為各二分類度量模型的加權(quán)求和,類似于機器學(xué)習(xí)分類器的一對一(One vs One,OvO)模型,本節(jié)所提度量更關(guān)注數(shù)據(jù)中屬于不同類別的樣本間的局部可分特性。 為驗證所提度量的有效性,本文首先在二維仿真數(shù)據(jù)集上開展實驗,二維數(shù)據(jù)可分性的特點在于其能夠通過繪制特征散點圖的方式直觀地判定,因此當(dāng)可分性度量值與直觀判定的可分性優(yōu)劣相當(dāng)時,認為度量有效衡量了數(shù)據(jù)可分性;此外,加噪數(shù)據(jù)可分性可以由仿真設(shè)置的信噪比預(yù)先判定,因此當(dāng)可分性度量值的變化趨勢隨信噪比增大逐漸減小時,認為度量有效衡量了加噪數(shù)據(jù)可分性。接著在實測高維數(shù)據(jù)上開展實驗,由于高維數(shù)據(jù)可分性是非直觀的,因此通過分析度量與不同模型統(tǒng)計得到的平均識別率之間的相關(guān)性來驗證度量有效性,該實驗的目的在于運用可分性度量量化數(shù)據(jù)識別難度,為評估識別模型在批量數(shù)據(jù)集上的識別能力提供評判基準(zhǔn)。最后運用可分性度量量化分析了卷積神經(jīng)網(wǎng)絡(luò)各模塊提取特征可分性變化趨勢,進一步將所提度量作為特征可分性損失參與網(wǎng)絡(luò)訓(xùn)練過程,達到優(yōu)化特征質(zhì)量的目的。上述實驗中,現(xiàn)有可分性度量DSI,N2,LSC和Density方法作為對比方法體現(xiàn)所提度量的優(yōu)勢。 算法 1 平均意義下的數(shù)據(jù)可分性度量計算過程Alg.1 Average data separability measure computing 由可分性度量方法評定的數(shù)據(jù)可分性優(yōu)劣首先應(yīng)當(dāng)與現(xiàn)實可觀察的數(shù)據(jù)可分程度吻合,因此該節(jié)實驗主要驗證可分性度量在已知可分性優(yōu)劣的二維仿真數(shù)據(jù)與加噪數(shù)據(jù)上的有效性。二維數(shù)據(jù)可分性可以通過可視化其特征散點圖的方式直觀地判定,因此本文構(gòu)造了不同可分性優(yōu)劣的數(shù)據(jù)集,其特征散點圖如圖6、圖7、圖8所示。圖6所示數(shù)據(jù)理想的決策邊界復(fù)雜度由圖6(a)-圖6(f)依次遞增,對應(yīng)可分性依次遞減;圖7、圖8所示數(shù)據(jù)的類間重疊度由圖7(a)-圖7(d)、圖7(e)-圖7(h)、圖8(a)-圖8(d)依次遞增,對應(yīng)可分性依次遞減。圖7與圖8的區(qū)別在于類內(nèi)樣本是否能夠用同一個高斯分布表示,以檢驗度量方法對非高斯分布數(shù)據(jù)的適用性。加噪數(shù)據(jù)可分性可以由仿真設(shè)置的信噪比預(yù)先判定,設(shè)置信噪比范圍為-5 dB 到15 dB。 圖6 二維數(shù)據(jù)特征圖Fig.6 2D data’s feature map 圖7 不同類間重疊度的高斯分布數(shù)據(jù)集Fig.7 Gaussian data with different class overlap 圖8 不同類間重疊度的非高斯分布數(shù)據(jù)集Fig.8 Non-Gaussian data with different class overlap 5.1.1 決策邊界復(fù)雜性度量驗證實驗 具體地,依據(jù)圖6所示特征散點圖,可以觀察到數(shù)據(jù)圖6(a)可以由一個簡單的線性超平面正確劃分開,數(shù)據(jù)圖6(b)-圖6(f)的理想劃分面則需要更多線性超平面擬合得到,其不規(guī)則程度相對線性超平面而言依次遞增,因此各數(shù)據(jù)集的識別復(fù)雜度是由圖6(a)-圖6(f)依次遞增的。當(dāng)可分性度量值由數(shù)據(jù)圖6(a)-圖6(f)順序遞增時,認為度量能夠有效衡量各數(shù)據(jù)集的可分性優(yōu)劣。依次設(shè)置高斯聚類數(shù)k1=k2=[1,3,5,8],則所提度量及對比方法在圖6所示數(shù)據(jù)的度量值總結(jié)如表1所示。 表1 典型特征圖可分性度量結(jié)果Tab.1 Separability measure results of typical feature 表1中,標(biāo)灰的度量值表示對應(yīng)行的度量方法無法有效衡量對應(yīng)列數(shù)據(jù)的可分性。具體地,對于圖6所示的數(shù)據(jù)集,度量DSI無法區(qū)分數(shù)據(jù)圖6(b)與圖6(c),這是由于其對決策邊界復(fù)雜度不敏感[12];度量N2及Density則無法區(qū)分數(shù)據(jù)圖6(d)與圖6(e),這是由于從樣本局部可分性的角度,度量N2認為圖6(d)中包含有更多與異類樣本更接近的樣本,度量Density則認為圖6(e)中同類樣本分布更加緊密,從而得出了與判定決策邊界復(fù)雜度相反的結(jié)論;所提度量在k=1時主要衡量數(shù)據(jù)線性可分度,表明圖6(c)-圖6(f)均為線性不可分數(shù)據(jù),在k=3時利用數(shù)據(jù)局部線性可分度信息還不夠充分,因此仍無法區(qū)分螺旋形與混合形數(shù)據(jù),上述表明僅利用樣本局部可分性的度量方法對數(shù)據(jù)整體可分結(jié)構(gòu)的描述還不準(zhǔn)確。實驗表明僅度量LSC與(k>3)能夠有效對比圖6數(shù)據(jù)集的可分性優(yōu)劣,這是由于度量LSC更關(guān)注決策邊界附近的樣本,而隨著聚類數(shù)k的增加,所提度量對各數(shù)據(jù)集可分性優(yōu)劣對比結(jié)果趨于穩(wěn)定,其通過數(shù)據(jù)高斯分塊的方式,結(jié)合基于率失真理論構(gòu)造的可分性度量M,統(tǒng)計局部線性可分度,實現(xiàn)對數(shù)據(jù)全局非線性可分度的評估。 5.1.2 類間重疊度度量驗證實驗 制約分類器識別性能的因素之一是數(shù)據(jù)類間重疊度。圖7、圖8展示了不同類間重疊度的二分類數(shù)據(jù)集,每個數(shù)據(jù)由幾族高斯分布采樣2000個樣本得到,類間重疊度則通過設(shè)置標(biāo)準(zhǔn)差σ或類中心距離μ調(diào)節(jié),共同構(gòu)成待評估數(shù)據(jù)集合。圖7的數(shù)據(jù)集類內(nèi)樣本服從典型高斯分布,圖8數(shù)據(jù)集的類內(nèi)樣本則呈現(xiàn)混合高斯分布的形式。對高斯分布數(shù)據(jù)設(shè)置兩組實驗,分別設(shè)置標(biāo)準(zhǔn)差σ ∈[1:1:9]與類中心距μ∈[0:0.5:4] ;對非高斯分布數(shù)據(jù),設(shè)置σ ∈[0.1:0.1:0.9]。運用度量M,(k1=k2=4)及現(xiàn)有對比方法,度量結(jié)果如圖9(a)、圖9(b)、圖9(c)所示。 圖9 不同類間重疊度的數(shù)據(jù)可分性度量結(jié)果Fig.9 Separability measures for datasets with different class overlap and dimensions 圖9(a)中,各可分性度量值均隨著類間距的增加逐漸下降,變化趨勢均符合觀察到的事實:類中心距越遠(μ越大),類間重疊度越小,數(shù)據(jù)越可分。但各方法在該測試樣例上的動態(tài)變化范圍各不相同,可以看到當(dāng)兩類目標(biāo)完全重疊(μ=0)時,度量M,DSI,N2,LSC均等于1,達到其上界,代表數(shù)據(jù)最不可分的情況,而Density等于0.765,取值無法反映最不可分數(shù)據(jù)集的可分性。當(dāng)μ由0增加到1.5時,類間重疊度顯然減小,對應(yīng)到LSC上卻沒有明顯的變化趨勢,而N2在μ由0增加到0.5時出現(xiàn)了陡然的下降趨勢,但此時類間重疊度變化是微小的。圖9(b)中,LSC在σ=6時取值為1達到其上界,但由圖7(g)數(shù)據(jù)此時還不是完全不可分的;其余可分性度量值均隨著類內(nèi)分散度的增加而逐漸上升,變化趨勢均符合圖7觀察到的事實:同類樣本越分散(σ越大),類間重疊度越大,數(shù)據(jù)越不可分。在圖9(a)、圖9(b)實驗中,僅M與DSI在兩類目標(biāo)由完全重疊到完全分離過程中,表現(xiàn)出最大動態(tài)變化范圍,且變化趨勢更加平滑。圖9(c)中,僅M,DSI,N2隨σ增加而逐漸增大,但DSI將未交疊非高斯數(shù)據(jù)(圖8(a))判定為可分性很差的數(shù)據(jù)集,度量值為0.75,但事實上對于K近鄰等能產(chǎn)生非線性決策邊界的識別器而言,該數(shù)據(jù)集是完全可分的。 在上述3個實驗中,LSC無法區(qū)分類間重疊度已經(jīng)達到一定量級的數(shù)據(jù)可分性;Density更多衡量同類樣本緊密度,因此在圖9(c)中由于同類樣本隨σ增加逐漸靠近,從而在數(shù)值上表現(xiàn)出可分性漸好的趨勢;僅M,DSI,N2隨著不同類樣本交疊量的增加均表現(xiàn)出正確的變化趨勢;但DSI無法衡量具有非線性劃分結(jié)構(gòu)數(shù)據(jù)的可分性;所提度量M具有更大的動態(tài)變化范圍,且相對N2更加平滑(圖9(a)),能夠有效衡量高斯或非高斯數(shù)據(jù)的類間重疊度。 為進一步解釋所提度量M的工作機理,圖10給出圖7實驗場景中作為M分子的類內(nèi)分布散度Mnum和作為分母的整體分布散度Mden的變化趨勢。圖10(a)表明當(dāng)μ變 化時,Mnum保 持恒定,Mden起到主要的可分性度量作用,說明整體分布散度中包含數(shù)據(jù)的均值差異信息;圖10(b)中隨著σ的增加,Mnum與Mden同時上升,Mden逐漸逼近Mnum,對應(yīng)類間重疊度增加,表明Mnum與Mden的相對數(shù)值能夠有效衡量數(shù)據(jù)類間重疊度。 圖10 整體分布散度與類內(nèi)分布散度變化趨勢Fig.10 The trend of overall and intra-class distribution divergence 5.1.3 加噪數(shù)據(jù)可分性度量驗證實驗 本節(jié)實驗?zāi)M真實目標(biāo)識別噪聲環(huán)境,通過將模型訓(xùn)練在原始數(shù)據(jù)測試在批量加噪數(shù)據(jù)上以評估其性能,同時驗證度量在加噪數(shù)據(jù)上的有效性。理想的識別模型是其在所有加噪數(shù)據(jù)上的識別率都一致高于其他模型,但在實際性能比對實驗中,更一般的現(xiàn)象是模型在不同加噪數(shù)據(jù)上的識別率各有高低,這導(dǎo)致性能評估模糊問題。以表2中數(shù)據(jù)WDBC為例,構(gòu)造信噪比-5 dB 到15 dB的加噪數(shù)據(jù),SVM(RBF),KNN,LSVM,LR的識別率結(jié)果反映了上述問題,如圖11。 表2 識別模型識別率結(jié)果Tab.2 Recognition accuracy results of recognition models 圖11 不同信噪比條件模型識別率表現(xiàn)Fig.11 Different models’ accuracy under various condition 圖11中KNN在各信噪比數(shù)據(jù)上的識別率一致地高于LR,而LR又一致地高于LSVM,可以得出三者抗噪性能的對比結(jié)論:KNN >LR >LSVM。但由該圖無法得出SVM(RBF)的性能評估結(jié)論,SVM(RBF)在信噪比高于3 dB時一致地優(yōu)于其他模型,信噪比低于-2 dB時性能最差。雖然可以通過對比各信噪比數(shù)據(jù)上的平均識別率來判定模型性能優(yōu)劣,但平均識別率忽略了各數(shù)據(jù)集的識別難度差異,直觀上更難識別的任務(wù)應(yīng)當(dāng)被賦予更大的權(quán)重,因此通過可分性度量量化識別難度,為識別率賦權(quán)提供依據(jù),加噪數(shù)據(jù)可分性度量結(jié)果如圖12。 圖12 加噪數(shù)據(jù)可分性度量結(jié)果Fig.12 Separability measure results of noisy data 圖12中僅Density數(shù)值隨信噪比上升存在微弱的起伏,說明其度量精度較差。DSI雖具有最大動態(tài)變化范圍,但圖11中大部分模型的識別率變化趨勢緩慢,說明各任務(wù)間識別難度差異并不十分顯著,且當(dāng)信噪比為 15 dB時模型識別率與表2中在原始數(shù)據(jù)的測試結(jié)果還存在一定差距,說明此時可分性數(shù)值也仍存在一定差距,但DSI數(shù)值已經(jīng)接近對原始數(shù)據(jù)可分性度量結(jié)果0.5833。所提度量M具有合適的動態(tài)變化范圍,且信噪比為15 dB時值為0.4352,與原始數(shù)據(jù)度量值0.2497還存在一定差距,綜合表3的實驗結(jié)果所提度量M更能真實地反映數(shù)據(jù)可分性。 表3 實測數(shù)據(jù)集可分性度量結(jié)果Tab.3 Separability measure results of real data 在數(shù)據(jù)集發(fā)布與構(gòu)建相關(guān)的文獻[31,32]中,通常運用公開通用的識別模型如支持向量機、經(jīng)典深度神經(jīng)網(wǎng)絡(luò)架構(gòu)等檢驗構(gòu)建數(shù)據(jù)集的適用性,用識別結(jié)果分析數(shù)據(jù)可分性。然而使用的識別模型不同,識別結(jié)果存在明顯差異,無法描述數(shù)據(jù)固有可分特性,因此本節(jié)基于可分性度量評估數(shù)據(jù)識別難度。此外數(shù)據(jù)識別難度評估的需求還源于目標(biāo)識別評估中的具體問題:如何從在各個識別任務(wù)上識別率各有高低的眾多識別器中選出識別性能最優(yōu)的模型。為直觀展現(xiàn)上述問題,本節(jié)選擇4種識別器:運用徑向基核函數(shù)(Radial Basis Function,RBF)的支持向量機(Support Vector Machine,SVM)、K近鄰(K-Nearest Neighbors,KNN)、線性SVM和邏輯回歸方法(Logistic Regression,LR),在表2所示的14個二分類實測數(shù)據(jù)集上[25]測試模型,測試過程中訓(xùn)練集與測試集按照7/3的比例劃分。表2給出數(shù)據(jù)集樣本總數(shù)、相應(yīng)的正負例數(shù)及特征數(shù),各模型在各數(shù)據(jù)上的識別率,“√”表示其在對應(yīng)行數(shù)據(jù)上識別率最高,“×”表示最低,平均識別率為4種識別器在同一數(shù)據(jù)上識別率的平均值,文獻[6]表明其可以作為側(cè)面反映識別難度的參考值。 表2首先可以直觀地反映以下問題:(1)同一種模型在不同數(shù)據(jù)上的識別率各不相同,變化的識別率無法作為衡量模型識別能力的固有屬性。(2)不同模型在同一數(shù)據(jù)上的識別率各不相同,且有時會出現(xiàn)較大差距,如 LSVM在Hill valley上的識別率為0.9670,而SVM(RBF)為0.4780,變化的識別率無法作為衡量數(shù)據(jù)識別難度的固有屬性。(3)平均識別率在一定程度上可以反映數(shù)據(jù)識別難度,但其有效性基于運用大量識別器開展統(tǒng)計實驗,并且無法客觀描述樣本數(shù)分布不均的數(shù)據(jù)集如Blood,ILPD,Haberman的識別難度。(4)在不同數(shù)據(jù)上模型識別率高低對比結(jié)果各不相同,如SVM(RBF)在Banknote,Ionosphere,Magic,Blood上識別率最高,而在Wisconsin,Fire,Hill valley上識別率最低,導(dǎo)致無法得出統(tǒng)一的性能優(yōu)劣評估結(jié)論。 為解決依賴識別率評估產(chǎn)生的性能比對模糊問題,考慮到數(shù)據(jù)固有可分特性對識別性能的影響,本節(jié)利用可分性度量方法評估數(shù)據(jù)識別難度,由量化的識別難度為識別任務(wù)標(biāo)定基準(zhǔn),進一步可以考慮構(gòu)建以識別難度為參數(shù)的識別率到模型識別能力的函數(shù)映射模型,得到表示模型固有識別性能的固定表征量。本文工作重點在于驗證所提度量方法的有效性,14個數(shù)據(jù)集可分性度量結(jié)果如表3所示,其中平均錯誤率作為參照指標(biāo)之一,各指標(biāo)值越大表示數(shù)據(jù)越不可分。在排除樣本數(shù)分布不均的數(shù)據(jù)集Blood,ILPD,Haberman后,平均錯誤率作為不同模型對同一數(shù)據(jù)識別結(jié)果的統(tǒng)計量對可分性的衡量具有一定的參照意義,因此通過分析各度量值與平均錯誤率之間的相關(guān)性驗證度量有效性,繪制各度量值與平均錯誤率之間的皮爾遜相關(guān)系數(shù)如圖13,同時繪制度量與平均錯誤率曲線圖如圖14。 圖13 可分性度量與平均錯誤率相關(guān)性矩陣Fig.13 Correlation matrix between separability measures and average recognition error 圖14 可分性度量與平均錯誤率曲線Fig.14 Curves between separability measure and average recognition error 相關(guān)系數(shù)的取值在-1到1之間,取值為正表示變量之間是正相關(guān),為負表示負相關(guān),其絕對值越大表示變量之間的線性相關(guān)性越強。圖13中,所提度量M與平均錯誤率的相關(guān)系數(shù)為 0.96,具有最大的線性正相關(guān)性,表明隨著M逐漸增大,數(shù)據(jù)變得越來越不可分,對大多數(shù)識別器而言識別性能下降,錯誤率隨之提升。表現(xiàn)最差的度量為Density,其與錯誤率的相關(guān)系數(shù)為-0.12,說明同類樣本緊密度并不足以衡量可分性。LSC,N2,DSI與平均錯誤率仍具有一定的正相關(guān)性,相關(guān)系數(shù)值分別為0.66,0.67,0.73,說明其也具備一定衡量可分性的效能,因此對于樣本數(shù)分布不均的數(shù)據(jù),則可以通過比對M與N2,DSI的判定結(jié)果來分析M是否有效。例如表3中樣本分布不均的Haberman數(shù)據(jù),平均錯誤率已不能客觀反映其與Mammographic的可分性差異,但通過與LSC,N2,DSI對照,表明M仍能夠正確地判定Haberman為可分性較差的數(shù)據(jù)集。圖14中,所提度量M數(shù)值與平均錯誤率基本對應(yīng),越小的M代表識別難度越小,對應(yīng)低平均錯誤率;對比方法均存在較大的振蕩幅度,而M僅在數(shù)據(jù)Spambase和Sonar之間出現(xiàn)微小的振蕩,說明二者的識別難度相當(dāng),而平均識別率的統(tǒng)計誤差導(dǎo)致了這一現(xiàn)象。 相較于依賴大量模型統(tǒng)計識別結(jié)果的錯誤率指標(biāo),所提度量M獨立于模型識別過程,對數(shù)據(jù)固有可分特性描述更加本原,度量值更加客觀。此外在計算量上M相較對比方法也具備突出的優(yōu)勢,對于具有m個樣本的n維數(shù)據(jù),M的計算量在于兩次協(xié)方差陣行列式的計算,協(xié)方差陣的規(guī)模為n×n,當(dāng)m>>n時如表3數(shù)據(jù)Magic,對比方法則需要建立19020×19020的距離矩陣而帶來巨大的存儲負擔(dān),且導(dǎo)致運算效率低下,M則只需要計算兩次10×10規(guī)模矩陣的行列式,在存儲空間和運行時間上都大大優(yōu)于對比方法。 深度學(xué)習(xí)識別模型具有提取數(shù)據(jù)高維可分特征的能力,本節(jié)實驗首先探究深層卷積神經(jīng)網(wǎng)絡(luò)中,隨著網(wǎng)絡(luò)層次的加深及訓(xùn)練輪次的迭代,各卷積層所提取特征可分性與模型識別率相對應(yīng)的變化趨勢特點,從特征可分性角度定量化解釋神經(jīng)網(wǎng)絡(luò)有效工作的原因。進一步地,本節(jié)將所提可分性度量作為網(wǎng)絡(luò)損失函數(shù)的一部分,優(yōu)化網(wǎng)絡(luò)學(xué)習(xí)到的特征質(zhì)量,探究特征可分性對提升網(wǎng)絡(luò)識別性能的實質(zhì)性作用。 本節(jié)采用合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像數(shù)據(jù)集,包含標(biāo)準(zhǔn)工作條件下的MSTAR數(shù)據(jù)集[33]和復(fù)旦大學(xué)發(fā)布的FUSAR數(shù)據(jù)集[32]。其中本文構(gòu)造的三分類FUSAR數(shù)據(jù)集包含樣本量較多的貨船、漁船和其余船只目標(biāo),3類船只包含相同的訓(xùn)練集樣本量,以保證訓(xùn)練過程的類平衡性。表4總結(jié)了SAR數(shù)據(jù)集相關(guān)參數(shù)。 表4 SAR圖像數(shù)據(jù)集Tab.4 SAR image datasets 本節(jié)首先在MSTAR數(shù)據(jù)集上評估文獻[34]提出的卷積神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)結(jié)構(gòu)及可分性分析模塊如圖15所示。其中原始SAR圖像經(jīng)過4個卷積模塊映射到可分的特征空間,為了減小可分性分析的計算量,在張量展開步驟之前對映射特征統(tǒng)一采用了2 ×2的自適應(yīng)平均池化操作,最終各層得到的特征維度分別是64,128,256及512維 。網(wǎng)絡(luò)在MSTAR測試數(shù)據(jù)集上的識別率acc如圖16所示,經(jīng)卷積模塊所提取特征的可分性度量結(jié)果分別如圖17所示,圖17由左至右分別是模塊1至模塊4提取特征可分性分析結(jié)果和各層可分性對比結(jié)果,由上至下分別對應(yīng)Density,DSI,LSC,N2,M度量方法。 圖16 網(wǎng)絡(luò)在MSTAR數(shù)據(jù)上的識別準(zhǔn)確性能Fig.16 Recognition accuracy performance of the network on MSTAR datasets 圖17 MSTAR數(shù)據(jù)集特征可分性度量結(jié)果Fig.17 Feature separability measure results for MSTAR dataset 由圖16僅能得出網(wǎng)絡(luò)在MSTAR測試數(shù)據(jù)上以較少的訓(xùn)練輪次就達到了較高的識別率,但無法從中解釋神經(jīng)網(wǎng)絡(luò)有效工作的具體原因,因此將各模塊提取特征可分性評估引入識別評估過程。圖17可以得出模型之所以在輸出端表現(xiàn)出優(yōu)異的識別性能是由于組成神經(jīng)網(wǎng)絡(luò)的各個模塊都提取到了逐漸可分的目標(biāo)潛在特征,在實驗現(xiàn)象上表現(xiàn)為隨著網(wǎng)絡(luò)深度的增加,所提取特征均呈現(xiàn)越來越可分的趨勢,數(shù)值上有ML1>ML2>ML3>ML4,并且隨著迭代輪次的增加,特征可分性漸高,預(yù)示著識別率的提升;特征可分性收斂,預(yù)示著識別率的飽和。圖17同時比對了本文所提方法與對比方法對特征可分性的度量結(jié)果。Density的度量性能最差,隨著訓(xùn)練輪次的增加,各層度量值呈現(xiàn)發(fā)散的趨勢,且無法區(qū)分第2~4層特征可分性優(yōu)劣;其余方法均能夠區(qū)分各層特征可分性的優(yōu)劣,數(shù)值上表現(xiàn)為DSIL1>DSIL2>DSIL3>DSIL4,LSCL1>LSCL2>LSCL3>LSCL4,N2L1>N2L2>N2L3>N2L4,可以體現(xiàn)越深層網(wǎng)絡(luò)提取的特征越可分,但所提度量M相比對比方法具有更加平滑的收斂趨勢,且各層可分性度量值的數(shù)量級差距更大,說明M對特征可分性的變化更為敏感。從模型性能優(yōu)化的角度,將M作為損失函數(shù)的一部分,迭代過程中同時優(yōu)化特征可分性,能夠快速引導(dǎo)模型學(xué)習(xí)到更加可分的特征,從而提高模型識別性能。 進一步地,本節(jié)在文獻[35]提出的骨干網(wǎng)絡(luò)中加入特征可分性度量損失,在FUSAR數(shù)據(jù)集上探究所提可分性度量對網(wǎng)絡(luò)識別性能提升的實質(zhì)性作用。帶有特征可分性度量約束的卷積神經(jīng)網(wǎng)絡(luò)組成如圖18,其中包含用于特征提取的卷積模塊、卷積注意力模塊(Convolutional Block Attention Module,CBAM)、全連接模塊,用于特征融合的平均特征融合模塊,以及用于評估特征質(zhì)量的特征可分性評估模塊。網(wǎng)絡(luò)損失函數(shù)由評估預(yù)測標(biāo)簽與真實標(biāo)簽差距的交叉熵損失和評估特征質(zhì)量的可分性損失構(gòu)成??紤]到識別性能與網(wǎng)絡(luò)各層特征及融合層特征都密切相關(guān),故損失函數(shù)L有式(17)與式(18)兩種方案。 圖18 特征可分性度量約束下的卷積神經(jīng)網(wǎng)絡(luò)Fig.18 Convolutional neural networks with feature separability constraints 其中,LLabel表示交叉熵損失,Mfi,Mfavg的形式如式(11),分別表示第i個特征提取模塊的特征fi與平均特征favg的可分性度量,favg為fi(i=1,2,...,5)的平均值,α,β為可調(diào)比例系數(shù)。式(17)與式(18)兩種訓(xùn)練方案在訓(xùn)練集上交叉熵損失表現(xiàn)如圖19,在測試集上的識別率表現(xiàn)如圖20。 圖19 訓(xùn)練集上交叉熵損失表現(xiàn)Fig.19 Cross-entropy loss performance on the training set 圖20 測試集上的識別率表現(xiàn)Fig.20 Accuracy performance on test set 圖19中,α=β=0表示訓(xùn)練時不加特征可分性約束的基準(zhǔn)網(wǎng)絡(luò)在訓(xùn)練集上的損失函數(shù)表現(xiàn),可以看到隨著可分性比例系數(shù)α或β逐漸增加,訓(xùn)練集上的交叉熵損失以更快的速度收斂到了更低的值,增強了對訓(xùn)練數(shù)據(jù)預(yù)測標(biāo)簽與真實標(biāo)簽之間的擬合效果。此外對比方案1與方案2的性能,當(dāng)α或β均較小時,二者性能相當(dāng),交叉熵損失曲線基本重合;隨著α與β逐漸增加,相同比例系數(shù)的方案2相較方案1對訓(xùn)練集具有更好的擬合效果。圖20展現(xiàn)了兩種方案在測試集上的識別率表現(xiàn),可以看到當(dāng)α或β取0.01,0.10或0.25時,識別率曲線在訓(xùn)練初期(10~30輪次)能夠相較基準(zhǔn)網(wǎng)絡(luò)達到更高的識別率,且α或β越大,提升效果越明顯。當(dāng)α或β取0.50時,識別率曲線出現(xiàn)了明顯的振蕩,但在整個訓(xùn)練過程中最高識別率相對基準(zhǔn)網(wǎng)絡(luò)仍有明顯的提升。此外對比兩種方案的性能,方案1在α=0.50時,第37輪達到了82.36%的識別率,方案2在α=0.25及α=0.50時分別在第37輪及第98輪達到了80%的識別率。而在訓(xùn)練的收斂階段(60~100輪次),方案1相較方案2在α=β=0.50時能夠相較基準(zhǔn)網(wǎng)絡(luò)有明顯的識別率提升。上述表明方案1在測試集上的泛化性能優(yōu)于方案2,將網(wǎng)絡(luò)各層特征可分性度量作為損失函數(shù)的一部分對特征可分性加以約束,能夠優(yōu)化網(wǎng)絡(luò)訓(xùn)練過程,并且改善網(wǎng)絡(luò)在測試集上最終的識別率表現(xiàn)。表5給出不同α與β數(shù)值下的兩種方案在測試集上最優(yōu)識別率表現(xiàn),對應(yīng)給出訓(xùn)練集上的識別率。其中隨著α或β的增加,訓(xùn)練集識別率均有不同程度的提升,方案1在訓(xùn)練集上擬合性能雖稍劣于方案2,但其在測試集上泛化性能明顯優(yōu)于方案2,具體表現(xiàn)在方案2β=0.50的測試識別率相對基準(zhǔn)網(wǎng)絡(luò)約有0.91%的提升,方案1α=0.50時則有3.27%的提升。 表5 不同可分性系數(shù)下最優(yōu)識別率表現(xiàn)(%)Tab.5 Optimal accuracy performance with different separability factors (%) 此外可分性度量對網(wǎng)絡(luò)識別性能的提升不僅體現(xiàn)在識別率上,還體現(xiàn)在其能夠引導(dǎo)網(wǎng)絡(luò)提取到更可分的特征。從可視化的角度分析特征可分性,本節(jié)采用樣本間余弦相似度矩陣及t分布隨機近鄰嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE),其中余弦相似度矩陣圖的行列表示樣本索引,已按照樣本所屬類別排序,兩個樣本余弦相似度越大表示二者越相似。圖21與圖22分別給出表5中基準(zhǔn)網(wǎng)絡(luò)與α=0.50的可分性約束網(wǎng)絡(luò)最終層提取特征的樣本間余弦相似度矩陣及t-SNE圖??梢钥吹较鄬鶞?zhǔn)網(wǎng)絡(luò),α=0.50時訓(xùn)練集和測試集上類內(nèi)樣本余弦相似度都有顯著的提升,而類間樣本余弦相似度雖然在第37輪迭代中沒有理想的下降趨勢,但在圖21(b)的訓(xùn)練集中其數(shù)值顯著小于類內(nèi)相似度,相較圖21(a),類間與類內(nèi)相似度比值存在下降趨勢,從而提升了特征可分性。而圖21(d)測試集上的可分性改善還在一定程度上受其與訓(xùn)練集模板相似度的影響,因此對特征可分性優(yōu)化效果不如圖21(b)顯著。由于t-SNE降維方法傾向于聚合相似度較高的樣本,圖21也表明加入可分性損失后,類內(nèi)樣本相似度普遍高于類間樣本,因此在圖22(b)與圖22(d)中更為相似的類內(nèi)樣本優(yōu)先被聚合,從而表現(xiàn)出更高的類內(nèi)聚集形式以及更加清晰的理想決策邊界。通過本實驗表明所提度量能夠有效地衡量網(wǎng)絡(luò)提取特征變化趨勢,將特征可分性度量作為網(wǎng)絡(luò)損失函數(shù)的一部分進行優(yōu)化,能夠快速引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)到更可分的特征,從而提升識別性能。 圖21 最終層輸出特征樣本間余弦相似度矩陣Fig.21 The cosine similarity matrix between feature samples output from the final layer 圖22 最終層輸出特征t-SNE圖Fig.22 The t-SNE visualization of the feature output from the final layer 數(shù)據(jù)可分性度量為分析和評估識別模型性能提供了一種基準(zhǔn),在賦予了數(shù)據(jù)可分性的條件下,更能客觀地評價識別模型性能。本文基于率失真理論構(gòu)建可分性度量模型,其描述了數(shù)據(jù)整體分布散度與類內(nèi)分布散度的相對關(guān)系,綜合了樣本分布在各個正交特征維度的可分性信息。實驗表明,設(shè)計的度量方法通過結(jié)合高斯混合模型能夠衡量非高斯數(shù)據(jù)可分度;所提度量可以比較具備不同維度的數(shù)據(jù)集可分性優(yōu)劣,其數(shù)值與經(jīng)不同模型統(tǒng)計得到的平均識別率有強相關(guān)性,能夠作為數(shù)據(jù)識別難度的量化值,為識別結(jié)果預(yù)先提供評判基準(zhǔn);并且能夠評估神經(jīng)網(wǎng)絡(luò)各卷積模塊提取可分特征的貢獻度,在測試階段作為網(wǎng)絡(luò)提取可分特征的評估指標(biāo),在訓(xùn)練階段作為網(wǎng)絡(luò)提取可分特征的優(yōu)化指標(biāo)。 本文是對數(shù)據(jù)可分性研究的初步探索,仍有許多值得進一步深入開展的研究工作,包括針對具體識別任務(wù)特性與考慮數(shù)據(jù)更多分布特性的可分性度量設(shè)計,探究可分性度量與識別性能上限的對應(yīng)關(guān)系,解釋識別網(wǎng)絡(luò)各層特征可分性之間的關(guān)聯(lián)等。總的來說,數(shù)據(jù)可分性度量作為直接面向數(shù)據(jù)的評估指標(biāo),與面向模型的準(zhǔn)確性指標(biāo)相結(jié)合,為雷達目標(biāo)識別評估提供了一個新的評估視角,對識別模型實用化改進具有指導(dǎo)性意義。3 率失真函數(shù)
4 基于率失真理論的數(shù)據(jù)可分性度量構(gòu)建方法
4.1 單一維度的數(shù)據(jù)可分性分析過程
4.2 高維數(shù)據(jù)可分性度量構(gòu)建方法
4.3 非高斯分布數(shù)據(jù)可分性度量方法
5 實驗驗證
5.1 可分性度量有效性驗證實驗
5.2 基于可分性度量的數(shù)據(jù)識別難度評估實驗
5.3 基于可分性度量的識別網(wǎng)絡(luò)特征質(zhì)量評估實驗
6 結(jié)論與展望