雷達目標(biāo)識別評估中的數(shù)據(jù)可分性度量方法

2023-09-15 01:37姜衛(wèi)東薛玲艷張新禹

雷達學(xué)報 2023年4期

姜衛(wèi)東薛玲艷張新禹

(國防科技大學(xué)電子科學(xué)學(xué)院長沙 410073)

1 引言

測試和評估是目標(biāo)識別模型中重要的組成部分，是衡量模型性能的重要手段[1]，識別評估方法相對識別模型的研究滯后[2]，這在一定程度上限制了目標(biāo)識別模型實用化發(fā)展。目前在評估階段，研究學(xué)者更傾向于在特定數(shù)據(jù)集上給出識別準(zhǔn)確性指標(biāo)來評價所提模型的性能優(yōu)勢[3]。該方法僅從識別率一個方面評價了模型性能，無法反映在輸入數(shù)據(jù)發(fā)生變化時識別模型的泛化能力[4,5]。其原因是面向模型的準(zhǔn)確性評估指標(biāo)無差別地對待了每一個數(shù)據(jù)集，忽略了數(shù)據(jù)集可分性對識別性能造成的影響[6]。識別性能與數(shù)據(jù)可分性密切相關(guān)，識別性能的評估應(yīng)當(dāng)結(jié)合對數(shù)據(jù)特性的評估，以滿足對模型泛化性能的評估需求。考慮到真實雷達目標(biāo)識別場景的多樣復(fù)雜與動態(tài)變化特性，要求實用化的目標(biāo)識別模型應(yīng)當(dāng)具備一定的泛化能力。因此針對某個特定的識別任務(wù)，如基于雷達散射截面積 (Radar Cross Section,RCS)、基于高分辨距離像 (High-Resolution Range Profile,HRRP)或基于逆合成孔徑雷達 (Inverse Synthetic Aperture Radar,ISAR)像的目標(biāo)識別任務(wù)，需要在不同觀測條件的數(shù)據(jù)上測試模型以評估其應(yīng)對復(fù)雜目標(biāo)識別環(huán)境的泛化性能。而評估模型泛化性能離不開對識別場景的描述，因此提出數(shù)據(jù)可分性度量量化模型所處識別條件。

數(shù)據(jù)可分性是在給定標(biāo)簽條件下，描述數(shù)據(jù)中屬于不同類別的樣本間混合程度的一種固有屬性[7]。在已知數(shù)據(jù)標(biāo)簽條件下，可以以具體的識別任務(wù)為導(dǎo)向，確定樣本依其類別在特征空間的分布，數(shù)據(jù)整體分布的擴展率與類別子空間類內(nèi)分布的壓縮率共同構(gòu)成數(shù)據(jù)可分性的衡量指標(biāo)?？煞中暂^好的數(shù)據(jù)具有較大的整體分布散度與較小的類內(nèi)分布散度，表明類間樣本相關(guān)性弱而類內(nèi)樣本相關(guān)性強。精確描述數(shù)據(jù)可分性有利于探究模型識別性能邊界，能夠預(yù)先為識別結(jié)果提供參考基準(zhǔn)，為模型性能評估與改進提供支撐。

數(shù)據(jù)可分性度量為建立具有一定難度梯度的標(biāo)準(zhǔn)測試數(shù)據(jù)庫提供依據(jù)，為實現(xiàn)層次化、輕量級的模型泛化性能評估過程打下基礎(chǔ)。雷達目標(biāo)識別數(shù)據(jù)集的可分特性受到目標(biāo)所處環(huán)境、傳感器狀態(tài)等因素的影響，待識別的任務(wù)是在不同信噪比、不同信雜比、不同分辨率、不同觀測角或不同頻段下的目標(biāo)散射特性信息集合。若將模型同時測試在上述所有狀態(tài)的數(shù)據(jù)集上，不僅耗費時間成本，并且無法得出指導(dǎo)性的評估結(jié)論，因此考慮一種更為輕量高效的層級式模型性能測試方法。如圖1，層級式模型識別性能評估中，模型由易到難每次測試在一個難度級別的數(shù)據(jù)集上，通過設(shè)置一定的識別率門限作為模型通過某層數(shù)據(jù)集測試的條件，模型在最終未通過測試的數(shù)據(jù)層所表現(xiàn)出的識別率代表了模型的性能上限，而模型通過測試的各數(shù)據(jù)層則體現(xiàn)模型性能的泛化范圍。上述測試方法的實施建立在對大規(guī)模數(shù)據(jù)按照其識別的難易程度進行分層的整理和歸納的基礎(chǔ)上，量化的數(shù)據(jù)可分性數(shù)值標(biāo)定了數(shù)據(jù)的識別難度，為數(shù)據(jù)分層提供科學(xué)的依據(jù)。

圖1 層級式模型識別性能評估示意圖Fig.1 Hierarchical model recognition performance evaluation schematic

數(shù)據(jù)復(fù)雜度標(biāo)定了識別任務(wù)難度[8]，決定了模型識別性能上限[9,10]。文獻[11]將數(shù)據(jù)空間的結(jié)構(gòu)與特性分析列為人工智能的重大數(shù)理基礎(chǔ)問題之一。文獻[12]研究表明可分性因素的分析有利于輔助預(yù)測識別模型的性能。文獻[13]認為可分性度量可以應(yīng)用于識別模型選擇、特征挑選算法、聚類算法、生成對抗網(wǎng)絡(luò)性能的評估，以評估挑選的特征、新聚類的數(shù)據(jù)及新生成樣本的可分性。文獻[14]依據(jù)分類復(fù)雜度設(shè)計了動態(tài)多分類器決策方法。文獻[15]將可分性度量結(jié)合到自編碼器網(wǎng)絡(luò)損失函數(shù)的迭代過程中，實現(xiàn)了對數(shù)據(jù)更可分低維特征的提取，將提取的隱藏層特征應(yīng)用在下游識別任務(wù)中，提升了識別性能，并在評估階段將特征可分性作為網(wǎng)絡(luò)性能評估的指標(biāo)之一。因此將數(shù)據(jù)可分性度量結(jié)合進雷達目標(biāo)識別評估過程，對解釋、指導(dǎo)模型性能改進具有重要實際應(yīng)用意義。

現(xiàn)有數(shù)據(jù)可分性度量方法大都基于對數(shù)據(jù)簡單統(tǒng)計特性或?qū)颖鹃g距離的分析。文獻[16]從數(shù)據(jù)可分性角度總結(jié)了現(xiàn)有分類復(fù)雜度的度量方法，該文獻將數(shù)據(jù)復(fù)雜性度量歸為6類。其中，基于統(tǒng)計特征的分析方法僅利用了數(shù)據(jù)的均值和方差特性；線性度量方法主要依賴于線性分類器的識別結(jié)果；近鄰度量方法更側(cè)重于分析數(shù)據(jù)的局部距離信息；網(wǎng)圖度量方法主要衡量樣本點依據(jù)一定準(zhǔn)則所構(gòu)成的圖結(jié)構(gòu)密度；樣本數(shù)與維度數(shù)指標(biāo)主要用于描述類不平衡性及降維復(fù)雜度。上述方法僅反映了數(shù)據(jù)的局部特性，其有效性大多基于數(shù)據(jù)的線性可分假設(shè)，無法區(qū)分具備非線性劃分結(jié)構(gòu)的特征族可分性差異[17]。文獻[13]驗證了基于統(tǒng)計特征、線性分類器、樣本數(shù)與維度數(shù)的度量方法無法有效衡量數(shù)據(jù)可分性；而基于鄰域和網(wǎng)圖的距離度量方法則具有較大的計算量，并且在衡量類間重疊度的實驗中不再適用。

為解決上述度量失效問題，本文考慮從概率論的角度解釋數(shù)據(jù)可分性。根據(jù)貝葉斯準(zhǔn)則，假設(shè)每個類別出現(xiàn)的概率相等，則樣本分類的結(jié)果取決于每個類別相對應(yīng)的似然函數(shù)大小[18]。此時各類別的似然函數(shù)差距越大，數(shù)據(jù)就越容易劃分開。然而由于高維數(shù)據(jù)的復(fù)雜性，似然函數(shù)建模比較困難。文獻[19]表明最小化數(shù)據(jù)編碼率的過程等價于求解似然函數(shù)的最優(yōu)解，即數(shù)據(jù)編碼速率和參數(shù)估計性能具有強一致性[20]。這意味著如果按類別編碼后的數(shù)據(jù)可以用更好的概率分布模型擬合，則該數(shù)據(jù)在給定失真率下具有較小的編碼量。文獻[21]認為，率失真函數(shù)為實值混合數(shù)據(jù)的分割優(yōu)度提供了一種自然的衡量標(biāo)準(zhǔn)。在最近的研究中，率失真理論被用于解釋神經(jīng)網(wǎng)絡(luò)模型[22]、優(yōu)化特征學(xué)習(xí)方法[23,24]等。

本文的主要貢獻在于基于率失真理論量化數(shù)據(jù)整體分布散度與類內(nèi)分布散度，通過構(gòu)造兩種分布散度的比例關(guān)系提出了一個新的數(shù)據(jù)可分性度量，該度量綜合了數(shù)據(jù)經(jīng)奇異值分解后各個正交特征維度上的可分性信息，能夠評估多維高斯分布數(shù)據(jù)的可分性優(yōu)劣；結(jié)合高斯混合模型，該度量能夠衡量非高斯分布數(shù)據(jù)的類間重疊度，度量效果相對現(xiàn)有方法具有明顯優(yōu)勢。在仿真數(shù)據(jù)上對所提方法進行了測試，結(jié)果表明由所提方法計算的可分性度量值在二維數(shù)據(jù)上與特征散點圖可分性的直觀判定結(jié)果對應(yīng)，并且能夠衡量加噪數(shù)據(jù)的可分性優(yōu)劣；在高維實測數(shù)據(jù)[25]上的識別難度評估實驗表明所提度量與模型統(tǒng)計得到的平均識別率具有強相關(guān)性，其能夠以獨立于識別過程的方式量化數(shù)據(jù)識別難度，預(yù)先為識別結(jié)果提供評判基準(zhǔn)；最后本文將所提度量應(yīng)用在識別網(wǎng)絡(luò)特征質(zhì)量評估中，在測試階段量化分析了網(wǎng)絡(luò)提取特征的可分性變化趨勢，在訓(xùn)練階段將特征可分性作為損失函數(shù)的一部分來同時優(yōu)化特征質(zhì)量，從特征可分性的角度為網(wǎng)絡(luò)識別性能的評估與提升提供新思路。

2 相關(guān)工作

本節(jié)總結(jié)本文所用到的對比方法，其特點是利用樣本間的距離信息構(gòu)造可分性度量。文獻[26]總結(jié)了一系列近鄰方法，如描述類內(nèi)距與類間距相對比值的方法(Ratio of Intra/Extra Class Nearest Neighbor Distance,N2)以及一種統(tǒng)計局部近鄰數(shù)量的方法[27](Local Set Average Cardinality,LSC)；基于網(wǎng)圖的方法如網(wǎng)圖平均密度法(Average Density of the Network,Density)[28]主要描述依據(jù)一定距離判決準(zhǔn)則所構(gòu)造的網(wǎng)圖鄰接邊數(shù)量；此外文獻[13]提出基于距離的可分性度量指標(biāo)(Distance-based Separability Index,DSI)，其主要利用類內(nèi)距與類間距分布之間的差異信息。下面介紹上述度量方法的計算原理及特性。

(1) N2

N2度量方法設(shè)數(shù)據(jù)X=[x1,x2,...,xm]∈Rn×m由具有n維特征的m個樣本構(gòu)成，計算樣本xi到其最近鄰?fù)悩颖?NN(xi)距離d(xi,NN(xi))及xi到其最近鄰異類樣本 NE(xi) 的距離d(xi,NE(xi))，取m個樣本的d(xi,NN(xi)) 之和與d(xi,NE(xi))之和的比值即為度量N 2。由于N 2 的數(shù)值范圍取N2∈[0,∞)，因此通過數(shù)值轉(zhuǎn)換將其規(guī)范到0～1之間，且值越大，表明數(shù)據(jù)越不可分，如式(1)

式(1)表明度量N2利用的是樣本與其近鄰樣本的距離信息，關(guān)注的是樣本周圍的可分性，每個樣本的可分性都僅與距離其最近的樣本相關(guān)，因此該度量只能反映數(shù)據(jù)的局部結(jié)構(gòu)特性，對于距離各個類別較遠的離群樣本，度量N2將無法刻畫其可分性。

(2) LSC

LSC度量方法設(shè)樣本xi與xj的距離為d(xi,xj)(i≠j)，xi到其最近鄰異類樣本N E(xi)的距離為d(xi,NE(xi))，則| LS(xi)|定義為滿足條件d(xi,xj)

式(2)表明LSC賦予距離異類樣本更近的樣本更大的值，意味著其認為處于異類樣本分布中或處于決策邊界附近的樣本點導(dǎo)致可分性的惡化，因此更適用于度量決策邊界的復(fù)雜度。雖然LSC相對N2更多考慮了同類樣本距離信息，但對于異類樣本距離信息的利用僅限于最近鄰的異類樣本，異類樣本距離信息的缺失使得LSC度量僅是對數(shù)據(jù)可分結(jié)構(gòu)的局部表征量。

(3) Density

Density度量方法首先將數(shù)據(jù)表示成網(wǎng)圖G=(V,E)的形式，網(wǎng)圖G中的V表示樣本，有節(jié)點數(shù)|V|=m，E表示樣本連接邊數(shù)，滿足0≤|E|≤m(m-1)/2，同類樣本xi與xj兩兩連接的條件是二者的距離小于給定閾值t，即d(xi,xj)

式(3)表明Density數(shù)值取決于網(wǎng)圖G中保留的邊數(shù)|E|，值越大表明數(shù)據(jù)越不可分。|E|的大小受到設(shè)定閾值t的影響，過大的t會產(chǎn)生近乎全連接結(jié)構(gòu)的網(wǎng)圖，過小的t將產(chǎn)生稀疏結(jié)構(gòu)的網(wǎng)圖，二者都將導(dǎo)致數(shù)據(jù)可分性判定的模糊。此外度量Density只利用了同類樣本的距離信息，其表示同類樣本緊密度，忽略了異類樣本距離對數(shù)據(jù)可分性的影響，因而對異類樣本距離變化不敏感。

(4) DSI

式(4)表明度量DSI充分利用了同類及異類樣本的距離信息，其對數(shù)據(jù)可分結(jié)構(gòu)的描述更加全面，但文獻[13]的實驗表明該度量無法衡量決策邊界的復(fù)雜度。

上述方法存在統(tǒng)一的缺陷，即其都基于對樣本距離的計算，因此度量性能將會受到所選擇的距離函數(shù)的影響[29]。例如歐氏距離不適用于衡量高維數(shù)據(jù)的距離，這將導(dǎo)致基于歐氏距離計算的度量值無法比較具備不同維度的數(shù)據(jù)集可分性優(yōu)劣。最后需要說明的是為了方便比較，各度量經(jīng)數(shù)值轉(zhuǎn)換后的取值范圍都在0～1之間，且數(shù)值越小，表明數(shù)據(jù)的可分度越高。

3 率失真函數(shù)

率失真函數(shù)源于信息論中的編碼理論，它描述了在限定編碼誤差下對數(shù)據(jù)的最小編碼率[19]。當(dāng)編碼誤差服從高斯分布時，零均值數(shù)據(jù)的最小編碼率具有易于計算的表達式[20]。率失真函數(shù)為

其中，數(shù)據(jù)X=[x1,x2,...,xm]∈Rn×m由具有n維特征的m個樣本構(gòu)成；ε為給定的編碼誤差量；最小編碼率R(X)是關(guān)于數(shù)據(jù)X的率失真函數(shù)，具體表現(xiàn)為與X的協(xié)方差陣有關(guān)的對數(shù)行列式log2det(·)的形式，n階單位陣In×n的引入保證了方陣滿秩，其行列式不為零。log2det(·)的凹函數(shù)性質(zhì)使得R(X)具有良好的優(yōu)化特性。

此外，式(5)同時具有較好的幾何可解釋性，可以作為數(shù)據(jù)所在特征空間的緊性度量。原始數(shù)據(jù)X在其特征空間的容量 vol(X)，正比于其正交的奇異向量組[σ1e1,σ2e2,...,σnen]所張成空間的體積，在數(shù)值上轉(zhuǎn)化為數(shù)據(jù)奇異值σj的乘積，又等價于其協(xié)方差陣XXT的特征值λj的開方的乘積，如式(6)

式(8)反映了率失真函數(shù)的幾何意義，即數(shù)據(jù)的奇異向量所張成空間的體積可以由多維高斯分布單元填充的數(shù)量表示，二維數(shù)據(jù)的率失真編碼示意圖如圖2所示，其中高斯分布單元的半徑應(yīng)當(dāng)小于數(shù)據(jù)的最短主軸，有

圖2 二維數(shù)據(jù)的率失真編碼示意圖Fig.2 Schematic of 2D data’s rate distortion coding

4 基于率失真理論的數(shù)據(jù)可分性度量構(gòu)建方法

4.1 單一維度的數(shù)據(jù)可分性分析過程

圖3 不同奇異值下的數(shù)據(jù)可分性示意圖Fig.3 Schematic of data separability under different singular values

4.2 高維數(shù)據(jù)可分性度量構(gòu)建方法

將單一維度的數(shù)據(jù)可分性分析判別式向原始多維數(shù)據(jù)擴展，一個簡單的思路就是將各個維度的可分性分析過程級聯(lián)，由于數(shù)據(jù)的奇異向量相互正交，因此各個維度的可分性信息互不串?dāng)_，多維正交基下的數(shù)據(jù)可分性度量構(gòu)建流程如圖4所示。

由 log det(·)的凹函數(shù)特性，可以證明度量M的取值邊界，其達到上界的充要條件為各類別的中心化數(shù)據(jù)具有完全相同的協(xié)方差陣，有定理1。

對于零均值多維高斯分布數(shù)據(jù)，當(dāng)且僅當(dāng)各類別協(xié)方差陣相等時，此時各類別數(shù)據(jù)具有完全相同的分布，數(shù)據(jù)處于完全不可分的狀態(tài)，度量M越趨近于1，數(shù)據(jù)越不可分。

4.3 非高斯分布數(shù)據(jù)可分性度量方法

由4.1節(jié)及4.2節(jié)，定義數(shù)據(jù)可分性度量的數(shù)學(xué)模型

文獻[30]在運用主動學(xué)習(xí)方法識別合成孔徑雷達目標(biāo)數(shù)據(jù)集時，首先給出了如圖5原始數(shù)據(jù)X所示的樣例。原始數(shù)據(jù)X中，目標(biāo)X1與X2在總的特征分布上具有較高的相似性，對于僅能產(chǎn)生線性超平面的分類器，該數(shù)據(jù)是完全不可分的數(shù)據(jù)集，運用上述度量也將相應(yīng)得出M ≈1的結(jié)論。但數(shù)據(jù)X中，不同類樣本間的特征互不交疊且具有清晰的分隔邊界，這意味著數(shù)據(jù)是局部可分的，對于能產(chǎn)生非線性分隔平面的分類器，該數(shù)據(jù)是完全可分的數(shù)據(jù)集，因此數(shù)據(jù)的局部可分特性影響了非線性分類器的識別性能上限。本文提出非高斯分布數(shù)據(jù)可分性度量方法，考慮了數(shù)據(jù)局部可分特性，能夠真實地反映數(shù)據(jù)特征的重疊度，圖5為在仿真樣例的可分性度量模型構(gòu)建示意圖。

圖5 非高斯分布數(shù)據(jù)可分性度量構(gòu)建示意圖Fig.5 Construction schematic of data separability measure under non-Gaussian condition

對于具有任意類別數(shù)的數(shù)據(jù)集可分性度量過程總結(jié)如算法1所示。特別地，當(dāng)高斯聚類數(shù)k=1時，算法的子過程退化為典型二分類高斯分布數(shù)據(jù)的可分性分析情形，此時多分類數(shù)據(jù)的可分性度量值為各二分類度量模型的加權(quán)求和，類似于機器學(xué)習(xí)分類器的一對一(One vs One,OvO)模型，本節(jié)所提度量更關(guān)注數(shù)據(jù)中屬于不同類別的樣本間的局部可分特性。

5 實驗驗證

為驗證所提度量的有效性，本文首先在二維仿真數(shù)據(jù)集上開展實驗，二維數(shù)據(jù)可分性的特點在于其能夠通過繪制特征散點圖的方式直觀地判定，因此當(dāng)可分性度量值與直觀判定的可分性優(yōu)劣相當(dāng)時，認為度量有效衡量了數(shù)據(jù)可分性；此外，加噪數(shù)據(jù)可分性可以由仿真設(shè)置的信噪比預(yù)先判定，因此當(dāng)可分性度量值的變化趨勢隨信噪比增大逐漸減小時，認為度量有效衡量了加噪數(shù)據(jù)可分性。接著在實測高維數(shù)據(jù)上開展實驗，由于高維數(shù)據(jù)可分性是非直觀的，因此通過分析度量與不同模型統(tǒng)計得到的平均識別率之間的相關(guān)性來驗證度量有效性，該實驗的目的在于運用可分性度量量化數(shù)據(jù)識別難度，為評估識別模型在批量數(shù)據(jù)集上的識別能力提供評判基準(zhǔn)。最后運用可分性度量量化分析了卷積神經(jīng)網(wǎng)絡(luò)各模塊提取特征可分性變化趨勢，進一步將所提度量作為特征可分性損失參與網(wǎng)絡(luò)訓(xùn)練過程，達到優(yōu)化特征質(zhì)量的目的。上述實驗中，現(xiàn)有可分性度量DSI,N2,LSC和Density方法作為對比方法體現(xiàn)所提度量的優(yōu)勢。

算法 1 平均意義下的數(shù)據(jù)可分性度量計算過程Alg.1 Average data separability measure computing

5.1 可分性度量有效性驗證實驗

由可分性度量方法評定的數(shù)據(jù)可分性優(yōu)劣首先應(yīng)當(dāng)與現(xiàn)實可觀察的數(shù)據(jù)可分程度吻合，因此該節(jié)實驗主要驗證可分性度量在已知可分性優(yōu)劣的二維仿真數(shù)據(jù)與加噪數(shù)據(jù)上的有效性。二維數(shù)據(jù)可分性可以通過可視化其特征散點圖的方式直觀地判定，因此本文構(gòu)造了不同可分性優(yōu)劣的數(shù)據(jù)集，其特征散點圖如圖6、圖7、圖8所示。圖6所示數(shù)據(jù)理想的決策邊界復(fù)雜度由圖6(a)-圖6(f)依次遞增，對應(yīng)可分性依次遞減；圖7、圖8所示數(shù)據(jù)的類間重疊度由圖7(a)-圖7(d)、圖7(e)-圖7(h)、圖8(a)-圖8(d)依次遞增，對應(yīng)可分性依次遞減。圖7與圖8的區(qū)別在于類內(nèi)樣本是否能夠用同一個高斯分布表示，以檢驗度量方法對非高斯分布數(shù)據(jù)的適用性。加噪數(shù)據(jù)可分性可以由仿真設(shè)置的信噪比預(yù)先判定，設(shè)置信噪比范圍為-5 dB 到15 dB。

圖6 二維數(shù)據(jù)特征圖Fig.6 2D data’s feature map

圖7 不同類間重疊度的高斯分布數(shù)據(jù)集Fig.7 Gaussian data with different class overlap

圖8 不同類間重疊度的非高斯分布數(shù)據(jù)集Fig.8 Non-Gaussian data with different class overlap

5.1.1 決策邊界復(fù)雜性度量驗證實驗

具體地，依據(jù)圖6所示特征散點圖，可以觀察到數(shù)據(jù)圖6(a)可以由一個簡單的線性超平面正確劃分開，數(shù)據(jù)圖6(b)-圖6(f)的理想劃分面則需要更多線性超平面擬合得到，其不規(guī)則程度相對線性超平面而言依次遞增，因此各數(shù)據(jù)集的識別復(fù)雜度是由圖6(a)-圖6(f)依次遞增的。當(dāng)可分性度量值由數(shù)據(jù)圖6(a)-圖6(f)順序遞增時，認為度量能夠有效衡量各數(shù)據(jù)集的可分性優(yōu)劣。依次設(shè)置高斯聚類數(shù)k1=k2=[1,3,5,8]，則所提度量及對比方法在圖6所示數(shù)據(jù)的度量值總結(jié)如表1所示。

表1 典型特征圖可分性度量結(jié)果Tab.1 Separability measure results of typical feature

表1中，標(biāo)灰的度量值表示對應(yīng)行的度量方法無法有效衡量對應(yīng)列數(shù)據(jù)的可分性。具體地，對于圖6所示的數(shù)據(jù)集，度量DSI無法區(qū)分數(shù)據(jù)圖6(b)與圖6(c)，這是由于其對決策邊界復(fù)雜度不敏感[12]；度量N2及Density則無法區(qū)分數(shù)據(jù)圖6(d)與圖6(e)，這是由于從樣本局部可分性的角度，度量N2認為圖6(d)中包含有更多與異類樣本更接近的樣本，度量Density則認為圖6(e)中同類樣本分布更加緊密，從而得出了與判定決策邊界復(fù)雜度相反的結(jié)論；所提度量在k=1時主要衡量數(shù)據(jù)線性可分度，表明圖6(c)-圖6(f)均為線性不可分數(shù)據(jù)，在k=3時利用數(shù)據(jù)局部線性可分度信息還不夠充分，因此仍無法區(qū)分螺旋形與混合形數(shù)據(jù)，上述表明僅利用樣本局部可分性的度量方法對數(shù)據(jù)整體可分結(jié)構(gòu)的描述還不準(zhǔn)確。實驗表明僅度量LSC與(k>3)能夠有效對比圖6數(shù)據(jù)集的可分性優(yōu)劣，這是由于度量LSC更關(guān)注決策邊界附近的樣本，而隨著聚類數(shù)k的增加，所提度量對各數(shù)據(jù)集可分性優(yōu)劣對比結(jié)果趨于穩(wěn)定，其通過數(shù)據(jù)高斯分塊的方式，結(jié)合基于率失真理論構(gòu)造的可分性度量M，統(tǒng)計局部線性可分度，實現(xiàn)對數(shù)據(jù)全局非線性可分度的評估。

5.1.2 類間重疊度度量驗證實驗

制約分類器識別性能的因素之一是數(shù)據(jù)類間重疊度。圖7、圖8展示了不同類間重疊度的二分類數(shù)據(jù)集，每個數(shù)據(jù)由幾族高斯分布采樣2000個樣本得到，類間重疊度則通過設(shè)置標(biāo)準(zhǔn)差σ或類中心距離μ調(diào)節(jié)，共同構(gòu)成待評估數(shù)據(jù)集合。圖7的數(shù)據(jù)集類內(nèi)樣本服從典型高斯分布，圖8數(shù)據(jù)集的類內(nèi)樣本則呈現(xiàn)混合高斯分布的形式。對高斯分布數(shù)據(jù)設(shè)置兩組實驗，分別設(shè)置標(biāo)準(zhǔn)差σ ∈[1:1:9]與類中心距μ∈[0:0.5:4] ；對非高斯分布數(shù)據(jù)，設(shè)置σ ∈[0.1:0.1:0.9]。運用度量M,(k1=k2=4)及現(xiàn)有對比方法，度量結(jié)果如圖9(a)、圖9(b)、圖9(c)所示。

圖9 不同類間重疊度的數(shù)據(jù)可分性度量結(jié)果Fig.9 Separability measures for datasets with different class overlap and dimensions

圖9(a)中，各可分性度量值均隨著類間距的增加逐漸下降，變化趨勢均符合觀察到的事實：類中心距越遠(μ越大)，類間重疊度越小，數(shù)據(jù)越可分。但各方法在該測試樣例上的動態(tài)變化范圍各不相同，可以看到當(dāng)兩類目標(biāo)完全重疊(μ=0)時，度量M,DSI,N2,LSC均等于1，達到其上界，代表數(shù)據(jù)最不可分的情況，而Density等于0.765，取值無法反映最不可分數(shù)據(jù)集的可分性。當(dāng)μ由0增加到1.5時，類間重疊度顯然減小，對應(yīng)到LSC上卻沒有明顯的變化趨勢，而N2在μ由0增加到0.5時出現(xiàn)了陡然的下降趨勢，但此時類間重疊度變化是微小的。圖9(b)中，LSC在σ=6時取值為1達到其上界，但由圖7(g)數(shù)據(jù)此時還不是完全不可分的；其余可分性度量值均隨著類內(nèi)分散度的增加而逐漸上升，變化趨勢均符合圖7觀察到的事實：同類樣本越分散(σ越大)，類間重疊度越大，數(shù)據(jù)越不可分。在圖9(a)、圖9(b)實驗中，僅M與DSI在兩類目標(biāo)由完全重疊到完全分離過程中，表現(xiàn)出最大動態(tài)變化范圍，且變化趨勢更加平滑。圖9(c)中，僅M,DSI,N2隨σ增加而逐漸增大，但DSI將未交疊非高斯數(shù)據(jù)(圖8(a))判定為可分性很差的數(shù)據(jù)集，度量值為0.75，但事實上對于K近鄰等能產(chǎn)生非線性決策邊界的識別器而言，該數(shù)據(jù)集是完全可分的。

在上述3個實驗中，LSC無法區(qū)分類間重疊度已經(jīng)達到一定量級的數(shù)據(jù)可分性；Density更多衡量同類樣本緊密度，因此在圖9(c)中由于同類樣本隨σ增加逐漸靠近，從而在數(shù)值上表現(xiàn)出可分性漸好的趨勢；僅M,DSI,N2隨著不同類樣本交疊量的增加均表現(xiàn)出正確的變化趨勢；但DSI無法衡量具有非線性劃分結(jié)構(gòu)數(shù)據(jù)的可分性；所提度量M具有更大的動態(tài)變化范圍，且相對N2更加平滑(圖9(a))，能夠有效衡量高斯或非高斯數(shù)據(jù)的類間重疊度。

為進一步解釋所提度量M的工作機理，圖10給出圖7實驗場景中作為M分子的類內(nèi)分布散度Mnum和作為分母的整體分布散度Mden的變化趨勢。圖10(a)表明當(dāng)μ變化時，Mnum保持恒定，Mden起到主要的可分性度量作用，說明整體分布散度中包含數(shù)據(jù)的均值差異信息；圖10(b)中隨著σ的增加，Mnum與Mden同時上升，Mden逐漸逼近Mnum，對應(yīng)類間重疊度增加，表明Mnum與Mden的相對數(shù)值能夠有效衡量數(shù)據(jù)類間重疊度。

圖10 整體分布散度與類內(nèi)分布散度變化趨勢Fig.10 The trend of overall and intra-class distribution divergence

5.1.3 加噪數(shù)據(jù)可分性度量驗證實驗

本節(jié)實驗?zāi)M真實目標(biāo)識別噪聲環(huán)境，通過將模型訓(xùn)練在原始數(shù)據(jù)測試在批量加噪數(shù)據(jù)上以評估其性能，同時驗證度量在加噪數(shù)據(jù)上的有效性。理想的識別模型是其在所有加噪數(shù)據(jù)上的識別率都一致高于其他模型，但在實際性能比對實驗中，更一般的現(xiàn)象是模型在不同加噪數(shù)據(jù)上的識別率各有高低，這導(dǎo)致性能評估模糊問題。以表2中數(shù)據(jù)WDBC為例，構(gòu)造信噪比-5 dB 到15 dB的加噪數(shù)據(jù)，SVM(RBF),KNN,LSVM,LR的識別率結(jié)果反映了上述問題，如圖11。

表2 識別模型識別率結(jié)果Tab.2 Recognition accuracy results of recognition models

圖11 不同信噪比條件模型識別率表現(xiàn)Fig.11 Different models’ accuracy under various condition

圖11中KNN在各信噪比數(shù)據(jù)上的識別率一致地高于LR，而LR又一致地高于LSVM，可以得出三者抗噪性能的對比結(jié)論：KNN >LR >LSVM。但由該圖無法得出SVM(RBF)的性能評估結(jié)論，SVM(RBF)在信噪比高于3 dB時一致地優(yōu)于其他模型，信噪比低于-2 dB時性能最差。雖然可以通過對比各信噪比數(shù)據(jù)上的平均識別率來判定模型性能優(yōu)劣，但平均識別率忽略了各數(shù)據(jù)集的識別難度差異，直觀上更難識別的任務(wù)應(yīng)當(dāng)被賦予更大的權(quán)重，因此通過可分性度量量化識別難度，為識別率賦權(quán)提供依據(jù)，加噪數(shù)據(jù)可分性度量結(jié)果如圖12。

圖12 加噪數(shù)據(jù)可分性度量結(jié)果Fig.12 Separability measure results of noisy data

圖12中僅Density數(shù)值隨信噪比上升存在微弱的起伏，說明其度量精度較差。DSI雖具有最大動態(tài)變化范圍，但圖11中大部分模型的識別率變化趨勢緩慢，說明各任務(wù)間識別難度差異并不十分顯著，且當(dāng)信噪比為 15 dB時模型識別率與表2中在原始數(shù)據(jù)的測試結(jié)果還存在一定差距，說明此時可分性數(shù)值也仍存在一定差距，但DSI數(shù)值已經(jīng)接近對原始數(shù)據(jù)可分性度量結(jié)果0.5833。所提度量M具有合適的動態(tài)變化范圍，且信噪比為15 dB時值為0.4352，與原始數(shù)據(jù)度量值0.2497還存在一定差距，綜合表3的實驗結(jié)果所提度量M更能真實地反映數(shù)據(jù)可分性。

表3 實測數(shù)據(jù)集可分性度量結(jié)果Tab.3 Separability measure results of real data

5.2 基于可分性度量的數(shù)據(jù)識別難度評估實驗

在數(shù)據(jù)集發(fā)布與構(gòu)建相關(guān)的文獻[31,32]中，通常運用公開通用的識別模型如支持向量機、經(jīng)典深度神經(jīng)網(wǎng)絡(luò)架構(gòu)等檢驗構(gòu)建數(shù)據(jù)集的適用性，用識別結(jié)果分析數(shù)據(jù)可分性。然而使用的識別模型不同，識別結(jié)果存在明顯差異，無法描述數(shù)據(jù)固有可分特性，因此本節(jié)基于可分性度量評估數(shù)據(jù)識別難度。此外數(shù)據(jù)識別難度評估的需求還源于目標(biāo)識別評估中的具體問題：如何從在各個識別任務(wù)上識別率各有高低的眾多識別器中選出識別性能最優(yōu)的模型。為直觀展現(xiàn)上述問題，本節(jié)選擇4種識別器：運用徑向基核函數(shù)(Radial Basis Function,RBF)的支持向量機(Support Vector Machine,SVM)、K近鄰(K-Nearest Neighbors,KNN)、線性SVM和邏輯回歸方法(Logistic Regression,LR)，在表2所示的14個二分類實測數(shù)據(jù)集上[25]測試模型，測試過程中訓(xùn)練集與測試集按照7/3的比例劃分。表2給出數(shù)據(jù)集樣本總數(shù)、相應(yīng)的正負例數(shù)及特征數(shù)，各模型在各數(shù)據(jù)上的識別率，“√”表示其在對應(yīng)行數(shù)據(jù)上識別率最高，“×”表示最低，平均識別率為4種識別器在同一數(shù)據(jù)上識別率的平均值，文獻[6]表明其可以作為側(cè)面反映識別難度的參考值。

表2首先可以直觀地反映以下問題：(1)同一種模型在不同數(shù)據(jù)上的識別率各不相同，變化的識別率無法作為衡量模型識別能力的固有屬性。(2)不同模型在同一數(shù)據(jù)上的識別率各不相同，且有時會出現(xiàn)較大差距，如 LSVM在Hill valley上的識別率為0.9670，而SVM(RBF)為0.4780，變化的識別率無法作為衡量數(shù)據(jù)識別難度的固有屬性。(3)平均識別率在一定程度上可以反映數(shù)據(jù)識別難度，但其有效性基于運用大量識別器開展統(tǒng)計實驗，并且無法客觀描述樣本數(shù)分布不均的數(shù)據(jù)集如Blood,ILPD,Haberman的識別難度。(4)在不同數(shù)據(jù)上模型識別率高低對比結(jié)果各不相同，如SVM(RBF)在Banknote,Ionosphere,Magic,Blood上識別率最高，而在Wisconsin,Fire,Hill valley上識別率最低，導(dǎo)致無法得出統(tǒng)一的性能優(yōu)劣評估結(jié)論。

為解決依賴識別率評估產(chǎn)生的性能比對模糊問題，考慮到數(shù)據(jù)固有可分特性對識別性能的影響，本節(jié)利用可分性度量方法評估數(shù)據(jù)識別難度，由量化的識別難度為識別任務(wù)標(biāo)定基準(zhǔn)，進一步可以考慮構(gòu)建以識別難度為參數(shù)的識別率到模型識別能力的函數(shù)映射模型，得到表示模型固有識別性能的固定表征量。本文工作重點在于驗證所提度量方法的有效性，14個數(shù)據(jù)集可分性度量結(jié)果如表3所示，其中平均錯誤率作為參照指標(biāo)之一，各指標(biāo)值越大表示數(shù)據(jù)越不可分。在排除樣本數(shù)分布不均的數(shù)據(jù)集Blood,ILPD,Haberman后，平均錯誤率作為不同模型對同一數(shù)據(jù)識別結(jié)果的統(tǒng)計量對可分性的衡量具有一定的參照意義，因此通過分析各度量值與平均錯誤率之間的相關(guān)性驗證度量有效性，繪制各度量值與平均錯誤率之間的皮爾遜相關(guān)系數(shù)如圖13，同時繪制度量與平均錯誤率曲線圖如圖14。

圖13 可分性度量與平均錯誤率相關(guān)性矩陣Fig.13 Correlation matrix between separability measures and average recognition error

圖14 可分性度量與平均錯誤率曲線Fig.14 Curves between separability measure and average recognition error

相關(guān)系數(shù)的取值在-1到1之間，取值為正表示變量之間是正相關(guān)，為負表示負相關(guān)，其絕對值越大表示變量之間的線性相關(guān)性越強。圖13中，所提度量M與平均錯誤率的相關(guān)系數(shù)為 0.96，具有最大的線性正相關(guān)性，表明隨著M逐漸增大，數(shù)據(jù)變得越來越不可分，對大多數(shù)識別器而言識別性能下降，錯誤率隨之提升。表現(xiàn)最差的度量為Density，其與錯誤率的相關(guān)系數(shù)為-0.12，說明同類樣本緊密度并不足以衡量可分性。LSC,N2,DSI與平均錯誤率仍具有一定的正相關(guān)性，相關(guān)系數(shù)值分別為0.66,0.67,0.73，說明其也具備一定衡量可分性的效能，因此對于樣本數(shù)分布不均的數(shù)據(jù)，則可以通過比對M與N2,DSI的判定結(jié)果來分析M是否有效。例如表3中樣本分布不均的Haberman數(shù)據(jù)，平均錯誤率已不能客觀反映其與Mammographic的可分性差異，但通過與LSC,N2,DSI對照，表明M仍能夠正確地判定Haberman為可分性較差的數(shù)據(jù)集。圖14中，所提度量M數(shù)值與平均錯誤率基本對應(yīng)，越小的M代表識別難度越小，對應(yīng)低平均錯誤率；對比方法均存在較大的振蕩幅度，而M僅在數(shù)據(jù)Spambase和Sonar之間出現(xiàn)微小的振蕩，說明二者的識別難度相當(dāng)，而平均識別率的統(tǒng)計誤差導(dǎo)致了這一現(xiàn)象。

相較于依賴大量模型統(tǒng)計識別結(jié)果的錯誤率指標(biāo)，所提度量M獨立于模型識別過程，對數(shù)據(jù)固有可分特性描述更加本原，度量值更加客觀。此外在計算量上M相較對比方法也具備突出的優(yōu)勢，對于具有m個樣本的n維數(shù)據(jù)，M的計算量在于兩次協(xié)方差陣行列式的計算，協(xié)方差陣的規(guī)模為n×n，當(dāng)m>>n時如表3數(shù)據(jù)Magic，對比方法則需要建立19020×19020的距離矩陣而帶來巨大的存儲負擔(dān)，且導(dǎo)致運算效率低下，M則只需要計算兩次10×10規(guī)模矩陣的行列式，在存儲空間和運行時間上都大大優(yōu)于對比方法。

5.3 基于可分性度量的識別網(wǎng)絡(luò)特征質(zhì)量評估實驗

深度學(xué)習(xí)識別模型具有提取數(shù)據(jù)高維可分特征的能力，本節(jié)實驗首先探究深層卷積神經(jīng)網(wǎng)絡(luò)中，隨著網(wǎng)絡(luò)層次的加深及訓(xùn)練輪次的迭代，各卷積層所提取特征可分性與模型識別率相對應(yīng)的變化趨勢特點，從特征可分性角度定量化解釋神經(jīng)網(wǎng)絡(luò)有效工作的原因。進一步地，本節(jié)將所提可分性度量作為網(wǎng)絡(luò)損失函數(shù)的一部分，優(yōu)化網(wǎng)絡(luò)學(xué)習(xí)到的特征質(zhì)量，探究特征可分性對提升網(wǎng)絡(luò)識別性能的實質(zhì)性作用。

本節(jié)采用合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像數(shù)據(jù)集，包含標(biāo)準(zhǔn)工作條件下的MSTAR數(shù)據(jù)集[33]和復(fù)旦大學(xué)發(fā)布的FUSAR數(shù)據(jù)集[32]。其中本文構(gòu)造的三分類FUSAR數(shù)據(jù)集包含樣本量較多的貨船、漁船和其余船只目標(biāo)，3類船只包含相同的訓(xùn)練集樣本量，以保證訓(xùn)練過程的類平衡性。表4總結(jié)了SAR數(shù)據(jù)集相關(guān)參數(shù)。

表4 SAR圖像數(shù)據(jù)集Tab.4 SAR image datasets

本節(jié)首先在MSTAR數(shù)據(jù)集上評估文獻[34]提出的卷積神經(jīng)網(wǎng)絡(luò)模型，網(wǎng)絡(luò)結(jié)構(gòu)及可分性分析模塊如圖15所示。其中原始SAR圖像經(jīng)過4個卷積模塊映射到可分的特征空間，為了減小可分性分析的計算量，在張量展開步驟之前對映射特征統(tǒng)一采用了2 ×2的自適應(yīng)平均池化操作，最終各層得到的特征維度分別是64,128,256及512維。網(wǎng)絡(luò)在MSTAR測試數(shù)據(jù)集上的識別率acc如圖16所示，經(jīng)卷積模塊所提取特征的可分性度量結(jié)果分別如圖17所示，圖17由左至右分別是模塊1至模塊4提取特征可分性分析結(jié)果和各層可分性對比結(jié)果，由上至下分別對應(yīng)Density,DSI,LSC,N2,M度量方法。

圖16 網(wǎng)絡(luò)在MSTAR數(shù)據(jù)上的識別準(zhǔn)確性能Fig.16 Recognition accuracy performance of the network on MSTAR datasets

圖17 MSTAR數(shù)據(jù)集特征可分性度量結(jié)果Fig.17 Feature separability measure results for MSTAR dataset

由圖16僅能得出網(wǎng)絡(luò)在MSTAR測試數(shù)據(jù)上以較少的訓(xùn)練輪次就達到了較高的識別率，但無法從中解釋神經(jīng)網(wǎng)絡(luò)有效工作的具體原因，因此將各模塊提取特征可分性評估引入識別評估過程。圖17可以得出模型之所以在輸出端表現(xiàn)出優(yōu)異的識別性能是由于組成神經(jīng)網(wǎng)絡(luò)的各個模塊都提取到了逐漸可分的目標(biāo)潛在特征，在實驗現(xiàn)象上表現(xiàn)為隨著網(wǎng)絡(luò)深度的增加，所提取特征均呈現(xiàn)越來越可分的趨勢，數(shù)值上有ML1>ML2>ML3>ML4，并且隨著迭代輪次的增加，特征可分性漸高，預(yù)示著識別率的提升；特征可分性收斂，預(yù)示著識別率的飽和。圖17同時比對了本文所提方法與對比方法對特征可分性的度量結(jié)果。Density的度量性能最差，隨著訓(xùn)練輪次的增加，各層度量值呈現(xiàn)發(fā)散的趨勢，且無法區(qū)分第2～4層特征可分性優(yōu)劣；其余方法均能夠區(qū)分各層特征可分性的優(yōu)劣，數(shù)值上表現(xiàn)為DSIL1>DSIL2>DSIL3>DSIL4,LSCL1>LSCL2>LSCL3>LSCL4,N2L1>N2L2>N2L3>N2L4，可以體現(xiàn)越深層網(wǎng)絡(luò)提取的特征越可分，但所提度量M相比對比方法具有更加平滑的收斂趨勢，且各層可分性度量值的數(shù)量級差距更大，說明M對特征可分性的變化更為敏感。從模型性能優(yōu)化的角度，將M作為損失函數(shù)的一部分，迭代過程中同時優(yōu)化特征可分性，能夠快速引導(dǎo)模型學(xué)習(xí)到更加可分的特征，從而提高模型識別性能。

進一步地，本節(jié)在文獻[35]提出的骨干網(wǎng)絡(luò)中加入特征可分性度量損失，在FUSAR數(shù)據(jù)集上探究所提可分性度量對網(wǎng)絡(luò)識別性能提升的實質(zhì)性作用。帶有特征可分性度量約束的卷積神經(jīng)網(wǎng)絡(luò)組成如圖18，其中包含用于特征提取的卷積模塊、卷積注意力模塊(Convolutional Block Attention Module,CBAM)、全連接模塊，用于特征融合的平均特征融合模塊，以及用于評估特征質(zhì)量的特征可分性評估模塊。網(wǎng)絡(luò)損失函數(shù)由評估預(yù)測標(biāo)簽與真實標(biāo)簽差距的交叉熵損失和評估特征質(zhì)量的可分性損失構(gòu)成?？紤]到識別性能與網(wǎng)絡(luò)各層特征及融合層特征都密切相關(guān)，故損失函數(shù)L有式(17)與式(18)兩種方案。

圖18 特征可分性度量約束下的卷積神經(jīng)網(wǎng)絡(luò)Fig.18 Convolutional neural networks with feature separability constraints

其中，LLabel表示交叉熵損失，Mfi,Mfavg的形式如式(11)，分別表示第i個特征提取模塊的特征fi與平均特征favg的可分性度量，favg為fi(i=1,2,...,5)的平均值，α,β為可調(diào)比例系數(shù)。式(17)與式(18)兩種訓(xùn)練方案在訓(xùn)練集上交叉熵損失表現(xiàn)如圖19，在測試集上的識別率表現(xiàn)如圖20。

圖19 訓(xùn)練集上交叉熵損失表現(xiàn)Fig.19 Cross-entropy loss performance on the training set

圖20 測試集上的識別率表現(xiàn)Fig.20 Accuracy performance on test set

圖19中，α=β=0表示訓(xùn)練時不加特征可分性約束的基準(zhǔn)網(wǎng)絡(luò)在訓(xùn)練集上的損失函數(shù)表現(xiàn)，可以看到隨著可分性比例系數(shù)α或β逐漸增加，訓(xùn)練集上的交叉熵損失以更快的速度收斂到了更低的值，增強了對訓(xùn)練數(shù)據(jù)預(yù)測標(biāo)簽與真實標(biāo)簽之間的擬合效果。此外對比方案1與方案2的性能，當(dāng)α或β均較小時，二者性能相當(dāng)，交叉熵損失曲線基本重合；隨著α與β逐漸增加，相同比例系數(shù)的方案2相較方案1對訓(xùn)練集具有更好的擬合效果。圖20展現(xiàn)了兩種方案在測試集上的識別率表現(xiàn)，可以看到當(dāng)α或β取0.01,0.10或0.25時，識別率曲線在訓(xùn)練初期(10～30輪次)能夠相較基準(zhǔn)網(wǎng)絡(luò)達到更高的識別率，且α或β越大，提升效果越明顯。當(dāng)α或β取0.50時，識別率曲線出現(xiàn)了明顯的振蕩，但在整個訓(xùn)練過程中最高識別率相對基準(zhǔn)網(wǎng)絡(luò)仍有明顯的提升。此外對比兩種方案的性能，方案1在α=0.50時，第37輪達到了82.36%的識別率，方案2在α=0.25及α=0.50時分別在第37輪及第98輪達到了80%的識別率。而在訓(xùn)練的收斂階段(60～100輪次)，方案1相較方案2在α=β=0.50時能夠相較基準(zhǔn)網(wǎng)絡(luò)有明顯的識別率提升。上述表明方案1在測試集上的泛化性能優(yōu)于方案2，將網(wǎng)絡(luò)各層特征可分性度量作為損失函數(shù)的一部分對特征可分性加以約束，能夠優(yōu)化網(wǎng)絡(luò)訓(xùn)練過程，并且改善網(wǎng)絡(luò)在測試集上最終的識別率表現(xiàn)。表5給出不同α與β數(shù)值下的兩種方案在測試集上最優(yōu)識別率表現(xiàn)，對應(yīng)給出訓(xùn)練集上的識別率。其中隨著α或β的增加，訓(xùn)練集識別率均有不同程度的提升，方案1在訓(xùn)練集上擬合性能雖稍劣于方案2，但其在測試集上泛化性能明顯優(yōu)于方案2，具體表現(xiàn)在方案2β=0.50的測試識別率相對基準(zhǔn)網(wǎng)絡(luò)約有0.91%的提升，方案1α=0.50時則有3.27%的提升。

表5 不同可分性系數(shù)下最優(yōu)識別率表現(xiàn)(%)Tab.5 Optimal accuracy performance with different separability factors (%)

此外可分性度量對網(wǎng)絡(luò)識別性能的提升不僅體現(xiàn)在識別率上，還體現(xiàn)在其能夠引導(dǎo)網(wǎng)絡(luò)提取到更可分的特征。從可視化的角度分析特征可分性，本節(jié)采用樣本間余弦相似度矩陣及t分布隨機近鄰嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)，其中余弦相似度矩陣圖的行列表示樣本索引，已按照樣本所屬類別排序，兩個樣本余弦相似度越大表示二者越相似。圖21與圖22分別給出表5中基準(zhǔn)網(wǎng)絡(luò)與α=0.50的可分性約束網(wǎng)絡(luò)最終層提取特征的樣本間余弦相似度矩陣及t-SNE圖?？梢钥吹较鄬鶞?zhǔn)網(wǎng)絡(luò)，α=0.50時訓(xùn)練集和測試集上類內(nèi)樣本余弦相似度都有顯著的提升，而類間樣本余弦相似度雖然在第37輪迭代中沒有理想的下降趨勢，但在圖21(b)的訓(xùn)練集中其數(shù)值顯著小于類內(nèi)相似度，相較圖21(a)，類間與類內(nèi)相似度比值存在下降趨勢，從而提升了特征可分性。而圖21(d)測試集上的可分性改善還在一定程度上受其與訓(xùn)練集模板相似度的影響，因此對特征可分性優(yōu)化效果不如圖21(b)顯著。由于t-SNE降維方法傾向于聚合相似度較高的樣本，圖21也表明加入可分性損失后，類內(nèi)樣本相似度普遍高于類間樣本，因此在圖22(b)與圖22(d)中更為相似的類內(nèi)樣本優(yōu)先被聚合，從而表現(xiàn)出更高的類內(nèi)聚集形式以及更加清晰的理想決策邊界。通過本實驗表明所提度量能夠有效地衡量網(wǎng)絡(luò)提取特征變化趨勢，將特征可分性度量作為網(wǎng)絡(luò)損失函數(shù)的一部分進行優(yōu)化，能夠快速引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)到更可分的特征，從而提升識別性能。

圖21 最終層輸出特征樣本間余弦相似度矩陣Fig.21 The cosine similarity matrix between feature samples output from the final layer

圖22 最終層輸出特征t-SNE圖Fig.22 The t-SNE visualization of the feature output from the final layer

6 結(jié)論與展望

數(shù)據(jù)可分性度量為分析和評估識別模型性能提供了一種基準(zhǔn)，在賦予了數(shù)據(jù)可分性的條件下，更能客觀地評價識別模型性能。本文基于率失真理論構(gòu)建可分性度量模型，其描述了數(shù)據(jù)整體分布散度與類內(nèi)分布散度的相對關(guān)系，綜合了樣本分布在各個正交特征維度的可分性信息。實驗表明，設(shè)計的度量方法通過結(jié)合高斯混合模型能夠衡量非高斯數(shù)據(jù)可分度；所提度量可以比較具備不同維度的數(shù)據(jù)集可分性優(yōu)劣，其數(shù)值與經(jīng)不同模型統(tǒng)計得到的平均識別率有強相關(guān)性，能夠作為數(shù)據(jù)識別難度的量化值，為識別結(jié)果預(yù)先提供評判基準(zhǔn)；并且能夠評估神經(jīng)網(wǎng)絡(luò)各卷積模塊提取可分特征的貢獻度，在測試階段作為網(wǎng)絡(luò)提取可分特征的評估指標(biāo)，在訓(xùn)練階段作為網(wǎng)絡(luò)提取可分特征的優(yōu)化指標(biāo)。

本文是對數(shù)據(jù)可分性研究的初步探索，仍有許多值得進一步深入開展的研究工作，包括針對具體識別任務(wù)特性與考慮數(shù)據(jù)更多分布特性的可分性度量設(shè)計，探究可分性度量與識別性能上限的對應(yīng)關(guān)系，解釋識別網(wǎng)絡(luò)各層特征可分性之間的關(guān)聯(lián)等。總的來說，數(shù)據(jù)可分性度量作為直接面向數(shù)據(jù)的評估指標(biāo)，與面向模型的準(zhǔn)確性指標(biāo)相結(jié)合，為雷達目標(biāo)識別評估提供了一個新的評估視角，對識別模型實用化改進具有指導(dǎo)性意義。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡