張 坤, 邸 憶,2, 顧曉輝
(1.南京理工大學 機械工程學院,南京 210094; 2.武昌理工學院 信息工程學院,武漢 430223)
坦克與直升機是現(xiàn)代地面戰(zhàn)爭中主要的突擊力量,近年來,采用聲目標探測識別技術對其進行識別被廣泛應用[1]。對戰(zhàn)場聲目標的特征提取是聲目標識別技術中的關鍵步驟,具有良好區(qū)分度的特征有助于簡化分類器的設計,提高目標識別率。同時兩者的聲信號表現(xiàn)出非平穩(wěn)、非線性、短時、強噪聲的特點增加了特征提取的難度,所以對戰(zhàn)場聲目標的特征提取的研究具有重要意義。
傳統(tǒng)的識別方法是針對信號的時域與頻域進行特征提取來進行識別[2]。為表征信號的非線性行為,可采用分形維數進行描述[3-6]。文獻[7]就采用分形維數對戰(zhàn)場聲目標進行了特征提取的研究,說明了該方法的可行性。但在實際應用中單一的分形維數只能從整體來反映信號的不規(guī)則性,而多重分形維數可以精確的體現(xiàn)信號的局部奇異性[8]。計算多重分形維數的方法一般運用盒計數法,該方法采用了規(guī)則的網格劃分,這會造成一定的計算誤差,且計算量較大[9]。文獻[10]提出了一種基于數學形態(tài)學計算多重分形維數的方法,該方法無需網格劃分,運用形態(tài)學的結構元素進行覆蓋,具有精度較高,便于實現(xiàn)等優(yōu)點,因此在齒輪運動狀態(tài)的識別中取得了良好的效果。然而將上述方法應用于戰(zhàn)場聲目標識別時發(fā)現(xiàn),不同類目標聲信號的分形維數特征區(qū)分度不明顯,目標識別精度較低。
為了能夠快速提取的聲目標的有效特征參量,本文在已有的形態(tài)學多重分形維數計算方法的基礎上提出了一種基于雙維度變化的數學形態(tài)學多重分形計算方法。為達到改變原有計算方法得到的分形維數偏小的問題,使尺度在時間與幅值上均發(fā)生改變,重新定義了配分函數,同時引入回歸分析對分形尺度與本文所提的分配函數進行擬合,保證了兩點法求斜率作為分形特征的準確性,再以運算速度與識別率為標準,篩選出最優(yōu)的兩個尺度直接計算多重分形維數。半實物仿真試驗驗證了本文所提方法得到的多重分形維數結果更符合分形理論的要求,且計算效率較已有算法有了明顯提升,同時將本文算法和文獻[10]算法運用于戰(zhàn)場聲目標的特征提取與識別,在相同條件下,本文算法提取的特征具有更高的識別率。
信號的多重分形是用譜函數來描述信號的不同層次的分形特征,計算多重分形譜的過程較復雜,一般采用配分函數法進行定義[11]。在尺度ε下,沿時間軸將信號劃分為單位長為ε的信號段,第i段信號的幅值之和為si(ε),所有幅值之和為∑si(ε),得第i段信號的配分函數為
(1)
假設信號被分為N段,在尺度ε下,由廣義維數方法得到譜函數的表達式為
(2)
多重分形維數定義為
(3)
當q=0時為容量維數
(4)
當q=1時為信息維數
(5)
當q=2時為關聯(lián)維數
(6)
由此可見,多重分形維數涉及了分形理論大部分分形維數。它的引入在一定程度上彌補了單重分形維數只能從單一測度描述信號的缺點,使信號的分形特征得到了拓展,能從多個測度對信號進行描述,為分形學應用于時間序列的信號處理提供了理論基礎[12-13]。同時多重分形維數計算主要涉及加減運算,乘除運算很少,為實現(xiàn)信號的快速處理提供了一種極佳選擇。
數學形態(tài)學方法的基本思想是用一定形態(tài)的結構元素去度量信號。在保證信號基本形態(tài)不變的前提下,用結構元素覆蓋信號,從而去除信號中的細節(jié)得到簡化的數據,使用的結構元尺度越小,得到信號細節(jié)的就越豐富。分形維數的估計方法也是在不同尺度下對信號進行的一種度量,因此數學形態(tài)學就提供了一種極佳的求解分形維數的方法[14]。但一般基于數學形態(tài)學計算多重維數,尺度僅在信號幅值域變化,當信號長度較大時,會導致計算的配分函數差異不明顯,未能達到尺度變化后,度量也發(fā)生變化的要求,求出的多重分形維數也就無法反映信號的非線性特征。本文提出在時間域與幅值雙維度尺度進行變化,就可以解決該問題,更好的反映出信號的非線性特征。
數學形態(tài)學的基本運算包括腐蝕與膨脹。設f(n)和g(m)分別定義在F={0,1,2,…,N-1}和G{0,1,2,…,M-1}上的離散函數,且N?M。f(n)為輸入信號,g(m)為結構元素。
則f(n)關于g(m)的腐蝕定義為
(7)
則f(n)關于g(m)的膨脹定義為
(8)
腐蝕與膨脹運算具有信號濾波的作用,一般腐蝕運算減小了信號的峰值,填補了信號的谷底;膨脹運算擴大了峰頂,增大了信號谷值。采用這兩種運算可構筑信號的輪廓線,從而完整覆蓋信號,為分形維數的計算提供基礎[15]。
假設離散信號f(n),n=1,2,…,N,單元結構元素定義為g,在尺度ε下所用結構元素定義為
(9)
則信號在尺度ε下的形態(tài)覆蓋面積Ag(ε)為
(10)
對信號完成形態(tài)學覆蓋后,根據多重分形的定義,關鍵在于分配函數的計算方法。文獻[10]提出的配分函數Pi(ε)定義為
(11)
式中:f⊕εg(n)-fΘεg(n)相當于對f(n)的離散值進行覆蓋,作用如同單個網格上的盒子數。根據式(2)與式(3),利用最小二乘法擬合數據點(lnε,Kq(ε)),其斜率即為多重分形維數Dq(ε)。該種方法在計算每個尺度下的分配函數時,項數與信號數據量相同,信號數據量較大時,Pi(ε)會很小,且隨尺度的變化不夠明顯,這會造成計算出的分形維數失真。
本文提出的改進方法主要是配分函數的算法與文獻[10]的不同。借鑒盒計數法的思想,在對信號進行形態(tài)學覆蓋后,每次計算配分函數的項數也應隨尺度的變化而變化,即在時間維度與幅值維度均進行變化。膨脹與腐蝕運算完成對幅值域的變化,根據尺度確定配分函數個數即對時間域的變化。這兩種變化同步進行,相較原方法中僅有信號幅值發(fā)生尺度變化,每次的變化程度更大。隨著尺度越大,對信號的描述就越粗略,配分函數的項數就越少。相對于原方法配分函數個數不變,得出分形維數精度更高。定義的基于雙維度變化的配分函數(Double Dimensions Changed Distributed Function, DDCDF)為
(12)
則譜函數變?yōu)?/p>
(13)
即計算的“盒子”不僅在幅值上隨尺度變化,在時間軸上也隨著尺度變化,改變了文獻[10]方法中尺度僅沿幅值變化的狀況。但尺度選擇上應滿足N/ε為正整數的關系。采用該種算法可將文獻[10]算法中較多的乘除運算改為加法運算,大大減少了運算量,也更符合分形中尺度變化的思想。同時解決了當信號長度較大時,計算的分形維數不能夠反映出信號非線性的問題。計算出分配函數Pi(ε)與譜函數Kq(ε)后,就可由式(3)得到多重分形維數Dq。
在利用式(3)計算多重分形維數時,多采用最小二乘法擬合,然后計算擬合直線的斜率,作為多重分形維數Dq的結果。本文通過對數據進行線性回歸證明與相關性檢驗說明譜函數Kq(ε)與尺度lnε滿足極好的線性關系,為選取其中兩點直接計算(lnε,Kq(ε))的斜率奠定了數據與理論基礎。再以運算速度與目標識別率為標準,篩選了最優(yōu)的兩個尺度作為擬合直線的兩點,直接計算斜率作為多重分形維數。
為說明本文方法的可行性與有效性,進行了半實物的仿真試驗。圖1所示為原理圖,四個相同的聲傳感器S1,S2,S3,S4均勻布置在半徑為25 cm的圓盤平臺上,聲源距圓盤圓心處距離為333 cm。
圖1 聲信號采集原理示意圖Fig.1 Schematic diagram of acoustic collection
聲源及裝置均保持靜止。采用PXI數據采樣系統(tǒng)對聲信號進行采集,采樣頻率為20 kHz,量程-4~+4 V。實物圖如圖2所示。
圖2 聲信號采集裝置實物圖Fig.2 Acoustic collected platform
利用該裝置采集坦克與直升機聲目標,測量信號的長度均為1 024個采樣點,信號在處理前經過了調理電路進行了濾波預處理,所得的坦克與直升機的聲信號與頻譜如圖3所示。
圖3 聲信號時域與頻域圖Fig.3 Acoustic signals and frequency spectrum
通過兩種聲音的頻譜圖可知,坦克與直升機聲的主要能量集中約在0~3 000 Hz,同時直升機聲較坦克聲有著更多高頻分量,這在時域圖上的表現(xiàn)是振動的幅度和頻率較大,這也為利用多重分形對兩種信號進行特征提取提供了基礎。
以一組坦克聲信號為例,說明改進的數學形態(tài)學多重分形維數計算方法。運用數學形態(tài)學方法估計分形維數時,關鍵在于單位結構單元的選取與尺度的選擇。為減小運算量且提高覆蓋信號的質量,結構元素選擇扁平結構g={0,0,0},在尺度選擇上,需要進行線性擬合,為減小計算量,尺度采用離散化取值,最大的取值不超過信號長度的一半,但所取值須能被信號長度整除,以保證計算的精度。由于信號樣本長度均為1 024,為滿足N/ε為正整數,則尺度ε∈[2,4,8,16,32,64,128,256,512]。對信號進行形態(tài)學覆蓋,圖4為選取尺度為8與16的結構元素對一組典型的坦克聲與直升機聲信號進行了形態(tài)學覆蓋。
圖4 兩種聲信號形態(tài)學覆蓋圖Fig.4 Morphological cover of the two kinds of signals
對信號進行形態(tài)學覆蓋后,根據式(12)與式(13)計算配分函數Pi(ε)與譜函數Kq(ε),q=2,3,…,10,表示為譜函數中的指數。為證明Kq(ε)與lnε的線性關系首先需要對回歸方程的顯著性進行檢驗[16],再進行相關分析說明兩個變量的相關程度。引入回歸系數β,檢驗統(tǒng)計量Fq(ε),將(lnε,Kq(ε))經最小二乘法擬合得
(14)
(15)
根據統(tǒng)計學原理,假設:β=0則
Fq~Fα(1,n-2)
(16)
式中:α為顯著性水平,一般令α=0.01,因為樣本點(lnε,Kq(ε))個數為9則得臨界值為
F0.99(1,7)=12.2
(17)
若Fq≥F0.99(1,7),則可認為線性回歸效果顯著。通過回歸檢驗,需對兩個變量進行相關檢驗,引入總體相關系數γq與樣本相關系數rq分別表示當譜函數指數中q為時的相應統(tǒng)計量,滿足式(18)
(18)
rq的計算公式與γq相同,由于樣本相關系數rq是總體相關系數γq的一致估計量,能否真實表現(xiàn)變量總體的相關情況受到隨機因素于樣本總量的影響,故需對其檢驗??傮w相關系數的檢驗統(tǒng)計上用t檢驗。
假設:τq=0則
(19)
當總體相關系數為0時,統(tǒng)計量t1服從t分布。一般設顯著性水平α=0.01,因為樣本點(lnε,Kq(ε))個數為9則
tα/2(9-2)=3.499
(20)
若tq>tα/2(7)則認為rq通過了顯著性檢驗,可認為lnε與Kq(ε)滿足線性關系。
選取坦克與直升機聲信號各60組,分別計算了這120組聲信號的Fq值與tq值,發(fā)現(xiàn)均滿足Fq≥F0.99(1,7)與tq>tα/2(7),且遠遠大于條件值,說明(lnε,Kq(ε))滿足良好的線性關系。隨機選取其中5組聲信號的Fq與tq,如表1和表2所示。
以表1以及表2中的聲信號1為例,當q=2,3,…,10時,統(tǒng)計量最小為F10=3 617.86,t10=60.15均遠大于條件值F0.99(1,7)與tα/2(7),說明通過聲信號1計算得到的(lnε,Kq(ε))滿足線性關系,使用兩點直接計算斜率仍能保證很高的擬合精度。同樣地,其他聲信號的Fq和tq計算結果均表現(xiàn)出了較高的擬合精度,故可選擇其中的兩點來計算這120組聲信號的改進的多重分形維數。
表1 5組聲信號的Fq值
表2 5組聲信號的tq值
由此分析可知:ε∈[2,4,8,16,32,64,128,256,512],則一共應有36種組合。為篩選出最優(yōu)的尺度組合,以計算所得多重分形維數為特征輸入,利用支持向量機進行兩種聲目標的識別,選取60組聲信號作為訓練集,另外60組作為測試集,分別比較這36個組合的識別率與計算速度,根據需要選擇識別率高,運算速度相對較快的一組。其識別率以及運算速度(指計算10組信號多重分形維數的時間),如圖5所示。
圖5 不同尺度組合下的運算時間與識別率Fig.5 The computing times and recognized rates of the different scale groups
由圖5選取運算時間在0.6 s以下,而識別率在85%以上的為最優(yōu)組合,其中當ε=[16,256]時為最優(yōu)解。此時用時為0.57 s,識別率為90%。選取坦克與直升機聲信號各10組采用本文提出的改進快速算法,選擇尺度為ε=[16,256],計算這20組聲信號的多重分形維數,并與文獻[10]的方法進行比較,提取的多重分形維數譜圖如圖6、圖7所示。
圖6 本文方法(DDCDF)提取的多重分形維數Fig.6 Multifractal dimension calculated by DDCDF
由圖6可知,坦克聲信號的多重分形維數基本大于直升機的多重分形維數,但中間仍有少許混雜。采用文獻[10]的方法得出兩者的多重分形維數混雜較為嚴重,且求出的值較小均為負值,而本文提出的算法計算的多重維數基本在[0.8,1],更利于后續(xù)的目標識別。本文方法較文獻[10]最大優(yōu)勢在于運算速度的提高。為了適應計算機的運算,文獻[10]算法中選擇的尺度為ε=[2,4,8,16,32,64,128,256],需要進行8次形態(tài)覆蓋,又因為信號長度為1 024,計算配分函數需要1 024次除法,則計算一組信號的維數就需要次除法運算。本文方法選擇了ε=[16,256],只需兩次形態(tài)學覆蓋,同時計算分配函數時需要2 048次加法運算和69次除法運算,則文獻[10]方法計算復雜度為O(4m×n),本文方法為O(m×n),計算120組聲信號的多重分形維數,本文方法用時5.16 s,而文獻[10]的算法需用時21.41 s,在運算效率上有了明顯提升。
圖7 文獻[10]提取的多重分形維數Fig.7 Multifractal dimension proposed by article [10]
為比較本文算法與文獻[10]算法提取的特征用于戰(zhàn)場聲目標識別的差異,選取直升機與坦克聲信號各120組,分別用本文方法與文獻[10]的方法提取的多重分形維數作為聲音識別的特征,采用支持向量機進行識別,其識別結果如表3所示。
表3 兩種方法識別結果比較
由表可見采用本文方法在兩類目標識別上均要遠遠優(yōu)于文獻[10]的方法,且直升機聲的識別率達到了93.4%。通過以上比較可知,本文提出的改進方法在戰(zhàn)場聲目標識別方面從運算速率與識別精度上均要優(yōu)于文獻[10]提出的方法,總識別率高了23.5%。
(1)本文提出了一種基于雙維度變化的形態(tài)學多重分形計算方法,并運用于戰(zhàn)場聲目標識別。為減少運算量使結果更精確,重新定義了配分函數,使時間與幅值兩個維度都可進行改變,相較之前僅在幅值域上改變,更符合分形維數計算的理論要求。
(2)分形維數實質為(lnε,Kq(ε))擬合直線的斜率,本文使用線性回歸的理論證明了擬合直線的精度很高,可由兩點直接計算斜率而保證精度。再以運算速度與識別率為標準,篩選出最優(yōu)的兩個尺度直接計算多重分形維數。減少了形態(tài)學覆蓋的次數,進一步減少了運算量。
(3)在半實物仿真實驗中,運用本文提出的改進算法與文獻[10]提出的形態(tài)學分形計算方法在計算速度與聲目標識別率上進行了對比,結果表明,本文方法計算復雜度為O(m×n),文獻[10]方法計算復雜度O(4m×n),而識別率上比文獻[10]的方法高了23.5%。該種算法主要涉及加減運算,也適用于硬件實現(xiàn),為戰(zhàn)場聲目標識別的應用提供了一種更為有效的方法。