廖明熙,張小薊,張 歆
(西北工業(yè)大學航海學院,陜西 西安 710072)
一直以來,水下目標識別與分類算法是水下艦船噪聲信號處理研究的重點及難點,其主要方法是通過艦船的發(fā)動機噪聲來判斷艦船的類別。在水下目標識別特征提取方法的研究中,有眾多的特征提取方法[1]:功率譜分析理論[2]、小波及小波包理論[3]、HHT 變 換 方 法、MFCC 方法。其 中 基 于HHT變換具有比較好的特征識別效果[4-5]。
這些特征提取與分類識別算法都是使用原信號,受限于水聲系統(tǒng)的帶寬,必須先將數(shù)據(jù)保存在水聲設備中,然后將信號傳輸?shù)降孛嬲具M行處理,給實際應用帶來不便。因此如何降低數(shù)據(jù)量,并進行實時處理成為水聲信號特征提取及分類識別的新方向。2006年Candès等提出了壓縮感知(Compressed Sensing,簡稱CS)理論[6-7],該理論的本質(zhì)內(nèi)容是稀疏或可壓縮信號的少量隨機的線性投影即包含了重構(gòu)和處理的足夠信息,也就是僅僅利用信號稀疏或可壓縮的先驗和少量的全局線性測量可以獲得精確的信號重建,該理論被美國科技評論評為2007年度十大科技進展。而一般的語音信號在DCT基下是可稀疏的[8-9],滿足壓縮感知理論要求,能夠?qū)崿F(xiàn)精確重構(gòu)。因此信號的稀疏表示必然包括信號的所有特征信息,因此使用稀疏表示作為信號特征在理論上可行,并且能夠減輕數(shù)據(jù)處理任務。
本文提出將CS理論中稀疏表示作為艦船噪聲信號的特征向量,然后使用支持向量機(SVM:Support Vector Machine)分類方法進行分類識別,仿真結(jié)果表明該方法與傳統(tǒng)特征提取方法相比,不僅速度得到了大幅度的提高,而且有效提高了識別率。
壓縮感知理論指出,如果一個信號是稀疏的,或者在某個變換域內(nèi)是稀疏的,那么就可以使用一個與變換基不相關的觀測矩陣將稀疏的高維信號“壓縮”成低維信號,并且如果稀疏滿足一定的條件,還可以通過“壓縮”之后的低維信號恢復成原信號[10-11]。
設空間R存在長度為N的列向量x∈R,且信號中是K稀疏的,即信號中只有K個系數(shù)不為零或明顯大于其他系數(shù),且滿足K≤N。用矩陣表示:
y稱之為x的感知值,長度為M(M<N)的列向量,稱之為測量自然數(shù),Φ為M×N的測量矩陣。
但是在實際當中,這樣稀疏的信號并不常見,經(jīng)過研究發(fā)現(xiàn),如果一個信號在某種正交變換下是稀疏的,那它同樣也適用于壓縮感知理論,用矩陣表示:
其中Ψ′表示正交基變換(N×N),α為稀疏系數(shù),即信號x經(jīng)過正交變換之后是稀疏的。經(jīng)過大量的實驗研究,得到一個更廣泛的結(jié)論,即如果一個信號在過完備字典下是稀疏的,則該信號同樣滿足壓縮感知理論,用矩陣表示:
D為冗余字典,α稱之為信號x在字典D下的稀疏表示。這個結(jié)論將使得非常多的信號都適用于壓縮感知理論。
大多數(shù)的信號本身是不稀疏的,而語音信號在離散余弦DCT(discrete cosine transform)域上有著近似稀疏性[8],DCT有很強的能量聚焦作用,艦船噪聲的高頻分量很小,根據(jù)實驗,發(fā)現(xiàn)艦船噪聲在DCT基下近似稀疏,將DCT系數(shù)取絕對值并排序得到系數(shù)分布,如圖1所示。
圖1 水聲信號DCT系數(shù)分布Fig.1 The signal DCT coefficient distribution
從圖1可以看出,水聲信號在DCT字典下是近似稀疏的。對于數(shù)字序列信號x(n),n=0,1,…,N-1,其DCT變換如式(4):
其中DN是大小為N×N的DCT變換矩陣,也就是DCT字典。
水聲信號在DCT字典下是近似稀疏的,為了能夠在DCT字典下嚴格稀疏,需要對DCT字典進行稀疏訓練。這里使用 K-SVD 算法[8-9]。K-SVD 算法模型:
化簡得:
其中,Y= {yi|i∈ [1 ,M ],yi∈Rn}為需要進行稀疏表示的信號集,X={xi}為稀疏系數(shù),K為稀疏度。得到稀疏化之后的字典D。K-SVD使用算法求解稀疏字典具體計算步驟如下:
1)字典為DCT字典。在信號集中隨機選取M個信號樣本組成初始信號集Y;
2)固定D,求解X,這是一個SR的實現(xiàn)過程,在K-SVD算法中,使用OMP算法實現(xiàn);
3)根據(jù)已經(jīng)求得的X,求解D,對Ek使用SVD分解,求解dk,依次更新D中所有的列。
4)循環(huán)步驟2),步驟3),重復迭代,得到稀疏化之后的冗余字典D。
根據(jù)以上算法得到稀疏化之后的冗余DCT字典,從而可以通過計算得到艦船噪聲信號在DCT冗余字典下進行的稀疏表示。即求解式(5)中的α:
由于信號長度是N,字典尺寸為M×N,M<N,因此該算法是個NP-h(huán)ard問題,常用的求解算法有基追蹤(BP)[12]、匹配追蹤法(MP)[13]和正交匹配追蹤法(OMP)[14]。結(jié)合 OMP的速度優(yōu)勢,這里采用OMP算法,求解問題如式(9)所示:
其中D= {di|i=1,2,…,M },是已知的字典,X= [x1,x2,…,xN]是待求解系數(shù)信號,OMP算法[14]是針對基于最小化l0范數(shù)問題而提出來的。
OMP算法步驟如下:
1)初始化殘差r0=y(tǒng),索引集Λ0為空集,t=1。
2)找出信號殘差rt和字典列dj內(nèi)積中最大值所對應的下標λ,即:
3)更新索引集Λt=Λt∪{λt},記錄找到的字典中的重建原子集合:
5)更新信號殘差
6)t=t+1,判斷是否滿足t>K,若滿足,則停止迭代,否則循環(huán)步驟二到步驟五。得到的Λ即為所求字典D,而α為所求稀疏表示系數(shù)。
經(jīng)過仿真實驗發(fā)現(xiàn),稀疏字典的計算時間tdic與測量次數(shù)M成正比,如圖2所示。
從K-SVD計算算法當中不難看出M的增長計算的復雜度是近似線性增長的。
圖2 測量次數(shù)M對tdic的影響Fig.2 The impact on tdicof measurements M
從壓縮感知理論體系中可知,如果一個信號在某個變換域是稀疏的,則信號的稀疏表示必然包含了原信號的大部分信息。所以不同類型的艦船噪聲信號的稀疏表示必然不一樣,因此可以將稀疏表示直接作為特征向量進行分類。根據(jù)稀疏表示中的K個非0系數(shù)這個特點,非常適合使用SVM分類器進行分類。具體步驟如下:
1)生成樣本集:三類實際艦船噪聲信號A、B、C。按長度 N 組成樣本集:XA、XB、XC。
2)設計DCT冗余字典:初始化DCT字典,尺寸為M×N,初始化的訓練信號集為A、B、C三類樣本集中任選M個樣本數(shù)。由于本文著重分類,不對信號進行重構(gòu),因此稀疏度K可任選,然后使用K-SVD算法進行訓練得到稀疏化的DCT冗余字典D。
3)求解稀疏系數(shù):使用OMP算法對XA、XB、XC三類樣本集中每個樣本求解系數(shù),得到系數(shù)集αA、αB、αC。
4)特征提?。簩A、XB、XC三類樣本中除去M個用于訓練字典的樣本,然后進行特征提取。使用文獻[4]中提到的方法,提取信號的EMD頻譜峰值,組成特征樣本集TA、TB、TC。
5)訓練分類模型:在XA、XB、XC與αA、αB、αC各類樣本集中,隨機抽取P個樣本構(gòu)成訓練集,進行SVM訓練,得到分類模型。
6)分類識別:在剩下的XA、XB、XC以及αA、αB、αC各樣本集中進行分類識別。
對比實驗結(jié)果,取M =40、64,N =1024,P=20,K取4~20;5),6)重復100次,實驗結(jié)果如圖3所示。
由圖可知,隨著稀疏度K值的減小,平均識別率在增加,其原因在于特征數(shù)據(jù)越稀疏,對于SVM分類器的分類效果越好。當足夠稀疏時,識別率超過了使用EMD頻譜峰值作為特征的識別率。其中,當K=4,M=64,N=1024的時候,各識別率如表1所示。
圖3 在不同特征下平均識別率比較Fig.3 Comparison of recognition rate in different feature
表1 分類識別率比較Tab.1 Comparison of classification rate
由表1可知,使用稀疏表示作為艦船噪聲信號分類作為特征,識別率較好于EMD特征提取方法。
使用EMD頻譜峰值作為特征進行分類識別所需要的總時間t1,包括特征提取所需要的時間temd加上分類需要的時間tsvm1。如式(13)所示:
使用稀疏表示作為特征進行分類識別所需要的總時間t1,包括稀疏字典求解時間tdic、特征提取所需要的時間tspr以及分類需要的時間tsvm2。由于本算法中使用了三類信號,如式(14)所示:
其中公式(8)(9)中的x表示樣本數(shù)個數(shù),“3”表示三類信號需要各計算一個字典。經(jīng)過多次仿真實驗,在t1中,temd·x達到了t1的99% 以上。在t2中,當x足夠小的時候,tdic·3遠大于其他兩項,隨著x的增大,占的比重越來越小。由于tsvm1、tsvm2相對于其他幾項可以忽略,因此在實驗中未計入t1、t2。針對x對t1與t2之間影響仿真結(jié)果如圖4所示。
圖4 信號長度與特征提取耗時倍數(shù)的關系Fig.4 The relationship between signal length and multiple consuming
由圖可知,使用稀疏表示作為特征的計算所用總時間增長斜率Δt1要遠遠小于使用EMD頻譜峰值作為特征的計算所使用總時間增長斜率Δt2。經(jīng)過仿真計算得到計算EMD頻譜峰值所需要的時間是計算稀疏表示的時間的20倍。如式(15)所示:
從以上仿真實驗中,可以得出結(jié)論:使用稀疏表示作為信號特征可以大大縮短使用EMD頻譜峰值作為特征的計算時間。
本文提出了一種新型的水聲信號特征表征方法,即采用壓縮感知中的稀疏表示作為艦船噪聲的特征,以實現(xiàn)用小量的特征信號取代大量的原始數(shù)據(jù)信號。具體實現(xiàn)中采用K-SVD算法訓練得到DCT冗余字典,在某種程度上包含了原信息的主要特征,并使用OMP算法對實際信號樣本進行求解稀疏系數(shù)。本文通過使用SVM分類算法對使用稀疏表示的目標特征集進行分類識別,實現(xiàn)了大幅提高目標識別速度的目的,在水聲信號分類中有非常重要的實際意義,實驗仿真結(jié)果表明,在選取合適的參數(shù)時,使用本文所提出的方法在分類識別率性能上優(yōu)于目前性能較好的特征分類器,具有非常高的實用價值。
[1]李新欣.船舶及鯨類聲信號特征提取和分類識別研究[D].哈爾濱:哈爾濱工程大學,2012.
[2]史廣智,胡均川.基于小波包和1(1/2)維譜的艦船輻射噪聲頻域特征提取及融合[J].聲學技術,2004,23(1):4-7.
[3]樊養(yǎng)余,陶寶祺.艦船噪聲的1(1/2)維譜特征提取[J].聲學學報,2002,27(1):71-76.
[4]劉深 ,張小薊,牛奕龍,等.基于IMF能量譜的水聲信號特征提取與分類研究 [J].計算機工程與應用,2014(3):203-206.
[5]張小薊,張歆,孫進才.基于經(jīng)驗模態(tài)分解的目標特征提取與選擇[J].西北工業(yè)大學學報,2006,24(4):453-456.
[6]Donoho D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[7]DONOHO D.Compressed sensing[J].IEEE Trans.Information Theory,2006,52(4):1289-1306.
[8]孫林慧.語音壓縮感知關鍵技術研究[D].南京:南京郵電大學,2012.
[9]戴瓊海,付長軍,季向陽.壓縮感知研究[J].計算機學報,2011,34(3):425-434.
[10]Candès E J.Compressive sampling[C]//Proceedings on the International Congress of Mathematicians.Madrid:IEEE,2006:1433-1452.
[11]Candès E J,Romberg J,Tao T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J].Information Theory,IEEE Transactions on,2006,52(2):489-509.
[12]Chen S S,Donoho D L,Saunders M A.Atomic decomposition by basis pursuit[J].SIAM journal on scientific computing,1998,20(1):33-61.
[13]Needell D,Vershynin R.Greedy signal recovery and uncertainty principles[C]//Electronic Imaging 2008.International Society for Optics and Photonics.2008,68140J-68140J-12.
[14]Tropp J A,Gilbert A C.Signal recovery from random measurements via orthogonal matching pursuit[J].Information Theory,IEEE Transactions on,2007,53(12):4655-4666.