張惠臣,那 健,翟春平
(大連測控技術(shù)研究所,遼寧 大連 116013)
尋找黑匣子(飛機飛行數(shù)據(jù)記錄器(FDR)和船舶航行數(shù)據(jù)記錄器(VDR)的統(tǒng)稱)是飛機或船舶失事墜海后的緊迫任務(wù)。黑匣子上裝載的水下定位信標(Underwater Locator Beacon)入水自動激活電路,發(fā)射固定頻率的周期性聲脈沖信號,供搜尋設(shè)備對黑匣子進行定位。水聲信標通常發(fā)送頻率為37.5 kHz的脈沖信號,可從數(shù)千米深的水下傳遞聲信號。一旦水聲信標開始工作,它將會每秒發(fā)送一次脈沖信號并持續(xù)一個月左右,這種脈沖信號可以被聲吶和聲學定位儀探測到[1-2]。定位失事的黑匣子,首先要檢測識別聲信標信號,因此對聲信標信號的檢測識別成為黑匣子搜尋的關(guān)鍵技術(shù)。
水聲信號自動識別是水下目標識別技術(shù)研究的一個重要領(lǐng)域,也是水聲信號處理領(lǐng)域的突出難題。國外早期使用的水聲信號處理方法是盲源分離,國內(nèi)目前主要用到的水聲信號處理方法有傅里葉變換(短時傅里葉變換、分數(shù)階傅里葉變換)、小波變換、希爾伯特黃變換、錯誤疊加算法[3]等。目前的水聲信號處理方法在水聲信號處理領(lǐng)域已經(jīng)有著較為成熟的應(yīng)用。但對于大海中水聲信標信號的檢測識別,這些常用的方法很容易受到水中傳播損失以及海洋環(huán)境背景噪聲等因素的影響,很難實現(xiàn)遠距離情況下聲信標信號的有效檢測識別[4]。
近年來人工智能(AI)技術(shù)飛速發(fā)展,為水聲信號處理領(lǐng)域帶來了新的思路?;诂F(xiàn)有的水聲信號處理技術(shù),本文提出一種新的聲信標信號的檢測識別方法,即對已知聲信標信號提取梅爾頻率倒譜系數(shù)特征,再將所提取聲信標信號的特征輸入卷積神經(jīng)網(wǎng)絡(luò)進行訓練學習,然后將待測數(shù)據(jù)提取MFCC特征后,輸入卷積神經(jīng)網(wǎng)絡(luò)從而實現(xiàn)對聲信標信號的檢測識別。
基于卷積神經(jīng)網(wǎng)絡(luò)的聲信標信號通常為CW脈沖信號,頻率 37.5 kHz,脈寬T=10 ms,重復周期 1 s,噪聲干擾為海洋背景噪聲。周期信號不滿足能量有限條件,對于周期信號、隨機信號在時間上的積分是無窮大,一般只研究信號的平均功率。在本文中,將聲信標信號截取處理,即信號具有周期特性但并不是周期信號。設(shè)聲信標信號為x(t)[4],則有
其中:A為幅度;f0為聲信標信號的中心頻率;t′為聲信標信號周期脈沖信號時間。圖1為聲信標信號仿真時域圖以及頻譜圖。
圖1 聲信標信號時頻分析Fig.1 Time-frequency analysis of acoustic beacon signals
為了識別出不同的聲音,需要對聲音提取內(nèi)在特征。一般要考慮到2個問題,一是提取出合適的特征參數(shù);二是進行數(shù)據(jù)壓縮與降維。MFCC特征在近些年得到了廣泛應(yīng)用,早期應(yīng)用于語音信號的處理領(lǐng)域。水聲信號與語音信號識別的原理一樣,也可以應(yīng)用MFCC進行水聲信號特征提取。本文采用MFCC作為聲信標信號的特征參數(shù),梅爾(Mel)頻率可由下式計算得到:
MFCC 就是基于 Mel頻率的概念而提出來的[5-6]。MFCC的物理意義是:提取信號頻譜中的包絡(luò)信息,將聲音的物理信息(頻譜包絡(luò)和細節(jié))提取得到一組特征向量,簡單來說可以理解為聲音信號的能量在不同頻率范圍的分布。MFCC特征參數(shù)提取流程如圖2所示。
圖2 MFCC 特征參數(shù)提取流程Fig.2 MFCC feature parameter extraction process
最終得到MFCC系數(shù)如下式[7]:
至此,一段聲音通過分幀、特征提取后,每幀都有一個特征向量,后續(xù)步驟要處理的對象就是這樣的特征向量。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類特殊的人工神經(jīng)網(wǎng)絡(luò)[8],是深度學習中的一種核心算法,區(qū)別于神經(jīng)網(wǎng)絡(luò)其他模型(如遞歸神經(jīng)網(wǎng)絡(luò)),其最主要的特點是卷積運算操作。卷積神經(jīng)網(wǎng)絡(luò)有一個輸入層、一個輸出層和中間的多個隱藏層。中間的隱藏層由卷積、激活、池化(pooling)3種結(jié)構(gòu)組成[9]。卷積神經(jīng)網(wǎng)絡(luò)與全連接網(wǎng)絡(luò)相比較,有3個特點:權(quán)值局部連接、權(quán)值共享和降采樣,以保證一定程度上的位移和旋轉(zhuǎn)不變性,并且大大減少網(wǎng)絡(luò)中需要訓練的參數(shù)個數(shù)。本文所使用的卷積網(wǎng)絡(luò)框架如圖3所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 Convolutional neural network structure
對事先已知的聲信標信號提取MFCC特征送入設(shè)置好的卷積神經(jīng)網(wǎng)絡(luò)進行訓練。通過訓練,輸入的是每類數(shù)據(jù)的MFCC特征,輸出對應(yīng)的標簽,根據(jù)誤差后向傳導進行訓練,使用算法的人僅需提供原始時域數(shù)據(jù)即可。訓練后,被測試數(shù)據(jù)先提取MFCC特征,再輸入卷積神經(jīng)網(wǎng)絡(luò),然后輸出對應(yīng)識別結(jié)果。
針對上文的聲信標信號識別算法,利用試驗數(shù)據(jù)對該方法進一步驗證。
試驗船作為拖體布放母船,試驗中1枚聲信標布放在海底,該聲信標信號中心頻率為37.5 kHz,采用拖曳裝置實現(xiàn)聲信標信號采集,試驗現(xiàn)場概況如圖4所示。
圖4 試驗現(xiàn)場概況Fig.4 Test site overview
試驗所使用的信標如圖5所示,頻率37.5 kHz,脈寬 10 ms,脈沖周期 1 s。
圖5 試驗水聲信標Fig.5 Test underwater acoustic beacon
圖6為聲信標信號距離拖體某一距離時的原始信號時域波形以及頻域波形圖。
把原始標簽數(shù)據(jù)提取MFCC特征后,輸入設(shè)置好參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)進行訓練。卷積神經(jīng)網(wǎng)絡(luò)的訓練效果隨著訓練批次的變化如圖7所示??梢钥闯鰶]訓練的卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)參數(shù)是隨機初始化的,其輸出誤差最大,隨著訓練批次的增加,誤差逐漸減少,訓練批次到達1 000前,誤差減少得比較快,當訓練批次超過1 000次之后,誤差減少得越來越慢。經(jīng)測試,本次實驗基于卷積網(wǎng)絡(luò)的正確率為93.9%。
將距離聲信標為1 900 m時的待測試的聲信標信號提取MFCC特征后輸入已經(jīng)訓練好的卷積神經(jīng)網(wǎng)絡(luò),識別并標記后的聲信標信號時域圖如圖8所示。12 s內(nèi)共有12個脈沖標記(白色標記為聲信標信號),每間隔1 s標記一次。結(jié)果表明,當距離為1 900 m時可全階段檢測識別到聲信標脈沖信號。
圖6 原始信號時域波形及頻域波形Fig.6 Time-domain and frequency-domain waveforms of the original signal
圖7 卷積神經(jīng)網(wǎng)絡(luò)訓練誤差變化圖Fig.7 CNN training error graph
圖8 1 900 m 時檢測識別結(jié)果Fig.8 Detection and recognition results at 1 900 m
將距離聲信標為2 600 m時的待測試的聲信標信號提取MFCC特征后輸入已經(jīng)訓練好的卷積神經(jīng)網(wǎng)絡(luò),識別并標記后的聲信標信號時域圖如圖9所示。12 s內(nèi)共有9個脈沖標記,脈沖信號標記不完整。結(jié)果表明,當距離為2 600時可檢測識別到部分聲信標脈沖信號。
圖9 2 600 m 時檢測識別結(jié)果Fig.9 Detection and recognition results at 2 600 m
在試驗驗證的過程發(fā)現(xiàn)對輸入卷積神經(jīng)網(wǎng)絡(luò)進行訓練的聲信標信號數(shù)據(jù)必須是全時間段可檢測識別的聲信標信號(下文稱為正常訓練數(shù)據(jù)),如果訓練數(shù)據(jù)是部分時間段可識別的聲信標信號(下文稱為非正常訓練數(shù)據(jù))則對測試數(shù)據(jù)的結(jié)果產(chǎn)生較大的誤差。
使用相同的測試數(shù)據(jù)對不同情況下的訓練完成的卷積神經(jīng)網(wǎng)絡(luò)進行測試。圖8為正常訓練數(shù)據(jù)下的聲信標距離為1 900 m時測試數(shù)據(jù)檢測識別結(jié)果,結(jié)果顯示此測試數(shù)據(jù)完全可識別,即1 s內(nèi)有一個聲信標信號脈沖發(fā)出。圖10為非正常訓練數(shù)據(jù)下的聲信標距離為1 900 m時測試數(shù)據(jù)檢測識別結(jié)果,結(jié)果顯示此測試數(shù)據(jù)識別出現(xiàn)錯誤,1 s內(nèi)有多個標記的脈沖信號。
圖10 1 900 m 非正常訓練數(shù)據(jù)測試結(jié)果Fig.10 1 900 m abnormal training data test results
本文將基于卷積神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于對水聲定位信標信號的檢測識別。使用已知的聲信標信號作為訓練數(shù)據(jù),然后對試驗獲取的待測聲信標信號進行測試。測試結(jié)果表明,在訓練數(shù)據(jù)正常的情況下,將待測聲信標信號提取MFCC特征后輸入卷積神經(jīng)網(wǎng)絡(luò)進行測試,測試數(shù)據(jù)的識別效果較好。本文所使用的方法對訓練數(shù)據(jù)要求較高,訓練數(shù)據(jù)必須是全時間段可檢測識別的聲信標信號,對于部分時間段識別的聲信標信號測試結(jié)果出現(xiàn)錯誤。