周 卓, 梁 紅, 楊長生, 趙國貴
基于海豚聽覺系統(tǒng)模型的水下目標識別
周 卓, 梁 紅, 楊長生, 趙國貴
(西北工業(yè)大學 航海學院, 陜西 西安, 710072)
從目標的主動聲吶回波中提取其特征信息是實現(xiàn)水下目標分類識別的有效手段。動物聲吶在水下目標識別中表現(xiàn)出的優(yōu)異性能為人工聲吶提供了解決方法。文中以寬吻海豚喀啦信號作為主動聲吶的發(fā)射信號,分別利用小波變換和海豚聽覺系統(tǒng)模型2種方法提取了目標回波特征并作為支持向量機的輸入進行分類。將通過海豚聽覺系統(tǒng)模型得到的時譜圖作為卷積神經(jīng)網(wǎng)絡的輸入, 對目標進行分類識別。研究表明, 相比于小波變換方法, 利用基于海豚聽覺系統(tǒng)模型的特征提取方法進行目標分類識別的效果更好; 結(jié)合卷積神經(jīng)網(wǎng)絡, 采用海豚喀啦信號結(jié)合海豚聽覺系統(tǒng)模型在水下目標識別中可以獲得更好的結(jié)果。
海豚喀啦信號; 海豚聽覺系統(tǒng); 目標分類識別
很多動物的體內(nèi)都有天然的回聲定位系統(tǒng), 例如蝙蝠、鯨魚和海豚等。研究表明, 具有回聲定位能力的動物有很高的目標分辨能力, 例如寬吻海豚能夠發(fā)現(xiàn)幾百米外的魚群, 還能識別出不同的魚群種類, 甚至可以分辨出黃銅、鋁及塑料等不同的物質(zhì)材料, 因此可以將海豚聲吶的良好特性應用到人工聲吶中, 為當前的目標分類識別方法提供新的思路。
1947年, Arthur McBride首次提出大西洋寬吻海豚可以通過回聲定位水下物體, 之后多位科學家對海豚聲吶系統(tǒng)展開了研究, 最終得出海豚可由頭部發(fā)出聲音, 然后接收回來的信號并對其進行處理的結(jié)論[1]。進一步研究發(fā)現(xiàn), 海豚不僅能夠檢測到目標, 甚至可分辨出獵物的形狀及大小等。20世紀60年代之后, 有關(guān)學者利用寬吻海豚做了多組實驗, 結(jié)果表明, 海豚能夠準確地區(qū)分生物目標與人工目標, 對于相似的人工目標, 海豚甚至能夠分辨出材料和厚度不同的金屬盤及空心圓柱體等[2-3]。2007年, Branstetter等[4]通過總結(jié)之前的實驗數(shù)據(jù)和結(jié)果, 提出一種海豚聽覺系統(tǒng)模型, 來模擬海豚在回聲定位過程中對不同目標之間的區(qū)分。國內(nèi)相關(guān)研究起步較晚, 牛富強等[5-7]研究了海豚的發(fā)聲信號, 發(fā)現(xiàn)海豚會根據(jù)生活環(huán)境改變發(fā)射信號, 并對不同環(huán)境下的海豚發(fā)聲信號進行了研究。
目前, 基于海豚聽覺系統(tǒng)的回聲識別定位研究較少?;谒暷繕颂卣鞯姆诸愖R別方法, 目前應用較為廣泛的有統(tǒng)計分類方法和神經(jīng)網(wǎng)絡方法[8]。文中使用支持向量機對從目標回波中提取的小波能量譜峰值特征進行分類, 同時利用海豚聽覺系統(tǒng)模型得到目標回波的強度特征以及“時譜圖”, 并結(jié)合支持向量機和卷積神經(jīng)網(wǎng)絡對其分類, 有效地提高了分類識別率。
一般將寬吻海豚的聲音分成喀啦聲(click)、哨聲(whistles)和突發(fā)脈沖(burst pulses)3種。其中, 在完成定位和探測任務時主要使用的是喀啦聲信號。文獻[9]提到了1個寬吻海豚喀啦信號模型, 該模型由2個高斯包絡的負調(diào)頻線性調(diào)頻(linear frequency modulation, LFM)信號疊加構(gòu)成, 信號的表達式為
表1給出了3種海豚喀啦(dolphin click, DC)信號的參數(shù)設置(DC1、DC2、DC6)[9], 其中信號時長0.6 ms, 高頻分量相對于低頻分量延遲0.1 ms。
表1 DC信號參數(shù)
海豚聲吶的接收系統(tǒng)就是它的聽覺系統(tǒng), 包括外耳、中耳和內(nèi)耳。不同于其他的哺乳動物, 海豚和一些鯨類沒有耳廓, 外耳道也不容易看見。在大多數(shù)海豚中, 外耳就像是1個針孔, 它的一部分由纖維組織組成, 這種具有狹窄橫截面和纖維結(jié)構(gòu)的外耳道幾乎不能通過鼓膜韌帶成為中耳和內(nèi)耳的聲學通路。目前通常認為海豚的外耳道是非功能性的, 聲音通過下頜骨的后半部分進入海豚的頭部, 然后經(jīng)過1個充滿脂肪的管道傳播到包含中耳和內(nèi)耳的鼓膜骨室中。
文獻[4]中提到了1種海豚聽覺系統(tǒng)模型, 描述海豚在回聲定位識別任務中如何表示和使用多種識別線索。該模型由一組Gammatone帶通濾波器、半波整流器和低通濾波器組成。
1)Gammatone濾波器
Gammatone濾波器的脈沖響應可以表示為
2)半波整流器
半波整流的過程可以描述為
3)低通濾波器
低通濾波器脈沖響應
低通濾波器的輸出
該輸出融合了海豚聽覺神經(jīng)元的低通濾波特性, 由于該輸出包含時間和頻率下的特征, 因此稱為“時譜圖”。與常規(guī)的頻譜圖相比, 該模型能夠更加真實地描述海豚接收到的聲音。
聲誘餌、無人水下航行器(unmanned undersea vehicle, UUV)和水下懸浮物等均為常見的水下小目標, 分別執(zhí)行水下干擾、探測及打擊等多項任務。這些水下小目標對艦艇和海洋設施的威脅很大且難以分辨, 因此需要對其進行精確識別。文中利用亮點模型仿真了聲誘餌、UUV和水下懸浮物等3種目標的回波數(shù)據(jù), 并利用小波變換和海豚聽覺系統(tǒng)模型對回波完成了特征提取。
仿真時選取的發(fā)射信號為LFM和DC信號。LFM是水下目標識別中常用的發(fā)射信號, DC信號模擬海豚發(fā)聲方式。其中: LFM信號的頻帶范圍為60~100 kHz, 信號脈沖長度為0.6 ms; DC信號的頻帶范圍選取同表1, 脈沖長度均為0.6 ms。
1)小波變換
小波變換的定義如下
式中:為內(nèi)積; 稱為母小波;為尺度因子, 由經(jīng)過伸縮平移運算得到; 為位移因子。
信號的尺度-小波能量譜定義為
在特征提取過程中, 主要利用信號的尺度-小波能量譜峰值作為目標的特征。
2) 海豚聽覺系統(tǒng)模型
上文介紹了海豚聽覺系統(tǒng)的構(gòu)造, 并給出了海豚聽覺系統(tǒng)模型。回波信號通過該模型后可以得到1個時譜圖, 從中可提取出海豚在分辨水下目標時利用的感知特征。在目標識別中, 比較有用的一種特征是從強度模型(intensity model, IM)中提取出的IM特征。其定義為
以發(fā)射信號為DC1信號為例, 發(fā)射信號時域、頻域圖如圖2所示。分別利用2種特征提取方法對3種目標的仿真回波進行特征提取, 結(jié)果如圖3所示。圖中的橫坐標表示目標與入射信號的夾角, 縱坐標表示特征的幅值大小。
從圖3可知, 利用信號的尺度-小波能量譜峰值和強度模型都可以完成對目標回波的特征提取, 目標的區(qū)分度均較高, 因此可以利用這2種特征完成對目標的分類識別。對比2幅圖還可以發(fā)現(xiàn): 2種方法下目標回波特征提取結(jié)果均是UUV的特征幅度較大, 水下懸浮物次之, 聲誘餌最小; 利用強度模型提取到的特征幅值高于信號的尺度-小能量譜峰值特征, 由于發(fā)射信號為DC1信號, 這也從側(cè)面驗證了相比于小波變換方法, 海豚聽覺系統(tǒng)模型更適合于對DC信號進行特征提取。
圖2 DC1信號時域圖和頻域圖
圖3 仿真回波特征提取結(jié)果曲線
設計支持向量機和神經(jīng)網(wǎng)絡2種分類器, 其中支持向量機對從目標提取的小波能量譜峰值特征和通過海豚聽覺系統(tǒng)模型得到的強度特征進行分類; 卷積神經(jīng)網(wǎng)絡對由海豚聽覺系統(tǒng)模型得到的時譜圖進行分類。
支持向量機是一種基于統(tǒng)計理論的機器學習方法, 可以利用有限的數(shù)據(jù)很好地平衡所需系統(tǒng)的復雜性和學習能力, 更好地運用到實際中, 增強了分類系統(tǒng)的魯棒性, 在非線性樣本的分類問題方面表現(xiàn)出了良好的應用價值[10]。
支持向量機利用非線性映射方法將輸入信號映射到另一個空間中, 該空間一般是高維度的特征空間, 然后在該空間中求解出最優(yōu)分類超平面。支持向量機中比較重要的概念是核函數(shù), 文中在仿真中選取的是高斯核函數(shù)。
表2 支持向量機分類器識別率
海豚在接收到回波信息之后, 大腦可能會利用一種類似于神經(jīng)網(wǎng)絡的方式對回波的時譜信息進行分析, 并提取相應的特征來完成對目標的分類[11]。文中結(jié)合目前在水下目標識別領(lǐng)域應用較多的深度學習方法中[12], 選取卷積神經(jīng)網(wǎng)絡(con- volutional neurual network, CNN)來模擬海豚大腦對回波時譜信息的處理過程。CNN是深度學習的一種核心方法, 其構(gòu)成一般包括輸入層、卷積層、池化層和全連接層[13]。
圖4 聲誘餌模型亮點回波時譜圖
表3 CNN分類器識別率
為了驗證DC信號及海豚聽覺系統(tǒng)模型的優(yōu)越性, 設計水池實驗, 對3種目標模型的回波特征提取并進行目標識別。實驗系統(tǒng)示意圖如圖5所示。實驗所用目標實物如圖6所示。
圖5 實驗系統(tǒng)示意圖
圖6 實驗目標實物圖
對比表2~表4的結(jié)果可知, 利用支持向量機和CNN分類器均可完成對目標的分類識別。使用支持向量機對目標進行分類識別時, 利用基于海豚聽覺系統(tǒng)的IM模型提取的特征更有利于目標的分類識別, 相比于LFM信號, 在利用CD信號作為發(fā)射信號時, 目標的仿真識別率均可達90%以上, 實驗識別率也處于80%左右, 這也說明海豚聽覺系統(tǒng)模型在對CD信號產(chǎn)生的回波進行特征提取時有更好的適應性。
表4 實驗處理結(jié)果中不同分類器的識別率
使用基于CNN的分類器對目標進行分類識別時, 利用海豚聽覺系統(tǒng)模型得到的回波信號時譜圖作為分類器的輸入, 可以得到很好的結(jié)果: 目標的平均分類仿真識別率達到93.24%, 實驗識別率達到80%以上, 相比于LFM信號, 在利用CD信號作為發(fā)射信號時, 得到的回波信號時譜圖更有利于CNN分類器對目標的分類識別。
在發(fā)射信號不變時, 相比于支持向量機方法, 基于CNN的分類器目標分類效果更優(yōu), 目標的分類仿真識別率最高可達95.93%, 實驗識別率達85.52%。但同時也要注意到, 由于CNN的參數(shù)相比支持向量機更多, 因此運算速度相對也會較慢, 這在實際應用中是需要考慮的因素。
文中基于海豚聲吶系統(tǒng)結(jié)合支持向量機和CNN方法完成了對水下目標的分類識別??紤]到海豚在目標回聲定位和分辨中的卓越能力, 利用CD信號, 結(jié)合海豚聽覺系統(tǒng)模型提取了目標回波中的IM特征, 并對比傳統(tǒng)的小波變換方法, 利用支持向量機完成了目標的分類識別。隨后, 利用海豚聽覺系統(tǒng)模型得到目標回波的時譜圖, 結(jié)合CNN完成了目標的分類識別。最后, 進行水池實驗驗證了仿真結(jié)果。仿真結(jié)果表明, 利用海豚聽覺系統(tǒng)模型得到的回波時譜圖可以有效提高水下目標的分類識別率, 且當發(fā)射信號為CD信號時, 分類效果更好。未來將繼續(xù)研究海豚大腦中的回波處理模型, 以期獲得更好的目標分類識別結(jié)果。
[1] Au W W L, Scheifele P M. The Sonar of Dolphins[J]. The Journal of the Acoustical Society of America, 1993, 95(1): 585-586.
[2] Au W W L, Hastings M C. Principles of Marine Bio- acoustics[M]. New York : Springer US, 2008.
[3] Au W W L, Pawloski D A. Cylinder Wall Thickness Difference Discrimination by an Echolocating Atlantic Bottlenose Dolphin[J]. Journal of Comparative Physiology. A: Neuroethology, Sensory, Neural and Behavioral Physiology, 1992, 170(1): 41-47.
[4] Branstetter B K, Mercado E, Au W W L. Representing Multiple Discrimination Cues in a Computational Model of the Bottlenose Dolphin Auditory System[J]. The Jour- nal of the Acoustical Society of America, 2007, 122(4): 2459.
[5] 牛富強, 楊燕明, 文洪濤, 等. 瓶鼻海豚的Click聲信號特性[J]. 聲學技術(shù), 2011, 30(2): 148-152.
[6] 牛富強, 薛睿超, 周在明, 等. 印太瓶鼻海豚(Tursiops aduncus)通訊聲信號分類及特征參數(shù)的環(huán)境差異性分析[J]. 聲學學報, 2020, 45(2): 189-195.Niu Fu-qiang, Xue Rui-chao, Zhou Zai-ming, et al. Analysis of Differences on Whistle Classification and Characteristics of Indo-Pacific Bottlenose Dolphins(Tursiops ad- uncus) in Different Environment[J]. Acta Acustica, 2020, 45(2): 189-195.
[7] 陳晟, 牛富強, 林長倫, 等. 不同環(huán)境下瓶鼻海豚click信號及仿真分析[J]. 聲學技術(shù), 2019, 38(4): 452-458.
[8] 景志宏, 林鈞清, 錢建立, 等. 水下目標識別技術(shù)的研究[J]. 艦船科學技術(shù), 1999, 21(4): 38-44.
[9] Capus C, Pailhas Y, Brown K, et al. Bio-inspired Wideband Sonar Signals Based on Observations of the Bottlenose Dolphin(Tursiops Truncatus)[J]. The Journal of the Acoustical Society of America, 2007, 121(1): 594-604.
[10] 任超. 基于支持向量機的水下目標識別技術(shù)[D]. 西安: 西北工業(yè)大學, 2016.
[11] Au W W L, Andersen L N, René Rasmussen A, et al. Ne- ural Network Modeling of a Dolphin’s Sonar Discrimination Capabilities[J]. The Journal of the Acoustical Society of America, 1995, 98(1): 43-50.
[12] Lecun Y, Bengio Y, Hinton G. Deep Learning[J]. Nature, 2015, 521(7553): 436.
[13] Lecun Y, Bottou L. Gradient-based Learning Applied to Document Recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[14] Simonyan K, Zisserman A. Very Deep Convolutional Net- works for Large-Scale Image Recognition[EB/OL]. ArXiv, (2014-09-04)[2020-07-14]. https://arxiv.org/abs/1409. 1556.
Underwater Target Identification Based on Dolphin Auditory System Model
ZHOU Zhuo, LIANG Hong, YANG Chang-sheng, ZHAO Guo-gui
(School of Marine Science and Technology, Northwestern Polytechnical University, Xi’an 710072, China)
Extracting feature information from the active sonar echo of target is an effective method to realize underwater target classification and identification. The excellent performance of animal sonar in underwater target identification provides a solution for artificial sonar. In this study, the click signal of bottlenose dolphin is used as the transmitting signal of active sonar. The echo characteristics of the target are extracted by wavelet transform and model of dolphin auditory system, and are classified as the input of support vector machine. In addition, this paper proposes an idea that the time spectrum obtained by the model based on dolphin auditory system is used as the input of convolution neural network to classify and identify the target. The results show that compared with that of the wavelet transform method, the feature extraction method based on the computer model of dolphin auditory system is better for target classification and identification. Combining with convolution neural network, using dolphin click signal and model of dolphin auditory system can obtain better results in underwater target identification.
dolphin click signal; dolphin auditory system; target classification and identification
TJ630; TN911.72; Q811.211
A
2096-3920(2021)02-0147-06
10.11993/j.issn.2096-3920.2021.02.003
周卓, 梁紅, 楊長生, 等. 基于海豚聽覺系統(tǒng)模型的水下目標識別[J]. 水下無人系統(tǒng)學報, 2021, 29(2): 147-152.
2020-07-14;
2020-07-24.
國家自然基金項目資助(61971354, 61771398).
周 卓(1996-), 男, 在讀碩士, 主要研究方向為水下信號處理.
(責任編輯: 楊力軍)