吳涢暉,趙子天,陳曉雷,鄒士亞*
(1. 軍事科學(xué)院防化研究院 北京 昌平區(qū) 102205;2. 電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 成都 611731)
大氣低頻聲監(jiān)測(cè)技術(shù)是中遠(yuǎn)程核爆炸探測(cè)的技術(shù)手段之一,次聲監(jiān)測(cè)已被聯(lián)合國(guó)列入全面禁核試監(jiān)測(cè)技術(shù)[1]。然而,自然界存在著多種大氣低頻聲信號(hào),如何對(duì)這些信號(hào)數(shù)據(jù)進(jìn)行實(shí)時(shí)分析和識(shí)別,是核爆探測(cè)需要解決的一個(gè)問(wèn)題,需要有效的技術(shù)方法來(lái)支持。深度學(xué)習(xí)的快速發(fā)展以及其不斷提高的性能為解決這個(gè)問(wèn)題提供了另外一個(gè)途徑[2]。
深度學(xué)習(xí)是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)發(fā)展而來(lái)[3],文獻(xiàn)[4-5]提出,具有多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)比淺層神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的學(xué)習(xí)能力,從而可以將原始輸入數(shù)據(jù)中人工分析難以獲取的特征信息挖掘出來(lái)。
本文首先對(duì)核爆低頻聲的特征進(jìn)行了分析并對(duì)機(jī)器學(xué)習(xí)中的支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了研究,然后針對(duì)這些特征對(duì)化爆、雷電、臺(tái)風(fēng)的低頻聲信號(hào)進(jìn)行了特征提取,并構(gòu)造了多分類支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別實(shí)驗(yàn),最后對(duì)學(xué)習(xí)過(guò)程進(jìn)行了改進(jìn),獲得了較好的性能。
在大氣層核爆炸的瞬間,核爆產(chǎn)生的能量被限制在具有極高溫度、極大壓力的小體積內(nèi)。在不到1 μs 內(nèi)這種高溫氣體產(chǎn)生大量的軟X 射線,這些射線被周圍1 m 內(nèi)的空氣吸收,使其迅速膨脹,在約1 ms 內(nèi)產(chǎn)生一個(gè)直徑超過(guò)100 m 的灼熱、極高的白熾狀火球。火球繼續(xù)以超聲速膨脹,并以約100 m/s 的速度緩慢上升。然后,近似球形的上升火球變成具有中心上升氣流的蘑菇云?;鹎蚶^續(xù)在大氣中上升、冷卻,直到放射性煙云的重力與其在大氣中的浮力相等為止[6]。
核爆炸時(shí)不到1 s 內(nèi)產(chǎn)生強(qiáng)大的沖擊波,在初始幾秒內(nèi)以超聲速膨脹火球向外傳播,沖擊波陣面的超壓是火球內(nèi)部高壓的2~3 倍。50 s 后,沖擊波可傳播到離爆心約20 km 處[7]。大氣層核爆炸產(chǎn)生的沖擊波慢慢衰減成聲波后,會(huì)發(fā)生頻散現(xiàn)象,低頻成分傳播速度快而衰減慢,高頻成分傳播速度慢而衰減快。由于幾何擴(kuò)散和高頻成分被大氣吸收而慢慢演變成低頻聲信號(hào)[8]。核爆炸產(chǎn)生的低頻聲信號(hào)的波形取決于核爆當(dāng)量和距離源的距離。由于高頻信號(hào)比低頻信號(hào)衰減得快,因此,離源很遠(yuǎn)的地方觀測(cè)到的信號(hào)以長(zhǎng)周期低頻聲波為主。如前所述,在離爆心約1000 km 內(nèi)的近場(chǎng)觀測(cè)到的低頻聲信號(hào)呈現(xiàn)為一系列到達(dá)時(shí)間不同的波組,這是由于平流層和熱電離層大氣的一次或多次反射造成的。與此相反,在距離為幾千km 的遠(yuǎn)場(chǎng),觀測(cè)到的低頻聲波是由首先到達(dá)的蘭姆波成分和隨后到達(dá)的幾個(gè)有層理的聲波成分疊加而成的。
根據(jù)國(guó)內(nèi)外對(duì)大氣層核爆炸低頻聲的觀測(cè)與研究,其特征主要包括以下幾個(gè)方面:
1)信號(hào)的振幅與距離、爆炸當(dāng)量和平流層的風(fēng)速分量有關(guān),其計(jì)算公式可以表示為[9]:
式中,Pc為含風(fēng)干擾修正的次聲監(jiān)測(cè)聲壓,單位為Pa;W 為核爆當(dāng)量,單位為kT;R 為監(jiān)測(cè)點(diǎn)與爆心的距離,單位為km;
2)信號(hào)的頻率大約在0.002~20 Hz 之間,對(duì)于小當(dāng)量(幾kt)的核爆,頻率大約在0.02~4 Hz之間[10];
3)信號(hào)的周期大約在0.01~100 s 之間;
4)由于平流層和熱電離層大氣一次或多次反射,以及高頻信號(hào)比低頻信號(hào)率減快,使得信號(hào)由幾個(gè)有層理的聲波成分疊加而成,出現(xiàn)明顯的頻散現(xiàn)象[11];
5)波形呈“壓縮式”變化。
這些特征是對(duì)信號(hào)進(jìn)行識(shí)別的基礎(chǔ),通過(guò)對(duì)這些特征建立相應(yīng)的數(shù)學(xué)模型,計(jì)算出信號(hào)的特征值,然后進(jìn)行深度學(xué)習(xí)來(lái)達(dá)到識(shí)別事件的目的。
本文采用中科院聲學(xué)所的InSAS2008 型電容式低頻聲傳感器在全國(guó)各地分別搭建了實(shí)驗(yàn)臺(tái)站。實(shí)驗(yàn)臺(tái)站由次聲監(jiān)測(cè)陣、數(shù)據(jù)信息處理中心和通信設(shè)備等組成。其中,次聲監(jiān)測(cè)陣為三元陣,每個(gè)次聲傳感器配置降噪管陣;數(shù)據(jù)信息處理中心負(fù)責(zé)各陣元的數(shù)據(jù)接收與處理。實(shí)驗(yàn)臺(tái)站結(jié)構(gòu)組成如圖1 所示。采集的樣本數(shù)據(jù)共有600 個(gè),其中包含化爆數(shù)據(jù)16 個(gè),臺(tái)風(fēng)數(shù)據(jù)36 個(gè),閃電數(shù)據(jù)248 個(gè),噪聲數(shù)據(jù)300 個(gè)。
圖1 實(shí)驗(yàn)臺(tái)站結(jié)構(gòu)組成圖
針對(duì)核爆低頻聲的基本特征,本文對(duì)化爆、閃電、臺(tái)風(fēng)3 種事件的低頻聲信號(hào),提取出了最大幅值、均值、方差、有效值、偏斜度、短時(shí)平均過(guò)零率、波形復(fù)雜度、頻率三次矩等8 種特征值組成特征向量數(shù)據(jù)集來(lái)進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn)。
最大幅值:對(duì)原始信號(hào)進(jìn)行去本底和大氣擾動(dòng)后,采樣點(diǎn)數(shù)據(jù)的最大值,用Max 表示。
均值:信號(hào)各采樣點(diǎn)數(shù)據(jù)的平均值,用μ表示。
方差:信號(hào)各采樣點(diǎn)數(shù)據(jù)與均值之差平方和的平均數(shù),用σ 表示。
有效值:可以衡量信號(hào)的能量效應(yīng),用Ev 表示[12]:
偏斜度:衡量數(shù)據(jù)分布偏斜方向及程度,能夠表示波形的分布方向,用Sc 表示[15]:
短時(shí)平均過(guò)零率:指每幀內(nèi)信號(hào)通過(guò)零值的次數(shù),在一定程度上可以反映信號(hào)的頻率信息,用Zn 表示[13]:
N 為采樣點(diǎn)個(gè)數(shù),sgn(x)為符號(hào)函數(shù),x≥0 時(shí),sgn(x)=1,x<0 時(shí),sgn(x)=?1。
波形復(fù)雜度:用于表示信號(hào)波形在能量分布上的復(fù)雜程度,用Cp 表示:
頻率三次矩:用于表示信號(hào)頻譜特性,用Ft 表示:
由于各維特征的計(jì)算方法不同,其值大小差異很大,在進(jìn)行實(shí)驗(yàn)前還要分別對(duì)各特征維進(jìn)行歸一化處理。
目前,構(gòu)造支持向量機(jī)多分類模型的方法主要有兩種,一種是直接構(gòu)造多個(gè)分類面對(duì)所有樣本進(jìn)行劃分,將多個(gè)分類面的參數(shù)求解合并到一個(gè)最優(yōu)化問(wèn)題中,通過(guò)求解多目標(biāo)函數(shù)的最優(yōu)化問(wèn)題實(shí)現(xiàn)多類分類,簡(jiǎn)稱直接法[14]。這種方法看似簡(jiǎn)單,但其最優(yōu)化問(wèn)題求解過(guò)程復(fù)雜,計(jì)算復(fù)雜度高,實(shí)現(xiàn)起來(lái)比較困難。另一種方法是將多分類問(wèn)題分解為多個(gè)二分類問(wèn)題,通過(guò)組合這些二分類器來(lái)間接實(shí)現(xiàn)多分類器的構(gòu)造,簡(jiǎn)稱間接法[15]。
由于樣本數(shù)據(jù)只包括化學(xué)爆炸、閃電、臺(tái)風(fēng)和噪聲4 類數(shù)據(jù),因此采用間接法構(gòu)造分類模型,可以降低模型的計(jì)算復(fù)雜度。將支持向量機(jī)作為神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點(diǎn),依次分別把化學(xué)爆炸、閃電、臺(tái)風(fēng)和噪聲作為一類,其他3 類樣本歸為另一類,總共需要構(gòu)造4 個(gè)支持向量機(jī)。判別時(shí),輸入數(shù)據(jù)分別經(jīng)過(guò)這4 個(gè)支持向量機(jī)共得到4 個(gè)輸出值,將輸出值經(jīng)過(guò)一個(gè)線性激活函數(shù)進(jìn)行比較,最大者對(duì)應(yīng)類別為輸入數(shù)據(jù)的類別,從而實(shí)現(xiàn)4 類數(shù)據(jù)的識(shí)別。
對(duì)于化學(xué)爆炸事件的識(shí)別,隨機(jī)抽取12 組化學(xué)爆炸特征數(shù)據(jù)作為正樣本(其余4 組化學(xué)爆炸特征數(shù)據(jù)用來(lái)測(cè)試),閃電、臺(tái)風(fēng)、噪聲3 類數(shù)據(jù)各隨機(jī)抽取6 組特征數(shù)據(jù)作為負(fù)樣本,共同組成訓(xùn)練集對(duì)一個(gè)支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.25,選取幅值特征和均值特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖2 所示。
對(duì)于閃電事件的識(shí)別,隨機(jī)抽取186 組閃電特征數(shù)據(jù)作為正樣本(其余62 組閃電特征數(shù)據(jù)用來(lái)測(cè)試),隨機(jī)抽取134 組噪聲特征數(shù)據(jù)、全部化學(xué)爆炸和臺(tái)風(fēng)特征數(shù)據(jù)組成負(fù)樣本,共同組成訓(xùn)練集對(duì)一個(gè)支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.15,選取幅值特征和均值特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖3所示。
對(duì)于臺(tái)風(fēng)事件的識(shí)別,隨機(jī)抽取27 組臺(tái)風(fēng)特征數(shù)據(jù)作為正樣本(其余9 組臺(tái)風(fēng)特征數(shù)據(jù)用來(lái)測(cè)試),化學(xué)爆炸、閃電、噪聲3 類數(shù)據(jù)各隨機(jī)抽取10 組特征數(shù)據(jù)作為負(fù)樣本,共同組成訓(xùn)練集對(duì)一個(gè)支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.20,選取幅值特征和均值特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖4 所示。
圖2 化爆SVM 訓(xùn)練結(jié)果
圖3 閃電SVM 訓(xùn)練結(jié)果
圖4 臺(tái)風(fēng)SVM 訓(xùn)練結(jié)果
對(duì)于噪聲的識(shí)別,隨機(jī)抽取400 組噪聲特征數(shù)據(jù)作為正樣本,全部化學(xué)爆炸、閃電、臺(tái)風(fēng)特征數(shù)據(jù)作為負(fù)樣本,共同組成訓(xùn)練集對(duì)一個(gè)支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.10,選取短時(shí)平均過(guò)零率特征和波形復(fù)雜度特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖5 所示。
圖5 噪聲SVM 訓(xùn)練結(jié)果
用訓(xùn)練好的4 個(gè)SVM 模型分別對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)分類,每一個(gè)樣本得到4 個(gè)預(yù)測(cè)類別得分值,分值最高的類別即為該樣本的識(shí)別結(jié)果。選取特征6 和特征7 對(duì)識(shí)別結(jié)果進(jìn)行可視化,得到測(cè)試樣本的真實(shí)分布與支持向量機(jī)的預(yù)測(cè)分布如圖6 所示,各種事件的識(shí)別結(jié)果見(jiàn)表1。
從以上實(shí)驗(yàn)結(jié)果中可以看出,這8 種特征對(duì)于化爆、閃電、臺(tái)風(fēng)和噪聲這4 種類型的數(shù)據(jù),支持向量機(jī)有較好的分類性能,且只需要訓(xùn)練4 個(gè)分類器,計(jì)算速度相對(duì)較快。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一[16]。卷積神經(jīng)網(wǎng)絡(luò)的隱含層一般包含卷積層、池化層和全連接層3 類常見(jiàn)結(jié)構(gòu),在一些新的算法中可能有Inception模塊、殘差模塊等復(fù)雜結(jié)構(gòu),卷積層和池化層為卷積神經(jīng)網(wǎng)絡(luò)所特有[17]。
卷積層的功能是對(duì)輸入數(shù)據(jù)使用卷積核進(jìn)行卷積運(yùn)算,生成特征圖。卷積核的每個(gè)元素都對(duì)應(yīng)一個(gè)權(quán)重系數(shù)和一個(gè)偏差量,類似于一個(gè)前饋神經(jīng)網(wǎng)絡(luò)的神經(jīng)元[18]。進(jìn)行卷積計(jì)算時(shí),卷積核在輸入矩陣中滑動(dòng),每滑動(dòng)到一個(gè)位置,就根據(jù)其大小對(duì)輸入特征做矩陣元素乘法求和并疊加偏差量。若Zl為第l 層特征圖,則第l+1 層特征圖的計(jì)算方法為:
式中,(i,j)為特征圖像素點(diǎn)下標(biāo);w 為卷積核;b 為偏差量。設(shè)第l 層特征圖為行列均是Ll的方陣,卷積核大小為f,卷積步長(zhǎng)為s0,填充層數(shù)為p,則:
圖6 支持向量機(jī)在測(cè)試集上的預(yù)測(cè)結(jié)果
表1 SVM 測(cè)試結(jié)果
在卷積層進(jìn)行特征提取后,輸出的特征圖傳遞至池化層進(jìn)行特征選擇和信息過(guò)濾,起到壓縮數(shù)據(jù)減少參數(shù)數(shù)量的作用。池化層將特征圖中一些相鄰區(qū)域中的點(diǎn)用某一統(tǒng)計(jì)量進(jìn)行代替,一般取池化區(qū)域內(nèi)的最大值或平均值。池化的過(guò)程與卷積核掃描特征圖類似,由池化大小f、步長(zhǎng)s0和填充層數(shù)p 控制,其一般表示形式為:
卷積神經(jīng)網(wǎng)絡(luò)的最后部分是一個(gè)全連接層,它等價(jià)于傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)中的隱含層,只用于對(duì)提取的特征進(jìn)行非線性組合以得到輸出。其網(wǎng)絡(luò)結(jié)構(gòu)包含3 個(gè)卷積層、3 個(gè)池化層和一個(gè)全連接層。
卷積神經(jīng)網(wǎng)絡(luò)主要用于圖像識(shí)別,其識(shí)別能力在某些方面已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)人腦。但對(duì)于低頻聲傳感器采集的離散信號(hào),無(wú)法直接對(duì)信號(hào)特征進(jìn)行識(shí)別。因此,本文將SVM 識(shí)別實(shí)驗(yàn)中采集的600 個(gè)樣本數(shù)據(jù)通過(guò)傅里葉變換轉(zhuǎn)換為時(shí)頻特征圖[19],并進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn)。圖7 為從4 種類型的數(shù)據(jù)中各隨機(jī)選取一個(gè)樣本進(jìn)行轉(zhuǎn)換的結(jié)果。
圖7 各類信號(hào)時(shí)頻圖示例
實(shí)驗(yàn)中,分別從噪聲數(shù)據(jù)和事件數(shù)據(jù)中隨機(jī)抽取3/5 的樣本作為訓(xùn)練集,其余樣本作為測(cè)試集,以檢驗(yàn)訓(xùn)練得到的網(wǎng)絡(luò)的分類能力,訓(xùn)練集和測(cè)試集的樣本分布如圖4 所示。為了消除訓(xùn)練集和測(cè)試集隨機(jī)選取帶來(lái)的影響,實(shí)驗(yàn)進(jìn)行多次運(yùn)行,再對(duì)結(jié)果進(jìn)行統(tǒng)計(jì)。
然后將訓(xùn)練樣本的時(shí)頻特征圖輸入到卷積神經(jīng)網(wǎng)絡(luò)中對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,經(jīng)過(guò)75 次迭代,訓(xùn)練準(zhǔn)確率達(dá)到99.9%,測(cè)試準(zhǔn)確率達(dá)到96.0%,訓(xùn)練準(zhǔn)確率和損失率變化如圖8 所示。
對(duì)各種事件的識(shí)別結(jié)果如表2 所示,可以看出此方法的總體識(shí)別率和支持向量機(jī)相差不大,但是對(duì)于樣本數(shù)據(jù)較少的化爆,其識(shí)別效果依然不理想。
由于在現(xiàn)實(shí)環(huán)境中,化爆數(shù)據(jù)較少,無(wú)法采集到大量有效的數(shù)據(jù)作為訓(xùn)練樣本。為了解決上述由于化爆樣本量不足引起的識(shí)別率低的問(wèn)題,本文將生成式對(duì)抗網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,把增強(qiáng)后的化爆數(shù)據(jù)輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。
圖8 訓(xùn)練準(zhǔn)確率和損失率變化曲線
表2 CNN 測(cè)試結(jié)果
生成式對(duì)抗網(wǎng)絡(luò)(generative adversarial nets,GAN)由文獻(xiàn)[20-22]于2014 年提出,它主要包括學(xué)習(xí)數(shù)據(jù)分布的生成模型(G)和分辨數(shù)據(jù)真實(shí)性的判別模型(D)兩個(gè)部分。在網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,兩個(gè)模型交替優(yōu)化,不斷地進(jìn)行對(duì)抗,最終達(dá)到一個(gè)動(dòng)態(tài)均衡,從而具有輸出與訓(xùn)練樣本相似的新數(shù)據(jù)的能力。
采用GAN 對(duì)化爆數(shù)據(jù)進(jìn)行了訓(xùn)練和生成,增加了一倍的化爆偽樣本數(shù)據(jù),然后使用CNN 進(jìn)行識(shí)別實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表3 所示,訓(xùn)練準(zhǔn)確率為99.8%,測(cè)試準(zhǔn)確率為93.0%,特別是對(duì)化爆數(shù)據(jù)的識(shí)別上,性能有較大的提升,但仍然不夠理想,需要進(jìn)一步的研究。
表3 改進(jìn)后測(cè)試結(jié)果
從以上實(shí)驗(yàn)結(jié)果可以看出,SVM 和CNN 兩種模型都具有較高的識(shí)別能力,但由于事件數(shù)據(jù)類型分布不均,對(duì)于樣本數(shù)據(jù)較少的事件,識(shí)別準(zhǔn)確率偏低。從這個(gè)角度出發(fā),對(duì)模型的假正率(false positive rate, FPR)和真正率(true positive rate, TPR)進(jìn)行綜合評(píng)價(jià)。剔除對(duì)事件識(shí)別無(wú)用的噪聲數(shù)據(jù),對(duì)化爆、閃電、臺(tái)風(fēng)3 種類型的數(shù)據(jù)進(jìn)行識(shí)別實(shí)驗(yàn),將分類模型的輸出修改為每一個(gè)樣本數(shù)據(jù)被識(shí)別為3 種事件的概率,分別計(jì)算它們的ROC 曲線和AUC 值,所得結(jié)果如圖9 所示。
圖9 模型的ROC 曲線
通過(guò)多次實(shí)驗(yàn),對(duì)模型的AUC 值進(jìn)行統(tǒng)計(jì),并對(duì)其概率密度函數(shù)進(jìn)行擬合,所得結(jié)果如圖10所示。
圖10 模型AUC 值擬合概率密度曲線
SVM 模型的AUC 值近似服從參數(shù)為(α =54.4831,β = 2.06348)的β 分布,期望值E(x) =0.9635。而CNN 模型的AUC 值近似服從參數(shù)為(α = 37.0722,β = 3.24117)的β 分布,期望值E(x) =0.9196。對(duì)于本文研究的次聲數(shù)據(jù)樣本分布的特點(diǎn),SVM 模型的AUC 值總體高于CNN 模型,即SVM 模型性能較高。
在本文的研究中,支持向量機(jī)模型的識(shí)別性能較好,但它對(duì)人工設(shè)計(jì)的特征有較高的要求,需要研究人員對(duì)各種信號(hào)的各種特征進(jìn)行深入的研究,以便找出區(qū)別較大的信號(hào)特征。且對(duì)于多種類型數(shù)據(jù)的分類而言,需要訓(xùn)練多個(gè)支持向量機(jī)模型,當(dāng)有新的類別加進(jìn)來(lái)時(shí),需要對(duì)所有的模型進(jìn)行重新訓(xùn)練。
卷積神經(jīng)網(wǎng)絡(luò)以其在圖像識(shí)別中的優(yōu)良性能,可以挖掘出人工設(shè)計(jì)時(shí)忽略的時(shí)頻特征,從而較為準(zhǔn)確地對(duì)本文中的3 種大氣低頻聲信號(hào)的頻譜圖進(jìn)行識(shí)別,但對(duì)于小樣本數(shù)據(jù),依然存在學(xué)習(xí)不充分的問(wèn)題。采用生成式對(duì)抗網(wǎng)絡(luò)對(duì)學(xué)習(xí)過(guò)程進(jìn)行改進(jìn),能改善對(duì)特定事件的識(shí)別效果,可以進(jìn)一步結(jié)合CNN 與GAN 進(jìn)行研究,以達(dá)到更好的效果。