袁靜, 王橋, 張學(xué)民, 楊德賀* , 王志國, 張樂, 申旭輝, 澤仁志瑪
1 防災(zāi)科技學(xué)院, 河北 廊坊 062541 2 應(yīng)急管理部國家自然災(zāi)害防治研究院, 北京 100085 3 中國地震局地震預(yù)測研究所, 北京 100036 4 清華大學(xué), 北京 100084 5 中國電信股份有限公司研究院, 北京 102209
高空閃電發(fā)生時(shí)產(chǎn)生寬頻帶電磁波,電磁波中含有高頻成分和低頻成分.由于頻率高的群速度大,故高頻成分比低頻成分先到達(dá),導(dǎo)致接收喇叭中出現(xiàn)下降的聲調(diào),像哨聲一樣,故稱其為哨聲波.有的哨聲波,到達(dá)電離層后,沿著地磁力線傳播(如圖1所示)到達(dá)地球另一端共軛點(diǎn),稱之為短哨聲波.還有一部分被電離層反射回到閃電發(fā)生地,稱之為長哨聲波(Chen et al., 1996).目前觀測閃電哨聲波主要有兩種方式:地面甚低頻(Very low frequency, VLF)觀測站和空中飛行器.最著名的地面VLF觀測站是電離層閃電全息成像陣列(張義軍和張陽, 2016; Johnson, 2000),該陣列覆蓋了美國中西部閃電影響的絕大部分區(qū)域,通過觀測VLF信號(hào),對(duì)閃電伴隨的電離層的擾動(dòng)進(jìn)行深入研究,其研究主要涉及到閃電引起的電離層變化特征、觀測方法、相互作用模式以及引起的中高層空間放電現(xiàn)象等方面(Johnson, 2000; Kucherov and Nikolaenko, 1979; Lay and Shao, 2011; Marshall et al., 2008a,b; Inan et al., 1991).因此,地面VLF觀測站能夠通過閃電哨聲波現(xiàn)象研究閃電引起的電離層擾動(dòng),其缺點(diǎn)是地面觀測站具有空間的局限性,且觀測信號(hào)容易受到地面干擾,比如地鐵、工地建設(shè)等人類活動(dòng)的影響.衛(wèi)星捕獲的閃電哨聲波避免了空間位置的限制且不容易受地面干擾影響,因此,基于電磁衛(wèi)星的閃電哨聲波更適合開展電離層方面的研究和探索.
圖1 閃電哨聲波傳播路徑Fig.1 Propagation path of a lightning whistler
1993年,地震電離層擾動(dòng)理論的出現(xiàn)推動(dòng)了地震電磁衛(wèi)星的發(fā)展(Parrot et al., 1993).法國2001年正式對(duì)外公布 DEMETER衛(wèi)星計(jì)劃,2004年成功發(fā)射,2010年底停止運(yùn)行.DEMETER衛(wèi)星特定的軌道設(shè)計(jì)方案,使其成為全球第一顆專門用于地震和火山引起的電離層擾動(dòng)監(jiān)測的電磁衛(wèi)星,是國際上地震電磁空間探測一個(gè)里程碑式的發(fā)展標(biāo)志.隨后,在經(jīng)歷了長期的科研論證后,中國于2013年正式啟動(dòng)電磁衛(wèi)星計(jì)劃,2018年2月2日,ZH-1衛(wèi)星成功發(fā)射,2018年11月完成在軌測試,是國內(nèi)首個(gè)地球物理場探測衛(wèi)星,主要用于獲取全球空間電磁場、電磁波、電離層等離子體、高能粒子沉降等科學(xué)數(shù)據(jù),是提取與地震前兆相關(guān)的空間環(huán)境信息的重要觀測手段.所獲取的探測資料有利于地震電離層及空間物理相關(guān)現(xiàn)象研究的開展,成為世界同行關(guān)注的熱點(diǎn)(申旭輝等, 2018; 張學(xué)民等, 2020).
ZH-1衛(wèi)星的感應(yīng)磁力儀(Wang et al., 2018)和電場探測儀(Huang et al., 2018a,b)均能捕獲到閃電哨聲波現(xiàn)象,其在VLF波段的電磁場數(shù)據(jù)的時(shí)頻圖中呈現(xiàn)的是色散狀,如圖2和圖3所示.產(chǎn)生該形態(tài)特征的物理機(jī)制是:高頻的電磁波傳播的速度快,先到達(dá);低頻的電磁波的速度慢,后到達(dá),反映在時(shí)頻圖上是頻率隨著時(shí)間逐漸減少,稱之為“色散譜”.當(dāng)路徑長度較長或沿傳輸路徑的電子密度較密集時(shí),色散譜變大.由此說明,色散形態(tài)與傳播路徑的長度和傳播路徑中的等離子體的電子密度分布有關(guān).除此之外,閃電哨聲波在傳播的過程中攜帶了其他大量的地球空間物理的相關(guān)信息,因此,電磁衛(wèi)星的閃電哨聲波是開展空間物理研究的重要媒介和手段.例如:Záhlava等(2018a)分析了DEMETER和RBSP對(duì)地球內(nèi)部磁層哨聲模式波的縱向依賴性的測量結(jié)果,結(jié)果表明等離子體層內(nèi)部的哨聲模式波的縱向依賴性很強(qiáng).Bayupati等(2012)分析AKEBONO衛(wèi)星觀測到的閃電哨聲波的色散形態(tài),討論了閃電哨聲波沿軌道傳播的時(shí)間與電子密度分布的關(guān)系,表明了閃電哨聲波的色散趨勢是確定等離子體層中整體電子密度分布的有力方法.Oike等(2014)分析了AKEBONO衛(wèi)星探測到的閃電哨聲波發(fā)生頻率與地面觀測到的閃電活動(dòng)的空間分布和時(shí)間變化,表明了在電離層中閃電哨聲波的出現(xiàn)與閃電活動(dòng)以及地球周圍的電子密度分布密切相關(guān).Clilverd等(2002)使用全球閃電定位網(wǎng)(World-Wide Lightning Location Network, WWLLN)來確定閃電的來源位置,然后根據(jù)閃電哨聲波的傳播時(shí)間,遠(yuǎn)程感測電子密度分布頻率,借助傳播理論導(dǎo)出電子密度沿傳播路徑的函數(shù).Parrot等(2019)通過閃電哨聲波發(fā)現(xiàn):全球溫度變化1°,閃電發(fā)生頻率變化5%~6%.Záhlava等(2018b)通過觀測閃電哨聲波色散形態(tài)的衰減程度發(fā)現(xiàn)晚上衰減慢,并得到晚間的空間電離層的濃度低的結(jié)論.此外,由于空中飛行的衛(wèi)星的電子元件容易受高能電子的總劑量效應(yīng)和單粒子效應(yīng)影響而受損,借助哨聲波數(shù)據(jù)構(gòu)造哨聲波參數(shù)統(tǒng)計(jì)模型,開展基于哨聲波模型的高能電子通量預(yù)測,對(duì)衛(wèi)星設(shè)計(jì)和防護(hù)具有重要的意義(Horne et al., 2013; 羅旭東等, 2017).
圖2 張衡一號(hào)衛(wèi)星閃電哨聲波形態(tài)圖例Fig.2 The time-frequency spectrogram of the lightning whistler observed by ZH-1 satellite
圖3 DEMETER衛(wèi)星閃電形態(tài)圖例(Parrot et al., 2015)Fig.3 The time-frequency spectrogram of the lightning whistler observed by DEMETER (Parrot et al., 2015)
綜上,電磁衛(wèi)星能夠捕獲到大量的閃電哨聲波,為借鑒閃電哨聲波的形狀特征和色散程度等開展地震電離層和空間物理研究提供了可靠的數(shù)據(jù)支撐.然而,目前通過人工識(shí)別閃電哨聲波現(xiàn)象的方式阻礙了相關(guān)研究的進(jìn)展(Ferencz et al., 2001;Lichtenberger et al., 2008),其主要原因是:
(1)電磁衛(wèi)星高精度和全天候的工作模式導(dǎo)致電磁衛(wèi)星存檔的數(shù)據(jù)體量很大,比如ZH-1衛(wèi)星日產(chǎn)的數(shù)據(jù)量高達(dá)20 G.
(2)閃電頻發(fā)使得電磁衛(wèi)星捕獲的閃電哨聲波現(xiàn)象的數(shù)量很大.閃電是在地球空間發(fā)生最為頻繁的一種自然現(xiàn)象,1925年,Brooks等(1925)使用雷暴日資料,估計(jì)全球在任一時(shí)刻存在1800個(gè)閃電.2003年Christian指出全球閃電每秒鐘45次.此外,據(jù)WWLLN(http:∥www.wwlln.com/)記載:僅2017年閃電發(fā)生了2.08億次.2019年7月28日,全球閃電分布如圖4所示,發(fā)生雷電約64萬個(gè).
圖4 2019年7月28日全球閃電密度分布圖 (http:∥dudwlln.otago.ac.nz/)Fig.4 A global lightning density map on July 28, 2019 (http:∥dudwlln.otago.ac.nz/)
面臨數(shù)據(jù)層面的挑戰(zhàn),近年來,隨著計(jì)算機(jī)視覺和深度學(xué)習(xí)等技術(shù)的發(fā)展,國內(nèi)外學(xué)者借助人工智能技術(shù)開始了從電磁衛(wèi)星數(shù)據(jù)中自動(dòng)檢測閃電哨聲波的研究,閃電哨聲波傳播的物理機(jī)制決定了其在時(shí)頻圖中特征是具有明顯的色散形態(tài),閃電哨聲波智能檢測的目標(biāo)是從時(shí)頻圖中識(shí)別色散形態(tài)并進(jìn)行定位.該問題的本質(zhì)屬于計(jì)算機(jī)視覺中的目標(biāo)檢測問題.目前發(fā)表的基于閃電哨聲波智能檢測算法涉及到空間物理、信號(hào)處理、圖像處理、模式識(shí)別和機(jī)器學(xué)習(xí)等多學(xué)科交叉,并取得了一定的效果.
本文將對(duì)閃電哨聲波智能檢測算法進(jìn)行整理和對(duì)比分析,創(chuàng)新點(diǎn)主要體現(xiàn)在:首次綜述基于電磁衛(wèi)星數(shù)據(jù)的閃電哨聲波智能檢測算法,對(duì)不同的算法進(jìn)行分類整理和分析,為開展基于人工智能技術(shù)的海量電磁衛(wèi)星數(shù)據(jù)處理提供參考.全文的內(nèi)容組織安排如下:第一節(jié)介紹閃電哨聲波的時(shí)頻特征和類型;第二節(jié)介紹智能檢測算法的基本內(nèi)容,分別從特征提取、分類(識(shí)別)和定位三個(gè)方面對(duì)不同的算法進(jìn)行整理和對(duì)比分析;第三節(jié)介紹智能檢測算法的評(píng)價(jià)標(biāo)準(zhǔn);第四節(jié)對(duì)部分算法進(jìn)行復(fù)現(xiàn);第五節(jié)總結(jié)當(dāng)前閃電哨聲波智能檢測算法的現(xiàn)狀,展望閃電哨聲波智能檢測研究的發(fā)展趨勢和應(yīng)用前景.
目前,人工識(shí)別電磁數(shù)據(jù)中的閃電哨聲波的過程通常包含三個(gè)環(huán)節(jié):對(duì)電場數(shù)據(jù)/磁場數(shù)據(jù)進(jìn)行預(yù)處理;采用重疊的快速傅里葉變換將預(yù)處理后的數(shù)據(jù)轉(zhuǎn)化成時(shí)頻圖;在時(shí)頻圖中,尋找色散形態(tài)區(qū)域.以此為依據(jù),在DEMETER衛(wèi)星中發(fā)現(xiàn)了大量的閃電哨聲波的降調(diào)形態(tài)(Helliwell, 1965; 胡云鵬等, 2020; Santolík et al., 2009),如圖3所示.Helliwell(1965)根據(jù)色散程度將地面VLF觀測站觀測到的閃電哨聲波分為8種不同的類型,如表1所示.Santolík等(2009)指出地面VLF觀測站記錄的閃電形態(tài)與衛(wèi)星觀測到的閃電形態(tài)極其相似且均具有頻散特性.不同類型的閃電哨聲波均與閃電源、傳播路徑的長短、電子密度等物理空間環(huán)境有關(guān),是探測等離子層及輻射帶的重要媒介.值得注意的是目前的閃電哨聲波識(shí)別算法均適用于識(shí)別單條線的閃電哨聲波類型.
閃電哨聲波自動(dòng)識(shí)別最早可追溯到2008年,Lichtenberger等(2008)指出通過哨聲波監(jiān)測等離子體層電子密度變化遇到的瓶頸問題是需要大量人力從觀測數(shù)據(jù)中去提取和辨識(shí)哨聲波并分析哨聲波的軌跡.因此,作者在蒂豪尼15個(gè)地面觀測站的數(shù)據(jù)的基礎(chǔ)上,提出了一個(gè)自動(dòng)檢測哨聲波的算法(Automatic whistler detector and analyzer system, AWD).該方法開辟了閃電哨聲波智能檢測算法的先例,并比較成功的應(yīng)用到從地面VLF觀測站中自動(dòng)識(shí)別閃電哨聲波,該方法對(duì)于識(shí)別分?jǐn)?shù)跳(表1中的第8個(gè)類型)的閃電哨聲波效果較佳.
閃電哨聲波智能檢測算法的本質(zhì)是屬于計(jì)算機(jī)視覺中的目標(biāo)檢測,旨在從圖像中尋找感興趣的區(qū)域,提取該區(qū)域的特征,準(zhǔn)確判斷該特征的類別,并進(jìn)行定位.因此,完整的閃電哨聲波智能檢測算法的流程如圖5所示:(1)收集電磁場數(shù)據(jù),通常是VLF波段的電場或磁場波形數(shù)據(jù),如圖6所示;(2)對(duì)數(shù)據(jù)進(jìn)行濾波等預(yù)處理;(3)采用快速傅里葉變換處理電磁場數(shù)據(jù)得到時(shí)頻圖,如圖7所示;(4)采用特征提取方法從時(shí)頻圖中提取能夠表示閃電哨聲波的特征;(5)對(duì)提取到的特征進(jìn)行分類(識(shí)別);(6)用邊界框?qū)ψR(shí)別的目標(biāo)進(jìn)行定位.
圖5 閃電哨聲波智能檢測的流程Fig.5 The overall flow chart of the lightning whistlers detection
圖6 張衡一號(hào)感應(yīng)式磁力儀測得的快速變化磁場數(shù)據(jù)Fig.6 The fast variation data of geomagnetic field obtained by Search Coil Magnetometer onboard ZH-1 satellite
圖7 張衡一號(hào)感應(yīng)式磁力儀快速變化磁場數(shù)據(jù)的時(shí)頻圖Fig.7 The time-frequency spectrogram of the Search Coil Magnetometer data in Fig.6
在上述流程中,閃電哨聲波的特征提取、分類(識(shí)別)和定位是算法的核心環(huán)節(jié).接下來分別從特征提取、分類(識(shí)別)和定位三個(gè)方面對(duì)現(xiàn)存的智能檢測識(shí)別算法進(jìn)行梳理和對(duì)比.
特征提取是計(jì)算機(jī)視覺智能識(shí)別過程中的關(guān)鍵環(huán)節(jié).其主要作用是將智能模型不能識(shí)別的原始數(shù)據(jù)轉(zhuǎn)化為智能模型可以識(shí)別的數(shù)值特征的過程.比如說,圖像是由一系列像素點(diǎn) (原始數(shù)據(jù)) 構(gòu)成的,這些像素點(diǎn)本身無法被智能模型直接使用,需要將這些像素點(diǎn)轉(zhuǎn)化成角點(diǎn)、紋理等形式(數(shù)值特征),供智能模型使用.特征的好壞對(duì)泛化性能有至關(guān)重要的影響(周志華, 2016).對(duì)閃電哨聲波進(jìn)行特征提取旨在數(shù)值化閃電哨聲波的色散形態(tài)特征.本小節(jié)分別從人工提取特征和自動(dòng)提取特征兩個(gè)方面進(jìn)行整理和對(duì)比分析.
2.1.1 人工提取特征
所謂人工提取特征是根據(jù)人工分析并結(jié)合相關(guān)的處理手段提取特征的過程.由于閃電哨聲波具有明顯的色散形態(tài),The Stanford VLF Group(2018),F(xiàn)iser等(2010),Oike等(2014),Ali Ahmad等(2019)和Dharma等(2014)采用圖像處理技術(shù)來提取閃電哨聲波的形態(tài)特征.The Stanford VLF Group(2018)針對(duì)DEMETER衛(wèi)星的閃電哨聲波,提出的特征提取方法是:對(duì)時(shí)頻圖(如圖8所示)進(jìn)行去噪處理和網(wǎng)格劃分,如圖9所示,然后計(jì)算每個(gè)網(wǎng)格中的平均幅度值,得到如圖10所示的特征表示.
圖8 時(shí)頻圖(The Stanford VLF Group, 2018)Fig.8 The time-frequency spectrogram (The Stanford VLF Group, 2018)
圖9 去噪和網(wǎng)格化(The Stanford VLF Group, 2018)Fig.9 Denoising and meshing (The Stanford VLF Group, 2018)
圖10 合并(The Stanford VLF Group, 2018)Fig.10 Binning (The Stanford VLF Group, 2018)
圖11 灰度化的時(shí)頻圖(Dharma et al., 2014)Fig.11 Grayscale image of the time-frequency spectrogram (Dharma et al., 2014)
圖12 二值化處理后的時(shí)頻圖(Dharma et al., 2014)Fig.12 Binary image of the time-frequency spectrogram (Dharma et al., 2014)
圖13 中值濾波和開運(yùn)算處理后的時(shí)頻圖(Dharma et al., 2014)Fig.13 The results by median filter and open operation (Dharma et al., 2014)
圖14 連通域標(biāo)記(Dharma et al., 2014)Fig.14 Labeling the connected domain (Dharma et al., 2014)
R=(x0,y0,w,h),
(2)
(3)
其中f(x,y)表示位置(x,y)的像素值,在本實(shí)例中其有兩種取值0和1.其目標(biāo)區(qū)域是0,背景區(qū)域是1.(5)本方法檢測的是單條譜線的閃電哨聲波.當(dāng)找到所有的連通區(qū)域后,發(fā)現(xiàn)不含閃電哨聲波的連通區(qū)域具有非常少的連通像素,因此,用下列篩選方法刪除非閃電哨聲波的連通區(qū)域.篩選方法是:統(tǒng)計(jì)每個(gè)連通區(qū)域的目標(biāo)像素的數(shù)量,該值小于某閾值時(shí),相應(yīng)的連通區(qū)域和矩形框被刪除,剩下的矩形框標(biāo)記的連通區(qū)域即為檢測到的閃電哨聲波區(qū)域.此時(shí),若依然存在兩個(gè)重疊的矩形框,則意味著存在兩個(gè)連通區(qū)域,這兩個(gè)區(qū)域相互之間不連通且兩個(gè)連通區(qū)域的重心不同,表示是兩個(gè)不同的單條譜線的閃電哨聲波.
該方法適合檢測單條譜線的閃電哨聲波,其缺陷是容易將相近的兩個(gè)閃電哨聲波識(shí)別為一個(gè)閃電哨聲波.
上述閃電哨聲波智能檢測算法的特征提取依賴人工定義.這些方法與傳統(tǒng)的計(jì)算機(jī)視覺的目標(biāo)檢測算法類似.在傳統(tǒng)的計(jì)算機(jī)視覺的目標(biāo)檢測中,通常人工提取的特征包括尺度不變特征(Scale Invariant Feature Transform)(Lowe, 2004; Cai et al., 2015),哈爾特征(Viola and Jones, 2001)等,針對(duì)提取的特征,再采用AdaBoost(Adaptive Boosting)(Zhang et al., 2016)和DPM(Deformable Parts Model)(Felzenszwalb et al., 2008)等方法對(duì)特征進(jìn)行分類(識(shí)別),其識(shí)別結(jié)果受特征的影響較大(Pei et al., 2016).因此,基于人工定義特征提取的閃電哨聲波智能檢測算法,最大的局限性是難以獲得魯棒性強(qiáng)的特征,對(duì)時(shí)頻噪聲十分敏感.
2.1.2 自動(dòng)提取特征
自動(dòng)提取特征旨在采用機(jī)器學(xué)習(xí)的方式由計(jì)算機(jī)自動(dòng)從數(shù)據(jù)集中獲取特征.LeCun等(2015)在利用深度神經(jīng)網(wǎng)絡(luò)自動(dòng)提取圖像特征方面取得了一系列的突破.從此,基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測越來越引起業(yè)界的重視(Liu et al., 2018).鑒于深度神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的自動(dòng)提取特征的能力,Konan等(2020)提出了兩種基于深度卷積神經(jīng)網(wǎng)絡(luò)的閃電哨聲波的特征提取方法:基于滑動(dòng)深度卷積神經(jīng)網(wǎng)絡(luò)的閃電哨聲波算法(Sliding Deep Neural Convolutional Neural Network, SDNN)(Konan et al., 2020)和基于YOLOV3 (You Only Look Once and Version 3rd, YOLOV3)目標(biāo)檢測網(wǎng)絡(luò)的閃電哨聲波算法(Konan et al., 2020),并公開了其源碼(https:∥github.com/Kojey/MSc-whistler-waves-detector).
滑動(dòng)深度卷積神經(jīng)網(wǎng)絡(luò)的閃電哨聲波特征提?。褐饕膬?yōu)勢是其卷積層具有強(qiáng)大的特征學(xué)習(xí)能力.由于閃電哨聲波具有簡單的形狀,提出了三個(gè)卷積層的卷積神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行特征提取.該網(wǎng)絡(luò)有兩個(gè)主要組成部分:卷積層和分類層,如圖15第1~3層所示為卷積層:第1層和第2層的卷積層具有卷積單元和池化單元:卷積單元負(fù)責(zé)提取圖像中的局部特征,第一層卷積單元有2個(gè)卷積核,第二層的卷積單元有4個(gè)卷積核;池化單元用來大幅降低參數(shù)量級(jí)(降維)防止過擬合;第3層的卷積層有8個(gè)卷積核,無池化層.全網(wǎng)絡(luò)結(jié)構(gòu)共14個(gè)卷積核,主要作用是提取圖像的局部特征.
圖15 滑動(dòng)的深度卷積神經(jīng)網(wǎng)絡(luò)(Konan et al., 2020)Fig.15 Sliding deep convolutional neural networks (Konan et al., 2020)
圖16為卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)到的卷積核及其相關(guān)的特征圖:圖16a是訓(xùn)練得到卷積神經(jīng)網(wǎng)絡(luò)模型后,顯示了該模型的第一層的兩個(gè)卷積核、第二層的四個(gè)卷積核以及第三層的8個(gè)卷積核;卷積核提取的特征都具有相同的功能(梯度遞減的線),但在卷積核中的位置不同;此外,卷積核提取的特征具有明顯的特征相似性,其原因是哨聲波的形態(tài)特征除了色散狀沒有明顯的其他形狀特征;第三層的卷積核提取的特征的分辨率低,其主要原因是隨著網(wǎng)絡(luò)的深入,學(xué)習(xí)到的特征更加復(fù)雜且不容易理解.圖16b顯示的是應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)模型提取閃電哨聲波特征,可以清楚地觀察到原始哨聲波的形狀.圖16c顯示的是應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)模型提取非閃電哨聲波的特征,沒有觀察到明顯的形狀.
圖16 卷積層的輸出(Konan et al., 2020)(a) 訓(xùn)練得到的卷積核; (b) 卷積核提取的閃電形態(tài)特征; (c) 卷積核提取的非閃電形態(tài)的特征.Fig.16 Output of convolutional layer (Konan et al., 2020)(a) Filters of the trained neural network; (b) Feature maps when detecting whistlers; (c) Feature Maps when detecting noise.
基于YOLOV3深度神經(jīng)網(wǎng)絡(luò)的閃電哨聲波特征提取:借鑒YOLOV3深度神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)能力,Konan等(2020)直接利用YOLOV3網(wǎng)絡(luò)訓(xùn)練閃電哨聲波數(shù)據(jù)集,其過程包括:將閃電哨聲波波形數(shù)據(jù)預(yù)處理后轉(zhuǎn)化為時(shí)頻圖,對(duì)時(shí)頻圖進(jìn)行圖像標(biāo)注,在標(biāo)注的數(shù)據(jù)上訓(xùn)練神經(jīng)網(wǎng)絡(luò)YOLOV3.YOLOV3的特征提取是目前最優(yōu)的特征提取方式,由Redmon等(Redmon et al., 2016; Redmon and Farhadi, 2017, 2018)提出.網(wǎng)絡(luò)模型結(jié)構(gòu)圖如圖17所示:此結(jié)構(gòu)主要由75個(gè)卷積層構(gòu)成,卷積層對(duì)于分析物體特征最為有效.由于沒有使用全連接層,該網(wǎng)絡(luò)可以適應(yīng)任意大小的輸入圖像.此外,在YOLOV3中沒有出現(xiàn)池化層,取而代之的是將卷積層的步長設(shè)為2來達(dá)到下采樣的效果,同時(shí)將尺度不變特征傳送到下一層.其自動(dòng)提取特征的優(yōu)勢體現(xiàn)在YOLOV3中使用了殘差結(jié)構(gòu)(對(duì)應(yīng)著在上面的YOLOV3結(jié)構(gòu)圖中的Residual Block).殘差結(jié)構(gòu)是由一系列卷積層和一條短路徑組成,如圖18所示.隨著網(wǎng)絡(luò)越來越深,學(xué)習(xí)特征的難度也就越來越大,之前的卷積神經(jīng)網(wǎng)絡(luò)是直接學(xué)習(xí)特征x,加入短路徑后變成在之前學(xué)習(xí)的特征的基礎(chǔ)上添加某些特征F(x),以此獲得更為魯棒的特征H(x)=F(x)+x(Redmon and Farhadi, 2018).該策略使得機(jī)器學(xué)習(xí)的目標(biāo)從學(xué)習(xí)完整的特征變成學(xué)習(xí)殘差特征,極大地降低了學(xué)習(xí)魯棒特征的難度.
圖17 YOLOV3的網(wǎng)絡(luò)結(jié)構(gòu)(Redmon and Farhadi, 2018)Fig.17 The network structure of YOLOV3 (Redmon and Farhadi, 2018)
圖18 YOLOV3的殘差網(wǎng)絡(luò)(Redmon and Farhadi, 2018)Fig.18 The residual network in the network structure of YOLOV3 (Redmon and Farhadi, 2018)
基于SDNN網(wǎng)絡(luò)的閃電哨聲波檢測模型和基于YOLOV3網(wǎng)絡(luò)的閃電哨聲波檢測模型的調(diào)參過程將在第4.2.2小節(jié)進(jìn)行闡述,模型的訓(xùn)練過程將在第4.3小節(jié)進(jìn)行介紹.
分類旨在通過設(shè)計(jì)算法為提取的特征分配類別標(biāo)簽,通常也叫識(shí)別.閃電哨聲波分類算法的目標(biāo)是對(duì)上節(jié)提取的特征進(jìn)一步判斷其是閃電哨聲波或不是閃電哨聲波.本小節(jié)將現(xiàn)有的閃電哨聲波的分類算法分為兩類:基于模板匹配的分類算法和基于神經(jīng)網(wǎng)絡(luò)的分類算法.分別從這兩個(gè)方面進(jìn)行整理和對(duì)比分析.
2.2.1 基于模板匹配的分類
由于閃電哨聲波具有明顯的色散形態(tài),The Stanford VLF Group(2018),F(xiàn)iser等(2010),Ali Ahmad等(2019)和Oike等(2014)在提取的閃電哨聲波形態(tài)特征的基礎(chǔ)上,采用模板匹配的方式對(duì)閃電哨聲波的特征進(jìn)行分類識(shí)別.首先:根據(jù)閃電哨聲波的色散形態(tài)制作模板,計(jì)算待識(shí)別區(qū)域與模板之間的相似度,當(dāng)其達(dá)到某個(gè)閾值時(shí),認(rèn)為該區(qū)域是閃電哨聲波,否則視為沒有閃電哨聲波.
The Stanford VLF Group(2018)制作的閃電哨聲波的模板,是采用格子化的手段對(duì)圖像進(jìn)行降采樣處理,得到如圖10相似的模板.用模板與待檢測的區(qū)域進(jìn)行卷積計(jì)算得到相似度度量的值,以此閾值作為分類標(biāo)準(zhǔn),高于該閾值,判斷待測區(qū)域?yàn)殚W電哨聲波.
Fiser等(2010)提出閃電哨聲波的色散符合Eckersley公式(Gurnett et al., 1990),t=Df-0.5,其中D是色散率,t是頻率f的波到達(dá)的時(shí)間.同時(shí)指出白天和晚上的色散狀態(tài)存在差異,則其制作兩個(gè)哨聲波模板.如圖19所示的是白天的哨聲波模板,時(shí)間寬度0.4 s,再按照同樣的方法得到晚上的哨聲波模板,模板記為b.然后,從電場波形數(shù)據(jù)中提取0.4 s的波形數(shù)據(jù),做重疊短時(shí)傅里葉變換得到頻譜圖,用a表示,接著按照下列公式(4)計(jì)算互相關(guān)函數(shù)得到互相關(guān)值.最后采用閾值判斷互相關(guān)值最大的地方,即為檢測到的閃電哨聲波,如圖20所示.
(4)
圖19 閃電哨聲波模板(Fiser et al., 2010)Fig.19 Lightning whistler template (Fiser et al., 2010)
圖20 基于互相關(guān)熵的閃電哨聲波自動(dòng)檢測(Fiser et al., 2010)Fig.20 Automatic detection of lightning whistler with cross-correlation entropy (Fiser et al., 2010)
當(dāng)上述30個(gè)頻帶中的6個(gè)頻帶與其中一個(gè)直線匹配時(shí),被判定為潛在的閃電哨聲波;當(dāng)同時(shí)檢測到多個(gè)潛在哨聲波重疊時(shí),從潛在哨聲中選出最匹配的一個(gè),其結(jié)果如圖22所示.
圖21 時(shí)間變化與頻率之間的關(guān)系圖(Oike et al., 2014)Fig.21 Relationship between time and frequency (Oike et al., 2014)
圖22 檢測閃電哨聲波的結(jié)果(Oike et al., 2014)Fig.22 Detection results of lightning whistler (Oike et al., 2014)
Ali Ahmad等(2019)認(rèn)為根據(jù)Eckersley公式制作的模板,能夠識(shí)別近似直線的閃電哨聲波,無法識(shí)別諸如鼻型、長型等類型的哨聲波,則提出了利用曲線檢測和模式規(guī)則結(jié)合的哨聲波識(shí)別方法.再用Bresenham線檢測算法檢測線(Bresenham, 1977),利用如圖23所示的決策方案識(shí)別6種不同類型的閃電哨聲波.
圖23 決策規(guī)則(Ali Ahmad et al., 2019)Fig.23 Decision Rules (Ali Ahmad et al., 2019)
2.2.2 基于神經(jīng)網(wǎng)絡(luò)的分類
基于SDNN的分類器(Konan et al., 2020):如圖24所示,其分類環(huán)節(jié)是由最后兩層完成,包含128個(gè)神經(jīng)元的全連接層和2個(gè)神經(jīng)元的輸出層.為防止過度擬合,在分類環(huán)節(jié)增加了2個(gè)Dropout層,聯(lián)合前面的3個(gè)卷積層和2個(gè)池化層,整個(gè)網(wǎng)絡(luò)共有522112個(gè)可訓(xùn)練參數(shù).
圖24 滑動(dòng)的三層深度卷積神經(jīng)網(wǎng)絡(luò) (Konan et al., 2020)Fig.24 Sliding three-layer deep convolutional neural network (Konan et al., 2020)
基于YOLOV3深度卷積神經(jīng)網(wǎng)絡(luò)的分類方法:在傳統(tǒng)的深度卷積網(wǎng)絡(luò)中利用不同深度的特征直接分類,小的物體會(huì)在相對(duì)較大的特征圖中被識(shí)別出來,而大的物體會(huì)在相對(duì)較小的特征中被識(shí)別出來,從而達(dá)到對(duì)應(yīng)不同尺度的物體的目的.然而在實(shí)際應(yīng)用中,不同深度所對(duì)應(yīng)的特征圖包含的信息不同,導(dǎo)致在不同級(jí)別的特征中進(jìn)行目標(biāo)檢測的精度不夠.為了克服該問題,YOLOV3采用了多尺度融合(Feature Pyramid Networks, FPN)技術(shù),如圖25所示:采用上采樣(Upsample)和融合做法,融合了3個(gè)尺度(13×13、26×26和52×52),在多個(gè)尺度的融合特征圖上分別獨(dú)立做檢測,使得對(duì)小目標(biāo)的檢測效果得到明顯提升.此外,其輸出層的激活函數(shù)用邏輯回歸替換了傳統(tǒng)的softmax,輸出結(jié)果由類別標(biāo)簽變?yōu)轭悇e的概率.
圖25 FPN特征融合: (a) 13×13; (b) 26×26; (c) 52×52.Fig.25 FPN fusion
基于SDNN網(wǎng)絡(luò)的閃電哨聲波檢測模型和基于YOLOV3網(wǎng)絡(luò)的閃電哨聲波檢測模型的調(diào)參過程將在第4.2.2小節(jié)進(jìn)行闡述,其訓(xùn)練過程將在4.3小節(jié)進(jìn)行介紹.
閃電哨聲波智能檢測算法中的定位方法主要有兩種:滑動(dòng)窗方法和智能判斷方法.The Stanford VLF Group(2018),F(xiàn)iser等(2010),Ali Ahmad等(2019)和Oike等(2014)提出的定位方法與Konan等(2020)提出的滑動(dòng)卷積神經(jīng)網(wǎng)絡(luò)的閃電哨聲波檢測的定位方法均采用的是在時(shí)頻圖中滑動(dòng)固定時(shí)間長度的窗,然后對(duì)窗內(nèi)的區(qū)域進(jìn)行特征提取和分類,該定位策略主要針對(duì)單條頻譜曲線的閃電哨聲波類型,且這些閃電哨聲波圖像區(qū)域的寬度相差不大,該方案無法檢測多個(gè)閃電源的閃電哨聲波和單個(gè)閃電源的多條頻譜曲線構(gòu)成的閃電哨聲波的類型.通常,多個(gè)閃電源的閃電哨聲波類型包含多條頻譜曲線,若多條頻譜曲線均由每個(gè)閃電源的第一跳的哨聲波頻譜曲線組成,則每條頻譜曲線的強(qiáng)度都較大,反映在圖像上的特點(diǎn)是多條頻譜曲線的顏色/亮度差別不大;若多條頻譜曲線是由每個(gè)閃電源的多跳的哨聲波頻譜曲線組成,則頻譜曲線的頻譜強(qiáng)度存在差異和變化,這種差異會(huì)周期性出現(xiàn),反映在圖像上的特點(diǎn)是顏色/亮度差異隨著時(shí)間的變化而周期性出現(xiàn).而單個(gè)事件的多條頻譜曲線的閃電哨聲波類型也包括多條頻譜曲線,但頻譜曲線的頻譜強(qiáng)度隨著時(shí)間發(fā)生變化,時(shí)間滯后的頻譜曲線其頻譜強(qiáng)度逐漸變小,反映在圖像上的特點(diǎn)是其顏色/亮度逐漸變淡.針對(duì)頻譜曲線的強(qiáng)度隨時(shí)間變化的特點(diǎn),可采用計(jì)算機(jī)視覺處理技術(shù)提取上述頻譜強(qiáng)度等信息,并進(jìn)一步探索新方法,使其適用于檢測多閃電源的多頻譜曲線的閃電哨聲波和單閃電源的多頻譜曲線的閃電哨聲波.
基于YOLOV3深度神經(jīng)網(wǎng)絡(luò)閃電哨聲波智能檢測算法 (Konan et al., 2020)采用的定位方法:其數(shù)學(xué)模型中融合了定位、特征提取和分類.位置的數(shù)學(xué)模型,如圖26所示.其中tx,ty,tw,th表示模型的預(yù)測輸出,cx和cy表示網(wǎng)格單元的坐標(biāo),pw和ph表示預(yù)測前邊界框的尺寸,bx,by,bw,bh就是預(yù)測得到的邊界框的中心坐標(biāo)和尺寸,坐標(biāo)的損失函數(shù)采用平方誤差.δ(tx)和δ(ty)表示在x軸和y軸上預(yù)測得到的邊界框的中心坐標(biāo)相對(duì)于網(wǎng)絡(luò)單元坐標(biāo)的距離.
圖26 YOLOV3 坐標(biāo)模型 (Redmon and Farhadi, 2018)Fig.26 Coordinate representation in mathematical model of the YOLOV3 (Redmon and Farhadi, 2018)
評(píng)估閃電哨聲波智能檢測算法通常需要用到基準(zhǔn)數(shù)據(jù),目前采用的基準(zhǔn)數(shù)據(jù)主要是歐洲閃電探測網(wǎng)(http:∥www.euclid.org)和全球閃電定位網(wǎng)絡(luò)(http:∥www.wwlln.com/)的數(shù)據(jù).在基準(zhǔn)數(shù)據(jù)的基礎(chǔ)上,其評(píng)價(jià)指標(biāo)主要有四種:錯(cuò)分率、虛警率、漏檢率和F1值.四種指標(biāo)從不同的角度評(píng)價(jià)了智能檢測模型的性能(楊德賀等, 2018).
設(shè)閃電哨聲波是正類樣本(Positive,P),非閃電哨聲波是負(fù)類樣本(Negative,N),接下來將闡述四種指標(biāo)的定義.首先,符號(hào)定義如表2的混淆矩陣.
表2 矩陣Table 2 Matrix
NTP表示真正例的樣本的數(shù)量;NFN表示假負(fù)例的樣本的數(shù)量;NFP表示假正例的樣本的數(shù)量;NTN表示真負(fù)例的樣本的數(shù)量;四種評(píng)價(jià)指標(biāo)的定義如下:
(1)錯(cuò)分率=(NFP+NFN)/(NTN+NTP+NFP
+NFN) .
(5)
含義:在所有待檢測的數(shù)據(jù)中,誤識(shí)別的數(shù)據(jù)量所占的比例,通常該指標(biāo)越小越好.
(2)虛警率=NFP/(NFP+NTP),
(6)
含義:在所有檢測到的閃電哨聲波的數(shù)據(jù)中,將非閃電哨聲波誤判為閃電哨聲波的數(shù)據(jù)所占的比例.
(3)漏檢率=NFN/(NTP+NFN),
(7)
含義:在所有已知的閃電哨聲波的樣本中,將閃電哨聲波誤判為非閃電哨聲波所占的比例.
(4)F1值(F1-Score)
=2/(1/Precision+1/Recall),
(8)
其中:Precision表示準(zhǔn)確率,準(zhǔn)確率=NTP/(NTP+NFP):其含義是預(yù)測正確的圖片個(gè)數(shù)占總的正類預(yù)測個(gè)數(shù)的比例,該指標(biāo)越大越好;Recall表示召回率,召回率=NTP/(NTP+NFN):其含義是確定正類被預(yù)測為正類圖片占所有標(biāo)注圖片的個(gè)數(shù),該指標(biāo)越大越好.通常情況下,準(zhǔn)確率高,召回率就低,召回率高,準(zhǔn)確率就低.指標(biāo)F1-Score綜合考慮準(zhǔn)確率和召回率的調(diào)和值.
目前評(píng)價(jià)閃電哨聲波智能檢測效果的定量指標(biāo)如表3所示.通過表3發(fā)現(xiàn),在閃電哨聲波智能檢測性能的評(píng)價(jià)指標(biāo)方面,更注重的是錯(cuò)分率和虛警率.同時(shí),本文認(rèn)為漏檢率亦重要.
表3 閃電哨聲波檢測算法的性能指標(biāo)比較Table 3 Performance indexes for lightning whistler detection algorithm
虛警率:基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的閃電哨聲波的特征具有抽象和強(qiáng)魯棒的特點(diǎn),強(qiáng)魯棒通常意味著學(xué)習(xí)到的特征具有旋轉(zhuǎn)不變性.比如,將圖27a分別旋轉(zhuǎn)了90°、180°和270°后則得到圖27(b—d),再將圖27(a—d)分別輸入到Y(jié)OLOV3網(wǎng)絡(luò)后獲取的特征是相同的.因此,若時(shí)頻圖中的非閃電哨聲波的空間現(xiàn)象呈現(xiàn)的形狀特征與閃電哨聲波呈現(xiàn)的形狀特征具有旋轉(zhuǎn)相似性,如圖28a所示:其矩形框內(nèi)的圖像不是閃電哨聲波,但其色散狀特征旋轉(zhuǎn)180°后與閃電哨聲波色散狀極其相似,因此容易被誤識(shí)別為閃電哨聲波,致其虛警率升高,同時(shí)錯(cuò)分率增加.
圖27 旋轉(zhuǎn)不變性(a) 原圖; (b) 逆時(shí)針旋轉(zhuǎn)90°; (c) 逆時(shí)針旋轉(zhuǎn)180°; (d) 逆時(shí)針旋轉(zhuǎn)270°.Fig.27 Rotation invariance(a) Original image; (b) 90° anticlockwise rotation; (c) 180° anticlockwise rotation; (d) 270° anticlockwise rotation.
圖28 實(shí)例(a) 虛警實(shí)例; (b) 漏檢實(shí)例.Fig.28 An example(a) False alarm; (b) Undetected.
漏檢率:若時(shí)頻圖中的閃電哨聲波比較密集,如圖28b所示最左邊的矩形框內(nèi)有兩條閃電哨聲波,但由于密集,導(dǎo)致只識(shí)別出一條閃電哨聲波,致使漏檢率增加,同時(shí)錯(cuò)分率增加.
除此之外,錯(cuò)分率、虛警率和漏檢率具有以下意義:閃電哨聲波的檢測結(jié)果通常被用來做進(jìn)一步的研究.閃電哨聲波智能檢測模型的錯(cuò)分率綜合評(píng)價(jià)了采用該模型自動(dòng)檢測閃電哨聲波的可靠性.錯(cuò)分率低意味著模型檢測的效果比較可靠,即采用該模型檢測出電磁衛(wèi)星數(shù)據(jù)中的閃電哨聲波后,可以直接使用檢測出的結(jié)果開展下一步研究.而若錯(cuò)分率高,則意味著需要人工對(duì)識(shí)別結(jié)果進(jìn)行復(fù)檢,以糾正錯(cuò)分的數(shù)據(jù),但錯(cuò)分率難以指明復(fù)檢的方向.而虛警率和漏檢率恰恰可以指出復(fù)檢的方向.若虛警率高則意味著需要人工進(jìn)一步從檢測到的閃電哨聲波的樣本中進(jìn)行復(fù)檢以剔除將非閃電哨聲波識(shí)別為閃電哨聲波的數(shù)據(jù).若漏檢率高意味需要人工進(jìn)一步從原始數(shù)據(jù)中復(fù)檢被遺漏的閃電哨聲波.這些復(fù)檢工作對(duì)于進(jìn)一步做閃電哨聲波的研究具有十分重要的作用.
閃電哨聲波智能檢測方法通過特征提取、分類和定位等過程實(shí)現(xiàn)了自動(dòng)檢測閃電哨聲波的功能.由于特征提取是閃電哨聲波分類和定位的前提,本節(jié)將現(xiàn)有的閃電哨聲波智能檢測算法按照特征的提取方式分為兩類:基于人工定義特征的智能檢測算法和基于神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征的智能檢測算法.并從中選擇了三種具有代表性的算法在張衡一號(hào)衛(wèi)星的數(shù)據(jù)上進(jìn)行了復(fù)現(xiàn).如圖29所示.在基于人工定義特征的智能檢測算法中,選擇基于形態(tài)學(xué)處理的智能檢測算法(Dharma et al., 2014);在基于神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征的智能檢測算法中,分別選擇SDNN網(wǎng)絡(luò)(Konan et al., 2020)和YOLOV3網(wǎng)絡(luò)的智能檢測算法(Konan et al., 2020).接下來,將分別從數(shù)據(jù)介紹,代表性算法的參數(shù)設(shè)置,代表性算法的模型訓(xùn)練和代表性算法的效果四個(gè)方面進(jìn)行闡述.
圖29 三種代表性的算法Fig.29 Three typical algorithms
利用2018年8月份張衡衛(wèi)星感應(yīng)磁力儀VLF頻段Z分量的波形數(shù)據(jù).以每2 s窗口且重疊90%的方式進(jìn)行傅里葉變換生成時(shí)頻圖,用這些時(shí)頻圖創(chuàng)建數(shù)據(jù)集,僅關(guān)注時(shí)頻圖中的單個(gè)色散形態(tài)的閃電哨聲波.使用深度神經(jīng)網(wǎng)絡(luò)常用的策略是構(gòu)建較小的超參數(shù)訓(xùn)練集,在其上盡量進(jìn)行過擬合訓(xùn)練尋找最佳的參數(shù)組合,當(dāng)超參數(shù)選擇確定后再在模型訓(xùn)練集上訓(xùn)練模型,最后再在測試集上對(duì)該模型進(jìn)行評(píng)價(jià).因此,將張衡衛(wèi)星的數(shù)據(jù)分為三類:超參數(shù)訓(xùn)練集含有1000條閃電哨聲波數(shù)據(jù)(用來選擇模型的超參數(shù));模型訓(xùn)練集含有2098條閃電哨聲波數(shù)據(jù)(超參數(shù)選定后用來訓(xùn)練模型);模型測試集含25834條閃電哨聲波(用來測試模型的效果),均為單個(gè)頻譜線的閃電哨聲波.
4.2.1 基于人工定義特征的智能檢測算法
本小節(jié)主要介紹基于形態(tài)學(xué)處理的閃電哨聲波檢測算法中每個(gè)環(huán)節(jié)中的參數(shù)設(shè)置情況.首先將原始時(shí)頻圖進(jìn)行灰度化處理;再采用閾值分割進(jìn)行二值化處理,該過程中的閾值分割算法采用自適應(yīng)閾值分割算法(Otsu, 2007);然后,進(jìn)行中值濾波處理,該過程中采用的窗口大小是5×5;接著,進(jìn)行開運(yùn)算處理,該環(huán)節(jié)采用的結(jié)構(gòu)算子是5×5的圓形結(jié)構(gòu)算子;再提取連通域,用矩形框?qū)ζ溥M(jìn)行標(biāo)記,用星號(hào)標(biāo)記其重心位置;最后,統(tǒng)計(jì)連通域中的目標(biāo)像素,當(dāng)目標(biāo)像素總量大于某閾值時(shí),保留該連通域的矩形框,否則將刪除該連通區(qū)域的矩形框,該環(huán)節(jié)中的閾值是40.
4.2.2 基于神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征的智能檢測算法
目前,神經(jīng)網(wǎng)絡(luò)具有自動(dòng)地學(xué)習(xí)魯棒特征的能力且效果最優(yōu),但其檢測效果依賴于神經(jīng)網(wǎng)絡(luò)模型的性能,該性能與訓(xùn)練過程中的超參數(shù)的設(shè)置有關(guān).其涉及的超參數(shù)主要有5種:學(xué)習(xí)率(learning rate或作lr),批次大小(batch_size),激活函數(shù)(activation),輪次(epoch)和優(yōu)化器(optimizer).在深度神經(jīng)網(wǎng)絡(luò)中,上述5種超參數(shù)之間存在比較強(qiáng)的耦合性,使得尋找最優(yōu)的超參數(shù)組合更困難.常用的方法是在超參數(shù)訓(xùn)練集上進(jìn)行訓(xùn)練進(jìn)而獲取最佳的超參數(shù)組合,當(dāng)超參數(shù)選擇確定后再在模型訓(xùn)練集上訓(xùn)練模型,最后在測試集上對(duì)訓(xùn)練好的模型性能進(jìn)行評(píng)估.本小節(jié)將以基于SDNN網(wǎng)絡(luò)的閃電哨聲波檢測模型為例介紹超參數(shù)調(diào)整的過程.
學(xué)習(xí)率(lr):指在優(yōu)化算法中沿?fù)p失梯度的反方向更新網(wǎng)絡(luò)權(quán)重的幅度大小.學(xué)習(xí)率過大導(dǎo)致模型(在最優(yōu)點(diǎn)附近)震蕩抑或不收斂;學(xué)習(xí)率過小則導(dǎo)致模型收斂速度偏慢,需要更長的時(shí)間訓(xùn)練.學(xué)習(xí)率參數(shù)的調(diào)整需要結(jié)合優(yōu)化器等參數(shù).
輪次(epoch):1輪次指的是完整的數(shù)據(jù)集通過了一次神經(jīng)網(wǎng)絡(luò)的前向傳播和一次反向傳播.輪次數(shù)量過少容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)欠擬合,輪次過多容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)過擬合.因此,訓(xùn)練輪次需要選擇合適的值.
批次大小(batch_size):指的是每次送入神經(jīng)網(wǎng)絡(luò)的樣本的數(shù)量.自2012年以來,其默認(rèn)的策略是最大限度增大batch_size,直到“吃滿”內(nèi)存為止.其原因是:batch_size太小導(dǎo)致訓(xùn)練過程不容易收斂,而大的batch_size使得訓(xùn)練過程中的振動(dòng)幅度減小,且容易收斂.但是,2018年,Masters和Luschi (2018)通過開展大量的實(shí)驗(yàn)指出過大的batch_size對(duì)測試集不利,即泛化能力較差.并指出最佳的實(shí)驗(yàn)表現(xiàn)都是在batch_size處于2~32之間.因此,其選擇策略是:當(dāng)有足夠算力時(shí),選取batch_size為32或更小一些;算力不夠時(shí),在效率和泛化性之間做折衷,盡量選擇更小的batch_size(Masters and Luschi, 2018).
優(yōu)化器:深度神經(jīng)網(wǎng)絡(luò)中的目標(biāo)函數(shù)比較復(fù)雜且一般為自定義的損失函數(shù),而神經(jīng)網(wǎng)絡(luò)的優(yōu)化目標(biāo)是求得損失結(jié)果最小條件下的網(wǎng)絡(luò)參數(shù)狀態(tài),這種優(yōu)化問題一般不存在解析解,通常需要使用數(shù)值計(jì)算的理論和技術(shù)更新網(wǎng)絡(luò)參數(shù),逼近最優(yōu)解.將這種迭代更新求解網(wǎng)絡(luò)參數(shù)的工具稱為優(yōu)化器.目前深度學(xué)習(xí)中有多種優(yōu)化器可供選擇,其中最基本的優(yōu)化器是隨機(jī)梯度下降法(Stochastic gradient descent, SGD),SGD雖然能達(dá)到極小值,但是其他用的時(shí)間長,而且可能會(huì)被困在鞍點(diǎn).類似這種的傳統(tǒng)優(yōu)化器通常將學(xué)習(xí)率設(shè)置為常數(shù)或者根據(jù)訓(xùn)練次數(shù)調(diào)節(jié)學(xué)習(xí)率,從而極大地忽略了學(xué)習(xí)率其他變化的可能性,進(jìn)而嚴(yán)重影響了模型的性能.而自適應(yīng)性學(xué)習(xí)率優(yōu)化器通過采取一些策略更新學(xué)習(xí)率提高模型的訓(xùn)練速度和模型性能,使得其廣泛應(yīng)用于深度學(xué)習(xí)中.常用的自適應(yīng)優(yōu)化器包括Adadelta(Zeiler, 2012),RMSprop(Root Mean Square Prop)(Graves et al., 2013)和Adam(Adaptive Moment Estimation)(Kingma and Ba, 2014)等.這些優(yōu)化器均采用歷史梯度信息調(diào)整學(xué)習(xí)率.
激活函數(shù):在神經(jīng)網(wǎng)絡(luò)中用激活函數(shù)給神經(jīng)網(wǎng)絡(luò)加入一些非線性因素,使得網(wǎng)絡(luò)可以更好地?cái)M合復(fù)雜函數(shù)表達(dá)式.在深度神經(jīng)網(wǎng)絡(luò)中,常用的激活函數(shù)是:Sigmoid,tanh,Relu和Softmax函數(shù).激活函數(shù)的選擇通常按照下列規(guī)則:Softmax 常常是作為多分類神經(jīng)網(wǎng)絡(luò)的輸出;Sigmoid函數(shù)常用于二分類,且適合淺層神經(jīng)網(wǎng)絡(luò)且需要配備較小的初始化權(quán)重(防止輸入到激活函數(shù)的數(shù)值落入飽和區(qū)間);tanh函數(shù)具有中心對(duì)稱性,適合于有對(duì)稱性的二分類;在深度學(xué)神經(jīng)網(wǎng)絡(luò)中,ReLU函數(shù)被廣泛應(yīng)用.其主要原因是:ReLU不僅僅使得梯度的計(jì)算變快,而且能夠緩解Sigmoid和tanh引起的梯度彌散和爆炸問題.
本文在復(fù)現(xiàn)SDNN網(wǎng)絡(luò)的閃電哨聲波智能檢測模型時(shí),其調(diào)參過程如表4所示,詳細(xì)過程如下:
(1)學(xué)習(xí)率:設(shè)初始的參數(shù)組合(lr=0.1,optimizer=Adam,batch_size=64,activation=Relu,momentum=0.9,epoch=40).其loss曲線的變化如圖30所示,觀察前10個(gè)epoch的loss值在快速下降,從第10個(gè)輪次開始,loss值基本不再變化,因此,其最終的loss值是1.087.這說明初始的學(xué)習(xí)率太大,且從第10個(gè)輪次開始神經(jīng)網(wǎng)絡(luò)幾乎停止“學(xué)習(xí)”.此時(shí),繼續(xù)按照下列方式調(diào)整學(xué)習(xí)率:保持其他參數(shù)不變,將學(xué)習(xí)率減少到lr=0.01,得到如圖31所示的loss曲線,其中每個(gè)epoch的loss值均低于圖30的loss值,且從第10個(gè)epoch開始,loss值具有持續(xù)變化的趨勢,最終的loss值是1.051;繼續(xù)向下調(diào)整lr=0.001,得到如圖32所示的loss曲線:發(fā)現(xiàn)整個(gè)訓(xùn)練過程中的loss值不僅僅下降速度快,而且隨著訓(xùn)練輪次的增加,loss變化的趨勢也比較明顯,說明隨著訓(xùn)練輪次的增加,神經(jīng)網(wǎng)絡(luò)依然在“學(xué)習(xí)”,其最終的loss值是0.157.繼續(xù)調(diào)整lr=0.0001得到如圖33所示的loss曲線,此時(shí)發(fā)現(xiàn)其loss值下降速度快,神經(jīng)網(wǎng)絡(luò)的”學(xué)習(xí)“趨勢依然存在,最終的loss值是0.384,將其與圖32進(jìn)行比較發(fā)現(xiàn):圖33所示的loss曲線整體明顯高于圖32所示的loss曲線,說明圖32所代表的神經(jīng)網(wǎng)絡(luò)的性能優(yōu)于圖33所代表的神經(jīng)網(wǎng)絡(luò)的性能.此時(shí),停止參數(shù)調(diào)整,將圖32對(duì)應(yīng)的學(xué)習(xí)率設(shè)為SDNN網(wǎng)絡(luò)的初始學(xué)習(xí)率,即lr=0.001.
圖30 初始學(xué)習(xí)率0.1,輪次40Fig.30 Learning Rate=0.1 and epoch=40
圖31 初始學(xué)習(xí)率0.01,輪次40Fig.31 Learning Rate=0.01 and epoch=40
圖32 初始學(xué)習(xí)率0.001,輪次40Fig.32 Learning Rate=0.001 and epoch=40
(2)輪次:目前最優(yōu)的超參數(shù)是圖32代表的參數(shù)組合(lr=0.001,optimizer=Adam,batch_size=64,activation=Relu,momentum=0.9,epoch=40),其最終的loss值是0.157.繼續(xù)觀察圖32所示的loss曲線:發(fā)現(xiàn)在epoch=40的地方,loss依舊呈現(xiàn)下降趨勢,此時(shí)的參數(shù)調(diào)整策略如下:繼續(xù)增大epoch到70,得到圖34所示的loss曲線,其最終的loss值是0.0603,而且在epoch=70的附近,loss的變化趨勢已經(jīng)逐漸平穩(wěn),說明此時(shí)的神經(jīng)網(wǎng)絡(luò)已經(jīng)停止了學(xué)習(xí).因此,參數(shù)epoch的值無需再繼續(xù)增加,停止對(duì)該參數(shù)進(jìn)行調(diào)整,設(shè)置SDNN網(wǎng)絡(luò)的epoch為70.
圖33 初始學(xué)習(xí)率0.0001,輪次40Fig.33 Learning Rate=0.0001 and epoch=40
圖34 初始學(xué)習(xí)率0.001,輪次70Fig.34 The learning rate=0.001 and epoch=70
(3)批次大?。涸趨?shù)組合(lr=0.001,optimizer=Adam,batch_size=64,activation=Relu,momentum=0.9,epoch=70)的基礎(chǔ)上,為了得到最佳的batch_size,嘗試對(duì)其進(jìn)行調(diào)整:如表4所示,保持其他參數(shù)不變,適當(dāng)增大batch_size到128,發(fā)現(xiàn)其最終的loss值是0.0714;繼續(xù)增加batch_size到256,發(fā)現(xiàn)最終的loss值變?yōu)?.0742;此時(shí)意味著大的batch_size導(dǎo)致其loss變差,則嘗試batch_size=32,發(fā)現(xiàn)其最終的loss值變?yōu)?.0089;持續(xù)減少batch_size到16,發(fā)現(xiàn)其loss值較0.0089變大,為0.0187,此時(shí),停止參數(shù)調(diào)整,選擇最低的loss值對(duì)應(yīng)的批次大小為SDNN網(wǎng)絡(luò)的batch_size的值,即batch_size=32.
(4)優(yōu)化器:在參數(shù)組合(lr=0.001,optimizer=Adam,batch_size=32,activation=Relu,momentum=0.9,epoch=70)的基礎(chǔ)上,保持其他參數(shù)不變,將優(yōu)化器分別設(shè)置為:Adam,Adadelata和RMSprop,計(jì)算其最終的loss值,如表4所示,分別是0.0089,0.8011,0.9742.選擇最低的loss值所對(duì)應(yīng)的優(yōu)化器為SDNN網(wǎng)絡(luò)的優(yōu)化器參數(shù),即optimizer=Adam.
(5)激活函數(shù):在參數(shù)組合(lr=0.001,optimizer=Adam,batch_size=32,activation=Relu,momentum=0.9,epoch=70)的基礎(chǔ)上,得到最終的loss值是0.0089.再將激活函數(shù)分別調(diào)整為tanh,Softmax,Sigmoid后進(jìn)行模型訓(xùn)練,得到最終的loss值,如表4所示,分別是1.703,1.847,1.912.選擇最低的loss值(0.0089)所對(duì)應(yīng)的激活函數(shù)為SDNN網(wǎng)絡(luò)的激活函數(shù),即activation=Relu.
表4 SDNN網(wǎng)絡(luò)的調(diào)參過程Table 4 Parameter adjustment of the SDNN model
按照類似的過程調(diào)試YOLOV3網(wǎng)絡(luò)的參數(shù),如表5所示.得到SDNN網(wǎng)絡(luò)和YOLOV3網(wǎng)絡(luò)的最佳參數(shù)如表6所示.這說明按照上述的調(diào)參策略得到的超參數(shù)組合,能夠使得網(wǎng)絡(luò)參數(shù)在更新過程中獲得比較合適的方向和步長,達(dá)到學(xué)習(xí)的目的,并最終獲得較優(yōu)的網(wǎng)絡(luò)參數(shù).
表5 YOLOV3網(wǎng)絡(luò)的調(diào)參過程Table 5 Parameters adjustment of the YOLOV3 model
表6 SDNN網(wǎng)絡(luò)和YOLOV3網(wǎng)絡(luò)最終的參數(shù)設(shè)置Table 6 Final parameter settings of SDNN network and YOLOV3 network
基于形態(tài)學(xué)的閃電哨聲波智能檢測算法的模型,無訓(xùn)練過程,無訓(xùn)練時(shí)間成本.
基于SDNN網(wǎng)絡(luò)的閃電哨聲波智能檢測算法的模型主要有3層卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成,其超參數(shù)的設(shè)置如表6所示.該模型的訓(xùn)練環(huán)境:Windows10 64位系統(tǒng),使用Nvidia GeForce RTX2080Ti顯卡,CUDA10.0和cuDNN調(diào)用GPU加速訓(xùn)練,模型的訓(xùn)練過程如圖35a所示:在前10個(gè)epoch內(nèi),其損失值急劇衰減,到第65個(gè)epoch后訓(xùn)練過程基本處于穩(wěn)定,訓(xùn)練時(shí)間是0.16 h.
圖35 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程(a) SDNN網(wǎng)絡(luò); (b) YOLOV3網(wǎng)絡(luò).Fig.35 Training the neural networks(a) SDNN; (b) YOLOV3.
基于YOLOV3網(wǎng)絡(luò)的閃電哨聲波智能檢測算法的模型主要有252層的神經(jīng)網(wǎng)絡(luò)構(gòu)成,其超參數(shù)的設(shè)置如表6所示,該模型的訓(xùn)練環(huán)境與SDNN網(wǎng)絡(luò)的環(huán)境相同,其模型的訓(xùn)練過程如圖35b所示:在前500epoch內(nèi),其損失值急劇衰減,直到第1800個(gè)epoch后損失值基本處于穩(wěn)定,其訓(xùn)練時(shí)間是4.5 h.
其中,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間成本主要受三方面影響:硬件設(shè)施,模型復(fù)雜度和超參數(shù)中的優(yōu)化器.
在硬件設(shè)施相同的情況下,模型越復(fù)雜、網(wǎng)絡(luò)層數(shù)越多,參數(shù)越多,其計(jì)算量就越大,同時(shí)其超參數(shù)“輪次”的值越高,因此,導(dǎo)致其訓(xùn)練的時(shí)間越長.比如SDNN網(wǎng)絡(luò)由三層卷積網(wǎng)絡(luò)構(gòu)成,其最佳的epoch為70,訓(xùn)練時(shí)間是0.16 h;而YOLOV3神經(jīng)網(wǎng)絡(luò)由252層網(wǎng)絡(luò)構(gòu)成,其最佳的epoch為2000,訓(xùn)練時(shí)間是4.5 h.
在網(wǎng)絡(luò)優(yōu)化的過程中,訓(xùn)練時(shí)間成本主要與優(yōu)化器的選擇有關(guān).最基本的優(yōu)化器是SGD,但是SGD的優(yōu)化速度較慢,容易駐留在鞍點(diǎn).為了提高訓(xùn)練速度和性能,大量的實(shí)驗(yàn)表明通過設(shè)置一個(gè)根據(jù)迭代次數(shù)衰減的學(xué)習(xí)率具有明顯效果.其基本思想是:在訓(xùn)練前期調(diào)整學(xué)習(xí)率的值變大,訓(xùn)練后期調(diào)整其變小.常用的學(xué)習(xí)率衰減策略包括分段常數(shù)衰減,指數(shù)衰減,自然指數(shù)衰減,余弦衰減等.但對(duì)學(xué)習(xí)率超參數(shù)的初始設(shè)置具有較強(qiáng)的依賴,而自適應(yīng)優(yōu)化器主要利用歷史梯度信息自適應(yīng)調(diào)整學(xué)習(xí)率,降低了對(duì)初始學(xué)習(xí)率參數(shù)的依賴性,同時(shí)加快了優(yōu)化速度.常用的自適應(yīng)優(yōu)化器是Adadelta,RMSProp和Adam.在實(shí)際應(yīng)用中,需結(jié)合具體問題有針對(duì)性地選擇合適的優(yōu)化器.
本小節(jié)主要從定量和定性的角度比較三種復(fù)現(xiàn)算法的效果:其中定量比較如表7所示,定性比較如圖36—38所示.基于形態(tài)學(xué)處理的閃電哨聲波智能檢測算法對(duì)噪聲敏感,雖然采用中值濾波、開運(yùn)算等方式濾除了一部分干擾,如圖36(c,d,e)所示,但仍然難以克服噪聲對(duì)該算法產(chǎn)生的影響,如圖36f顯示的是連通域的標(biāo)記結(jié)果,其中每個(gè)星號(hào)點(diǎn)是一個(gè)連通域的重心.對(duì)比圖36a和圖36f可知:圖36f中的兩個(gè)橢圓區(qū)域各有一條閃電哨聲波,即理論上每個(gè)橢圓區(qū)域內(nèi)應(yīng)該各有一個(gè)連通區(qū)域且每個(gè)區(qū)域有一個(gè)星號(hào)點(diǎn)所表示的連通域的重心.仔細(xì)觀察圖36f中的兩個(gè)橢圓區(qū)域發(fā)現(xiàn):每個(gè)橢圓區(qū)域均存在多個(gè)星號(hào)點(diǎn),說明每個(gè)橢圓區(qū)域存在多個(gè)連通域.說明連通特性被干擾點(diǎn)破壞,使得一個(gè)完整的哨聲波區(qū)域被標(biāo)記成了若干個(gè)連通區(qū)域,導(dǎo)致連通域分析出現(xiàn)了較大的偏差,最終使得這兩條閃電哨聲波被漏檢.因此,該方法的漏檢率較高.而滑動(dòng)卷積神經(jīng)網(wǎng)絡(luò)(SDNN)通過特征學(xué)習(xí)獲得了較魯棒的哨聲波特征,并有效地克服了上述噪聲的干擾,但由于采用了固定大小的滑動(dòng)窗,導(dǎo)致圖37最下邊的閃電哨聲波(橢圓標(biāo)記區(qū)域)被漏檢了.YOLOV3網(wǎng)絡(luò)由于將自動(dòng)特征提取、分類和定位統(tǒng)一整合在其損失函數(shù)所表示的數(shù)學(xué)模型中,其在定位方面比滑動(dòng)卷積神經(jīng)網(wǎng)絡(luò)更精準(zhǔn),如圖38所示,但模型的訓(xùn)練時(shí)間長.總之,人工定義的特征不具有魯棒性容易受到噪聲等因素的干擾,自動(dòng)化提取的特征較之更為魯棒,且自動(dòng)定位效果亦更為精準(zhǔn).
表7 三種閃電哨聲波自動(dòng)檢測算法在張衡一號(hào)衛(wèi)星數(shù)據(jù)中的效果Table 7 Results of three different methods for detecting lightning whistler from the data captured by ZH-1 satellite
圖36 基于形態(tài)學(xué)處理的閃電哨聲波檢測算法(a) 原始時(shí)頻圖; (b) 灰度化; (c) 二值化; (d) 中值濾波; (e) 開運(yùn)算; (f) 連通域分析/連通域標(biāo)記; (g) 連通域篩選; (h) 最終結(jié)果.Fig.36 The Process of lightning whistler detection algorithm based on morphological processing(a) Original time-frequency diagram; (b) Gray image; (c) Binarization; (d) Median filtering; (e) Open operation; (f) Connected domain analysis/connected domain labeling; (g) Connected domain filtering; (h) Final result.
圖37 滑動(dòng)卷積神經(jīng)網(wǎng)絡(luò)的檢測的效果Fig.37 SDNN neural network
圖38 YOLOV3神經(jīng)網(wǎng)絡(luò)的檢測的效果Fig.38 YOLOV3 neural network
近年來,電磁衛(wèi)星的監(jiān)測數(shù)據(jù)量急劇增長,閃電哨聲波智能檢測作為人工智能與地球物理交叉的研究方向,受到了廣泛關(guān)注.本文對(duì)基于電磁衛(wèi)星數(shù)據(jù)的閃電哨聲波智能檢測進(jìn)行了全面而層次化的綜述.通過綜述可以得到以下結(jié)論:
(1)電磁衛(wèi)星:目前電磁衛(wèi)星的閃電哨聲波的研究主要集中在DEMETER衛(wèi)星、Arase 衛(wèi)星和Akebono衛(wèi)星,其目的是統(tǒng)計(jì)閃電哨聲波全球的分布特點(diǎn),并通過衛(wèi)星的閃電哨聲波反演電離層的高通電子量、等離子密度等信息.
(2)閃電哨聲波智能檢測方法在時(shí)頻圖的基礎(chǔ)上,借鑒計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)的相關(guān)技術(shù),通過逐步實(shí)現(xiàn)特征提取、分類和定位等過程達(dá)到了自動(dòng)檢測閃電哨聲波的目的.表8—10分別從特征提取、分類和定位三個(gè)方面對(duì)閃電哨聲波智能檢測算法進(jìn)行了總結(jié)整理和對(duì)比.
表8總結(jié)和對(duì)比了閃電哨聲波智能檢測算法中的特征提取技術(shù):①人工提取特征(The Stanford VLF Group, 2018; Fiser et al., 2010; Ali Ahmad et al., 2019; Dharma et al., 2014; Oike et al., 2014):該方法是依賴人工觀察閃電哨聲波的時(shí)頻圖,結(jié)合閃電哨聲波的物理機(jī)理總結(jié)出閃電哨聲波的特征,比如色散形狀等,然后采用數(shù)字圖像處理技術(shù)設(shè)計(jì)預(yù)處理算法以增強(qiáng)該特征,最后再采用計(jì)算機(jī)視覺技術(shù)設(shè)計(jì)算法提取該特征.這種方式適合在數(shù)據(jù)量不大的情況下進(jìn)行使用,且時(shí)間成本低.但閃電哨聲波的色散形狀亦是多種多樣,采用計(jì)算機(jī)視覺相關(guān)技術(shù)提取的人工定義的特征僅僅能夠代表一部分閃電哨聲波的特征,該特征不僅僅泛化性差且容易受到噪聲的干擾.說明人工提取的特征魯棒性差,在數(shù)據(jù)量大的情況下其檢測效果不佳.②自動(dòng)提取特征(Konan et al., 2020):首先在時(shí)頻圖上,由人工標(biāo)注大量的單閃電源的單條頻譜線的閃電哨聲波,然后將這些標(biāo)注圖片數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)去訓(xùn)練得到一模型,該模型能夠自動(dòng)提取閃電哨聲波特征.這種方式可以獲得較魯棒的閃電哨聲波特征,在數(shù)據(jù)量增大的情況下,其檢測到的單閃電源的單譜線的閃電哨聲波的效果最佳.
表8 閃電哨聲波智能檢測算法中的哨聲波特征提取方法的總結(jié)和對(duì)比Table 8 Summary of the feature extracting methods in the lightning whistler detection algorithms
表9總結(jié)和對(duì)比了閃電哨聲波智能檢測算法中的分類技術(shù):①模板匹配(The Stanford VLF Group, 2018; Fiser et al., 2010; Ali Ahmad et al., 2019; Dharma et al., 2014; Oike et al., 2014):該方法首先依賴人工提取閃電哨聲波的特征,對(duì)其進(jìn)行歸一化處理后得到閃電哨聲波的特征模板,然后提取待識(shí)別的閃電哨聲波的特征,將該特征與特征模板進(jìn)行匹配,匹配度高意味著該圖像是閃電哨聲波,否則認(rèn)為該圖像是非閃電哨聲波圖像.該方法存在兩方面的局限性:第一個(gè)局限性來自于模板,閃電哨聲波雖然具有色散狀特征,但該特征有大量的不同的形態(tài).因此,難以用一個(gè)標(biāo)準(zhǔn)化模板表示所有的閃電哨聲波的色散特征.第二個(gè)局限性來自于匹配,匹配策略可被視作一線性分類器,隨著閃電哨聲波數(shù)據(jù)量的增加以及色散特征的多樣化,線性可分性越來越難以滿足,導(dǎo)致分類結(jié)果變差.②神經(jīng)網(wǎng)絡(luò)分類器(Konan et al., 2020):神經(jīng)網(wǎng)絡(luò)能夠很好地?cái)M合閃電哨聲波圖像與識(shí)別結(jié)果之間的非線性關(guān)系,并克服線性分類器的缺點(diǎn),總之,神經(jīng)網(wǎng)絡(luò)分類器分類效果優(yōu)于模板匹配分類器.
表9 閃電哨聲波智能檢測算法中的哨聲波分類(識(shí)別)方法的總結(jié)和對(duì)比Table 9 Summary of the classification methods in the lightning whistler detection algorithms
表10總結(jié)和對(duì)比了閃電哨聲波智能檢測算法中的定位技術(shù):①滑動(dòng)窗定位(The Stanford VLF Group, 2018; Fiser et al., 2010; Ali Ahmad et al., 2019; Dharma et al., 2014; Oike et al., 2014; Konan et al., 2020):在時(shí)頻圖上,固定一個(gè)大小的時(shí)間窗,比如以步長2 s進(jìn)行滑動(dòng),對(duì)每一個(gè)滑動(dòng)區(qū)域進(jìn)行特征提取和分類(識(shí)別),該方法簡單易實(shí)現(xiàn)但最大的問題是閃電哨聲波持續(xù)的時(shí)間是不固定的,其時(shí)間尺度范圍從毫秒級(jí)到秒級(jí),因此,滑動(dòng)窗定位的方式只能定位出某個(gè)固定時(shí)間寬度的閃電哨聲波,定位精度低.②智能判斷定位(Konan et al., 2020):采用YOLOV3神經(jīng)網(wǎng)絡(luò)對(duì)閃電哨聲波圖像區(qū)域與其相鄰的上下文圖像區(qū)域進(jìn)行建模,經(jīng)過大量的訓(xùn)練后得到的神經(jīng)網(wǎng)絡(luò)模型能夠準(zhǔn)確地定位到任意時(shí)間寬度的閃電哨聲波.
表10 閃電哨聲波智能檢測算法中的哨聲波定位方法的總結(jié)和對(duì)比Table 10 Summary of the location methods in the lightning whistler detection algorithms
總之,閃電哨聲波智能檢測的研究處于起步階段.目前的閃電哨聲波智能檢測算法僅在識(shí)別單條的閃電哨聲波方面取得一定的效果.通過綜述分析目前的電磁衛(wèi)星的閃電哨聲波智能檢測算法,本文認(rèn)為該領(lǐng)域未來的發(fā)展趨勢和應(yīng)用前景將主要體現(xiàn)在以下四個(gè)方面.
(1)現(xiàn)有的智能檢測算法能夠檢測出大部分的單個(gè)閃電源的單條頻譜線的閃電哨聲波類型,如何檢測出表1中由單個(gè)閃電源的多條頻譜線組成的閃電哨聲波是探索空間物理現(xiàn)象機(jī)制亟需解決的問題.針對(duì)多條頻譜線的閃電哨聲波類型,其典型的特點(diǎn)是由多條色散狀的頻譜線組成,衰減速度隨著時(shí)間的變化逐漸變小,同時(shí)頻譜強(qiáng)度逐漸減少.可在單條頻譜線的哨聲波檢測的基礎(chǔ)上,通過計(jì)算機(jī)視覺處理技術(shù)提取頻譜曲線的斜率變化,用其表達(dá)該曲線的衰減信息,將提取得到斜率和頻譜強(qiáng)度隨時(shí)間變化的信息作為時(shí)間序列,進(jìn)一步設(shè)計(jì)循環(huán)神經(jīng)網(wǎng)絡(luò)以實(shí)現(xiàn)對(duì)單閃電源的多條頻譜線的閃電哨聲波進(jìn)行智能檢測的功能.
(2)單條頻譜線的閃電哨聲波依然存在多種形態(tài),在閃電哨聲波智能檢測結(jié)果的基礎(chǔ)上,能夠根據(jù)用戶提供的閃電哨聲波圖像自動(dòng)地從海量的電磁衛(wèi)星的數(shù)據(jù)池里找到與其形態(tài)相似的若干張哨聲波圖像并返回相關(guān)的時(shí)空信息,是未來研究的方向之一.其方案如圖39所示:首先通過對(duì)電磁衛(wèi)星的數(shù)據(jù)進(jìn)行預(yù)處理和傅里葉變換等方式建立電磁衛(wèi)星數(shù)據(jù)池;然后,輸入待查詢的閃電哨聲波圖像,提取待查詢的閃電哨聲波圖像的形狀特征、位置信息、頻譜強(qiáng)度特征以及斜率特征等創(chuàng)建待檢索向量;然后借用哈希技術(shù)對(duì)待檢索向量進(jìn)行哈希編碼;接下來,在電磁衛(wèi)星數(shù)據(jù)池中采用閃電哨聲波智能檢測算法檢測識(shí)別單條頻譜線的閃電哨聲波,再對(duì)每個(gè)檢測到的閃電哨聲波采用計(jì)算機(jī)視覺等技術(shù)提取其形狀特征、位置信息、頻譜強(qiáng)度特征以及斜率特征等信息,利用這些信息創(chuàng)建向量表示該閃電哨聲波,同時(shí)對(duì)該向量進(jìn)行哈希編碼.計(jì)算待檢索數(shù)據(jù)的哈希編碼與數(shù)據(jù)池中每個(gè)數(shù)據(jù)向量的哈希編碼之間的漢明距離,選擇前K(K是非負(fù)整數(shù))個(gè)最小的漢明距離所對(duì)應(yīng)的閃電哨聲波圖像即為檢索到的閃電哨聲波圖像,且檢索到的圖像共有K張.
圖39 基于哈希的哨聲波圖像智能檢索Fig.39 The image retrieval technology of lightning whistler based on Hashing
(3)目前的閃電哨聲波檢測算法沒有公開的龐大的數(shù)據(jù)庫,構(gòu)造閃電哨聲波電磁衛(wèi)星的數(shù)據(jù)庫亦是目前亟需解決的問題,可通過收集ZH-1衛(wèi)星VLF波段感應(yīng)磁力儀數(shù)據(jù)和電場探測儀數(shù)據(jù),將其轉(zhuǎn)化成時(shí)頻圖后,通過人工處理方式建立統(tǒng)一的電磁衛(wèi)星的閃電哨聲波數(shù)據(jù)庫,以期大力推動(dòng)閃電哨聲波智能檢測算法的發(fā)展.
(4)目前的閃電哨聲波智能檢測算法能夠檢測出部分閃電哨聲波,在此基礎(chǔ)上,根據(jù)其形態(tài)特征開展哨聲波的軌跡跟蹤是進(jìn)行電子密度估計(jì)的關(guān)鍵,值得研究和探索.可通過跟蹤其軌跡,利用軌跡的幅值和色散度反演電子密度.
致謝本工作使用了中國國家航天局和中國地震局支持的張衡一號(hào)衛(wèi)星的觀測數(shù)據(jù).特別感謝來自應(yīng)急管理部國家自然災(zāi)害防治研究院張衡一號(hào)衛(wèi)星團(tuán)隊(duì)的所有成員為本文研究數(shù)據(jù)提供的技術(shù)服務(wù)支持.