劉鈍 於曉 熊雯 郝藝 朱慶林
(中國電波傳播研究所, 青島 266107)
電離層閃爍是影響GNSS性能的重要空間環(huán)境因素,其由電離層中的小尺度不均勻體通過對衛(wèi)星信號的衍射、折射效應引起[1-2]。小尺度不均勻體具有產(chǎn)生、發(fā)展和衰變過程,在電場和風場等因素作用下還會有擴展和漂移運動[3]。同時,GNSS衛(wèi)星不斷運動造成用戶的觀測幾何也在不斷變化。接收機受到的閃爍影響是由上述多個因素決定的,由此用戶受到的閃爍影響具有偶發(fā)性、突發(fā)性。
對閃爍影響進行快速有效識別是電離層閃爍研究和系統(tǒng)應用的重要需求。閃爍監(jiān)測一般須通過對衛(wèi)星信號進行高頻采樣實現(xiàn),原始數(shù)據(jù)量大,且閃爍僅在特定時間段發(fā)生,因此,常規(guī)觀測中希望僅在閃爍發(fā)生時進行測量和原始數(shù)據(jù)存儲,從而減少數(shù)據(jù)存儲需求。衛(wèi)星導航應用中,完好性是增強系統(tǒng)的重要性能指標之一。完好性要求當系統(tǒng)不能提供預定服務時,應具有向用戶及時告警的能力。閃爍影響的突發(fā)性要求系統(tǒng)或用戶端必須具有對電離層閃爍影響的快速識別能力。
閃爍研究中,對電離層閃爍事件的確定采用事后分析方法實現(xiàn),須按照閃爍影響超過一定門限且持續(xù)一定時間的標準進行事件確定,所需時間一般要十幾分鐘甚至幾十分鐘[4]。這樣的閃爍事件識別方法是難以在實際中應用的。
閃爍事件識別是一個典型的分類問題,由于機器學習方法在分類問題上的廣泛應用,很多學者將機器學習方法應用于閃爍識別,并取得了不錯的效果[5-11]。但已有利用機器學習方法應用于閃爍識別的工作中存在一個普遍問題,即僅從數(shù)據(jù)科學角度分析機器學習方法對閃爍識別的有效性,缺乏從電離層研究角度的深入分析。如Nicola Linty和Fabio Dovis等人討論和分析了利用不同機器學習方法進行閃爍事件識別,精度可以達到98%,但其工作中采用的輸入數(shù)據(jù)為幅度閃爍指數(shù)S4、觀測仰角及信號載噪比[5-7]。文獻[9]提出了利用深度學習方法進行閃爍識別,其采用的輸入數(shù)據(jù)為接收機相關器輸出的I支路和Q支路信號處理結果,包括信號幅度和強度的均值、方差和協(xié)方差。實際上,S4指數(shù)僅是一種信號強度變化的反映(信號強度的歸一化方差),如信號傳播研究中將S4稱為調制指數(shù),表明S4反映的是一種信號起伏變化的程度。并且,這種起伏變化并不一定僅是由閃爍相關的小尺度電離層不均勻體造成的,也可以是太陽射電爆發(fā)或多徑影響造成的[12-13]。因此,這些文獻在閃爍事件標識中,采用較大的S4值作為閃爍事件篩選的依據(jù),如Nicola Linty等人的工作中選擇S4等于0.4作為閃爍事件判斷門限,這樣可最大限度地降低其他因素造成的“疑似閃爍事件”影響。對于GNSS工作的L頻段,S4等于0.4表明已經(jīng)達到中等強度閃爍。從電離層閃爍常規(guī)觀測數(shù)據(jù)分析可知,一次強閃爍影響的開始和結束時期,S4指數(shù)一般處于弱閃爍或中等強度閃爍狀態(tài)(0.2 Jiao Yu等人從電離層閃爍特點出發(fā),提出了利用信號功率譜作為輸入,并利用機器學習建立閃爍識別的方法。該方法利用了閃爍信號譜具有冪率譜變化特征的特點,對閃爍事件的識別精度優(yōu)于90%[10-11]。盡管Jiao Yu工作中對閃爍事件的識別精度不如Nicola Linty等人的工作,但其工作是以S4指數(shù)為0.2作為閃爍事件識別門限的,因此分析中包含了中等強度閃爍、弱閃爍和強閃爍,其工作更具有實際意義。 盡管上述工作已獲得一些有意義的結果,但仍有一些問題需要進一步研究,如基于閃爍譜的閃爍事件識別中頻譜范圍選擇的依據(jù)、頻譜范圍選擇對閃爍識別的影響等。尤其是,既然冪率譜特征是閃爍信號的明顯特征,為何基于譜特征的閃爍識別精度要低于僅依賴S4指數(shù)和仰角實現(xiàn)的識別方法。為此,本文對不同情況下的閃爍事件識別性能進行比較,進一步明確了功率譜系數(shù)選擇對閃爍事件識別的影響,以及譜特征選擇對閃爍事件識別的影響,說明通過合理選擇一定頻率范圍內的譜特征,可以有效提高閃爍識別精度。 需要說明的是,已有工作中為適合機器學習方法的使用,普遍將閃爍事件(Event)定義在一次較短時間間隔內,如Nicola Linty等人定義在1 min間隔內[5-6],Jiao Yu等人定義在3 min或5 min間隔內[10-11]。每個時間間隔內的數(shù)據(jù)用于計算閃爍相關參數(shù),并根據(jù)結果確定是否有閃爍發(fā)生。而閃爍研究中,一般認為閃爍影響持續(xù)一定時間(如15 min)以上才是一次有效事件[4]。為了兼顧二者,本文仍將一個較短時間間隔(1 min)內的閃爍變化稱為閃爍事件,而將一次較長時間的閃爍變化稱為閃爍(發(fā)生)過程。 從電離層閃爍分析的相位屏理論可知,閃爍信號功率譜與電離層不均勻體的空間譜密切相關。因此,對閃爍影響下GNSS信號的功率譜進行分析可以獲得閃爍相關不均勻體的特征。對于閃爍信號功率譜,有多種方式描述其特征變化。 1)功率譜系數(shù) 對閃爍信號進行譜分析后獲得的功率譜系數(shù)是描述功率譜的最基本參數(shù)。研究表明,閃爍影響下的衛(wèi)星信號功率譜在Fresnel頻率處達到極大值,并隨頻率增加在高頻端具有冪率譜變化趨勢[14-15]。這些特征會體現(xiàn)在實測的GNSS信號功率譜上,具體表現(xiàn)為譜系數(shù)的變化上。 功率譜分析中,對于第k個分量Fk=F(k?y)(k=0,1,...,N-1),有 2)功率譜特征參數(shù) 閃爍信號功率譜具有冪率譜變化特征。具體而言,其在高頻部分存在以下近似[14]: 式中:Tscin為1 Hz處的相位譜強度;p=2v為相位譜指數(shù)。二者描述了閃爍功率譜的冪率變化特征,可以作為一種功率譜特征參數(shù)用于閃爍識別。 3)幅度閃爍指數(shù)S4 理論分析可知,幅度閃爍指數(shù)S4與空間功率譜Φ(q)(q為空間波數(shù))的積分存在如下關系[15]: 由于空間功率譜Φ(q)可由時域功率譜Φ(f)轉換得到[15],因此幅度閃爍指數(shù)S4在一定程度上也描述了閃爍信號的功率譜特征。 圖1給出了典型的閃爍影響下GPS信號功率譜變化,原始數(shù)據(jù)為RPN18衛(wèi)星L1信號的電離層閃爍觀測數(shù)據(jù),觀測地點為??冢℉NHK),時間為2013-09-24T22:10UT,原始數(shù)據(jù)長度為1 min,數(shù)據(jù)采樣率為20 Hz。其中藍色曲線為信號功率譜,紅色直線為對高頻端信號功率譜的擬合結果,擬合范圍為0.3~2 Hz。 圖1 電離層閃爍信號功率譜及擬合結果(???013-09-24T22:10UT, GPS PRN18 L1信號。 該段數(shù)據(jù)閃爍指數(shù)S4 =0.47, 譜擬合結果p = 2.80, T = -39.2 dB·rad2/Hz)Fig.1 Intensity spectrum and its fitting result for ionosphere scintillation impacted signals (HNHK 2013-09-24T22:10UT,GPS PRN 18 L1.Scintillation index S4 = 0.47, spectrum fitting results p = 2.80, T = -39.2 dB·rad2/Hz) 針對不同時期、不同地點、不同系統(tǒng)電離層閃爍觀測,分析不同譜特征情況下利用機器學習方法獲得的閃爍事件識別精度。這里主要給出支持向量機(support vector machine, SVM)和神經(jīng)網(wǎng)絡(neural network, NN)方法的結果。SVM是一類按監(jiān)督學習方式對數(shù)據(jù)進行分類的廣義線性分類器,對于本文分析的閃爍事件識別,可采用常見的二分類SVM模型。NN方法則采用多層前饋NN實現(xiàn)。 選擇廣州(GDGZ)和海口在2003年和2004年(第23個太陽活動周期)的GPS閃爍觀測數(shù)據(jù),以及海口在2013年的GPS閃爍觀測數(shù)據(jù)和2014年的BDS閃爍觀測數(shù)據(jù)(第24個太陽活動周期)進行分析。 閃爍觀測的原始數(shù)據(jù)采樣頻率為20 Hz,數(shù)據(jù)分析長度為1 min,即以1 min長度的原始數(shù)據(jù)進行閃爍參數(shù)計算和事件標識,截止觀測仰角為25°。主要數(shù)據(jù)處理過程包括:數(shù)據(jù)預處理,相關參數(shù)計算,事件判斷與標識。 1)數(shù)據(jù)預處理 對原始數(shù)據(jù)進行預處理分析,包括確定閃爍觀測具體時刻;計算相應衛(wèi)星觀測信息;剔除原始數(shù)據(jù)中的錯誤輸出,形成用于進一步計算的數(shù)據(jù)。 2)相關參數(shù)計算 對預處理后的數(shù)據(jù)進行分段檢測,修復原始數(shù)據(jù)中存在的短暫信號中斷,如果數(shù)據(jù)中存在較多信號丟失情況,則該段數(shù)據(jù)不用于后繼處理;進行數(shù)據(jù)的濾波和閃爍指數(shù)計算;進行信號功率譜分析;利用獲得的功率譜進一步估計典型譜特征參數(shù),包括譜強度、譜指數(shù)等。 3)事件判斷與標識 以0.1作為S4指數(shù)門限,超過該門限值判斷為疑似閃爍事件。連續(xù)15 min時間長度內,S4指數(shù)超過門限值的時間采樣個數(shù)超過12個時,判斷該時間段為有效閃爍發(fā)生過程,該閃爍發(fā)生過程內S4指數(shù)超過門限的閃爍事件確定為閃爍事件,并標識為1[4]。其他事件為無閃爍事件,標識為0。上述閃爍事件判斷標識過程批量處理完成后,對所有標識的事件結果進一步進行人工檢測,確定閃爍事件標識是否符合實際情況,如存在閃爍事件標識錯誤或疑似不確定性事件,則剔除相應數(shù)據(jù)。經(jīng)上述處理后獲得的閃爍事件數(shù)據(jù)集如表1所示。 表1 閃爍事件識別分析可用數(shù)據(jù)集Tab.1 Data set for scintillation events analysis 需要說明的是,上述閃爍事件判定方法是理論研究中采用的有效閃爍過程判斷方法。已有工作中雖然也聲明利用人工方法對閃爍事件進行標識,但其方法僅是通過是否超過預定門限對閃爍事件進行標識[5-9]。與上述基于閃爍理論分析進行事件標識的方法相比,這些工作中的方法缺乏對有效閃爍過程的判斷。 利用SVM方法和NN方法,針對多種情形建立閃爍事件識別模型,并進行性能測試。具體包括針對不同區(qū)域、不同時期、不同GNSS系統(tǒng)(GPS和BDS)信號,以及不同閃爍功率譜特征參數(shù),進行模型建立和測試。 1)不同時期/區(qū)域/系統(tǒng)信號觀測數(shù)據(jù)之間的交叉訓練與測試 根據(jù)年份、區(qū)域的不同,將所有觀測數(shù)據(jù)分為四個數(shù)據(jù)集,即GDGZ 0304、HNHK 0304、HNHK 2013、HNHK 2014(表2)。其中,為保持同樣數(shù)據(jù)規(guī)模,兩站2003年、2004年數(shù)據(jù)分別合為一個數(shù)據(jù)集,即GDGZ 0304和HNHK 0304。以每個數(shù)據(jù)集中的所有樣本數(shù)據(jù)作為訓練數(shù)據(jù)集對模型進行訓練,并分別利用其余不同年份、區(qū)域的觀測數(shù)據(jù)作為測試集對所建立模型進行識別精度的交叉驗證。 表2 三種情形下SVM方法實現(xiàn)的閃爍事件識別模型交叉驗證精度(每組精度分析中的三行數(shù)據(jù)分別為三種情形的精度結果)Tab.2 Accuracy of SVM method to scintillation classification(Cross verification is made for 3 different scenarios, with its result shown in each row accordingly) 2)不同閃爍事件特征對機器學習方法識別性能的影響 分別選擇不同閃爍事件特征,對識別模型進行訓練和測試,包括: ①情形1:選擇最小可分辨頻率至2 Hz頻率范圍內的信號功率譜系數(shù)作為閃爍事件特征。這是目前譜分析識別普遍采用的方法[10-11]。 ②情形2:選擇最小可分辨頻率至0.5 Hz頻率范圍內的信號功率譜系數(shù)作為閃爍事件特征。 ③情形3:利用閃爍指數(shù)S4,譜強度和譜指數(shù)作為閃爍事件特征。 由于所涉及問題為二分類問題,因此可以采用混淆矩陣的形式對識別結果進行直觀描述,并計算相應的識別精度。 對于二分類問題,可將樣本根據(jù)其真實類別和學習器預測類別的組合劃分為真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)四種情形,令mTP、mFP、mTN、mFN分別表示其對應的樣本數(shù),則有mTP+mFP+mTN+mFN=樣本總數(shù)[16]。分類結果的精度表示為 對于本文分析的閃爍事件識別而言,正例為有閃爍,標識為1;反例為無閃爍,標識為0。上述定義的分類精度即為有閃爍發(fā)生且識別模型預測為1和無閃爍發(fā)生且識別模型預測為0的樣本數(shù)在總樣本中所占的比例。 表2為三種情形下利用SVM方法實現(xiàn)的閃爍事件識別結果,表3為情形3下SVM方法和NN方法的識別結果??梢钥闯觯?/p> 表3 情形3下SVM和NN方法實現(xiàn)的閃爍事件識別模型交叉驗證精度( 每組精度分析中的兩行數(shù)據(jù)分別為SVM和NN方法的精度結果)Tab.3 Accuracy of SVM and NN methods for scintillation classification for scenario 3 (Up and low line in each cell is for SVM and NN method respectively) 1)基于閃爍信號譜特征,利用機器學習方法可以較好地實現(xiàn)閃爍事件識別。 冪率譜變化是閃爍信號功率譜的基本變化特征,這種特征不會隨時間、地點、觀測系統(tǒng)的不同而有顯著差異。因此,可以利用閃爍譜特征對機器學習方法進行訓練,實現(xiàn)對閃爍事件的有效識別。其中,利用譜系數(shù)進行識別的精度一般可以達到90%~95%。這個結果與已有的研究成果類似[10-11]。 2)不同譜特征選擇對事件識別結果有影響。 不同閃爍譜特征的選擇對閃爍事件識別結果有影響,尤其是情形2的閃爍事件識別結果總體上略優(yōu)于情形1,這個結果具有重要意義。因為常規(guī)GNSS觀測的采樣率一般為1 Hz,考慮到Nyquist準則,其有效采樣率為0.5 Hz。因此,情形2意味著,在一定情況下可以利用常規(guī)GNSS觀測進行閃爍事件識別。情形3閃爍事件識別結果有顯著提高,這表明對閃爍譜特征進行進一步提取,可以顯著提高對閃爍事件的識別精度。 3)同樣情況不同機器學習方法的結果沒有顯著不同。 閃爍事件識別是一個典型的二分類問題,可以采用不同機器學習方法建立識別模型。這里的工作表明,對于SVM方法和NN方法,在同樣情況下實現(xiàn)的閃爍事件識別精度類似,進一步提高精度需考慮其他性能提升方法。 不同機器學習方法都可以實現(xiàn)對閃爍事件的識別,表明不同學習方法均可以建立一個根據(jù)閃爍信號譜特征實現(xiàn)的超平面,對閃爍事件的有無進行劃分。因此,閃爍信號譜特征的可區(qū)分性是影響閃爍事件識別精度的重要因素。為此,對閃爍功率譜進行深入分析。 1)閃爍功率譜頻率范圍選擇 閃爍信號的功率譜具有顯著特征,主要表現(xiàn)在:在Fresnel頻率附近達到極大值,在Fresnel頻率至接收機有效觀測頻率(受接收機采樣率及觀測噪聲影響)之間,呈現(xiàn)出冪率下降趨勢[14-15]。這個特征只在一定頻率范圍內存在,確定該范圍是進行功率譜參數(shù)擬合估計以及機器學習模型輸入?yún)?shù)的關鍵。嚴格意義上,上述頻率范圍應動態(tài)確定,但在實際中,可以通過經(jīng)驗分析選擇一個確定的頻率范圍。 假設閃爍監(jiān)測接收機原始信號采樣頻率為f(一般情況下f≥20 Hz),則理論上信號功率譜的最大可觀測頻率為f/2。實際上,受接收機觀測噪聲、測量環(huán)境以及電離層不均勻體變化的影響,冪率譜特征在閃爍信號功率譜上的表現(xiàn)并不一定能持續(xù)到最大可觀測頻率。實際觀測發(fā)現(xiàn),閃爍信號功率譜一般在大于2 Hz情況下會表現(xiàn)出噪聲增大現(xiàn)象,因此分析中將有效觀測頻率設置為2 Hz。 文獻[2]對閃爍相關的電離層不均勻性大小、形狀、漂移速度進行了統(tǒng)計分析,結果表明,GPS信號觀測到的不均勻體Fresnel尺度一般在400~800 m,最大可達1 600 m,漂移速度可在50 ~500 m/s范圍內變化,主要集中在100~200 m/s。因此,典型的Fresnel頻率可選為0.25 Hz。 綜合上述考慮,實際工作中在擬合冪率譜特征參數(shù)時,選擇擬合的頻率范圍為0.3~2 Hz。從后繼閃爍事件識別精度的分析結果可以看到,這個頻率范圍的選擇是合理的。在以譜系數(shù)作為機器學習模型輸入時(情形1),選擇最小可分辨頻率至2 Hz之間的頻譜系數(shù)作為輸入?yún)?shù)。 2)冪率譜特征對閃爍事件識別的影響 對利用譜系數(shù)作為特征進行閃爍事件識別的結果分析發(fā)現(xiàn),錯誤分類的情況主要集中在一次閃爍發(fā)生過程的初始階段或結束階段,此時閃爍多為中等強度和弱閃爍事件。為此,選擇存在多個識別錯誤的一段閃爍發(fā)生過程為例進行分析。 圖2給出了海南2013-09-24T22:00—24:00UT期間GPS RPN18衛(wèi)星L1信號的閃爍指數(shù)S4(原始數(shù)據(jù)以2 h時段進行存儲)。從發(fā)生時長和閃爍指數(shù)變化可以看出,該次事件為一次強閃爍逐漸衰變消失的變化過程。分析中發(fā)生的多次閃爍事件錯誤識別均發(fā)生在該時間段。按照閃爍事件標識方法,該段閃爍過程中,除了S4指數(shù)小于0.1的歷元處被標識為無閃爍事件外,其余歷元處均標識為有閃爍事件發(fā)生。為此對該時間段內不同歷元處的閃爍事件進行詳細分析。 圖2 電離層閃爍指數(shù)與錯誤事件標識(海口2013-09-24T22:00—24:00UT, GPS PRN18 L1)Fig.2 Scintillation index(blue stars) and error event marks(red circles) (HNHK 2013-09-24T22:10—24:00UT, GPS PRN18 L1) 在該次閃爍發(fā)生過程中,SVM方法將22:09UT觀測的閃爍事件準確識別為“有”,而將22:40UT觀測的閃爍事件錯誤識別為“無”。這兩次事件期間的閃爍指數(shù)基本相等,分別為0.29和0.28,但從信號頻譜上可以看出,這兩次事件期間的信號頻譜存在顯著不同(圖3和圖4)。 圖3 電離層閃爍信號功率譜及擬合結果(???013-09-24T22:09UT,GPS PRN18 L1信號。 該段數(shù)據(jù)閃爍指數(shù)S4 =0.29, 譜擬合結果p = 2.30, T = -42.2 dB·rad2/Hz)Fig.3 Intensity spectrum and its fitting result for ionosphere scintillation impacted signals (HNHK 2013-09-24T22:09UT,GPS PRN 18 L1.Scintillation index S4 = 0.29, spectrum fitting results p = 2.30, T = -42.2 dB·rad2/Hz) 圖4 電離層閃爍信號功率譜及擬合結果(海口2013-09-24T22:40UT,GPS PRN18 L1信號。 該段數(shù)據(jù)閃爍指數(shù)S4 =0.28, 譜擬合結果p = 0.92, T = -50.4 dB·rad2/Hz)Fig.4 Intensity spectrum and its fitting result for ionosphere scintillation impacted signals (HNHK 2013-09-24T22:40UT,GPS PRN 18 L1.Scintillation index S4 = 0.28, spectrum fitting results p = 0.92, T = -50.4 dB·rad2/Hz) 22:09UT歷元時刻信號頻譜在Fresnel頻率與有效觀測頻率(2 Hz)之間存在顯著的冪率譜下降趨勢,這種趨勢在圖1中也可以明顯看到。但對于22:40 UT歷元時刻觀測信號而言,功率譜在0.3 Hz時已基本從最大值降為一個較小值,而在0.3 Hz至2 Hz之間,信號頻譜的變化趨勢接近水平。 對比23:58UT歷元時刻觀測信號,此時閃爍指數(shù)為0.1,表明閃爍變化已接近消失(圖5)。從該時段信號頻譜可以看出,功率譜在0.3 Hz之前已從最大值降為較小值,在0.3 Hz至2 Hz之間,信號頻譜基本為無顯著變化趨勢??梢钥闯觯?22:40UT歷元時刻信號頻譜與23:58UT歷元時刻信號頻譜更為相似。因此,以譜特征作為閃爍事件分類標準的學習方法將22:40UT歷元時刻信號識別為無閃爍發(fā)生。其他識別錯誤歷元時刻的數(shù)據(jù)分析表現(xiàn)出相同變化規(guī)律。 圖5 電離層閃爍信號功率譜及擬合結果(???013-09-24T23:58UT,GPS PRN18 L1信號。 該段數(shù)據(jù)閃爍指數(shù)S4 =0.10, 譜擬合結果p = 0.48, T = -51.6 dB·rad2/Hz)Fig.5 Intensity spectrum and its fitting result for ionosphere scintillation impacted signals (HNHK 2013-09-24 23:58UT,GPS PRN 18 L1.Scintillation index S4 = 0.10, spectrum fitting results p = 0.48, T = -51.6 dB·rad2/Hz) 由此可見,冪率譜特征是在一定強度閃爍下表現(xiàn)出的特征,對于弱閃爍而言,信號頻譜在Fresnel頻率及其附近很小一段高頻范圍內只表現(xiàn)出陡降趨勢,而不是冪率下降趨勢。由于很難界定出陡降趨勢和冪率下降趨勢,因此,在弱閃爍情況下,利用譜系數(shù)作為學習器的輸入會存在識別困難的問題。 這里同時也提示我們,利用一個較大范圍內(最小可分辨頻率至2 Hz)的頻譜系數(shù)進行閃爍識別并不一定有助于性能的提高。減少作為學習器輸入的頻譜系數(shù)范圍,利用大于Fresnel頻率一定頻譜范圍內譜強度顯著降低這一特征作為閃爍事件識別的依據(jù),而不是依據(jù)更大頻譜范圍內可能存在的冪率譜變化特征,有可能提高機器學習模型的識別精度。 3)利用常規(guī)GNSS觀測進行閃爍監(jiān)測的可行性 高精度GNSS定位中,參考站GNSS接收機一般工作在1 Hz采樣頻率上[17]。對于這種高精度GNSS常規(guī)觀測(1 Hz),其信號功率譜的最高截止頻率為0.5 Hz。從圖1和圖3~5可以看出:對于較強閃爍而言,信號功率譜從Fresnel頻率至接收機有效觀測頻率之間均表現(xiàn)出冪率譜下降特征;對于較弱的閃爍事件而言,其頻譜在Fresnel頻率至0.2~0.3 Hz范圍表現(xiàn)出明顯的下降趨勢,而在更高頻率上表現(xiàn)為類似噪聲。因此,以0.5 Hz作為截止頻率,則在強閃爍及中弱強度閃爍情況下,信號功率譜在Fresnel頻率至截止頻率之間存在“統(tǒng)一”的明顯下降變化趨勢,從而可以更容易建立對閃爍事件識別的超平面。而在0.5 Hz至接收機有效觀測頻率之間的頻譜部分,在弱閃爍情況下表現(xiàn)近似為噪聲特征。因此將該部分頻譜也用于學習器訓練,會由于不同強度閃爍的頻譜特征變化不同,降低學習器的識別能力。閃爍信號功率譜的這個特點也從頻譜角度說明,利用常規(guī)高精度GNSS參考站接收機觀測建立閃爍事件識別方法具有一定的可行性[17]。 但需要說明的是,如果存在磁暴等大尺度不均勻體影響,利用信號頻譜特征進行擾動識別會產(chǎn)生困難。從圖4和圖5可以看出,弱閃爍情況下信號頻譜的特征是在Fresnel頻率到0.3 Hz頻率之間顯著下降,而不是冪率譜變化規(guī)律。這時信號頻譜變化集中在低頻端,表明是大尺度電離層不均勻體影響。這種大尺度不均勻體可能與磁暴相關,也可能與閃爍變化過程中的大尺度不均勻體相關[18]。 4)譜特征選擇與閃爍識別精度提高 閃爍信號的功率譜變化特征可以通過不同方式進行描述。2.2節(jié)中特征選擇的三種情形即是對這種譜特征的不同描述,不同情形下的識別精度在一定程度上說明了該情形對閃爍信號譜特征描述的有效性。 如果將信號頻譜看作是一個測量過程,則信號頻譜在每個頻率分量上的強度起伏變化可以看作為一種帶噪聲的測量。因此,直接用信號頻譜分量進行學習器的訓練會受到這種噪聲的影響。當采用閃爍指數(shù)、譜強度和譜斜率進行訓練時,由于這些參數(shù)是對信號頻譜的特征進行擬合,實際可等效為對信號頻譜進行了某種濾波,降低了觀測噪聲。因此,利用這些估計參數(shù)進行建模和識別,得到的精度會提高。 從情形3的結果可以看出,利用閃爍功率譜擬合的特征參數(shù)進行學習器訓練,可提高對閃爍事件的識別精度。該精度可以達到98%,基本和Nicola Linty等人工作中僅對強閃爍事件進行識別的精度相當[5-6],但包括了對中弱強度閃爍事件的識別能力。 本文比較分析了不同時期/區(qū)域/系統(tǒng)信號測量及不同機器學習模型情況下,利用信號譜特征進行閃爍事件識別的性能。結果表明: 閃爍信號的功率譜具有顯著變化特征,一般表現(xiàn)為高頻端的冪率譜下降,這個特征不會隨時間、地點、觀測系統(tǒng)的不同而有顯著差異,因此可以用于建立閃爍事件的有效識別方法。對于SVM方法,利用不同截止頻率及譜擬合結果作為模型輸入,建立的閃爍識別模型精度最高可達98.5%,最低為91.3%,其精度均可優(yōu)于90%。NN方法的結果與SVM類似。 采用截止頻率為0.5 Hz的閃爍功率譜系數(shù)進行建模,其識別精度略優(yōu)于采用截止頻率為2 Hz的結果。這表明信號譜特征用于閃爍事件識別的根本在于,在大于Fresnel頻率的一定頻譜范圍內,譜強度存在顯著降低這一特征,而并不僅僅是冪率譜變化特征。因此,合理選擇頻譜范圍使譜特征變化更為顯著,是影響識別方法實現(xiàn)性能的重要因素。 閃爍信號譜的這一特點也為利用常規(guī)高精度GNSS參考站接收機觀測(1 Hz)建立閃爍事件識別方法提供了理論依據(jù)。但利用常規(guī)GNSS觀測進行閃爍事件識別,需進一步考慮與磁暴事件的區(qū)分。 對信號功率譜進行進一步擬合分析處理,利用進一步獲得的譜特征參數(shù)進行學習器的訓練,可顯著提高閃爍事件識別精度,且所需參數(shù)大幅減少。1 閃爍譜特征
2 基于不同譜特征的閃爍事件識別
2.1 閃爍事件提取與標識
2.2 機器學習模型訓練與測試
2.3 識別精度計算
2.4 閃爍事件識別結果
3 討論和分析
4 結 論