宮 哲 鄒自明 陸 陽
1(中國科學院國家空間科學中心 北京 100190)
2(中國科學院大學 北京 100049)
太陽質子事件是一種空間天氣現象。太陽活動例如耀斑和日冕物質拋射(CME)等爆發(fā)時,會噴射出大量的高能粒子,其中一部分會從太陽低層大氣傳播到近地空間,并被地球附近的衛(wèi)星或飛行器探測到[1]。當高能粒子通量達到一定標準時,便認為發(fā)生了太陽質子事件。中國空間環(huán)境預測中心將太陽質子事件定義為:在地球同步軌道上探測能量大于10 MeV 的質子,每5 min 計算一次平均積分通量,單位pfu(1 pfu=1 cm–2·s–1·sr–1)。當連續(xù)三次積分通量大于10 pfu 時,便認為發(fā)生了太陽質子事件。太陽質子事件中,大量的高能粒子會對航天器和宇航員產生嚴重危害,因此準確的太陽質子事件短期預報對航天活動災害預防是非常必要的。
根據預報方法的不同,可以將太陽質子事件的預報模式分為物理預報模式和經驗預報模式兩種。物理預報模式是基于太陽質子事件發(fā)生的物理機制建立預報模型。例如,SOLPENCO 模型[1]根據從太陽質子事件開始到激波到達拉格朗日點(L1)的時間計算質子事件的通量變化趨勢對太陽質子事件進行預報;SEPMOD 模型[2]通過計算給定位置的高能粒子通量曲線實現太陽質子事件的預報。經驗預報模式是基于質子事件相關的太陽活動與現象,例如利用太陽黑子,太陽耀斑,日冕物質拋射等,對太陽質子事件進行預報。2006 年美國空軍實驗室(AFRL)以IMP 系列衛(wèi)星于1997-2001 年觀測到的21 個質子事件與對應耀斑之間的關系為基礎,建立了質子預報系統(tǒng)(Proton Prediction System,PPS)[3],其報準率能達到85.71%,但是虛報率高達50%;2009 年,Laurenza等[4]選取了1995-2005 年的70 個太陽質子事件,以耀斑經緯度、耀斑重要性等級、軟X 射線積分通量和射電噪暴積分通量等作為輸入建立預報模型,該預報模型將虛報率降低至42%的同時,報準率也下降至63%;Nú?ez[5]提出了UMASEP 模型,該模型通過分析第22 和第23 太陽活動周期間軟 X 射線和近地空間的 9~500 MeV 的微分質子通量等數據,預報太陽質子事件發(fā)生與否,其報準率為80.72%,虛報率為33.99%。Huang 等[6]使用集成學習的方法,基于耀斑和CME 相關數據建立了兩個隱樸素貝葉斯模型,并將這兩個模型集成對太陽質子事件進行預測,取得了78.57%的報準率和50%的虛報率。Zhong 等[7]通過分析地球靜止運行環(huán)境衛(wèi)星5 min 平均軟X 射線通量和差分積分質子通量,預測在未來24 h 內是否會發(fā)生太陽質子事件,其報準率為80.00%,虛報率為25.85%。
現存太陽質子事件短期預報方法的局限性主要在于:在獲得較高的報準率時,虛報率依然較高。針對這個問題,本文提出一種基于集成學習的太陽質子事件短期預報方法,選取了8 種具有不同特點的機器學習模型,以現存方法中廣泛使用的太陽黑子數據、耀斑數據、CME 數據作為輸入對模型進行訓練,并通過一定的決策方式將8 個模型集成為一個協同作業(yè)系統(tǒng),用以預報太陽質子事件24 h 內是否發(fā)生。本文選取了完整的第23 太陽活動周的數據進行實驗,并在完整覆蓋太陽活動高年和低年的數據上進行了模型構建與測試,取得了80.95%的報準率的同時,將虛報率降低至19.05%,相比現有的預報系統(tǒng)具有較為明顯的優(yōu)勢。
使用包括太陽耀斑、CME、太陽黑子三類數據用于太陽質子事件的短期預報,選取依據和使用的參數如下。
(1)太陽耀斑。太陽耀斑是發(fā)生在太陽大氣層局部區(qū)域的一種劇烈的爆發(fā)現象。根據Kahler[8]提出的大耀斑假說,耀斑的大小與高能粒子事件的發(fā)生有著密切的聯系。Le 等[9]的研究也表明,太陽耀斑對于能量大于10 MeV 的質子加速有明顯貢獻。本文所使用的耀斑數據主要包括X 射線耀斑等級和耀斑位置兩項參數。
(2)CME。CME 是日冕磁場以及積聚在日冕中的等離子體團在較短時間內向行星際爆發(fā)的現象。根據Kahler 等[10]的研究,CME 與太陽質子事件中高能粒子的峰值通量有很強的相關性。Wang 等[11]也曾提出,速度大且源區(qū)位置距離日面上連接地球磁力線足點近的全暈CME 極易引發(fā)太陽質子事件。本文所使用的CME 數據主要包括中心位置角、角寬度、線速度和加速度四項參數。
(3)太陽黑子。太陽黑子是太陽光球層表面深色的區(qū)域,是日面強磁場的產物,與耀斑和CME 都具有密切的聯系。Mariachiara 等[12]和Aoife 等[13]曾采用太陽黑子相關數據進行耀斑預測。Howard[14]曾提出太陽黑子處的強磁場與CME 的形成緊密相關。Bai 等[15]的研究也表明了太陽黑子與太陽質子事件之間較強的相關性。本文使用的太陽黑子數據主要包括黑子群的磁極性分類、McIntosh 分類[16]、黑子群位置、黑子群面積、黑子數目以及經度范圍6 項參數。
本文所使用的太陽質子事件、太陽耀斑和CME的數據來源于美國協作數據分析工作室(CDAW),太陽黑子的數據來源于美國國家地球物理數據中心(NGDC)官方網站。為了使預報系統(tǒng)全面地學習太陽活動高年和太陽活動低年中太陽質子事件的活動規(guī)律,選用了一個完整的太陽活動周——第23 個太陽活動周(1997-2007 年)的數據。該選擇參考了Xu 等[17]對太陽活動周的劃分。該活動周內有記錄的太陽質子事件共105 次,由于設備的故障造成數據殘缺,有25 次事件未被使用。數據的總量為654 條,每條數據由相關聯的CME、太陽耀斑和太陽黑子的參數組成。數據的關聯工作由CDAW 完成。其中有80 條數據對應了太陽質子事件的發(fā)生,574 條無太陽質子事件發(fā)生。
選取在多個領域中廣泛使用的機器學習模型,采用太陽質子事件預報中常用的評價指標,以交叉驗證的方式計算每個模型的指標并依此為模型賦予權重,然后通過加權投票的方式將其集成為一個模型。集成模型能夠綜合所有單一模型的優(yōu)點,擁有更強的預報能力。
本質上,太陽質子事件的短期預報(發(fā)生與否)是機器學習領域中常見的二分類問題。近些年來,一些機器學習分類模型(下稱模型)在太陽質子事件預報中得到了一定的應用,但是僅限于單個模型的使用,普遍存在虛報率較高的問題。表1 給出了本文選用的用于太陽質子事件的短期預報8 種模型。每個模型經過訓練后,對于一條輸入數據,會預報24 h 內發(fā)生質子事件的概率,當概率大于50%時,認為24 h 內會有太陽質子事件發(fā)生。
表1 本文使用的8 種機器學習模型Table 1 Machine learning models applied in this study
2.2.1 評價指標
模型對太陽質子事件的預報能力需要一定的指標來進行衡量。目前太陽質子事件短期預報中廣泛采用的評價指標包括報準率(Rpd)和虛報率(Rfa),即
其中:NTP為真正例(True Positive,TP),表示將正類(發(fā)生了太陽質子事件的數據)正確預測為正類的數量;NFP為假正例(False Positive,FP),表示將負類(未發(fā)生太陽質子事件的數據)錯誤預測為正類的數量;NFN(False Negative,FN) 為假負例,表示將正類錯誤預測為負類的數量。
但是單獨使用報準率和虛報率兩項指標之一,并不能完全反映一個模型對質子事件的預測能力。因此引入了F1值作為綜合評價指標,其計算方式如下:
2.2.2 評價方法——交叉驗證
交叉驗證是用于評價一種機器學習模型是否適用于當前應用場景(在本文中是太陽質子事件短期預報)的實驗方法。交叉驗證的第一步即是將數據集按照特定規(guī)律劃分。根據機器學習領域中的慣例,結合本文數據集規(guī)模,表2 給出了本文數據集的劃分方式。
表2 實驗數據的劃分方式Table 2 Dataset division strategy
(1)將數據集按照約3∶1 的比例劃分為訓練集和測試集。這種劃分并非是隨機劃分,而是采用時序分層劃分的方式。首先將數據按照時間順序排列,取前4 條出列,從中隨機取3 條劃入訓練集,剩余1 條劃入測試集。重復此過程,直至整個數據集被劃分完畢。采用這種劃分方式,可以使太陽活動高年和太陽活動低年的數據被均勻地分配到訓練集和測試集中,使模型對于太陽高年和太陽活動低年的太陽質子事件均有較強的預報能力。
(2)將訓練集按照4∶1 的比例進一步劃分為交叉訓練集和交叉驗證集。需要注意的是:在訓練集的劃分中,交叉訓練集和交叉驗證集不是固定的,而是將訓練集平均分為5 個子集后隨機取4 個子集合并作為交叉訓練集,剩余1 個子集作為交叉驗證集,共有5 種不同的組合。這里的5 等分同樣采用時序分層的劃分方式,將數據按照時間順序排列后,取前5 條出列,并將其隨機劃分到5 個子集中。重復此過程,直至整個數據集被劃分完畢。因此每種組合中都等比例地包含太陽活動高年和太陽活動低年的數據。
將交叉訓練集輸入到某個模型對其進行訓練,并將其對應的交叉驗證集輸入到訓練后的模型中進行預報,則可以獲得一組報準率,虛報率和F1值用于評價該模型的預報能力。在訓練集5 種不同的組合上均進行一次實驗,稱為一次交叉驗證。每次交叉驗證,都會獲得5 個報準率,虛報率和F1值,以其均值表征模型預報的準確性。
模型評價完成后,需要根據評價結果對模型進行集成,以綜合利用多個模型的優(yōu)點。由于F1值綜合了一個模型報準率與虛報率,更能代表一個模型的預報能力,因此選用F1值作為每個模型的權重用來對模型進行集成。集成采用了一種加權投票的方式。
設定一條數據輸入集成模型后預報所得的輸出(即質子事件發(fā)生的概率)為,則有
其中,N為單個模型的數量,wi為單個模型的權重,pi為單個模型的輸出。預報閾值設置為0.5,若0.5則認為短期內會發(fā)生太陽質子事件;反之則認為不會。
為了使集成模型輸出的取值范圍在0 和1 之間,需要對每個模型的F1值做歸一化處理得到權重
集成后的模型首先使用訓練集數據進行訓練,訓練得到的模型即是最終的預報模型。使用測試集對其預報能力進行測試。測試集則是從未參與過預報模型訓練的數據,預報模型對其未知,性質等同于生產環(huán)境中新到來的數據,因此可以很好地用來測試集成模型的能力。
根據表2 的數據集劃分,在訓練集上對選用的8 種模型進行交叉驗證后得到的報準率,虛報率和F1值的均值列于表3。
表3 八種模型各自在交叉驗證中的表現Table 3 Performance of 8 individual models on cross-validation dataset
獲取到F1值的均值之后,利用2.3 節(jié)中介紹的模型集成方法,將8 種模型集成為一個最終的預報模型,在訓練集上訓練后,在測試集上對集成模型測試。
測試集數據共164 條,有21 條數據對應了太陽質子事件的發(fā)生。表4 為集成模型對測試集中太陽質子事件的預報結果。其中17 次被集成模型正確預測,而2001 年11 月17 日,2002 年8 月14 日,2003年12 月2 日,2004 年11 月1 日發(fā)生的4 次太陽質子事件被漏報。由表4 可以看出,漏報的4 次太陽質子事件峰值通量均在10~100 pfu 之間。
表4 集成模型對測試集中的太陽質子事件的預報結果Table 4 SPEs prediction result of the ensemble model on the test set
此外,有4 條并未對應太陽質子事件發(fā)生的數據,被虛報為有太陽質子事件發(fā)生。將測試結果匯總列于表5,計算得到報準率為80.95%,誤報率為19.05%。
表5 集成模型在測試集上的預報結果Table 5 Result of the ensemble model on the test set
為了直觀地說明本文預報方法的性能,表6 給出了本文實驗結果與美國空軍實驗室的PPS 系統(tǒng),Laurenza 模型,Nú?ez 等開發(fā)的UMASEP 模型,以及Qiuzhen 等方法預報性能的對比情況。由表6 可以看出,本文方法在保證80%以上報準率的基礎上,進一步降低了虛報率,模型綜合表現(F1值)有了明顯的提升。
表6 本文模型與現行其他預報方法的對比Table 6 Comparison with other current prediction methods
根據上述的實驗與結果進行分析,本文在以下幾個方面取得了一定成果。
(1)提出了一種基于集成學習的太陽質子事件短期預報的方法。該方法選用了8 種廣泛使用的機器學習模型,通過交叉驗證評價和加權投票機制獲得了一個集成的預報模型。
(2)本文模型在對太陽質子事件預報的報準率高達80.95%的同時,進一步將虛報率降低至19.05%。相比現有的預報方法性能有較大的改善。
(3)本文使用了一個完整的太陽活動周的數據,并且通過時序分層劃分的方式,保證了模型訓練和模型測試的數據中都包括了太陽活動高年與太陽活動低年的數據。因此,本文模型對于太陽活動高年和低年的太陽質子事件均具有較好的預報能力。
本文的集成預報模型在太陽質子事件短期預報任務中擁有較強的能力,如果能夠將該集成模型進行工程化,形成功能完備的業(yè)務預報系統(tǒng),并應用于實際航天任務中,則能更加有效地進行航天任務的規(guī)劃,規(guī)避或減少對航天器與航天員的傷害。此外,本文中僅應用了太陽黑子、太陽耀斑、CME 相關數據進行太陽質子事件短期預報。然而太陽質子事件的形成是一個極為復雜的物理過程。高能粒子的產生,粒子的加速機制與行星際運輸過程等,均受到日地空間多重因素影響。近地X 射線背景、總太陽輻照度、太陽射電通量以及射電噪暴等現象都與太陽質子事件的形成密切相關。相關輸入數據集的選擇、擴充和完善,則有機會獲得更為精準的太陽質子事件短期預報模型。這些都將是下一步研究的方向。
致謝國家科技資源共享服務平臺國家空間科學數據中心(http://www.nssdc.ac.cn)提供計算服務,美國協作數據分析工作室(CDAW)提供太陽耀斑與CME 相關數據,美國國家地球物理數據中心(NGDC)提供太陽黑子相關數據以及太陽質子事件列表。