許凱凱,張銳
(中國科學院微小衛(wèi)星創(chuàng)新研究院, 上海 201203; 中國科學院大學, 北京 100049) (2021年12月7日收稿; 2022年4月6日收修改稿)
衛(wèi)星帆板作為衛(wèi)星整個生命周期的能源提供部件,在衛(wèi)星的健康狀態(tài)評估中占有非常重要的比重。根據(jù)對2003—2021年91顆衛(wèi)星在軌典型故障案例的分析,供電分系統(tǒng)出現(xiàn)故障的比率在所有分系統(tǒng)中排名最高,占比44%,其次是推進分系統(tǒng)和控制分系統(tǒng),分別占比26%和16%[1]。因此通過分析衛(wèi)星帆板相關指數(shù)來判斷衛(wèi)星帆板當前的健康狀態(tài)就顯得至關重要。而衛(wèi)星帆板溫度遙測數(shù)據(jù)就是可以直接反映當前帆板工作狀態(tài)的具體指標之一,該指標主要受到太陽、地球、衛(wèi)星本體3方面的影響,具體包括太陽入射角、地球反照率、衛(wèi)星本體溫度等因素。衛(wèi)星在發(fā)射升空進入軌道之后,就會按照預先設置的特定軌道嚴格恪守物理學定律進行周期性運動。即使考慮到軌道攝動、近地衛(wèi)星受到大氣層影響而降低高度、衛(wèi)星執(zhí)行任務時引起的姿態(tài)改變,也可以將其看作是漸周期性運動,這是本文采用自回歸神經(jīng)網(wǎng)絡對衛(wèi)星帆板溫度遙測數(shù)據(jù)進行缺失值插補的根本原因。本文采用的衛(wèi)星帆板溫度遙測數(shù)據(jù)采樣周期為256 s,遙測數(shù)據(jù)缺失情況主要是從連續(xù)缺失幾個點到連續(xù)缺失1軌乃至2軌,為將缺失值盡可能多地插補出來,本文采用根據(jù)歷史數(shù)據(jù)預測未來2軌的方法構建神經(jīng)網(wǎng)絡。
目前的時序缺失數(shù)據(jù)的插補方法已經(jīng)比較完備,按照插補函數(shù)中殘差存在與否主要包括確定性插補和隨機性插補兩個方法[2],其中確定性插補方法又包括最近鄰插補[3]、多項式插補[4]、基于距離權重的插補[5]、基于信號分析的插補如傅里葉分析等[6];隨機性插補方法又包括回歸插補方法[4]、自回歸插補方法[7]、機器學習插補方法如ANN神經(jīng)網(wǎng)絡(artifical neural network,ANN)[8]、基于數(shù)據(jù)驅動的插補方法如K近鄰[9]、基于Kriging的插補方法等[2,10]。按照插補變量的維度又可以分為單變量插補方法和多變量插補方法,常見的單變量插補方法包括直接刪除法、基于統(tǒng)計學的插補方法如均值插補、基于機器學習的插補方法等,其中基于機器學習的插補方法又包括回歸插補[4]、K近鄰插補[9]、極大似然插補、多重插補等,多變量插補方法包括主成分分析插補[11]、基于概率矩陣分解的插補等[12]。本文使用的模型是屬于機器學習插補的范疇,涉及的衛(wèi)星帆板溫度遙測數(shù)據(jù)則是單變量,因此也屬于單變量插補。傳統(tǒng)的確定性插補方法在面對缺失數(shù)據(jù)較少以及主要缺失點分布在光滑緩變區(qū)域時較為有效,一旦數(shù)據(jù)點缺失比較多且主要分布在短期劇烈變化的區(qū)域,插補效果就會很差,而隨機性插補方法面對這一問題就會表現(xiàn)出其優(yōu)越性。Babu和Sure[13]使用自回歸移動平均模型(autovegressive integrated moving average model,ARIMA)和ANN的混合模型對諸如太陽黑子和用電價格的時間序列進行預測插補,進一步提高了模型的預測精度,取得了較好的效果。Hundman等[14]使用長短時記憶網(wǎng)絡(long short term memory network,LSTM)對衛(wèi)星遙測數(shù)據(jù)建模預測,并提出自適應閾值算法以達到衛(wèi)星異常數(shù)據(jù)檢測的目的。王少影等[15]使用隨機森林(random forest,RF)、支持向量機(support vector machine,SVM)、人工神經(jīng)網(wǎng)絡ANN 3種機器學習模型對若爾蓋高寒濕地生態(tài)系統(tǒng)研究站2016年感熱、潛熱以及凈生態(tài)系統(tǒng)交換通量序列進行插補,取得了很棒的插補效果。Raubitzek和Neubauer[16]提出一種分形插值方法以改進神經(jīng)網(wǎng)絡對困難時間序列數(shù)據(jù)的預測。
本文處理的遙測數(shù)據(jù)連續(xù)缺失較多,從連續(xù)缺失幾個點到連續(xù)缺失1或2軌的情況都比較常見,且連續(xù)缺失點在光滑緩變區(qū)域以及短時劇烈變化區(qū)域均有分布,因此采用確定性插補方法效果不理想。目前在時序數(shù)據(jù)插補領域應用研究中,LSTM、ANN等神經(jīng)網(wǎng)絡是使用較為廣泛的方法,但是卻具有模型訓練困難、模型訓練時間長、梯度不穩(wěn)定等缺點。為達到較好的缺失插補效果,本文采用加入了注意力機制的時間卷積網(wǎng)絡(time convolution network with squeeze and excitation,SE-TCN)。目前時間卷積網(wǎng)絡(time convolution network,TCN)[17]已在音頻合成[18]、單詞語言建模[19]、機器翻譯[20]等領域取得優(yōu)良效果,但其在多步預測任務中存在短期劇烈變化處模型特征表征能力不足的問題,因此采用squeeze-and-excitation networks[21]中的通道注意力機制對TCN進行改進,以增強TCN網(wǎng)絡的特征提取能力[22]。
根據(jù)真實的太空環(huán)境,能量守恒定律,以及有限差分理論,帆板溫度物理模型的表達式如下所示[23]
Q4(t)+Q5(t)+Qi(t),
(1)
其中:Q1(t)表示衛(wèi)星帆板在x和y方向的熱衰減對帆板各處溫度的影響,Q2(t)表示衛(wèi)星帆板向外熱輻射損失的熱量,Q3(t)表示太陽對衛(wèi)星帆板的熱輻射帶來的熱量,Q4(t)表示地球對帆板的反照熱輻射帶來的熱量,Q5(t)表示地球對帆板的紅外熱輻射帶來的熱量,Qi(t)表示來自衛(wèi)星本體的熱量。它們的具體計算公式如下,公式中各個符號的物理含義詳見表1。
(2)
圖1(a)是衛(wèi)星帆板的物理模型,對應式(1)和式(2)。設置初始值后,經(jīng)過多次迭代,溫度將趨于穩(wěn)定,穩(wěn)定狀態(tài)是吸收和輻射之間的平衡。仿真結果如圖1(b)所示,從一段時間的仿真結果可以看出,在較短時間范圍內,帆板溫度數(shù)據(jù)具有很強的規(guī)律性和周期性,但是物理仿真對于缺失值的插補至少有兩點不足。其一,從式(1)和式(2)來看,在計算過程中存在多次微分積分運算和參數(shù)調整,導致有限元網(wǎng)格優(yōu)化計算成本高、難度大;其二,物理建模并未考慮到影響溫度變化的所有因素,插值的準確度并不高,理論計算和實際的遙測數(shù)據(jù)會因為環(huán)境的不同而有所差異??紤]到物理模型插值的效果,采用物理建模的方法對帆板溫度遙測數(shù)據(jù)進行填補并不可行。同時由于仿真數(shù)據(jù)在短時間范圍內的漸周期性,采用針對時序數(shù)據(jù)的神經(jīng)網(wǎng)絡對缺失值進行插補具有可行性。
圖1 衛(wèi)星帆板溫度物理模型及其仿真Fig.1 Physical model and simulation of satellite sail temperature
之前介紹了多種基于機器學習的時間序列插值方法,如ARIMA、ANN、SVM、LSTM、TCN、SE-TCN等等,考慮到本文處理的衛(wèi)星帆板溫度遙測數(shù)據(jù)的漸周期特性,使用SE-TCN[22]可以解決ARIMA、ANN等模型的周期描述性不強帶來的對歷史數(shù)據(jù)的信息提取不足、LSTM等模型的訓練周期長、TCN模型對時序數(shù)據(jù)劇烈變化區(qū)域特征提取能力弱等問題。
1.2.1 因果卷積
1.2.2 膨脹卷積
膨脹卷積是為解決簡單因果卷積感受野能力有限,從而隨著網(wǎng)絡層數(shù)的增加,每層的感受野只能線性增加帶來的網(wǎng)絡復雜、層數(shù)高、難以訓練等問題。TCN引入了膨脹卷積[17],可以使感受野大小成指數(shù)式增長。對于一維輸入時間序列x∈Rn以及濾波器f∶{0,…,k-1}→R,空洞卷積在t時刻的結果如下
(3)
其中:d是膨脹因子,k是濾波器大小,t-d·i表示歷史數(shù)據(jù)的方向,xt-d·i表示輸入序列x在時刻t之前的第d·i個分量。每個卷積層的感受野計算公式如下
receptive field=(k-1)d+1.
(4)
可以選擇較大的濾波器大小k或者增加膨脹因子d來增加感受野。第i層的膨脹因子通常為O(2i)。關于膨脹因果卷積網(wǎng)絡架構可見圖2。
圖2 因果膨脹卷積網(wǎng)絡架構Fig.2 Dilated causal convolution network architecture
1.2.3 殘差連接
殘差連接是訓練深層網(wǎng)絡的有效方法,它使得網(wǎng)絡以跨層的方式傳遞信息,而且可以防止網(wǎng)絡過深導致出現(xiàn)梯度消失的問題[17]。殘差塊包含兩層的卷積以及非線性映射,在每層中還使用權重正則化和Dropout層來正則化網(wǎng)絡以防止深層網(wǎng)絡的過擬合,此外還包含1×1卷積,其作用是降維,目的是為了兩層相加時特征圖數(shù)量相同。
注意力機制是計算機視覺領域常用的模塊,它的提出是為解決在卷積池化過程中特征圖的不同通道所占的重要性不同而帶來的損失問題[21]。在傳統(tǒng)的卷積池化過程中,默認特征圖的每個通道是同等重要的。而在實際的問題中,不同通道的重要性是有差異的。注意力機制模塊(squeeze-and-excitation,SE)包括3個部分:壓縮(squeeze)、激勵(excitation)和權重調整(scale)。TCN殘差模塊和SE-TCN殘差模塊的對比結果如圖3所示。圖中TCN殘差塊輸出的特征圖維度設為W×H×C,經(jīng)過全局池化層的壓縮操作之后,輸出維度變?yōu)?×1×C,得到當前特征圖的全局壓縮特征量。接下來是激勵操作,通過兩層全連接的Bottleneck結構得到特征圖中每個通道的權值,并將加權后的特征圖作為下一層網(wǎng)絡的輸入。第1個全連接層含有C/r個神經(jīng)元,輸入維度為1×1×C,輸出維度為1×1×C/r,其中r是一個縮放參數(shù),這個參數(shù)的目的是為減少通道個數(shù)從而降低計算量。第2個全連接層含有C個神經(jīng)元,輸入維度為1×1×C/r,輸出維度為1×1×C。最后是權重調整操作,將激勵操作輸出的特征圖維度調整到和原特征圖維度相同,即將維度從1×1×C調整到W×H×C。
圖3 TCN和SE-TCN殘差塊對比Fig.3 The comparison of TCN residual block and SE-TCN residual block
圖4展示了遙測及仿真數(shù)據(jù)的相關統(tǒng)計特性,其中圖4(a)是時間跨度一年半的衛(wèi)星帆板遙測數(shù)據(jù)全覽及某一段時間局部圖,采樣周期為256 s,衛(wèi)星繞地球1圈即1軌會采樣23~24個點,一天大概會產生15軌遙測數(shù)據(jù)。數(shù)據(jù)缺失具有以下幾種情況:連續(xù)缺失1~2個采樣點;連續(xù)缺失3個采樣點至半軌;連續(xù)缺失半軌至1軌;連續(xù)缺失1~2軌。針對連續(xù)缺失1~2個采樣點的情況,一般發(fā)生在數(shù)據(jù)較為平滑的區(qū)域,可以采用線性插值或者樣條插值的辦法進行初步填補,使得處理后的數(shù)據(jù)遙測盡可能少地出現(xiàn)間斷點,為之后盡可能多地構建數(shù)據(jù)集樣本做出貢獻。至于連續(xù)缺失3個點至2軌的情況,不能簡單使用統(tǒng)計學方法進行插值,因為連續(xù)缺失點較多,再使用樣條插值等方法就會引入大量誤差,使得插值后的曲線完全不符合歷史數(shù)據(jù)走向,因此有必要引入時間卷積神經(jīng)網(wǎng)絡對缺失的數(shù)據(jù)進行插補。
圖4 遙測數(shù)據(jù)一覽和遙測及仿真數(shù)據(jù)傅里葉變換Fig.4 Overview of telemetry data and Fourier transform of telemetry and simulation data
從直觀上來分析,衛(wèi)星圍繞地球公轉,而地球圍繞太陽公轉,公轉可以理解為周期性運動,衛(wèi)星帆板溫度主要受到太陽、地球、衛(wèi)星本體的影響。衛(wèi)星在陽照區(qū)未執(zhí)行任務的時候姿態(tài)穩(wěn)定,為讓帆板最大程度獲取太陽能,帆板表面和太陽入射光是垂直關系,在執(zhí)行任務的時間段才會有短暫的姿態(tài)改變,而在地影區(qū)衛(wèi)星也是姿態(tài)穩(wěn)定的,所以衛(wèi)星姿態(tài)改變對溫度變化造成的影響可以忽略。圖4(b)前2幅圖分別是帆板溫度仿真數(shù)據(jù)和帆板溫度遙測數(shù)據(jù)對應的傅里葉變換,可以看到這2幅圖都是由主要的幾個峰和一些幅度較小的信號量組成,遙測數(shù)據(jù)傅里葉變換中頻率為0附近的幾個頻點是由于遙測數(shù)據(jù)的缺失造成的,可以忽略。這從數(shù)據(jù)的頻域上進一步反映了帆板溫度數(shù)據(jù)屬于和時間密不可分的時間序列。通過以上分析,可以認為帆板溫度遙測數(shù)據(jù)是與時間密切相關的漸周期性時間序列,可以采用處理時間序列效果較好的時間卷積網(wǎng)絡進行建模。
卷積神經(jīng)網(wǎng)絡建模本質是找到從一段歷史時序數(shù)據(jù)到一段未來時序數(shù)據(jù)的映射函數(shù),帆板溫度數(shù)據(jù)相鄰兩軌的數(shù)據(jù)由于時間上連續(xù),間隔時間較短,差異也比較小。如果直接使用前一軌作為模型輸入,后一軌作為模型輸出,從而建立映射模型,那么模型納入考量的歷史數(shù)據(jù)太少,即感受野太小,模型過于簡單,模型對于訓練集和測試集的擬合程度都不會好,造成欠擬合。為增加模型復雜度,在模型層與層之間的濾波器個數(shù)k和擴張因子d一定的情況下,可以通過增加輸入維度,即增加輸入層感受野來達到目的。而且,從圖4(b)中仿真數(shù)據(jù)和遙測數(shù)據(jù)的離散傅里葉變換來看,在誤差允許范圍內,排除幅度較低的高頻信號,確定信號頻域右邊界,就可以將帆板溫度數(shù)據(jù)看作眾多正余弦信號的疊加。此外,圖4(b)中第3幅圖可以看到,長周期低頻信號量信息較為豐富,盡可能多地增加輸入層維度,卷積神經(jīng)網(wǎng)絡也將盡可能多地納入長周期的信號和多軌短周期的信號,使得神經(jīng)網(wǎng)絡針對不同頻率段的歷史信息都能進行學習。但是如果模型過于復雜,就會造成訓練時間長、訓練資源占用高、模型過擬合等情況。
構建模型結構時需要考慮造成數(shù)據(jù)缺失的原因(主要包括組幀錯誤和入境時間短)帶來的影響。組幀錯誤是隨機發(fā)生的,造成的影響僅限于出現(xiàn)時間或者溫度維度上的離群值,把離群值剔除即可,一般會帶來零星采樣點的缺失。入境時間短是造成數(shù)據(jù)缺失的主要原因,會造成遙測數(shù)據(jù)缺失幾個零星的采樣點到2軌不等,在極少情況下,會造成連續(xù)多軌的缺失。由于本文處理的帆板溫度遙測數(shù)據(jù)的基本缺失場景是連續(xù)缺失最長不超過2軌數(shù)據(jù),為盡量補齊缺失數(shù)據(jù),設定模型輸出維度為2軌。模型輸入需要取模型輸出序列之前的一段連續(xù)時間序列,而帆板溫度遙測數(shù)據(jù)一天大約15軌數(shù)據(jù)中能連續(xù)的數(shù)據(jù)只有7軌左右。考慮到遙測數(shù)據(jù)缺失的特點、盡可能多地增加感受野、模型復雜度等因素的影響,取模型輸入為連續(xù)5軌的數(shù)據(jù)。確定了模型輸入輸出維度之后,接著根據(jù)1.2節(jié)的計算公式初步確定所需殘差塊的最小數(shù)目,殘差塊數(shù)目越多,代表模型結構越復雜。為使得模型更好的擬合數(shù)據(jù)集,需要調節(jié)殘差塊數(shù)目以得到擬合最好的模型。模型在最后一個殘差塊后面加了Flatten層,把最后一個殘差塊輸出的高維數(shù)據(jù)“碾壓”成一維數(shù)據(jù),而Flatten后面的全連接層在整個卷積神經(jīng)網(wǎng)絡中起到“分類器”的作用,再將上述一維數(shù)據(jù)映射成2軌的未來數(shù)據(jù),本文中SE-TCN模型結構如圖5所示。
圖5 本文的SE-TCN模型結構Fig.5 SE-TCN model structure of this paper
算法流程主要包括3個部分:數(shù)據(jù)預處理、模型的訓練、使用訓練好的模型進行預測插值。圖6是算法流程圖。
1)數(shù)據(jù)預處理
①衛(wèi)星帆板遙測數(shù)據(jù)時間上和溫度值上離群值的去除、時間上的去重、采樣相位的偏移矯正。
②按照神經(jīng)網(wǎng)絡模型的輸入輸出維度,對上面處理好的數(shù)據(jù)進行數(shù)據(jù)集的構建。
2)模型的訓練
①構建模型并初始化,加載訓練集進行訓練,訓練次數(shù)達到目標迭代次數(shù)或者模型對訓練集的擬合程度達到目標時,得到初步訓練好的網(wǎng)絡模型。
②使用測試集對初步得到的模型進行泛化能力評估,即評價指標達到目標范圍內,認為模型訓練完成,否則回到第①步。
3)使用訓練好的模型進行預測插值
①對于遙測數(shù)據(jù)中的缺失部分,根據(jù)模型的輸入維度,讀取缺失數(shù)據(jù)之前一定長度的歷史數(shù)據(jù),載入模型中將會輸出一段完整的插值序列。
②計算不完整的缺失數(shù)據(jù)和完整的插值數(shù)據(jù)之間的評價指標,以判斷實際插值的效果。
為評價模型的性能,引入機器學習回歸任務中常用的評價指標,分別是平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和相關系數(shù)(related coefficient,R)[24-25]。為計算測試集的評價指標,需要用到L1、L2范數(shù)的概念,
(5)
式(5)是向量x的Lp范數(shù)的定義,其中,x=(x1,x2,…,xm),m表示向量x的維數(shù)。
(7)
(8)
(9)
(10)
(11)
(12)
(13)
本文模型采用SE-TCN對從連續(xù)5軌的歷史數(shù)據(jù)到未來連續(xù)2軌時序數(shù)據(jù)的映射進行擬合。相關訓練集、測試集也據(jù)此進行構建。圖7(a)是使用SE-TCN模型對2軌(含)以下的某缺失場景進行預測插補的效果圖,這類插補場景占據(jù)所有缺失場景的98.64%;圖7(b)則是遞歸使用SE-TCN模型對某多軌(2軌以上)缺失場景進行預測插補的效果圖,這類插補場景占據(jù)所有缺失場景的1.36%。圖7(c)是SE-TCN訓練過程中的損失函數(shù)曲線,橙黃色虛線和藍色實線分別代表隨著訓練批次的增加,訓練集和驗證集分別對應的損失函數(shù)曲線。可以看到隨著訓練批次的增加,兩者的損失函數(shù)都以近似指數(shù)的形式下降。圖8是不同模型的插值效果對比。其中圖8(a)是針對某2軌缺失場景的不同模型插值效果對比,從圖中結果分析可以看出SE-TCN、TCN、LSTM、物理模型的插值效果依次降低,其中物理模型由于建模時未能全面考慮太空干擾因素,插值效果最差;圖8(b)是針對某多軌缺失場景(5軌)的不同模型插值效果對比,圖8(c)則是該場景下的絕對誤差擴散圖。由于物理仿真結果同神經(jīng)網(wǎng)絡對比差距太大,此處只對3種神經(jīng)網(wǎng)絡進行插值對比,因為模型結構是針對絕大多數(shù)的缺失場景構建的,模型輸入輸出長度確定,即根據(jù)歷史5軌數(shù)據(jù)預測未來2軌數(shù)據(jù)。那么在多軌缺失場景下是通過遞歸調用模型對缺失值進行插補的,每次模型的輸出都將作為下一次模型輸入的一部分。在這種情況下,隨著多軌插補的進行,誤差會逐漸積累。但是由于多軌缺失場景占比很少,多軌插補帶來的累計誤差并不大。相比于SE-TCN和TCN,LSTM的多軌插補劣勢明顯,其誤差擴散更快,而SE-TCN估計誤差比TCN更小,多軌插補效果更好。針對2軌(含)以下的缺失場景和多軌缺失場景,SE-TCN均表現(xiàn)出良好的插值效果。
圖7 SE-TCN插補效果圖及其訓練損失函數(shù)曲線Fig.7 SE-TCN interpolation effect diagram and its training loss function curve
圖8 不同模型的插值效果對比及多軌絕對誤差擴散情況Fig.8 Comparison of interpolation effects of different models and multi track absolute error diffusion
表2為SE-TCN、TCN、LSTM 3個模型的參數(shù),其中TCN除了不含有SE模塊以外,其余參數(shù)和SE-TCN相同。SE模塊僅有一個縮放參數(shù)r,而1.3節(jié)的W×H×C,其中W在本模型中為常值1,因為這是計算機視覺中SE模塊在二維時序場景下的應用,H代表模型輸入長度,即5軌采樣點個數(shù),C表示經(jīng)過殘差塊之后每個采樣點的維度大小,是個變量。表3表示LSTM、TCN、SE-TCN 3種模型在測試集和實際缺失數(shù)據(jù)集上的評價指標值,測試集相關指標計算方式由式(6)和式(7)確定,實際缺失數(shù)據(jù)集相關指標計算方式由式(12)和式(13)確定。對比不同模型分別在測試集和實際缺失數(shù)據(jù)集上的評價指標,可以看到使用SE-TCN模型進行衛(wèi)星帆板遙測數(shù)據(jù)插值具有良好的效果。與LSTM和TCN模型相比,SE-TCN在測試集上的評價指標R分別提升2.59%、0.06%,MAE分別降低65.85%、12.28%,RMSE分別降低42.94%、2.17%;SE-TCN在實際缺失數(shù)據(jù)集上的評價指標R分別提升2.93%、0.04%,MAE分別降低56.35%、12.43%,RMSE分別降低35.42%、0.47%。
表2 不同模型的參數(shù)Table 2 Parameters of different models
表3 不同模型在2個數(shù)據(jù)集上的評價指標Table 3 Evaluation indexes of different models on two data sets
本文采用引入注意力機制的時間卷積網(wǎng)絡SE-TCN對衛(wèi)星帆板溫度遙測數(shù)據(jù)進行插值填補。與衛(wèi)星帆板物理模型仿真插補方法、傳統(tǒng)統(tǒng)計學插補方法如線性插值和樣條插值、常見的時間序列處理模型如LSTM、TCN等比較,獲得了較好的插值填補效果。遙測數(shù)據(jù)進行插值填補之后可以得到較為完整的數(shù)據(jù),方便對該時序數(shù)據(jù)進一步分析統(tǒng)計,進而對下一步的研究打下基礎。