惠甜甜,劉長星,王圣杰,郭一帆
(1. 西安科技大學測繪科學與技術(shù)學院,陜西 西安 710054)
近幾年來,隨著深度學習的不斷發(fā)展,深度學習模型逐漸替代了傳統(tǒng)的預測模型,已經(jīng)被運用到時間序列數(shù)據(jù)應(yīng)用研究中。其中,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)就是把時間序列數(shù)據(jù)作為網(wǎng)絡(luò)的輸入,并將時間序列數(shù)據(jù)在演進的方向上進行遞歸,并且所有的神經(jīng)元節(jié)點以鏈式結(jié)構(gòu)連接一種遞歸神經(jīng)網(wǎng)絡(luò),而長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)是建立在RNN基礎(chǔ)上的,通過設(shè)置“門控狀態(tài)”改變RNN 的網(wǎng)絡(luò)結(jié)構(gòu),使時間序列數(shù)據(jù)分析處理上表現(xiàn)出超強的適應(yīng)能力,進行高精度預測[1-8]。
基于此,本文根據(jù)SBAS-InSAR 技術(shù)所獲取的地表時序形變信息,結(jié)合LSTM 網(wǎng)絡(luò)和網(wǎng)格搜索算法(GS)對地表形變做出準確的預測,提前對礦區(qū)開采沉陷做出安全預警,避免造成不必要的損失。
SBAS 方法是由Berardino[9]等在2002 年提出的InSAR時間序列分析方法,該方法采用所有的SAR數(shù)據(jù),根據(jù)時、空基線閾值進行主副影像配對,獲取到若干個小基線數(shù)據(jù)集,使得各個子集的干涉對基線距盡量適中。然后利用最小二乘法計算每個集合的地表沉降變形時間序列,再利用奇異值分解方法將多個干涉對集合聯(lián)立求解,最后得到各個時間段的平均沉降速率和累積形變量[10-11]。
假設(shè)獲取到N+1 景按時間序列(t0,…,tN)時間段的覆蓋研究區(qū)域的SAR影像,從中選取一景作為超級主影像,并將超級主影像與其他N景輔影像配準、重采樣后,設(shè)定合理的時空基線閾值進行基線組合,干涉后可以獲取到M幅干涉對,其中M滿足條件為:
對與任意時刻ta、tb主輔影像形成的第j幅差分干涉圖,經(jīng)過去平、去地形、濾波、相位解纏處理后,任意點的干涉相位為:
式中,φ為干涉相位;λ為波長;dta、dtb分別以t0時刻起算在ta、tb時刻時的雷達視線方向的累積形變量。
將任意點的干涉相位轉(zhuǎn)化為各個干涉對的平均相位速度,公式為:
因此,第j景干涉圖形變相位公式可變?yōu)椋?/p>
將解纏后的所有差分干涉圖的相位組合可以寫成矩陣形式為:
式中,B為M×N的矩陣,由于矩陣B為秩虧,采用奇異值分解方法求取最終的形變速率。
LSTM網(wǎng)絡(luò)是建立在RNN的基礎(chǔ)上通過改進網(wǎng)絡(luò)結(jié)構(gòu)而來的,通過網(wǎng)絡(luò)內(nèi)部引入自循環(huán)方式,以便在長時間網(wǎng)絡(luò)運算過程中,產(chǎn)生梯度持久性流動的途徑,以此來解決RNN梯度消失的問題。它在RNN網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上添加了輸入門、遺忘門以及輸出門和細胞狀態(tài)[12-13]。其網(wǎng)絡(luò)單元結(jié)構(gòu)如圖1所示,其中Ct-1,ht-1分別為上一步輸出的細胞狀態(tài),上一步隱藏狀態(tài)的輸出值;Xt為當前LSTM網(wǎng)絡(luò)單元的輸入;Ct為網(wǎng)絡(luò)更新后的細胞狀態(tài);ht為當前網(wǎng)絡(luò)在隱藏狀態(tài)下的輸出值。LSTM 網(wǎng)絡(luò)結(jié)構(gòu)單元的核心是細胞狀態(tài),該細胞狀態(tài)利用時間序列進行相關(guān)信息的傳輸,實現(xiàn)其狀態(tài)的更新。更新是由遺忘門、輸入門和輸出門決定。
圖1 LSTM單元
遺忘門ft的主要作用是控制網(wǎng)絡(luò)循環(huán)過程中決定應(yīng)該丟棄還是保留信息,該遺忘門會讀取到Xt和ht-1,并且會輸出一個(0,1) 區(qū)間的一個數(shù)值(“1”表示有用信息保留,“0”表示無用信息丟棄),然后將輸出的值乘到每一個在網(wǎng)絡(luò)循環(huán)狀態(tài)Ct-1上,最后把乘積值作為下一個網(wǎng)絡(luò)循環(huán)狀態(tài)Ct上,以此繼續(xù)向下做循環(huán)??梢员硎緸椋?/p>
式中,ft為上一網(wǎng)絡(luò)隱藏狀態(tài)下的信息和當前網(wǎng)絡(luò)輸入信息傳遞給sigmoid 函數(shù);Wf,bf分別為權(quán)重項,偏置項。
輸入門it主要的作用是決定如何更新細胞狀態(tài),即將新獲取的信息選擇后記錄到細胞狀態(tài)中。該門主要包含兩個部分,第一部分是sigmoid層,稱為“輸入門層”,它決定著網(wǎng)絡(luò)信息的更新;第二部分是一個tanh 層,它創(chuàng)建了一個新的候選值向量,即用來更新內(nèi)容可以表示為:
式中,ht-1和Xt傳遞給sigmoid 函數(shù);同時將其傳入給tanh 激活函數(shù);最后得到細胞狀態(tài)候選值它們兩者共同決定著新的細胞狀態(tài)Ct。
輸出門ot主要的作用是決定網(wǎng)絡(luò)當前隱藏狀態(tài)下的輸出,它與輸入門相類似。首先是由一個sigmoid層來決定細胞狀態(tài)的哪些部分將要輸出,緊接著把細胞狀態(tài)所輸出的值通過tanh 層進行處理(得到一個在-1~1之間的值),并將它和sigmoid層輸出的值進行相乘,最終僅僅會輸出一個確定要輸出的那部分??梢员硎緸椋?/p>
經(jīng)過遺忘門、輸入門和輸出門的計算,最后輸出的結(jié)果為:
式中,V、c分別為線性關(guān)系的系數(shù)。
本文以鄂爾多斯東部某煤礦為研究對象,礦區(qū)內(nèi)地形總體趨勢是北高南低,東高西低,大部分為低矮山丘。該礦井可采煤層有6 層,其中3~1 煤層為首采煤層,該煤層全區(qū)可采,是井田的主要可采煤層之一,煤層厚度為4.52~6.89 m,平均6.20 m。
實驗選取時間跨度為2018年9月至2019年2月的14 景覆蓋本礦井的Sentinel-1 數(shù)據(jù),并采用美國地質(zhì)調(diào)查局網(wǎng)站公布的地面分辨率為30×30 m 的SRTM DEM數(shù)據(jù),以減少地形相位的影響。
實驗使用SARScape 軟件通過SBAS-InSAR 技術(shù)對14 景Sentinel-1 數(shù)據(jù)進行處理,處理流程包括:①生成連接圖;②干涉工作流;③軌道精煉和重去平;④SBAS-InSAR 反演第一步;⑤SBAS-InSAR 反演第二步;⑥地理編碼。在數(shù)據(jù)處理過程中,主要參數(shù)設(shè)置為:最大臨界基線為45%,最大時間基線為180 d,解纏相關(guān)系數(shù)閾值為0.2,相關(guān)系數(shù)閾值也為0.2,其他參數(shù)均采用該軟件自帶默認參數(shù)。經(jīng)過一系列處理流程后所得到的時序累積沉降量結(jié)果如圖2所示。
圖2 時序累積沉降量
在SARScape 軟件處理中會把第一幅影像監(jiān)測圖的累計形變量默認為0,所以第一幅影像圖為空白。為了驗證SBAS-InSAR 技術(shù)反演的可靠性,選取了布設(shè)在3104工作面上方的地表移動觀測站的實測水準數(shù)據(jù)進行對比。提取水準點所對應(yīng)的SBAS-InSAR 技術(shù)的反演值,剔除反演結(jié)果為無效值點及大尺度形變點,選取形變量較小的點進行驗證,最終獲取到9 個實測水準點,按順序命名為Z1~Z9,如圖3所示。
圖3 工作面及水準點布設(shè)圖
由于實測水準數(shù)據(jù)觀測時間段為2018-09-18~2019-02-17, 而 影 像 獲 取 時 間 為2018-09-15~2019-02-18,兩者起始時間不一致。為了減小起始時間不一致所帶來的誤差,以地表時序累積沉降量為依據(jù),將實測水準數(shù)據(jù)內(nèi)插至獲取SAR數(shù)據(jù)的研究時間段,即2018-09-15~2019-02-18。實測水準數(shù)據(jù)與SBAS-InSAR 技術(shù)反演值對比結(jié)果如圖4 所示。從圖上可以看出,SBAS-InSAR 反演值與實測水準數(shù)據(jù)下沉趨勢基本保持一致,最大誤差不超過20 mm,由此說明SBAS-InSAR技術(shù)反演地表沉降較為可靠。
圖4 實測值與SBAS-InSAR反演值比較
LSTM 網(wǎng)絡(luò)超參數(shù)的選取會直接影響到該網(wǎng)絡(luò)模型的預測效果,為了使預測精度更高,本文將采用網(wǎng)格搜索算法對網(wǎng)絡(luò)超參數(shù)進行全局尋優(yōu)。網(wǎng)格搜索算法是窮舉法的一種,它是將估計函數(shù)的參數(shù)通過交叉驗證的方法進行優(yōu)化來得到最優(yōu)的學習算法[14-16]。該算法要通過預先設(shè)定各個網(wǎng)絡(luò)參數(shù)的取值,在不同網(wǎng)絡(luò)參數(shù)的組合下訓練模型,在網(wǎng)絡(luò)模型達到最優(yōu)狀態(tài)時所選取的網(wǎng)絡(luò)超參數(shù)就是一組最優(yōu)參數(shù)。本文通過網(wǎng)格搜索算法優(yōu)選LSTM 網(wǎng)絡(luò)的超參數(shù)有:一次輸入網(wǎng)絡(luò)的樣本數(shù)(n_input)、迭代次數(shù)(n_epochs)、學習速率(learn_rate)、隱層中神經(jīng)元個數(shù)(neurons),LSTM網(wǎng)絡(luò)超參數(shù)選取值如表1所示。
表1 網(wǎng)絡(luò)超參數(shù)
煤礦開采沉陷預計在煤礦可持續(xù)生產(chǎn)中起著至關(guān)重要的作用,提前對煤礦做出安全預警,減少或防止災(zāi)難的發(fā)生,確保煤礦安全,綠色生產(chǎn)。其預測模型構(gòu)建流程如圖5所示。
圖5 LSTM-GS模型預測流程圖
在2.2 節(jié)中,通過SBAS-InSAR 技術(shù)反演,在3104工作面上方所獲取的走向時序累積沉降值作為數(shù)據(jù)集,共14組,如表2所示。本文將前11組數(shù)據(jù)作為訓練集,后3組數(shù)據(jù)作為測試集。
表2 時序累積沉降量數(shù)據(jù)集
為了驗證礦區(qū)開采沉陷預計模型的可靠性和預測結(jié)果的準確性,采用以下指標對模型精度評定。
1)均方根誤差(RMSE)。
式中,yi,y′i分別代表訓練樣本的真實值和預測值。
2)平均絕對誤差(MAE)。
3)決定系數(shù)(R2)。
式中,決定系數(shù)(R2)越接近于1,則說明預測模型的擬合度越好;越接近0,則說明預測模型的擬合度越差;通常認定決定系數(shù)(R2)大于0.4時,預測模型精度能夠滿足工程需求。
為了使該模型預測精度更高,本文選取的損失函數(shù)為均方根誤差,當均方根誤差收斂到最小值并趨于穩(wěn)定時,認為網(wǎng)絡(luò)模型達到最優(yōu)狀態(tài)。該網(wǎng)絡(luò)模型達到最優(yōu)狀態(tài)時,網(wǎng)絡(luò)超參數(shù)的選取值為:n_input 為3;n_epochs為1 000,learn_rate為0.01;neurons為10。
檢測結(jié)果證明SBAS-InSAR技術(shù)反演值與LSTM-GS模型預測結(jié)果基本保持一致,最大均方根誤差為3.569 3 mm;最大平均絕對誤差為3.252 4 mm;最小決定系數(shù)為0.57。說明LSTM-GS模型擬合度較好,預測精度更高,能夠滿足工程需求,可以應(yīng)用到實際生產(chǎn)中。
本文通過SBAS-InSAR 技術(shù)對鄂爾多斯東部某煤礦開采沉陷實時監(jiān)測,通過對SBAS-InSAR 技術(shù)反演值和實測水準數(shù)據(jù)進行比較,證明了SBAS-InSAR 技術(shù)具有較高的精度,可以為礦區(qū)開采沉陷預測提供可靠的數(shù)據(jù)。根據(jù)SBAS-InSAR 技術(shù)獲取的時序累積沉降值,提出了以LSTM-GS 模型對礦區(qū)開采沉陷進行預測,結(jié)果表明:該預測模型精度較高,最大均方根誤差為3.569 3 mm,最大平均絕對誤差為3.252 4 mm,最小決定系數(shù)為0.57。由此可以說明,基于SBASInSAR技術(shù)和LSTM-GS模型可以應(yīng)用到煤礦開采沉陷監(jiān)測和預測當中,對煤礦安全、綠色、和諧生產(chǎn)具有重要的意義。