高 寧,苗林光,苑春雨,高彩云
(1.河南城建學院 測繪與城市空間信息學院,河南 平頂山 467036;2.河南理工大學 測繪與國土信息工程學院,河南 焦作 454000)
中國是世界上自然災害最嚴重的國家之一,滑坡災害作為其中一種主要的地質(zhì)災害,因其分布廣、破壞性強,所引起的損失慘重,已引起社會的廣泛關(guān)注[1]。據(jù)中國地質(zhì)環(huán)境信息網(wǎng)發(fā)布的中國地質(zhì)災害通報顯示:2018-2020年3年間全國共發(fā)生地質(zhì)災害16 987起,其中滑坡發(fā)生的比例居地質(zhì)災害首位,占地質(zhì)災害總數(shù)的62.75%,因此,針對滑坡開展全面、科學的形變監(jiān)測、預測及危險性評價,不僅是國際學術(shù)研究的熱點問題,且對防災、減災具有重要的應(yīng)用價值與現(xiàn)實意義。
由于滑坡成因的復雜性和多樣性、數(shù)據(jù)的高度非線性等特點,使得滑坡災變數(shù)據(jù)分析顯得尤為困難[2]?;跀?shù)據(jù)驅(qū)動的機器學習方法SVM(Support Vector Machine,SVM)可根據(jù)有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折中,以期獲得最好的分析擬合效果,鑒于此,SVM已被廣泛應(yīng)用于各類滑坡災變數(shù)據(jù)分析。文獻[3-7]采用SVM算法構(gòu)建了滑坡變形位移預測及危險評價模型,取得較好效果,并基于不同視角,對SVM算法進行了優(yōu)化改進,例如核函數(shù)的構(gòu)造形式、懲罰系數(shù)、核函數(shù)參數(shù)及松弛系數(shù)等關(guān)鍵參數(shù)的選取等,各種改進方法在一定程度上提高了SVM的預測評價精度。但面對具體的滑坡災變數(shù)據(jù),究竟應(yīng)該采用何種類型的SVM并沒有一定標準,而是通過大量嘗試比較確定,而且SVM算法復雜,也沒有成熟的商品化軟件,特別是對SVM缺少了解的研究人員,很難用好這些模型,這給SVM算法在滑坡方面的大規(guī)模推廣應(yīng)用帶來困難。
基于此,以標準SVM算法為基礎(chǔ),同時融合交叉驗證CV(Cross-validation,CV)、遺傳算法GA(Genetic Algorithm,GA)、粒子群PSO(Particle Swarm Optimization,PSO)等,構(gòu)建了滑坡災變數(shù)據(jù)智能分析體系,借助 MATLAB APP Designer強大的交互設(shè)計功能,實現(xiàn)滑坡災變數(shù)據(jù)智能分析可視化系統(tǒng)的開發(fā),以期實現(xiàn)滑坡災害監(jiān)測信息的科學化、信息化、標準化等,為防災減災決策提供科學支撐。
滑坡災變數(shù)據(jù)智能可視化分析系統(tǒng)是集合多學科、多專業(yè)知識的一項復雜工程,主要涉及地質(zhì)學、測繪數(shù)據(jù)處理、數(shù)學建模、智能算法、系統(tǒng)開發(fā)等。該系統(tǒng)總體功能結(jié)構(gòu)分為數(shù)據(jù)源的導入、數(shù)據(jù)預處理及參數(shù)設(shè)置、滑坡位移預測、滑坡危險性評價、圖形的可視化、成果輸出與管理等功能。
1.2.1 支持向量機理論
支持向量機是一種以統(tǒng)計學習理論為基礎(chǔ)的機器學習算法,它通過結(jié)構(gòu)風險最小化原則,根據(jù)有限樣本信息在模型的復雜性和學習能力之間尋求得到最優(yōu)解,多用于非線性、多維度的數(shù)據(jù)處理[8-9]。
設(shè)滑坡數(shù)據(jù)的訓練樣本為:
D={(x1,y1),(x2,y2),…,(xi,yi)}i=1,2,…,i
(1)
將式(1)中的數(shù)據(jù)映射到高維特征空間,可以優(yōu)化函數(shù)的解:
(2)
(3)
高斯核函數(shù)作為支持向量機模型中的核函數(shù),引入γ為徑向基函數(shù)(RBF),其數(shù)學表達式為:
K(Xi,Xj)=(φ(Xi)*φ(Xj))=exp(-γ||xi-xj||2)
(4)
將式(2)、式(3)優(yōu)化方向轉(zhuǎn)換為:
(5)
(6)
式(5)的最優(yōu)化函數(shù)為:
(7)
式(7)中:αi為Lagrange乘子。
支持向量機要想構(gòu)建最佳預測模型,需要尋找最佳的懲罰因子c和核函數(shù)參數(shù)g[4,10],為此本系統(tǒng)的核心算法關(guān)鍵技術(shù)設(shè)計在于參數(shù)優(yōu)化。
1.2.2 交叉驗證法CV優(yōu)化參數(shù)c&g
交叉驗證是一種統(tǒng)計分析方法,基本思想是在某種意義下將數(shù)據(jù)進行分組,一部分作為訓練集,另一部分作為驗證集,先對訓練集進行訓練,然后用驗證集測試訓練集得到的模型,以訓練樣本均方誤差作為性能指標,流程圖見圖1所示。
圖1 交叉驗證算法流程圖
1.2.3 遺傳算法GA優(yōu)化參數(shù)c&g
遺傳算法是一種搜索最優(yōu)解方法,它模擬生物進化機制,即從任意一個種群出發(fā),通過隨機選擇、交叉、變異操作,產(chǎn)生更適應(yīng)環(huán)境的新個體,通過群體不斷進化,最后收斂于最適應(yīng)環(huán)境的個體,從而求得問題的最優(yōu)解[2],算法流程圖見圖2,在遺傳算法應(yīng)用在SVM模型中尋優(yōu)時,將訓練集的均方誤差作為GA優(yōu)化過程中的適應(yīng)度函數(shù)值。
圖2 GA-SVM模型計算流程圖
圖3 PSO-SVM模型計算流程圖
1.2.4 粒子群PSO優(yōu)化參數(shù)c&g
粒子群優(yōu)化算法是一種有效的全局尋優(yōu)算法,通過群體中粒子間的合作與競爭產(chǎn)生群體智能,在解空間追隨最優(yōu)的粒子進行搜索,找到全局最優(yōu)解[5,10-11]。算法流程圖見圖3。
粒子群的核心算法見式(8):
(8)
式中:ω為慣性權(quán)重,c1,c2為學習因子,r1,r2為[0,1]隨機數(shù),vid為粒子的速度,xid為粒子所在的位置。
點擊菜單欄數(shù)據(jù)讀入的下拉菜單,可讀取滑坡位移數(shù)據(jù)和滑坡危險性因素,見圖4。
圖4 數(shù)據(jù)讀取界面
點擊菜單欄數(shù)據(jù)預處理及參數(shù)設(shè)置的下拉菜單可以完成標準化區(qū)間設(shè)置、 SVM核函數(shù)設(shè)置、動態(tài)預測維數(shù)設(shè)置 、數(shù)據(jù)的濾波處理 、 CV優(yōu)化參數(shù)設(shè)置、 GA優(yōu)化參數(shù)設(shè)置 、PSO優(yōu)化參數(shù)設(shè)置,如圖5所示。
系統(tǒng)設(shè)計時,針對不同的滑坡位移曲線,設(shè)計了5種預測模型,分別為:標準SVM算法、濾波-SVM、CV-SVM、GA-SVM、PSO-SVM,如圖6所示。
圖5 數(shù)據(jù)預處理及參數(shù)設(shè)置界面
圖6 滑坡位移預測界面
針對滑坡危險性評價時,考慮不同滑坡體所受內(nèi)在因素與外界影響因素的不同,設(shè)計了4種評價模型,分別為:標準SVM算法、CV-SVM、GA-SVM、PSO-SVM,見圖7。
圖7 滑坡危險性評價界面
在滑坡預測過程中,通過可視化系統(tǒng),可以完成滑坡原始數(shù)據(jù)可視化表達、智能優(yōu)化算法尋優(yōu)過程可視化表達、各類算法預測結(jié)果的可視化表達等,以交叉驗證算法為例,參數(shù)優(yōu)選圖如圖8所示。
圖8 交叉驗證SVM優(yōu)選參數(shù)圖
數(shù)據(jù)1:滑坡位移數(shù)據(jù)—古樹屋滑坡。古樹屋滑坡位于湖北省境內(nèi),滬-蓉-西高速宜昌至恩施段,地質(zhì)環(huán)境屬于典型的喀斯特地貌,其斷面跨越兩道峽谷,穿越8座高山,線路走向復雜,在巴東古樹屋段施工過程中發(fā)現(xiàn)邊坡有較大變形,對主滑方向3#監(jiān)測點進行監(jiān)測,位移監(jiān)測數(shù)據(jù)共33期[12]。
數(shù)據(jù)2:滑坡危險性評價數(shù)據(jù)—重慶萬州區(qū)滑坡體。重慶萬州區(qū)地勢東高西低,主要地貌形態(tài)是海拔500~1 000 m低山區(qū),屬于亞熱帶季風濕潤帶,雨量充沛,境內(nèi)河流眾多,呈枝狀分布,溪澗切割深,落差大,均屬長江水系,地質(zhì)年代以侏羅紀分布最廣,三疊紀次之,由于特殊的自然條件和地質(zhì)環(huán)境,一直以來,該區(qū)域為受到滑坡和危巖崩塌地質(zhì)災害影響最為嚴重的地方之一,選取代表性滑坡體16個[13-14]。
利用所開發(fā)的智能預測系統(tǒng),加載數(shù)據(jù)集1數(shù)據(jù),1~25期作為建模樣本,26~33期作為預測,分別采用CV-SVM、GA-SVM、PSO-SVM 3種模型,預測精度評價指標如表1所示。
表1 古樹屋滑坡位移預測效果比較
由表1可知:CV-SVM、GA-SVM、PSO-SVM三種模型的預測值與實測值間的相關(guān)系數(shù)均可達到0.99以上,說明預測結(jié)果具有較高的可信性,其中GA-SVM的預測效果最優(yōu),PSO-SVM次之,CV-SVM相對較差。
利用所開發(fā)的智能預測系統(tǒng),加載數(shù)據(jù)集2數(shù)據(jù),1~10滑坡體作為建模樣本,11~16滑坡體作為待評價樣本,分別采用CV-SVM、GA-SVM、PSO-SVM 3種模型進行滑坡危險等級評價,評價結(jié)果如表2所示。
表2 萬州區(qū)滑坡危險等級評價結(jié)果比較
從幾種方法的判別結(jié)果并結(jié)合萬州區(qū)滑坡現(xiàn)場調(diào)查情況來看,系統(tǒng)所構(gòu)建的幾種分級模型均具有較高的準確性。
(1)針對SVM經(jīng)典算法的特點及其在滑坡災變數(shù)據(jù)分析中存在的不足,采用CV、GA、PSO等算法進行優(yōu)化改進,用戶可以根據(jù)不同的滑坡數(shù)據(jù)特點靈活選擇系統(tǒng)中的模型進行預測,擴展了 SVM算法的應(yīng)用范圍,提高了預測精度;
(2)基于MATLAB APP Designer進行系統(tǒng)設(shè)計開發(fā),簡化了布置用戶界面可視組件的過程,能夠開發(fā)穩(wěn)定良好的圖形窗口,可構(gòu)建較好的交互環(huán)境,并充分發(fā)揮MATLAB的數(shù)值計算及圖形可視化等功能;
(3)采用大量滑坡災變數(shù)據(jù)對智能可視化分析系統(tǒng)進行測試,結(jié)果表明該系統(tǒng)可靈活導入導出數(shù)據(jù),并進行可視化圖形展示,所建立的模型預測值與實際值吻合,預測結(jié)果穩(wěn)定;系統(tǒng)操作簡單,可視化程度高,能夠?qū)聻暮M行預測預報。