唐 寧
(廣東省地質(zhì)災(zāi)害應(yīng)急搶險技術(shù)中心,廣東廣州 510080)
地質(zhì)災(zāi)害是地球自然過程中產(chǎn)生的重大不利事件,如崩塌、滑坡、泥石流、地面塌陷、地面沉降等,造成重大生命損失和財產(chǎn)破壞。中國山地面積占國土總面積的65%左右,地質(zhì)條件復(fù)雜活躍,是世界上山地災(zāi)害最嚴(yán)重的國家之一。最受威脅的弱勢群體遭受著最嚴(yán)重的地質(zhì)災(zāi)害。2018 年,全國發(fā)生地質(zhì)災(zāi)害約3000起,直接經(jīng)濟(jì)損失達(dá)14.7 億元。地質(zhì)災(zāi)害區(qū)大多集中在在中國西部[1]。
易受地震斷裂帶、活火山、斜坡等影響的地區(qū),在強(qiáng)降雨的情況下,可確定為滑坡風(fēng)險地區(qū)。目前,國家有關(guān)部門建立了疑似山體滑坡數(shù)據(jù)庫,已確定的高風(fēng)險地質(zhì)災(zāi)害區(qū)域超過30 萬處,未來[2]發(fā)生的可能性很大。根據(jù)Brabb[3]的研究,如果能在滑坡事件發(fā)生前識別出問題,至少90%的滑坡?lián)p失可以避免。國務(wù)院辦公廳強(qiáng)調(diào),需要充分利用遙感數(shù)據(jù)支持地質(zhì)災(zāi)害,包括災(zāi)害預(yù)防的各個階段和方面[1]。顯然,滑坡早期數(shù)據(jù)庫對于重大危機(jī)下的滑坡定位、災(zāi)害預(yù)防和對特定區(qū)域的高度關(guān)注具有重要意義。然而,由于《自然[4]》中高度隱蔽、突然性和破壞性的特征,一些潛在的滑坡尚未被確定。換句話說,與未知的滑坡趨勢相比,識別出的潛在滑坡數(shù)據(jù)庫只占非常有限的一部分。一般來說,我們對已知數(shù)據(jù)庫進(jìn)行的研究既不徹底也不完整。地質(zhì)災(zāi)害防治仍然是一項艱巨的任務(wù)。
一般來說,主流的地質(zhì)災(zāi)害檢測方法可分為兩類,一類是基于專家知識的傳統(tǒng)方法,另一類是基于遙感技術(shù)的方法。
大部分的研究都是建立在通過空間或統(tǒng)計數(shù)據(jù)分析,找出滑坡的制約因素和滑坡的發(fā)生。Pardeshi概述了傳統(tǒng)方法,如基于庫存的制圖、啟發(fā)式方法、概率評估、確定性方法、統(tǒng)計分析和多準(zhǔn)則決策方法,包括降雨閾值模型和其他基于物理的滑坡易感性模型[5-6]。與滑坡發(fā)生相關(guān)的滑坡制約因素的選擇方法很多。然而,這些方法嚴(yán)重依賴專家知識,這往往是主觀的,耗時和費力的。而提取的特征往往局限于淺層信息,無法表達(dá)人們經(jīng)常理解的語義信息。
遙感技術(shù)也被用于地質(zhì)災(zāi)害的測繪、監(jiān)測和探測[7-10]。衛(wèi)星干涉合成孔徑雷達(dá)(InSAR)可以提供從處理大量雷達(dá)衛(wèi)星圖像中獲得的地面位移估計。應(yīng)用小基線亞群InSAR 技術(shù)計算了金坪子滑坡[7]的時間序列變形。他應(yīng)用InSAR技術(shù)和地面專業(yè)監(jiān)測方法識別地質(zhì)災(zāi)害[8]。遙感光學(xué)圖像也可以看作是一種有用的工具。在文獻(xiàn)[9]中提出了一種基于多數(shù)投票和多尺度分割相結(jié)合的滑坡清單制圖框架。InSAR 和光學(xué)EO 數(shù)據(jù)被用于在應(yīng)急管理的所有階段(緩解、準(zhǔn)備、危機(jī)和恢復(fù)[10])的滑坡繪圖和監(jiān)測。
近年來,隨著大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)方法應(yīng)運而生并成功應(yīng)用于滑坡易感性評價領(lǐng)域,而將其應(yīng)用于地質(zhì)災(zāi)害檢測與預(yù)測的研究較少。
與之前的工作不同的是,考慮到目前防災(zāi)的現(xiàn)狀,我們在本研究中試圖回答以下兩個關(guān)鍵問題:一是我們?nèi)绾卫萌斯ぶ悄軄硖剿骱脱芯恳汛_定的疑似滑坡數(shù)據(jù)庫?二是如何利用已知數(shù)據(jù)樣本的知識,廣泛有效地預(yù)測和探測潛在的滑坡隱蔽點?為了找出這些問題的答案,在本文中,我們的貢獻(xiàn)主要包括以下三點:
首先提出了一種基于InSAR和高分辨率光學(xué)遙感影像綜合遙感技術(shù)的山體滑坡人工智能探測新框架。將這兩種機(jī)制結(jié)合起來,通過實驗發(fā)現(xiàn)可以有效提高地質(zhì)災(zāi)害檢測的效率。該框架應(yīng)用現(xiàn)有數(shù)據(jù)庫知識,擴(kuò)展了簡化的滑坡預(yù)測方法,并在中國金沙江白格滑坡預(yù)測中得到了成功的應(yīng)用和驗證。
其次詳細(xì)討論了如何通過對具有一定數(shù)據(jù)特征的樣本子數(shù)據(jù)庫進(jìn)行分類,逐步構(gòu)建包含異構(gòu)數(shù)據(jù)融合的樣本數(shù)據(jù)庫。
最后提出了一種確定地質(zhì)災(zāi)害隱患類型、空間位置、活動規(guī)律,形成地質(zhì)災(zāi)害隱患分布圖的綜合識別模型。
利用InSAR 和高分辨率光學(xué)遙感圖像,提出了一種綜合遙感技術(shù)的人工智能山體滑坡探測新框架。高分辨率遙感主要用于地表條件,包括地形、覆蓋和地面類型等基本信息的獲取。然而,InSAR 通過測量表面位移來表征表面變形。兩者結(jié)合深度學(xué)習(xí)方法的應(yīng)用,分別從形態(tài)和變形的角度判斷是否是滑坡。所提出的方法有以下五個主要步驟,如圖1所示。
圖1 擬議架構(gòu)概述
隨著基于深度學(xué)習(xí)和大量樣本的智能地質(zhì)災(zāi)害識別方法的探索和研究,綜合利用遙感光學(xué)影像大數(shù)據(jù)、InSAR 產(chǎn)品等地理地質(zhì)相關(guān)服務(wù)數(shù)據(jù),可以對專家知識進(jìn)行總結(jié)和提取。同時,高性能計算使大規(guī)模預(yù)測成為可能,提高了識別效率。同時,基于人工智能的識別地質(zhì)災(zāi)害可以研究和探索通過廣域空間的變化范圍大的時間跨度下,結(jié)合地質(zhì)災(zāi)害樣本數(shù)據(jù)記錄的專家、地形數(shù)據(jù)和居民區(qū)、道路、橋梁、城鎮(zhèn)供水系統(tǒng)等。基本地理數(shù)據(jù),如土地利用、土地和空間規(guī)劃和其他數(shù)據(jù)、智能礦山地質(zhì)災(zāi)害的特點是相對一致,并進(jìn)一步自學(xué)來分析邊坡可能的運動方向,形式和影響地質(zhì)災(zāi)害的范圍可以提高早期滑坡識別的可靠性和準(zhǔn)確性。
具體來說,更多的研究基于以下領(lǐng)域的框架不需要進(jìn)一步開展:
首先是影響因素與地質(zhì)災(zāi)害的相關(guān)模型。專業(yè)知識的指導(dǎo)下,我們能夠設(shè)計一個密集的深度學(xué)習(xí)模型,專家知識作為先驗信息嵌入深度學(xué)習(xí)網(wǎng)絡(luò),或融合異構(gòu)信息設(shè)計不同類型的網(wǎng)絡(luò)中提取一個真理的特征,然后通過多層感知集成它們。該模型加速了算法的收斂速度,減少了訓(xùn)練樣本的數(shù)量,最終提高了算法的性能。異構(gòu)信息包括關(guān)于地形、地貌、地質(zhì)、氣候、水文、人類活動和其他因素的信息。
其次是地質(zhì)災(zāi)害風(fēng)險評估模型及關(guān)鍵因素的評估與監(jiān)測。在各種典型地質(zhì)條件下,不同因素對地質(zhì)災(zāi)害的影響不同。基于特征反演技術(shù),研究了地質(zhì)災(zāi)害影響程度評價模型,確定了各種典型地質(zhì)條件下關(guān)鍵因素的閾值。
傳統(tǒng)的地質(zhì)災(zāi)害識別方法高度依賴主觀專家知識,需要耗費大量的人力和時間來逐一識別危險區(qū)可能發(fā)生的地質(zhì)災(zāi)害。與傳統(tǒng)的框架相比,本文提出的基于人工智能的框架具有以下三個方面的優(yōu)勢:
一是專家知識的總結(jié)和突出。在專家知識的指導(dǎo)下,通過對歷史地質(zhì)災(zāi)害樣本的研究,可以獲得地質(zhì)災(zāi)區(qū)發(fā)現(xiàn)和風(fēng)險評估的模型。當(dāng)樣本很少或沒有樣本時,建立一個基于語義信息的模型來實現(xiàn)專家知識的外顯語法表示。
二是專家知識的推廣和應(yīng)用。該框架采用了專家知識的綜合集成和一般規(guī)則與特殊場景的綜合考慮,提高了模型的適用性;此外,模型的客觀性和大數(shù)據(jù)處理能力的優(yōu)越性提高了框架的應(yīng)用價值。
三是發(fā)現(xiàn)新知識,更新專家知識。機(jī)器學(xué)習(xí)/深度學(xué)習(xí)建立了影響因素與輸出結(jié)果的相關(guān)模型。通過與專家因果分析模型的比較,可以發(fā)現(xiàn)專家尚未掌握的新規(guī)則。經(jīng)過專家評估/實地調(diào)查,新知識將進(jìn)一步豐富具有原始認(rèn)知的專家知識庫,并以另一種方式反饋優(yōu)化的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型。
異構(gòu)樣本數(shù)據(jù)庫的構(gòu)建主要包括兩個方面。一是地質(zhì)災(zāi)害相關(guān)要素數(shù)據(jù)庫,二是地質(zhì)災(zāi)害相關(guān)要素數(shù)據(jù)庫算法數(shù)據(jù)庫的構(gòu)建。元素數(shù)據(jù)庫是算法數(shù)據(jù)庫的基礎(chǔ)和前提,算法數(shù)據(jù)庫是元素數(shù)據(jù)庫的價值體現(xiàn)。
這兩個數(shù)據(jù)庫需要逐步積累和完善,通過積累、有針對性的模型增強(qiáng)、專家知識的普適性、新知識的發(fā)現(xiàn)來增加基本要素的數(shù)量和類型。元素數(shù)據(jù)庫的內(nèi)容包括以下類型:
地形要素:山、坡、脊、河、湖等。地被要素:雪、植被(森林、牧場)、云等。人類活動要素:道路、橋梁、房屋等。
算法數(shù)據(jù)庫的設(shè)計是為了實現(xiàn)遙感大數(shù)據(jù)的各種任務(wù)的目標(biāo)。以地質(zhì)災(zāi)害識別為例,算法庫的建設(shè)主要包括:
基于InSAR地質(zhì)變形數(shù)據(jù)的地面沉降聚類區(qū)識別模型;
基于高分辨率遙感影像的地面要素識別模型,包括邊緣分割和目標(biāo)識別模型;
基于元素分割與識別,高分辨率圖像校正模型實現(xiàn)了由于視角、光照、季節(jié)、地表覆蓋等因素的不同而導(dǎo)致的圖像不一致;
地貌要素的時變識別模型;
基于多源數(shù)據(jù)融合的地質(zhì)災(zāi)害識別模型;
地質(zhì)災(zāi)害風(fēng)險評估模型和關(guān)鍵因素預(yù)警模型。
具體來說,示例數(shù)據(jù)庫的內(nèi)容包括以下四個方面類別:
一是生成地質(zhì)遙感元素庫。輸入素材庫分為兩類:一類是遙感影像公共服務(wù)數(shù)據(jù)集,如GF-1、GF-2、ZY-3等。這種類型的數(shù)據(jù)庫包含各種類型的地質(zhì)元素但需要算法如邊緣分割、對象識別、自動貼標(biāo)實現(xiàn)識別、地質(zhì)元素的標(biāo)簽,以及標(biāo)準(zhǔn)化預(yù)處理過程,如數(shù)字化和編碼的特征描述,最后,形成一個元件庫。第二類是單元素數(shù)據(jù)庫,但它可能不是遙感圖像。它需要通過尺度等各種圖像處理進(jìn)行數(shù)字化和編碼變換和透視變換,最后構(gòu)成一個元素庫(圖2)。
圖2 地質(zhì)遙感要素數(shù)據(jù)庫
二是基于InSAR 數(shù)據(jù)的地質(zhì)災(zāi)害識別樣本庫建設(shè)。地質(zhì)災(zāi)害的典型特征是明顯的地面沉降變形,這與邊坡、地層等地質(zhì)特征密切相關(guān),歷史樣本的地質(zhì)特征和變形特征為隱患提供了參考價值。因此,設(shè)計相應(yīng)的算法模型,最終得到各種典型地質(zhì)條件下基于In-SAR地表變形聚類的地質(zhì)災(zāi)害典型樣本(圖3)。
圖3 基于InSAR數(shù)據(jù)的地質(zhì)災(zāi)害識別樣本庫建設(shè)
三是基于遙感影像的地質(zhì)災(zāi)害識別樣本數(shù)據(jù)庫的構(gòu)建。基于時段遙測遙感圖像,圖像配準(zhǔn)后,通過邊緣分割、目標(biāo)識別相同的目標(biāo)和時間變化對表面覆蓋,結(jié)合梯度計算,和斜率識別的數(shù)字高程模型(DEM)數(shù)據(jù),積極的和消極的樣本構(gòu)造地質(zhì)災(zāi)害。負(fù)樣本包括道路、房屋等人工開挖山體造成的土方堆積變化以及山體體積的時間變化如四季。我們可以借助地質(zhì)數(shù)據(jù)和歷史樣本識別和標(biāo)記地質(zhì)災(zāi)害級別(圖4)。
圖4 基于遙感影像的地質(zhì)災(zāi)害識別樣本數(shù)據(jù)庫
四是多源異構(gòu)信息融合的地質(zhì)災(zāi)害識別樣本庫建設(shè)。在更多類型數(shù)據(jù)的基礎(chǔ)上,通過數(shù)據(jù)融合技術(shù),不僅構(gòu)建了地質(zhì)災(zāi)害類型、等級及其影響因素的典型樣本,而且構(gòu)建了各種典型地質(zhì)條件下地質(zhì)災(zāi)害觸發(fā)的關(guān)鍵影響因素和閾值。數(shù)值樣本為識別和關(guān)鍵要素的關(guān)鍵監(jiān)測提供了基礎(chǔ)(圖5)。
圖5 多源異構(gòu)信息融合的地質(zhì)災(zāi)害識別樣本數(shù)據(jù)庫
一是數(shù)據(jù)采集、標(biāo)簽、標(biāo)準(zhǔn)化、存儲管理。首先,采集經(jīng)遙感處理的地質(zhì)、地形、地面覆蓋物(道路、橋梁、房屋、積雪等)的各類圖像(遙感類型)需要對圖像進(jìn)行傳感,并通過視角、照度、變形等對其進(jìn)行歸一化處理。然后通過邊緣檢測、目標(biāo)識別、分類/聚類、自動標(biāo)注等,實現(xiàn)基本元素樣本的生成。最后,通過統(tǒng)一編碼、抽象生成等存儲和檢索處理,構(gòu)建樣本元素數(shù)據(jù)集的文件存儲。
二是專家知識的正規(guī)化。在樣本庫建立的初期,專家知識具有極其重要的指導(dǎo)價值,有必要將專家知識轉(zhuǎn)化為可以被機(jī)器學(xué)習(xí)利用的規(guī)則。具體來說,它包括如下的設(shè)計:
首先確定影響因素。當(dāng)樣本數(shù)據(jù)集較小時,很難定量地分析影響因素與結(jié)果之間的相關(guān)性。同時,機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型的收斂性難以保證。因此,有必要利用專家知識選擇影響因素,并進(jìn)行適當(dāng)?shù)念A(yù)處理和數(shù)字化,使模型具有快速迭代的適用性。
性能指標(biāo)設(shè)計和標(biāo)簽準(zhǔn)確性審查。機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的模型性能很大程度上取決于成本函數(shù)的設(shè)計,性能的衡量取決于需求的應(yīng)用程序。這樣,將專家知識對結(jié)果的判斷和分級轉(zhuǎn)化為成本函數(shù)的設(shè)計。隨著樣本的增加,成本函數(shù)、性能指標(biāo)等也會相應(yīng)調(diào)整。
專家知識的整合與修正。針對不同的數(shù)據(jù)集,設(shè)計相應(yīng)的模型和訓(xùn)練算法,構(gòu)建算法庫。例如,在InSAR 數(shù)據(jù)集上,利用二維濾波模型識別地表變形群;結(jié)合DEM 高程數(shù)據(jù)、地層/地質(zhì)數(shù)據(jù)、歷史樣本數(shù)據(jù),設(shè)計并訓(xùn)練貝葉斯分類器,實現(xiàn)地質(zhì)災(zāi)害風(fēng)險等級的評估。在遙感影像數(shù)據(jù)集上,通過邊緣分割、目標(biāo)識別、時間變化規(guī)律識別、地質(zhì)災(zāi)害識別等模型,建立了地質(zhì)災(zāi)害正、負(fù)樣本算法庫和樣本庫?;A(chǔ)上掌握更多類型的異構(gòu)數(shù)據(jù),如InSAR 圖像數(shù)據(jù)集,時段遙測遙感圖像數(shù)據(jù)集,地質(zhì)/地層數(shù)據(jù)集,和DEM 數(shù)據(jù)集,我們需要設(shè)計集成學(xué)習(xí)和多源異構(gòu)融合的深度學(xué)習(xí)模型實現(xiàn)一個樣本庫構(gòu)建,包括關(guān)鍵因素和算法模型。
本文提出了一種基于綜合遙感的地質(zhì)災(zāi)害探測人工智能框架。該方法通過高分辨率遙感圖像變化檢測,對滑坡形態(tài)、地表覆蓋變化進(jìn)行研究,研究災(zāi)害的形成、發(fā)展,揭示潛在的災(zāi)害情況。利用InSAR監(jiān)測獲取災(zāi)體地表變形,表征邊坡的運動變形狀態(tài),確定滑坡的大小、活動階段和發(fā)展趨勢;嵌入式深度學(xué)習(xí)算法從災(zāi)害情況、當(dāng)前變形情況和潛在災(zāi)害情況進(jìn)行全面判斷;自動、高效地實現(xiàn)了災(zāi)害發(fā)生前的早期識別??蚣苤械闹饕绦?,如樣本數(shù)據(jù)庫的建立,面向?qū)ο蟮谋砻娓采w變化檢測,智能綜合識別方法也在我們的研究中得到充分的研究。該框架將很快應(yīng)用于貴州省、西藏省、四川省的隱性災(zāi)害檢測項目。