国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)在滑坡預(yù)測(cè)預(yù)報(bào)中的應(yīng)用

2022-06-09 07:24秦文濤郭小坤郭軍峰洪碧武
巖土工程技術(shù) 2022年3期
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù)滑坡數(shù)據(jù)挖掘

秦文濤 郭小坤 郭軍峰 郝 璐 洪碧武

(西南交通建設(shè)集團(tuán)股份有限公司,云南昆明 650000)

0 引言

數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)從20世紀(jì)90年代開始在商業(yè)領(lǐng)域得到廣泛應(yīng)用,在金融業(yè)、電子技術(shù)、圖像處理等海量數(shù)據(jù)密集行業(yè)的應(yīng)用尤為廣泛和成熟。如王冬梅[1]結(jié)合醫(yī)院現(xiàn)有的HIS 系統(tǒng)和數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)輔助醫(yī)療診斷;王 云等[2]提出用多維關(guān)聯(lián)規(guī)則技術(shù)分析交通事故記錄,用于識(shí)別和發(fā)現(xiàn)事故發(fā)生規(guī)律和起因;陳 起[3]將數(shù)據(jù)挖掘應(yīng)用于電信客戶細(xì)分中,實(shí)現(xiàn)了數(shù)據(jù)分群操作;數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)方式與傳統(tǒng)數(shù)據(jù)庫(kù)的組織和應(yīng)用方面具有很大不同,其應(yīng)用領(lǐng)域仍然有待繼續(xù)挖掘。

在滑坡地質(zhì)災(zāi)害預(yù)測(cè)預(yù)報(bào)領(lǐng)域,由于滑坡相關(guān)的工程地質(zhì)數(shù)據(jù)在空間和時(shí)間上具有不確定性,數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用非常少見,對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的認(rèn)識(shí)也亟待建立和應(yīng)用[4-6]。目前關(guān)于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)與地學(xué)的結(jié)合,最著名的是加拿海洋深度數(shù)據(jù)倉(cāng)庫(kù)和美國(guó)國(guó)家水質(zhì)評(píng)價(jià)數(shù)據(jù)倉(cāng)庫(kù),前者利用Oracle 關(guān)系數(shù)據(jù)庫(kù)開發(fā)出水平和垂直方向的數(shù)值地形模型;后者的聯(lián)機(jī)數(shù)據(jù)庫(kù)保存約700 萬(wàn)條記錄,用于監(jiān)測(cè)全美46個(gè)州大部分河流水質(zhì)數(shù)據(jù)。

本文根據(jù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù),在對(duì)滑坡敏感性因子成因分析的基礎(chǔ)上,建立了滑坡敏感性多維數(shù)據(jù)模型,將滑坡區(qū)的致滑因子空間數(shù)據(jù)按不同地區(qū)、不同類型儲(chǔ)存于滑坡災(zāi)害數(shù)據(jù)倉(cāng)庫(kù)中,實(shí)現(xiàn)了滑坡預(yù)測(cè)預(yù)報(bào)的數(shù)據(jù)快速響應(yīng),為地區(qū)滑坡地質(zhì)災(zāi)害防治提供了針對(duì)性建議。

1 滑坡數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)

滑坡災(zāi)害防治需要對(duì)各類地質(zhì)資料數(shù)據(jù)進(jìn)行整合與分析,這些數(shù)據(jù)包括空間上的數(shù)據(jù)如滑坡地點(diǎn)、巖性條件、水文地質(zhì)條件和地形地貌等,以及時(shí)間尺度上的滑坡變形位移、歷史滑坡等。數(shù)據(jù)從類型上可以劃分為空間數(shù)據(jù)、時(shí)間數(shù)據(jù)和管理數(shù)據(jù)三類,數(shù)據(jù)存放于不同的操作數(shù)據(jù)庫(kù)中,其目的是便于在預(yù)測(cè)預(yù)報(bào)時(shí)從中準(zhǔn)確挖掘出有用數(shù)據(jù),具有面向主體、高集成度、歷時(shí)快和能夠快速檢索等特點(diǎn)。

1.1 設(shè)計(jì)原則

滑坡災(zāi)害數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中盡量采用已有的Oracle 關(guān)系數(shù)據(jù)庫(kù),防止研究新型數(shù)據(jù)庫(kù)技術(shù)所導(dǎo)致的不成熟和不穩(wěn)定,保證系統(tǒng)擴(kuò)展性好、易于維護(hù)和方便快捷。在數(shù)據(jù)倉(cāng)庫(kù)的邏輯結(jié)構(gòu)上,分為數(shù)據(jù)獲取、管理和使用三步。

1.2 多維模型

數(shù)據(jù)倉(cāng)庫(kù)基于多維模型,該模型可以更好地理解數(shù)據(jù)分析的目的,且適用于復(fù)雜分析查詢,多維模型由維和事實(shí)描述[7]。事實(shí)包括若干個(gè)相關(guān)的維,維用于描述屬性來(lái)提供上下文。所有的維被組成不同的聚集層次,這樣使得事實(shí)的度量能夠基于不同細(xì)節(jié)進(jìn)行分析。在建立滑坡災(zāi)害模型中它能夠幫助使用者理清數(shù)據(jù)來(lái)源,因此形成開一個(gè)對(duì)數(shù)據(jù)的具體求解方法。

1.3 數(shù)據(jù)倉(cāng)庫(kù)體系

數(shù)據(jù)倉(cāng)庫(kù)體系主要分為三層:數(shù)據(jù)獲取層、數(shù)據(jù)存儲(chǔ)層和數(shù)據(jù)訪問(wèn)層[8]。三個(gè)層次分別對(duì)應(yīng)著后端層、數(shù)據(jù)倉(cāng)庫(kù)層以及用戶層。其中,后端層用于傳回?cái)?shù)據(jù),在原始數(shù)據(jù)上傳至數(shù)據(jù)倉(cāng)庫(kù)之前,其主要作用是對(duì)數(shù)據(jù)進(jìn)行集成和轉(zhuǎn)換;數(shù)據(jù)倉(cāng)庫(kù)層的主要作用是保存數(shù)據(jù);用戶層主要用于處理和分析數(shù)據(jù),包括報(bào)告、統(tǒng)計(jì)以及數(shù)據(jù)挖掘等直接面向用戶的操作。體系結(jié)構(gòu)圖見圖1。

圖1 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)

1.4 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)

數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)參照傳統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)進(jìn)行,滑坡地質(zhì)災(zāi)害數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)過(guò)程中采用“數(shù)據(jù)驅(qū)動(dòng)”的設(shè)計(jì)思路,包含如下兩個(gè)方面:

(1)盡量利用已有數(shù)據(jù),在已有的基礎(chǔ)數(shù)據(jù)庫(kù)上進(jìn)行建設(shè),這是數(shù)據(jù)驅(qū)動(dòng)的出發(fā)點(diǎn)。

(2)面向主體而非面向應(yīng)用,從數(shù)據(jù)系統(tǒng)出發(fā),按照地質(zhì)災(zāi)害領(lǐng)域的要求設(shè)計(jì)數(shù)據(jù)之間的聯(lián)系,來(lái)組織數(shù)據(jù)倉(cāng)庫(kù)中的主題。

本文所研究的基于地質(zhì)環(huán)境數(shù)據(jù)倉(cāng)庫(kù)ETL 的滑坡數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)內(nèi)容包括數(shù)據(jù)選擇、轉(zhuǎn)換、清晰和加載,具體架構(gòu)實(shí)現(xiàn)過(guò)程見圖2。

圖2 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)流程

2 概念模型

滑坡預(yù)測(cè)預(yù)報(bào)的概念模型包括兩方面:第一是模型的事實(shí)、維和劃分標(biāo)準(zhǔn);第二是多維模型的架構(gòu)設(shè)計(jì)?;聰?shù)據(jù)倉(cāng)庫(kù)建立過(guò)程中,逐步對(duì)每個(gè)主題進(jìn)行求解和分析。本文設(shè)計(jì)了兩個(gè)主題:滑坡預(yù)測(cè)預(yù)報(bào)主題與滑坡數(shù)據(jù)監(jiān)測(cè)主題,每個(gè)主題的維、度量方法和劃分層次不盡相同。

2.1 滑坡預(yù)測(cè)預(yù)報(bào)

滑坡地質(zhì)災(zāi)害預(yù)測(cè)預(yù)報(bào)是在數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的基礎(chǔ)上,針對(duì)滑坡區(qū)域的致滑因子搜集數(shù)據(jù)并進(jìn)行統(tǒng)計(jì)分析,然后對(duì)此區(qū)域的滑坡危險(xiǎn)性進(jìn)行評(píng)價(jià),為地質(zhì)災(zāi)害的預(yù)測(cè)預(yù)報(bào)提供可靠依據(jù)。在數(shù)據(jù)統(tǒng)計(jì)過(guò)程中,致滑因子的數(shù)據(jù)來(lái)源可分為如下幾大類:

(1)所在區(qū)域地形地質(zhì)圖、地質(zhì)災(zāi)害分布圖、植被覆蓋情況、土地規(guī)劃圖。

(2)區(qū)域內(nèi)滑坡歷史數(shù)據(jù),包括滑坡分布地點(diǎn)、滑坡體外貌、坡腳特征,巖土體性質(zhì)、歷史滑動(dòng)數(shù)據(jù)等具體數(shù)據(jù)。

(3)環(huán)境資料,包括氣候條件、溫濕度變化、降雨量等。

(4)經(jīng)濟(jì)建設(shè)與人文資料,包括研究區(qū)域人文地理,重要建筑物、道路橋梁隧道、地下管線等與人類活動(dòng)相關(guān)的工程設(shè)施分布情況數(shù)據(jù)。

(5)現(xiàn)場(chǎng)監(jiān)測(cè)數(shù)據(jù),主要是危險(xiǎn)滑坡體的變形監(jiān)測(cè)數(shù)據(jù)及防治工程監(jiān)測(cè)數(shù)據(jù)。

(6)各級(jí)相關(guān)部門通訊方式和資料。

(7)國(guó)家和地區(qū)相關(guān)政策法規(guī)關(guān)于滑坡地質(zhì)災(zāi)害預(yù)測(cè)預(yù)報(bào)的規(guī)定。

2.2 層次劃分

在數(shù)據(jù)收集的基礎(chǔ)上,通過(guò)對(duì)滑坡成因分析,從而將致滑因子劃分為如下四個(gè)層次:

(1)區(qū)域滑坡概況,包括一個(gè)地區(qū)滑坡的地理位置、滑坡類型(土質(zhì)滑坡、巖質(zhì)滑坡、變形體等)、每個(gè)滑坡組成部分(滑坡體、滑動(dòng)面、滑坡床、滑動(dòng)帶等)的特征、滑坡發(fā)生頻率以及所有相關(guān)的數(shù)據(jù)。

(2)賦存環(huán)境,包括滑坡的巖土體結(jié)構(gòu)構(gòu)造、地層巖性、地質(zhì)構(gòu)造以及相關(guān)的水文條件(如水系分布等)。

(3)誘發(fā)因素,包括降雨、地震、人為活動(dòng)(植被破壞、修筑建筑物、爆破等)。

(4)潛在受災(zāi)對(duì)象,滑坡周圍可能因受到潛在危險(xiǎn)而導(dǎo)致經(jīng)濟(jì)損失的地區(qū),如人口、建筑物、生態(tài)環(huán)境等。

2.3 評(píng)價(jià)指標(biāo)確定

滑坡預(yù)測(cè)預(yù)報(bào)基于滑坡敏感性區(qū)劃來(lái)進(jìn)行,對(duì)于滑坡敏感性的區(qū)劃,需要對(duì)導(dǎo)致滑坡形成的所有因子的貢獻(xiàn)進(jìn)行權(quán)值劃分,并對(duì)每個(gè)因子的貢獻(xiàn)大小定量化,評(píng)價(jià)指標(biāo)的目的就是通過(guò)深入分析滑坡形成因素的基礎(chǔ)上對(duì)致滑因子定量化取值。各個(gè)致滑因子的評(píng)價(jià)指標(biāo)如下:

(1)滑坡分布:對(duì)于所在區(qū)域各地點(diǎn)是否有滑坡,已知滑坡由數(shù)1 表示,不存在滑坡用數(shù)值0 表示。

(2)滑坡結(jié)構(gòu):滑坡所在地區(qū)地層巖性是控制滑坡發(fā)生的重要條件,由松散堆積體、碎石土、風(fēng)化殼組成的坡體抗剪強(qiáng)度低易于發(fā)生滑坡,堅(jiān)硬巖質(zhì)坡體抗剪強(qiáng)度高不易發(fā)生滑坡,坡體中存在軟弱滑動(dòng)面的斜坡在觸發(fā)因素作用下易發(fā)生滑塌;從順向坡、順斜坡、橫向坡、逆斜坡至逆向坡,滑坡危險(xiǎn)性逐漸降低。

(3)滑坡坡度:將滑坡坡度分為五個(gè)維度,分別為0°~15°、15°~30°、30°~45°、45°~60°以 及>60°。坡度越大,發(fā)生失穩(wěn)破壞的可能性越高,其賦值從1 至0 呈5 級(jí)遞減。

(4)海拔高度:通過(guò)分析工程區(qū)滑坡分布高度發(fā)現(xiàn),海拔越低地方滑坡體發(fā)生概率越小。根據(jù)海拔高度的不同統(tǒng)計(jì)不同類型滑坡數(shù)量,本文將海拔高度按小于100 m,100~200 m,200~250 m,250~300 m和大于300 m 分成5 個(gè)級(jí)別,海拔高度較低區(qū)域發(fā)生滑坡的風(fēng)險(xiǎn)性越低。

(5)水系分布:河流對(duì)于滑坡坡腳底部侵蝕作用非常明顯,沖蝕掏空直接導(dǎo)致滑坡底部產(chǎn)生臨空面,從而使滑動(dòng)面暴露于外部環(huán)境中;通過(guò)統(tǒng)計(jì)滑坡所在位置與河流水系的距離,對(duì)其危險(xiǎn)性分級(jí),其距離以200 m 作為分界線,在河流流域200 m 以內(nèi)的滑坡受影響作用明顯,200 m 以外的影響忽略不計(jì)。

(6)人類工程活動(dòng):人類工程活動(dòng)(如修筑公路開挖坡腳)對(duì)于滑坡影響較大,因此以工程建筑物與滑坡距離作為衡量尺度進(jìn)行分級(jí)。本文設(shè)定滑坡區(qū)與公路的距離來(lái)進(jìn)行量化,距離公路直線距離100 m作為分界,100 m 以內(nèi)滑坡受影響明顯,100 m 以外影響忽略不計(jì)。

3 系統(tǒng)設(shè)計(jì)

3.1 界面設(shè)計(jì)原則

在不妨礙用戶使用方便快捷的基礎(chǔ)上,盡量保證系統(tǒng)的界面布局相同、操作方式一致、對(duì)信息的讀取一目了然。

3.2 功能設(shè)計(jì)

(1)數(shù)據(jù)管理:數(shù)據(jù)管理主要指對(duì)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)際操作功能的設(shè)計(jì),對(duì)于滑坡數(shù)據(jù)中多維度、模型和ETL 設(shè)計(jì)都必須及時(shí)同步至數(shù)據(jù)庫(kù),對(duì)于數(shù)據(jù)庫(kù)用戶設(shè)置不同權(quán)限便于其對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行整理,對(duì)數(shù)據(jù)資料做好備份防止丟失。

(2)數(shù)據(jù)顯示:方便用戶直觀地了解數(shù)據(jù)變化情況,目標(biāo)區(qū)域降雨量、地震活動(dòng)、人類活動(dòng)等觸發(fā)因素,以及所在區(qū)域巖性條件、地質(zhì)構(gòu)造、水文地質(zhì)等環(huán)境條件等,都需要及時(shí)準(zhǔn)確顯示。

(3)數(shù)據(jù)挖掘:方便用于快速瀏覽和提取特征數(shù)據(jù)進(jìn)行對(duì)比分析,為滑坡預(yù)測(cè)預(yù)報(bào)提供詳盡資料。

圖3是滑坡預(yù)測(cè)預(yù)報(bào)系統(tǒng)的管理員界面,通過(guò)此界面,管理可以實(shí)時(shí)對(duì)數(shù)據(jù)庫(kù)進(jìn)行更新操作,調(diào)用某個(gè)特定數(shù)據(jù)進(jìn)行特征分析,并可以將不同地區(qū)降雨量與滑坡危險(xiǎn)性相關(guān)聯(lián),利用實(shí)體化視圖顯示出來(lái)。

圖3 滑坡預(yù)測(cè)預(yù)報(bào)系統(tǒng)界面

4 實(shí)例分析

研究區(qū)為巴東縣,其城區(qū)面積約為1 km2,此區(qū)域?qū)儆谒拇ㄅ璧?,地形深切割明顯,沖溝發(fā)育較多,降雨量大,其詳盡地質(zhì)資料見文獻(xiàn)[4]。

4.1 預(yù)測(cè)變量

根據(jù)巴東縣數(shù)據(jù)收集情況,選擇如下5 個(gè)因子的數(shù)據(jù)進(jìn)行數(shù)據(jù)整理:滑坡海拔高程、坡度、滑坡結(jié)構(gòu)以及與水系、公路的距離。其中,前三個(gè)因子需通過(guò)滑坡區(qū)地形地質(zhì)圖,結(jié)合滑坡產(chǎn)狀、地層條件等綜合分析得出,后兩個(gè)因子可直接測(cè)量得到。在統(tǒng)計(jì)分析過(guò)程中,對(duì)巴東縣滑坡危險(xiǎn)性區(qū)劃的分割選擇100 m2的正方形面積作為最小單位,每個(gè)單位面積統(tǒng)計(jì)5 個(gè)因子權(quán)值按照給定模型計(jì)算出其危險(xiǎn)性系數(shù)。權(quán)值分布見表1。

表1 影響因子權(quán)值分布

4.2 數(shù)據(jù)疊加模型

滑坡影響因子的疊加模型選擇Logistic 回歸模型進(jìn)行分析,邏輯回歸模型并沒(méi)有直接說(shuō)明滑坡發(fā)生的可能性,而是用量化的概率進(jìn)行推導(dǎo),邏輯回歸模型用概率計(jì)算公式進(jìn)行疊加操作[9-10]:

式中:P為滑坡發(fā)生概率;Y為擬合因變量,Y的計(jì)算公式為:

式中:C0~Cn為相關(guān)系數(shù),代表貢獻(xiàn)率大??;X為因子的值。

通過(guò)邏輯回歸模型計(jì)算出5 個(gè)致滑因子的相關(guān)性大小分別為:坡度(0.488),海拔高程(1.18),河流距離(16.263),公路距離(4.19),結(jié)構(gòu)(0.205)?;旅舾行詤^(qū)劃見圖4,圖中紅色部分代表滑坡災(zāi)害發(fā)生概率較高,綠色部分說(shuō)明地區(qū)受滑坡災(zāi)害影響較小,安全系數(shù)較高,從紅色到綠色滑坡危險(xiǎn)性逐漸降低。

圖4 巴東縣滑坡敏感性分布圖

5 結(jié)論

本文將數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘技術(shù)與地質(zhì)災(zāi)害相關(guān)知識(shí)結(jié)合,以巴東縣為例建立了基于數(shù)據(jù)倉(cāng)庫(kù)的滑坡災(zāi)害區(qū)劃與預(yù)測(cè)預(yù)報(bào)模型,得出了巴東縣新城區(qū)的滑坡危險(xiǎn)性區(qū)劃圖,并形成如下結(jié)論:

(1)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)具有高度集成性、面向用戶和快速的數(shù)據(jù)支持與決策等優(yōu)勢(shì),能夠?qū)聻?zāi)害數(shù)據(jù)進(jìn)行分級(jí)重組,檢索速度快;在滑坡預(yù)測(cè)預(yù)報(bào)過(guò)程中,可以根據(jù)分析統(tǒng)計(jì)在海量的數(shù)據(jù)庫(kù)中挖掘有效的地質(zhì)災(zāi)害信息,使得預(yù)測(cè)過(guò)程迅速、準(zhǔn)確。

(2)在對(duì)滑坡成因深入分析的基礎(chǔ)上,設(shè)計(jì)出影響滑坡發(fā)生五個(gè)致滑因子:坡度、海拔、結(jié)構(gòu)以及與公路、水系的距離,將這五個(gè)致滑因子通過(guò)邏輯回歸模型加權(quán)分析后,存放于滑坡災(zāi)害數(shù)據(jù)庫(kù)中,滿足滑坡空間分布預(yù)測(cè)的需求。

(3)本文所述數(shù)據(jù)庫(kù)模型對(duì)滑坡致滑因子的考慮還不夠精細(xì)(如未考慮降雨量、地震和人類工程活動(dòng)等因素),預(yù)測(cè)預(yù)報(bào)模型的可靠性也還需要時(shí)間檢驗(yàn),期待在以后的滑坡預(yù)測(cè)數(shù)據(jù)庫(kù)建設(shè)與挖掘工作中進(jìn)一步細(xì)化和完善。

猜你喜歡
數(shù)據(jù)倉(cāng)庫(kù)滑坡數(shù)據(jù)挖掘
2001~2016年香港滑坡與降雨的時(shí)序特征
改進(jìn)支持向量機(jī)在特征數(shù)據(jù)挖掘中的智能應(yīng)用
某停車場(chǎng)滑坡分析及治理措施
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)傾斜解決方案研究
基于事故數(shù)據(jù)挖掘的AEB路口測(cè)試場(chǎng)景
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)復(fù)用在存儲(chǔ)數(shù)據(jù)倉(cāng)庫(kù)中的運(yùn)用
數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在檔案管理領(lǐng)域的應(yīng)用
崇阳县| 乐都县| 广丰县| 兴文县| 兴山县| 广昌县| 宜川县| 章丘市| 页游| 保靖县| 林西县| 商丘市| 苗栗市| 辽宁省| 浙江省| 蓝山县| 澄江县| 白银市| 芜湖市| 咸宁市| 临邑县| 阿拉善盟| 遂昌县| 东山县| 和龙市| 晋中市| 南部县| 新津县| 黄浦区| 兴安盟| 永昌县| 东丰县| 宾阳县| 磐安县| 崇州市| 哈巴河县| 旅游| 侯马市| 桃园县| 贵德县| 汽车|