陳 波,詹明強(qiáng),黃梓莘
(1.河海大學(xué) 水利水電學(xué)院,南京 210098; 2.河海大學(xué) 水文水資源與水利工程科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,南京 210098; 3.中國電建集團(tuán)中南勘測設(shè)計(jì)研究院有限公司,長沙 410014)
庫岸邊坡的運(yùn)行穩(wěn)定對于水利工程的服役安全至關(guān)重要,其失穩(wěn)災(zāi)害會對工程自身效益和周邊生命財(cái)產(chǎn)安全造成巨大損失。研究表明,庫岸邊坡失穩(wěn)破壞會經(jīng)歷漸變到突變的累進(jìn)發(fā)展過程,而邊坡運(yùn)行監(jiān)測資料記錄了失穩(wěn)災(zāi)害孕育的全過程信息,尤其是失穩(wěn)破壞發(fā)生的前兆信息,有必要結(jié)合監(jiān)測資料開展庫岸邊坡的安全監(jiān)控和災(zāi)變預(yù)警研究。在庫岸邊坡工程安全監(jiān)測過程中,必然會產(chǎn)生海量與邊坡穩(wěn)定相關(guān)的數(shù)據(jù)信息,關(guān)聯(lián)規(guī)則正是運(yùn)用統(tǒng)計(jì)學(xué)有關(guān)原理,尋找不同屬性數(shù)據(jù)間隱蔽的相互關(guān)系,較為廣泛地應(yīng)用于水利工程的知識發(fā)現(xiàn)。
近年來,學(xué)者們對邊坡安全監(jiān)測數(shù)據(jù)挖掘方法展開了研究。張治強(qiáng)等[1]考慮到邊坡地形、巖體等影響因素,應(yīng)用Apriori算法構(gòu)建邊坡穩(wěn)定性和破壞方式的智能預(yù)測模型。馬水山等[2]運(yùn)用經(jīng)典頻集算法對滑坡監(jiān)測資料進(jìn)行關(guān)聯(lián)規(guī)則挖掘,得到了滑坡變形與監(jiān)測數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則。劉小珊等[3]基于大量邊坡工程失穩(wěn)破壞全過程的監(jiān)測數(shù)據(jù),采用Apriori算法揭示了邊坡累積位移和累積速率在不同失穩(wěn)演化階段的特征。揭奇等[4]針對分布式光纖傳感(DFOS)的邊坡多場監(jiān)測資料開展關(guān)聯(lián)挖掘,發(fā)現(xiàn)了庫水位和地下水位監(jiān)測序列之間的蘊(yùn)含的潛在關(guān)聯(lián)特征。王林偉等[5]提出了一種基于Apriori的邊坡巖體變形特征關(guān)聯(lián)分析方法,根據(jù)關(guān)聯(lián)規(guī)則挖掘分析了邊坡巖體變形的主要成因。趙久彬等[6]提出了前后部項(xiàng)約束關(guān)聯(lián)規(guī)則并行化算法,深入總結(jié)了典型滑坡和區(qū)域滑坡的危險(xiǎn)性規(guī)則。段功豪等[7]研究了堆積層滑坡的形成和演化原理,結(jié)合聚類分析和關(guān)聯(lián)規(guī)則算法快速提取邊坡監(jiān)測數(shù)據(jù)的實(shí)時(shí)變形特征,為滑坡災(zāi)害的預(yù)測預(yù)報(bào)提供了參考依據(jù)。Zhao等[8]采用灰色關(guān)聯(lián)方法探尋了邊坡位移與庫水位、降雨量、外部氣溫等因素間的相關(guān)性,研究結(jié)果表明傾覆巖邊坡存在水動力失穩(wěn)的可能性。
通過總結(jié)上述運(yùn)用關(guān)聯(lián)規(guī)則時(shí)空數(shù)據(jù)挖掘算法在庫岸邊坡監(jiān)測資料分析的研究現(xiàn)狀可以看出,目前針對動態(tài)多方位的實(shí)時(shí)監(jiān)測數(shù)據(jù)的挖掘工作開展較少,同時(shí)監(jiān)測數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘多采用Apriori算法。然而,在Apriori算法搜索過程中,不僅需要重復(fù)掃描數(shù)據(jù)庫而且需要處理大量候選頻繁項(xiàng)集,在應(yīng)對海量、長模式或密集型的數(shù)據(jù)時(shí),不可避免會暴露出時(shí)間效率低、空間壓縮性差等弊端。基于此,本文采取改進(jìn)的關(guān)聯(lián)規(guī)則算法FP-Growth對多測點(diǎn)和多項(xiàng)目的監(jiān)測數(shù)據(jù)展開挖掘,從大量看似無規(guī)則的原始監(jiān)測數(shù)據(jù)中獲取有效判別信息,從而為后續(xù)邊坡運(yùn)行的安全預(yù)警研究提供方向性指導(dǎo)。
假設(shè)存在事務(wù)集合C={c1,c2,…,cn},ci(i=1,2,…,n),將關(guān)聯(lián)規(guī)則的具體定義介紹如下[9-10]。
2.1.1 關(guān)聯(lián)規(guī)則
設(shè)A={a1,a2,...,aj},B={b1,b2,...,bk},(1≤j,k≤i),若存在A?C,B?C,且A∩B≠?,則說明項(xiàng)集A和B各自為事務(wù)集合C中的兩個(gè)項(xiàng)集。此時(shí),根據(jù)項(xiàng)集A和B構(gòu)建形如A=>B的關(guān)系,即被稱為關(guān)聯(lián)規(guī)則。在關(guān)聯(lián)規(guī)則A=>B中,前項(xiàng)A可視為關(guān)聯(lián)規(guī)則的條件,后項(xiàng)B可視為關(guān)聯(lián)規(guī)則的結(jié)論。
2.1.2 支持度
在事務(wù)集合C中,包含A∩B的事務(wù)即同時(shí)包含項(xiàng)集A和B的事務(wù)占全部事務(wù)的比重,稱為事務(wù)集合C中關(guān)聯(lián)規(guī)則A=>B的支持度,則有
(1)
2.1.3 置信度
在事務(wù)集合C中,包含A∩B的事務(wù)占包含A事務(wù)的比重,稱為事務(wù)集合C中關(guān)聯(lián)規(guī)則A=>B的置信度Conf,則有
(2)
2.1.4 強(qiáng)關(guān)聯(lián)規(guī)則
在事務(wù)集合C中,設(shè)置min_Supp和min_Conf為指標(biāo)閾值,當(dāng)關(guān)聯(lián)規(guī)則A=>B同時(shí)滿足Supp(A=>B)≥min_Supp和Conf(A=>B)≥min_Conf兩個(gè)條件時(shí),稱關(guān)聯(lián)規(guī)則A=>B為強(qiáng)關(guān)聯(lián)規(guī)則。
FP-Growth算法是一種在不產(chǎn)生候選項(xiàng)目集的前提下挖掘出全部頻繁項(xiàng)集的方法,關(guān)鍵在于利用歸納分散策略將事務(wù)數(shù)據(jù)庫以頻繁模式樹FP-Tree的形式重構(gòu)[11]。FP-Tree在壓縮存儲數(shù)據(jù)量級的同時(shí)保留關(guān)聯(lián)信息,顯著縮小算法搜索范圍,有效避免關(guān)聯(lián)組合爆炸,能夠改善邊坡監(jiān)測數(shù)據(jù)挖掘運(yùn)行速度慢的問題。
結(jié)合圖1的算法原理,將FP-Growth算法主要步驟介紹如下。
2.2.1 整體掃描數(shù)據(jù)庫
整體掃描事務(wù)數(shù)據(jù)庫,分別計(jì)算各項(xiàng)目的支持度指標(biāo),接著根據(jù)設(shè)定閾值min_Supp篩選出其中所有頻繁項(xiàng)集,并按照支持度計(jì)數(shù)從大到小對頻繁項(xiàng)集進(jìn)行排序,形成頻繁項(xiàng)表L(圖1(a)中的頭結(jié)點(diǎn)表)。
2.2.2 二次掃描數(shù)據(jù)庫
二次掃描事務(wù)數(shù)據(jù)庫,利用搜索出的所有頻繁項(xiàng)集構(gòu)造如圖1(b)所示的FP-Tree,首先創(chuàng)造FP-Tree的根節(jié)點(diǎn)Null,接著按照頻繁項(xiàng)表L的排列次序,將頻繁項(xiàng)集依次插入FP-Tree中的每個(gè)分支中。
2.2.3 創(chuàng)建頭節(jié)點(diǎn)表
為方便搜索FP-Tree,創(chuàng)建如圖1(a)所示的頭節(jié)點(diǎn)表,目標(biāo)在于讓每個(gè)頻繁項(xiàng)集能通過紅色箭頭所示的結(jié)點(diǎn)鏈與FP-Tree的樹結(jié)點(diǎn)位置相連。
2.2.4 挖掘關(guān)聯(lián)規(guī)則
利用頭節(jié)點(diǎn)表和樹結(jié)點(diǎn)的鏈接,采用自底向上的方式對Priority樹進(jìn)行關(guān)聯(lián)規(guī)則的挖掘。
考慮到FP-Growth算法在計(jì)算效率上的優(yōu)越性,本文基于FP-Growth算法,分別從因果關(guān)聯(lián)規(guī)則挖掘和空間關(guān)聯(lián)規(guī)則挖掘2個(gè)角度,對多測點(diǎn)多項(xiàng)目的邊坡時(shí)空監(jiān)測數(shù)據(jù)開展關(guān)聯(lián)規(guī)則挖掘工作。結(jié)合圖2的算法流程,將主要步驟介紹如下。
3.1.1 因果關(guān)聯(lián)規(guī)則挖掘
探究環(huán)境量和效應(yīng)量之間兼具的因果性和關(guān)聯(lián)性,針對邊坡監(jiān)測數(shù)據(jù)進(jìn)行因果關(guān)聯(lián)規(guī)則挖掘。根據(jù)領(lǐng)域內(nèi)專家經(jīng)驗(yàn)可知,降雨和庫水作為邊坡失穩(wěn)誘因之一,主要通過軟化、飽水加載、靜水壓力、動水壓力4種作用造成邊坡變形[12]。因此,基于降雨量測值、庫水位測值、氣溫測值等監(jiān)測環(huán)境量數(shù)據(jù)設(shè)置關(guān)聯(lián)規(guī)則的前項(xiàng)X,同時(shí)以位移測值、滲流測值等監(jiān)測效應(yīng)量數(shù)據(jù)作為關(guān)聯(lián)規(guī)則的后項(xiàng)Y的設(shè)置依據(jù)。
3.1.2 空間關(guān)聯(lián)規(guī)則挖掘
針對邊坡監(jiān)測數(shù)據(jù)探尋不同空間位置測點(diǎn)測值數(shù)據(jù)的潛在聯(lián)系,開展空間關(guān)聯(lián)規(guī)則挖掘。邊坡效應(yīng)量的監(jiān)測數(shù)據(jù)由多個(gè)測點(diǎn)測值組成,這些測點(diǎn)各自具有不同的空間位置,在關(guān)聯(lián)規(guī)則挖掘過程中引入對空間位置的考慮,更有助于深入了解邊坡整體結(jié)構(gòu)和內(nèi)在規(guī)律。以監(jiān)測效應(yīng)量數(shù)據(jù)為基礎(chǔ)設(shè)置規(guī)則前項(xiàng)和后項(xiàng),前項(xiàng)X表征某一監(jiān)測項(xiàng)目的測點(diǎn)測值變動情況,后項(xiàng)Y表征同時(shí)刻同一監(jiān)測項(xiàng)目另一測點(diǎn)的測值變動情況。
在關(guān)聯(lián)規(guī)則挖掘開始之前,還需要將數(shù)據(jù)變化程度、數(shù)據(jù)離散情況依據(jù)現(xiàn)有監(jiān)測水平詮釋為簡明易懂的定性語言,原因在于每個(gè)邊坡監(jiān)測數(shù)據(jù)都是一個(gè)精確的定量數(shù)值,無法反映任何定性信息,同時(shí)以連續(xù)數(shù)值形式表示的測值序列也不方便直接參與計(jì)算。因此需要實(shí)現(xiàn)測值數(shù)據(jù)的屬性轉(zhuǎn)換,具體做法是在不破壞數(shù)據(jù)分布的前提下,將數(shù)據(jù)值域劃分成若干個(gè)區(qū)間組合,并分別賦予不同區(qū)間以明確的物理含義。
假設(shè)邊坡存在一固定特征,包含該特征的n個(gè)測點(diǎn)組成項(xiàng)集集合xi,i=1,2,…,n,則項(xiàng)集集合xi在所有項(xiàng)集集合xj(j=1,2,...,m)中的貢獻(xiàn)占比D=n/m。
基于等距分箱思想[13],結(jié)合貢獻(xiàn)占比極值Dmax和Dmin,將貢獻(xiàn)占比D等距劃分為3類,依次取得三級劃分點(diǎn),形成區(qū)間等差數(shù)列為:
d=(Dmax-Dmin)/3 ;
(3)
(4)
根據(jù)三級劃分點(diǎn)生成不同貢獻(xiàn)占比的項(xiàng)集集合區(qū)間,包括:低貢獻(xiàn)占比的項(xiàng)集集合區(qū)間為[a1,a2),中貢獻(xiàn)占比的項(xiàng)集集合區(qū)間為[a2,a3),高貢獻(xiàn)占比的項(xiàng)集集合區(qū)間為[a3,a4]。通過判斷邊坡測值數(shù)據(jù)的區(qū)間屬性,可以實(shí)現(xiàn)測值數(shù)據(jù)的屬性轉(zhuǎn)換。
在進(jìn)行測值數(shù)據(jù)的屬性轉(zhuǎn)換之后,在保留項(xiàng)集信息的基礎(chǔ)上構(gòu)造邊坡時(shí)空數(shù)據(jù)挖掘的Priority樹,采用自底向上的方式全面掃描數(shù)據(jù)庫,篩選出在min_Supp和min_conf兩個(gè)閾值約束下的關(guān)聯(lián)規(guī)則,即生成強(qiáng)關(guān)聯(lián)規(guī)則。
最后,對照工程實(shí)際運(yùn)行情況對生成規(guī)則進(jìn)行逐一評價(jià)和解釋,詮釋所篩選規(guī)則內(nèi)含的物理現(xiàn)象本質(zhì),從而在邊坡時(shí)空監(jiān)測數(shù)據(jù)中挖掘出反映工程運(yùn)行性狀的有效信息。
本文研究邊坡位于某拱壩庫首左岸,是該拱壩的近壩邊坡,距離大壩600~1 300 m,順河方向長700 m,相對坡高500~700 m。高度1 400 m以上平均坡度25°~45°,高程1 400 m以下22°~25°,并有多級緩坡地段。坡面走向約S60°E,巖層產(chǎn)狀近EW/S∠30°~35°,邊坡為二元結(jié)構(gòu)的單斜順向坡。由于邊坡沿河各段的穩(wěn)定程度不一,根據(jù)邊坡巖性特征、邊坡地質(zhì)構(gòu)造和失穩(wěn)破壞模式的不同,將1 400 m 高程以下的邊坡自上游向下游分為Ⅰ、Ⅱ、Ⅲ區(qū),如圖3所示。
自1985年以來,經(jīng)歷前期勘察、大壩施工、水庫蓄水及工程運(yùn)營等多個(gè)時(shí)期,邊坡積累了包含地表變形、深層變形和環(huán)境量的大量監(jiān)測資料,現(xiàn)有監(jiān)測信息匯總?cè)绫?所示。
表1 研究邊坡的監(jiān)測信息
在開展邊坡監(jiān)測信息時(shí)空數(shù)據(jù)挖掘工作前,首先采用箱線圖對邊坡原始監(jiān)測資料進(jìn)行異常值確定。根據(jù)箱形圖的定義,箱子的長度代表四分位數(shù)的間距(IQR),箱兩端分別是上四分位數(shù)(Q3)和下四分位數(shù)(Q1)。箱形圖定義的異常值指樣本數(shù)據(jù)大于上限(Q3+1.5IQR)和小于下限(Q1-1.5IQR)。
首先根據(jù)箱線圖的內(nèi)外限分布,以及上下四分位數(shù)距,直觀判斷原始監(jiān)測信息的對稱性、離群測值和極端測值的分布情況。
觀察邊坡位移監(jiān)測信息的箱線圖(圖4)可以看出:對比3個(gè)方向的位移監(jiān)測數(shù)據(jù),其中以順坡向位移監(jiān)測數(shù)據(jù)的集中趨勢最顯著,順坡向、垂直向和順河向3個(gè)方向位移監(jiān)測數(shù)據(jù)的集中趨勢依次遞減;綜合測點(diǎn)區(qū)域分布結(jié)果,3個(gè)區(qū)域的位移監(jiān)測數(shù)據(jù)整體離散程度比較相似。在極值識別的基礎(chǔ)上,根據(jù)箱線圖定義對異常測值進(jìn)行處理,此處將異常值全部剔除,同時(shí)采用3次樣條插值法填補(bǔ)監(jiān)測序列中的缺失值,為后續(xù)關(guān)聯(lián)分析的時(shí)空數(shù)據(jù)挖掘工作開展奠定基礎(chǔ)。
基于FP-Growth算法對邊坡監(jiān)測數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,關(guān)鍵在于邊坡監(jiān)測數(shù)據(jù)前后項(xiàng)的設(shè)置,本節(jié)主要選取環(huán)境量與效應(yīng)量的監(jiān)測數(shù)據(jù)作為構(gòu)建關(guān)聯(lián)規(guī)則X=>Y前、后項(xiàng)的基礎(chǔ),分別從因果關(guān)聯(lián)和空間關(guān)聯(lián)2個(gè)角度開展邊坡監(jiān)測信息關(guān)聯(lián)挖掘和知識發(fā)現(xiàn)。其中,環(huán)境量數(shù)據(jù)來源于庫水位的監(jiān)測數(shù)據(jù),效應(yīng)量數(shù)據(jù)來源于位移測點(diǎn)順坡向、順河向、垂直向的位移監(jiān)測數(shù)據(jù),以及鉆孔測點(diǎn)的地下水位監(jiān)測數(shù)據(jù)。
在關(guān)聯(lián)分析開始之前,首先需要對各測值數(shù)據(jù)進(jìn)行屬性轉(zhuǎn)換處理,運(yùn)用相應(yīng)數(shù)學(xué)統(tǒng)計(jì)量表征測值數(shù)據(jù)的時(shí)序分布情況和變動劇烈程度,然后采用等差數(shù)列依次取得三級劃分點(diǎn),將各部分?jǐn)?shù)據(jù)進(jìn)行等距區(qū)間劃分和名稱轉(zhuǎn)換。以庫水位數(shù)據(jù)的屬性轉(zhuǎn)換為例,假設(shè)庫水位數(shù)據(jù)H∈[Hmin,Hmax],分別取得區(qū)間三級劃分點(diǎn)H1、H2、H3、H4,當(dāng)H∈[H1,H2)時(shí),命名為“低水位”,當(dāng)H∈[H2,H3),命名為“常水位”,當(dāng)H∈(H3,H4]時(shí),命名為“高水位”。
進(jìn)行測值數(shù)據(jù)的屬性轉(zhuǎn)換之后,在保留項(xiàng)集信息的基礎(chǔ)上構(gòu)造邊坡時(shí)空數(shù)據(jù)挖掘的Priority樹,并采用自底向上的方式全面掃描數(shù)據(jù)庫,篩選出符合工程實(shí)際的強(qiáng)關(guān)聯(lián)規(guī)則。
4.2.1 邊坡監(jiān)測信息的因果關(guān)聯(lián)規(guī)則挖掘
4.2.1.1 庫水位時(shí)序分布與鉆孔水位的因果關(guān)聯(lián)規(guī)則挖掘
計(jì)算庫水位時(shí)序分布與鉆孔水位時(shí)序分布的因果關(guān)聯(lián)規(guī)則X1=>Y1,首先設(shè)置前項(xiàng)X1為監(jiān)測環(huán)境量,即庫水位的時(shí)序分布情況,設(shè)置后項(xiàng)Y1為監(jiān)測效應(yīng)量,即43#、44#、45#鉆孔水位的時(shí)序分布情況。在進(jìn)行屬性轉(zhuǎn)換后,規(guī)則前項(xiàng)為形如X1={高水位,常水位,低水位}的項(xiàng)集集合,規(guī)則后項(xiàng)為形如Y1={高鉆孔水位,常鉆孔水位,低鉆孔水位}的項(xiàng)集集合。在此基礎(chǔ)上,開展因果關(guān)聯(lián)規(guī)則X1=>Y1的挖掘工作。運(yùn)用FP-Growth算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘,所篩選出的強(qiáng)關(guān)聯(lián)規(guī)則計(jì)算結(jié)果如表2所示,關(guān)聯(lián)規(guī)則挖掘示意圖如圖5所示。
表2 X1 =>Y1的關(guān)聯(lián)規(guī)則計(jì)算結(jié)果
綜合上述基于43#、44#、45#測孔監(jiān)測數(shù)據(jù)獲得的關(guān)聯(lián)規(guī)則挖掘結(jié)果,可以得出如下結(jié)論:
(1)從置信度角度可以看出,所提煉的關(guān)聯(lián)規(guī)則置信度均超過95%,最大置信度達(dá)到100%,規(guī)則的可靠程度和可信程度較高,可得出鉆孔水位高程的時(shí)序分布情況與庫水位的時(shí)序分布情況關(guān)聯(lián)程度高的結(jié)論,說明了監(jiān)測數(shù)據(jù)的可靠性。
(2)從支持度角度可以看出,43#鉆孔水位不同高程的時(shí)序分布較為均勻,而45#鉆孔水位高程則基本位于高水位區(qū)間,支持度達(dá)到91.29%。
根據(jù)工程經(jīng)驗(yàn)知識可知,地下水位的時(shí)序分布和庫水位的時(shí)序分布具有因果效應(yīng),而上述基于FP-Growth的關(guān)聯(lián)規(guī)則挖掘結(jié)果表征地下水位高程的時(shí)序分布還與庫水位的時(shí)序分布具有顯著關(guān)聯(lián)效應(yīng),說明邊坡地下水位受庫水位升降影響,巖體滲透性較好。
4.2.1.2 庫水位與位移測值的因果關(guān)聯(lián)規(guī)則挖掘
計(jì)算庫水位變動劇烈程度與位移測值變動劇烈程度的關(guān)聯(lián)規(guī)則X2=>Y2,設(shè)置前項(xiàng)X2為庫水位的測值變動程度,設(shè)置后項(xiàng)Y2為邊坡Ⅰ區(qū)、Ⅱ區(qū)和Ⅲ區(qū)位移的代表測點(diǎn)(交8、交9、交12)3個(gè)方向(順坡向、順河向、垂直向)位移測值的變動程度。此時(shí),規(guī)則前項(xiàng)為形如X2={水位變動小,水位變動中等,水位變動大}的項(xiàng)集集合,規(guī)則后項(xiàng)為形如Y2={測值變動小,測值變動中等,測值變動大}的項(xiàng)集集合。在此基礎(chǔ)上,采用FP-Growth算法開展因果關(guān)聯(lián)規(guī)則X2=>Y2的數(shù)據(jù)挖掘工作。所篩選出可信程度較高的因果關(guān)聯(lián)規(guī)則如表3所示。
表3 X2 =>Y2的關(guān)聯(lián)規(guī)則計(jì)算
分析上述計(jì)算結(jié)果,得出如下結(jié)論:
(1)對比不同監(jiān)測項(xiàng)目,可以看出三向位移測值與庫水位的關(guān)聯(lián)程度明顯低于地下水位與庫水位的關(guān)聯(lián)程度,原因在于位移測值受到溫度、水位、降雨等因素的綜合影響,而地下水位高程則主要受到庫水位的影響。
(2)對比不同分布區(qū)域,在邊坡Ⅰ區(qū)、Ⅱ區(qū)和Ⅲ區(qū)代表測點(diǎn)中,邊坡Ⅱ區(qū)的交8測點(diǎn)位移測值變動對于庫水位的測值變動程度較為敏感,3個(gè)方向?qū)?yīng)的置信度分別為93.33%、93.33%、80.00%,表征關(guān)聯(lián)規(guī)則的可信程度較高。
(3)對比不同位移方向,順坡向位移測值變動與庫水位測值變動關(guān)聯(lián)程度最高,3個(gè)測點(diǎn)對應(yīng)的規(guī)則置信度分別為93.33%、83.33%、80.00%,因此可以得出順坡向位移測值變動受庫水位影響最大的結(jié)論。
(4)從支持度水平還可以看出,三向位移測值的變動程度均較小,與目前邊坡變形相對穩(wěn)定但存在緩慢增長趨勢的穩(wěn)定性分析結(jié)論相吻合。
為計(jì)算庫水位狀態(tài)和庫水位變化二維變量與邊坡位移之間的關(guān)聯(lián)規(guī)則X3=>Y3,規(guī)則前項(xiàng)為形如X3={低水位時(shí)水位降低,低水位時(shí)水位升高,常水位時(shí)水位降低,常水位時(shí)水位升高,高水位時(shí)水位降低,高水位時(shí)水位升高}的項(xiàng)集集合,規(guī)則后項(xiàng)為形如Y3={位移速率升高,位移速率降低}的項(xiàng)集集合。位移速率指的是兩次采集數(shù)據(jù)期間發(fā)生的位移變化量除于采集間隔的天數(shù),得到的平均變化速率??紤]到交8測點(diǎn)順坡向位移變動受庫水位影響最大,篩選出交8順坡向可信程度較高的因果關(guān)聯(lián)規(guī)則如表4所示。
表4 X3 =>Y3的關(guān)聯(lián)規(guī)則計(jì)算
從置信度水平可以看出庫水位處于低位時(shí)比處于高位時(shí),水位降低對位移速率和邊坡穩(wěn)定性的影響更大。當(dāng)庫水位處于低位且?guī)焖唤档蜁r(shí),對邊坡的穩(wěn)定是最不利的。庫水位的變化對邊坡穩(wěn)定性的影響可以理解為:當(dāng)庫水位下降時(shí),邊坡將出現(xiàn)臨空面,坡體內(nèi)部滲透壓力差、水力梯度增大,易導(dǎo)致邊坡失穩(wěn)。
由上述分析可以看出,因果關(guān)聯(lián)規(guī)則挖掘能夠抽取并挖掘環(huán)境量和效應(yīng)量之間的關(guān)聯(lián)性和因果性,可以為工程安全監(jiān)控理論提供一個(gè)全新視角。
4.2.2 邊坡監(jiān)測信息的空間關(guān)聯(lián)規(guī)則挖掘
計(jì)算多個(gè)位移測點(diǎn)測值發(fā)展規(guī)律間的關(guān)聯(lián)規(guī)則X4=>Y4,設(shè)置前項(xiàng)X4為一測點(diǎn)的測值發(fā)展規(guī)律,設(shè)置規(guī)則后項(xiàng)Y4為另一測點(diǎn)的測值發(fā)展規(guī)律,此處選取交10、交8、交12、交13、交16、交5、交6、交7、交9、交11、交14、交15共12個(gè)位移測點(diǎn)1998—2019年的三向監(jiān)測數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則計(jì)算。此時(shí),規(guī)則前項(xiàng)為形如X4={測點(diǎn)1測值小,測點(diǎn)1測值中等,測點(diǎn)1測值大}的項(xiàng)集集合,規(guī)則后項(xiàng)為形如Y4={測點(diǎn)2測值小,測點(diǎn)2測值中等,測點(diǎn)2測值大}的項(xiàng)集集合。在此基礎(chǔ)上,采用FP-Growth算法開展關(guān)聯(lián)規(guī)則X4=>Y4的數(shù)據(jù)挖掘工作。所篩選出可信程度較高的空間關(guān)聯(lián)規(guī)則如表5、圖6所示。
表5 X4=>Y4的關(guān)聯(lián)規(guī)則計(jì)算
綜合上述基于3個(gè)方向測值數(shù)據(jù)計(jì)算獲得的空間關(guān)聯(lián)規(guī)則,可以看出:
(1)3個(gè)方向的測值數(shù)據(jù)中,順河向的測點(diǎn)同步變化程度普遍較低,而順坡向和垂直向呈現(xiàn)了顯著的測點(diǎn)同步變化趨勢。
(2)測點(diǎn)交10、交5和交13三個(gè)測點(diǎn)在三個(gè)方向的測點(diǎn)變化同步程度都很高。其中,測點(diǎn)交10和交5三個(gè)方向變化同步支持度分別為100%、77.27%、100%,測點(diǎn)交13和交5三個(gè)方向變化同步支持度分別為100%、90.91%、100%,測點(diǎn)交10和交13三個(gè)方向變化同步支持度分別為100%、68.18%、100%。
在計(jì)算得出不同測點(diǎn)空間關(guān)聯(lián)規(guī)則的基礎(chǔ)上,對比交10、交5和交13三個(gè)測點(diǎn)在不同方向的測值變化過程線對輸出規(guī)則加以驗(yàn)證,如圖7所示。從圖7可以看出:3個(gè)方向的位移測值增減趨勢比較一致、變化范圍大體相同,由此判斷輸出規(guī)則可信程度比較高。
在空間關(guān)聯(lián)規(guī)則挖掘過程中,衡量不同測點(diǎn)的變化同步程度,并篩選出其中變化同步程度較高的關(guān)聯(lián)測點(diǎn)。利用這些測點(diǎn)間的空間關(guān)聯(lián)規(guī)則,當(dāng)部分測點(diǎn)監(jiān)測數(shù)據(jù)缺失時(shí),可以參考另一個(gè)或幾個(gè)同步變化置信度高的關(guān)聯(lián)測點(diǎn)來修復(fù)空缺數(shù)據(jù);當(dāng)同步置信度高的2個(gè)關(guān)聯(lián)測點(diǎn)的變化出現(xiàn)較大差異時(shí),應(yīng)提出疑似異常信號,以保證庫岸邊坡的安全服役。
針對庫岸邊坡監(jiān)測數(shù)據(jù)隱含的時(shí)空關(guān)聯(lián)關(guān)系,結(jié)合工程實(shí)際,研究了關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法,對多測點(diǎn)多項(xiàng)目的海量邊坡監(jiān)測信息開展時(shí)空數(shù)據(jù)挖掘工作,所得主要結(jié)論如下:
(1)分別考慮環(huán)境量和效應(yīng)量之間的關(guān)聯(lián)性和因果性,并考慮不同空間位置測點(diǎn)測值變動情況的關(guān)聯(lián)性,挖掘了邊坡時(shí)空監(jiān)測數(shù)據(jù)中潛藏的因果關(guān)聯(lián)規(guī)則和空間關(guān)聯(lián)規(guī)則??梢钥闯觯蚬P(guān)聯(lián)規(guī)則挖掘能夠抽取并挖掘環(huán)境量和效應(yīng)量之間的關(guān)聯(lián)性和因果性,可以為工程安全監(jiān)控理論提供一個(gè)全新視角;空間關(guān)聯(lián)規(guī)則挖掘可以匯總生成服務(wù)于邊坡健康工作的規(guī)則集合,相關(guān)關(guān)聯(lián)測點(diǎn)也可以用來相互參考測值變化趨勢和互為補(bǔ)充缺失測值。
(2)FP-Growth算法新穎、思路清晰、結(jié)果簡約、實(shí)用性強(qiáng),實(shí)例表明,F(xiàn)P-Growth算法為庫岸邊坡監(jiān)測數(shù)據(jù)挖掘提供一條良好思路。
(3)本文對庫岸邊坡潛在的關(guān)聯(lián)規(guī)則進(jìn)行了初步研究,但仍有一些內(nèi)容需要深入研究,如監(jiān)測數(shù)據(jù)的可靠性與規(guī)則的支持度、置信度之間的影響;庫岸邊坡出現(xiàn)異常行為時(shí),監(jiān)測數(shù)據(jù)給出的各種結(jié)構(gòu)響應(yīng)之間的相關(guān)性驗(yàn)證。