李明超,任秋兵,孔 銳,杜勝利,司 文
(1. 天津大學(xué)水利工程仿真與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津 300354;2. 中國(guó)電建集團(tuán)西北勘測(cè)設(shè)計(jì)研究院有限公司,陜西西安 710065)
我國(guó)大壩建設(shè)取得了舉世矚目的成就,目前已有三峽、錦屏等一批大型水電工程[1-2]。大壩數(shù)量急劇上升,大壩潰決造成的損失亦隨之增加,這將加強(qiáng)大壩安全管理擺到了更為重要的位置。大壩安全監(jiān)測(cè)是大壩安全管理的重要內(nèi)容,同時(shí)是掌握大壩運(yùn)行性態(tài)的主要手段[3-4]。鑒于此,對(duì)安全監(jiān)測(cè)資料進(jìn)行綜合分析是評(píng)判大壩安全狀況的最直接有效的方法之一。其中,大壩變形觀測(cè)資料易于獲取,能直觀可靠地反映大壩服役性態(tài),故常運(yùn)用數(shù)學(xué)模型和壩工理論構(gòu)建大壩變形監(jiān)控模型[5]。建立可靠的大壩變形監(jiān)控模型對(duì)于及時(shí)發(fā)現(xiàn)安全隱患、保障大壩穩(wěn)定運(yùn)行具有重要意義。
大壩與基巖有機(jī)構(gòu)成一個(gè)復(fù)雜時(shí)變的動(dòng)力系統(tǒng),其變形、滲流等效應(yīng)量(又稱響應(yīng)變量)自身具有不確定性、高度非線性等特征[6-7]。在系統(tǒng)內(nèi)部,各變形監(jiān)控點(diǎn)觀測(cè)數(shù)據(jù)序列之間往往存在交叉相似性,尤其是同一壩段不同高程的變形數(shù)列。此外,大壩在服役期間始終受到降水、庫(kù)水位、壩址氣溫等外部環(huán)境因子(又稱解釋變量)的耦合作用,即具有多誘因性[8-9]。因子間亦存在顯著的交互效應(yīng)(簡(jiǎn)稱因子相關(guān)性),例如庫(kù)區(qū)降水量、氣溫勢(shì)必會(huì)影響上下游水位變幅,進(jìn)而引起變形性態(tài)的變化。就整體而言,關(guān)于大壩變形的復(fù)雜關(guān)聯(lián)性主要體現(xiàn)在單一因子內(nèi)部、多因子之間、變形與因子之間、單一變形數(shù)列內(nèi)部以及多測(cè)點(diǎn)變形數(shù)列之間等5個(gè)維度上。需要說(shuō)明的是,單一環(huán)境因子內(nèi)部的關(guān)聯(lián)性并不屬于大壩安全監(jiān)控研究的范疇,至于單一變形數(shù)列內(nèi)部的關(guān)聯(lián)性,可參考文獻(xiàn)[10]。因此,本文將重點(diǎn)對(duì)多因子之間、變形與因子之間以及多測(cè)點(diǎn)變形數(shù)列之間的關(guān)聯(lián)性在大壩變形動(dòng)態(tài)建模中的應(yīng)用展開研究。
大壩變形監(jiān)控模型是多維復(fù)雜關(guān)聯(lián)性以數(shù)學(xué)形式表達(dá)的集成載體。目前,國(guó)內(nèi)外常用的數(shù)學(xué)建模方法主要包括數(shù)理統(tǒng)計(jì)法、時(shí)序分析法和因果建模法等[11-12]。因果建模法由于適合處理復(fù)雜輸入-輸出關(guān)系且能夠整合多元監(jiān)測(cè)信息,現(xiàn)已成為應(yīng)用最廣泛的大壩變形數(shù)學(xué)建模方法。該方法一般根據(jù)歷史監(jiān)測(cè)資料找出響應(yīng)變量與其解釋變量之間的因果關(guān)系來(lái)建立相應(yīng)的數(shù)學(xué)模型,然后通過(guò)求解對(duì)效應(yīng)量作出估計(jì)[13-14]。例如,張豪等[15]根據(jù)各因子的特性,利用經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)(sup?port vector machine,SVM)構(gòu)建出多尺度大壩變形監(jiān)控模型。Kang等[16]提出了一種基于極限學(xué)習(xí)機(jī)的混凝土壩變形監(jiān)控模型,并通過(guò)實(shí)例證明了該模型的有效性。Su等[17]采用相空間重構(gòu)、改進(jìn)粒子群優(yōu)化小波支持向量機(jī)等算法建立了大壩變形組合預(yù)報(bào)模型,并將其應(yīng)用于實(shí)際工程??偠灾?,大壩變形與環(huán)境因子間的因果關(guān)系是構(gòu)建上述模型的基礎(chǔ)。然而,多數(shù)因果模型賦予不同因子的輸入權(quán)重幾乎一致[18],實(shí)則各因子對(duì)于大壩變形的影響程度是不同的,并且會(huì)隨著時(shí)間的推移而不斷變化。Dai等[19]借助統(tǒng)計(jì)模型優(yōu)化隨機(jī)森林的方法證實(shí)了這一觀點(diǎn),但其仍著重于靜態(tài)差別,而未顧及到因果關(guān)系的動(dòng)態(tài)演化過(guò)程。
大壩變形數(shù)學(xué)建模僅考慮動(dòng)態(tài)因果關(guān)系是不夠的。因子相關(guān)性會(huì)對(duì)模型的準(zhǔn)確性和穩(wěn)定性產(chǎn)生影響,特別是統(tǒng)計(jì)模型[20]。盡管運(yùn)用簡(jiǎn)單剔除[21](如逐步回歸)、合并降維[22](如主成分分析)等方法可以減小其影響,但仍未從根本上解決該問(wèn)題。從模型角度考慮,以SVM 為代表的非線性模型(如隨機(jī)森林等)不易受因子相關(guān)性的影響[23],進(jìn)一步體現(xiàn)出非線性因果建模的優(yōu)越性。此外,監(jiān)測(cè)信息利用不充分,比如忽略多測(cè)點(diǎn)變形數(shù)列之間的相似性,會(huì)導(dǎo)致多測(cè)點(diǎn)監(jiān)控模型的泛化能力不足。文獻(xiàn)調(diào)研發(fā)現(xiàn),目前國(guó)內(nèi)外有關(guān)多測(cè)點(diǎn)變形數(shù)列相似性的研究相對(duì)較少,已有研究多集中于插值填補(bǔ)[24]、異常檢測(cè)[25]等方面,這足以說(shuō)明直接將序列相似性應(yīng)用于數(shù)學(xué)建模尚未引起學(xué)術(shù)界的廣泛關(guān)注。于是,本文將因子相關(guān)性和序列相似性納入到大壩變形動(dòng)態(tài)監(jiān)控模型之中。
綜上,本文擬開展綜合考慮動(dòng)態(tài)因果關(guān)系、因子相關(guān)性以及序列相似性等多維關(guān)聯(lián)性影響下的大壩變形動(dòng)態(tài)建模及應(yīng)用研究,其主要包括以下幾個(gè)方面的內(nèi)容:(1)傳統(tǒng)因果建模中,各環(huán)境因子與大壩變形間的因果關(guān)系多用靜態(tài)線性相關(guān)系數(shù)來(lái)量化,難以體現(xiàn)兩者間的動(dòng)態(tài)非線性演化過(guò)程。為真實(shí)反映因果關(guān)系,特提出一種動(dòng)態(tài)非線性因果關(guān)系檢驗(yàn)方法(dynamic nonlinear causality test,DNCT);(2)針對(duì)如何衡量多測(cè)點(diǎn)變形數(shù)列間的相似性以及如何將其應(yīng)用于大壩變形數(shù)學(xué)建模等問(wèn)題,分別提出標(biāo)準(zhǔn)化動(dòng)態(tài)時(shí)間規(guī)整算法(normalized dynamic time warping,NDTW)和交叉多輸出模型改進(jìn)措施;(3)為驗(yàn)證考慮因子相關(guān)性的必要性,引入一種耦合方差擴(kuò)大因子(variance inflation fac?tor,VIF)和條件數(shù)(condition index,CI)的相關(guān)性診斷方法(VIF and CI-based coupling collinearity test,VCCT);(4)結(jié)合工程實(shí)例,就如何將上述復(fù)雜關(guān)聯(lián)性集成于同一大壩變形數(shù)學(xué)模型中這一難題,總結(jié)提出一種兼顧相關(guān)性和相似性的大壩變形動(dòng)態(tài)監(jiān)控模型(causal model combining correlation with similarity,CMCS),并將其與傳統(tǒng)常用模型進(jìn)行對(duì)比。
根據(jù)環(huán)境因子及多測(cè)點(diǎn)變形數(shù)列等監(jiān)控資料,在充分考慮動(dòng)態(tài)因果關(guān)系、因子相關(guān)性以及序列相似性等多維關(guān)聯(lián)性影響的前提下構(gòu)建大壩變形動(dòng)態(tài)監(jiān)控模型(CMCS),并將該模型應(yīng)用于實(shí)際工程,研究框架如圖1所示。
(1)在維度層面上,建立因子集是探討多維復(fù)雜關(guān)聯(lián)性的基礎(chǔ),遂以壩工理論和數(shù)理統(tǒng)計(jì)方法為依據(jù)對(duì)環(huán)境因子進(jìn)行合理篩選。
(2)在關(guān)聯(lián)層面上,將多維關(guān)聯(lián)性細(xì)分為動(dòng)態(tài)因果關(guān)系、因子相關(guān)性以及序列相似性等3 個(gè)維度,從而降低數(shù)學(xué)建模的復(fù)雜度。
(3)在檢驗(yàn)層面上,為全面驗(yàn)證考慮多維復(fù)雜關(guān)聯(lián)性的必要性,從上述3個(gè)維度出發(fā)提出對(duì)應(yīng)關(guān)聯(lián)性的檢驗(yàn)方法。
(4)在措施層面上,本文著重研究3種關(guān)聯(lián)性并存的最復(fù)雜情況,為此分別提出相應(yīng)的數(shù)學(xué)建模方法。
圖1 大壩變形動(dòng)態(tài)監(jiān)控模型總體框架
(5)在模型層面上,將多種建模方法集成在同一模型中,隨即得到考慮相關(guān)性和相似性的大壩變形動(dòng)態(tài)監(jiān)控模型。
(6)以某混凝土重力壩為例,先構(gòu)建各壩段的變形監(jiān)測(cè)數(shù)據(jù)庫(kù),后將所提模型應(yīng)用于該項(xiàng)工程,并通過(guò)對(duì)比分析來(lái)驗(yàn)證所提模型的有效性和準(zhǔn)確性。
3.1 多因子相關(guān)性大壩變形除受庫(kù)水壓力(水壓)影響外,還受到溫度、滲流以及時(shí)效等因素的影響,其中水壓由上游來(lái)水量、庫(kù)水位、庫(kù)水比重等因素確定,溫度由季節(jié)變化、氣象條件等因素確定,上述因子影響層級(jí)呈現(xiàn)樹狀結(jié)構(gòu)[26]。鑒于此,從眾多影響因子中提煉出少量能夠反映大壩變形信息的因子就成為大壩變形數(shù)學(xué)建模的關(guān)鍵。目前發(fā)展較成熟且應(yīng)用較多的變形監(jiān)控模型主要有統(tǒng)計(jì)模型和確定性模型。與確定性模型相比,統(tǒng)計(jì)模型擬合精度較高,盡管沒(méi)有考慮大壩及壩基的物理特性,但已囊括大部分環(huán)境和結(jié)構(gòu)信息,因而可據(jù)其建立因子集。具體來(lái)說(shuō),大壩變形δ按其成因可分為水壓分量δH、溫度分量δT和時(shí)效分量δθ,僅有氣溫資料時(shí),變形統(tǒng)計(jì)模型[3]可表示為:
式中:a0為常數(shù)項(xiàng);H 為上游水深;n為壩型系數(shù),對(duì)于不同壩型,n 取值不同,其中重力壩一般取3,拱壩宜取4或5;i 為周期,對(duì)于年周期i=1,對(duì)于半年周期i=2;t 為監(jiān)測(cè)日到基準(zhǔn)日的累計(jì)監(jiān)測(cè)天數(shù),其中θ=t 100;m 通常取1或2;ai、b1i、b2i、c1和c2均為未知系數(shù)。
式中:VIFi為自變量xi的方差擴(kuò)大因子;CIj為特征根λj的條件數(shù);Ri2為自變量xi對(duì)其余p-1個(gè)自變量的復(fù)決定系數(shù); λm為矩陣XTX 的最大特征根[27],X 為自變量構(gòu)成的矩陣。通常,當(dāng)VIFi≥10 且CIj≥100 時(shí),認(rèn)為各因子間存在較為嚴(yán)重的相關(guān)性。
一般統(tǒng)計(jì)模型不適合處理因子相關(guān)性問(wèn)題。此外,構(gòu)建統(tǒng)計(jì)模型需要大量監(jiān)測(cè)數(shù)據(jù),其預(yù)測(cè)效果亦不理想。機(jī)器學(xué)習(xí)建模方法現(xiàn)已成功應(yīng)用于大壩變形性態(tài)分析,尤以神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)為甚。其中,SVM在解決小樣本、非線性及高維數(shù)問(wèn)題中表現(xiàn)突出,并且不易受到因子相關(guān)性的影響,因而本文將基于SVM進(jìn)行大壩變形動(dòng)態(tài)建模。SVM模型基本原理和具體計(jì)算方法詳見文獻(xiàn)[28]。
3.2 動(dòng)態(tài)因果關(guān)系作為一種輸入-輸出模型,SVM 常用來(lái)反映環(huán)境因子與大壩變形間的因果關(guān)系,但其在應(yīng)用中仍存在固有問(wèn)題,即模型對(duì)各個(gè)歸一化輸入因子的精度要求以及偏離精度要求的懲罰是一視同仁的[29]。實(shí)際上,不同環(huán)境因子對(duì)變形產(chǎn)生的影響往往有所不同,故需將這種“區(qū)別對(duì)待”引入模型中。諸多學(xué)者對(duì)此開展了廣泛研究,其中利用靜態(tài)線性相關(guān)系數(shù)(如Pearson 相關(guān)系數(shù)[30]、統(tǒng)計(jì)模型回歸系數(shù)[19]等)對(duì)不同因子分別進(jìn)行加權(quán)處理是最常用的方法。該方法在一定程度上解決了這一問(wèn)題,但用一定值量化因子與變形間的長(zhǎng)期因果關(guān)系顯然是不合理的。大壩服役性態(tài)并非是一成不變的,水位、氣溫等環(huán)境因子在其運(yùn)行中也是不斷改變的,據(jù)此斷定因子與變形間的因果關(guān)系始終處于動(dòng)態(tài)變化中,且屬于非線性關(guān)聯(lián)。因此,有必要采用一種動(dòng)態(tài)非線性方法對(duì)模型輸入進(jìn)行適當(dāng)修正。
滾動(dòng)時(shí)間窗口算法[31](rolling time window,RTW)是一種動(dòng)態(tài)序列分析技術(shù),可直接反映因子對(duì)變形所施加作用的動(dòng)態(tài)特性。最大信息系數(shù)[32](maximal information coefficient,MIC)不僅可以度量?jī)勺兞块g的線性和非線性關(guān)系,還可以探索兩者潛在關(guān)聯(lián)性,如函數(shù)疊加等。為此,整合RTW和MIC提出一種動(dòng)態(tài)非線性因果關(guān)系檢驗(yàn)方法(DNCT),進(jìn)而實(shí)現(xiàn)對(duì)SVM模型的動(dòng)態(tài)輸入修正?,F(xiàn)給定因子集{A1,A2,…,Am,…,AM}和多測(cè)點(diǎn)變形數(shù)列集合{B1,B2,…,Bn,…,BN},分別選定因子和變形數(shù)列作為初始解釋變量和響應(yīng)變量,那么DNCT具體實(shí)現(xiàn)過(guò)程如下:
(1)步驟1。全部輸入因子Am(m=1,2,…,M )均作同維規(guī)范化處理,以消除各個(gè)因子量級(jí)不同所帶來(lái)的影響[33]。此外,從A1、B1開始,根據(jù)監(jiān)測(cè)數(shù)據(jù)量k 分別設(shè)置其滾動(dòng)窗口大小為ωAm和ωBn(ω=ωAm=ωBn)。
(2)步驟2。在同一時(shí)間窗口內(nèi),給定有序?qū)M成的有限集合對(duì)Am、Bn構(gòu)成的散點(diǎn)圖中不同區(qū)域G進(jìn)行x列y行網(wǎng)格化(允許某些網(wǎng)格為空集),并通過(guò)概率質(zhì)量函數(shù)D|G 求出所有網(wǎng)格G在D上的最大互信息值MI*(D,x,y ),即:
(3)步驟3。對(duì)集合D上不同網(wǎng)格G的所有最大互信息值進(jìn)行歸一化,得到特征矩陣M( D )x,y:
(4)步驟4。通過(guò)窮舉搜索獲取特征矩陣中的最大歸一化互信息值,也就是最大信息系數(shù)MIC( D ),0 ≤MIC( D )≤1。值得一提的是, MIC( D )不受解釋變量(即Am,m=1,2,…,M )間顯式函數(shù)關(guān)系的影響。
(5)步驟5。利用嵌套循環(huán)計(jì)算全部環(huán)境因子Am(m=1,2,…,M )與多測(cè)點(diǎn)變形數(shù)列Bn(n=1,2,…,N )的動(dòng)態(tài)最大信息系數(shù)DMICim×n(i=1,2,…,k ),其中循環(huán)次數(shù)C 由因子數(shù)量M和測(cè)點(diǎn)個(gè)數(shù)N確定。
(6)步驟6。將因子序列中各個(gè)時(shí)間點(diǎn)的監(jiān)測(cè)量(或派生量)aim乘以對(duì)應(yīng)動(dòng)態(tài)最大信息系數(shù)以獲得動(dòng)態(tài)修正后的輸入因子集{A′m,m=1,2,…,M }。
3.3 多測(cè)點(diǎn)相似性多測(cè)點(diǎn)變形數(shù)列間的相似性目前在大壩變形建模中的應(yīng)用相對(duì)較少,本文將對(duì)此進(jìn)行初步探討。一方面,不同于動(dòng)態(tài)因果關(guān)系,序列相似性一般較為穩(wěn)定,故可用一定值來(lái)量化。另一方面,僅用定值表示變形數(shù)列相似性,并將其與SVM相銜接,顯然未考慮多測(cè)點(diǎn)變形數(shù)列間的交叉(即一對(duì)多)關(guān)系。為此,分別提出標(biāo)準(zhǔn)化動(dòng)態(tài)時(shí)間規(guī)整算法(NDTW)和交叉多輸出改進(jìn)措施。動(dòng)態(tài)時(shí)間規(guī)整算法[34](DTW)是一種衡量時(shí)間序列相似度的經(jīng)典方法,常用于語(yǔ)音識(shí)別、手勢(shì)辨認(rèn)和信息檢索等領(lǐng)域。然而,在利用DTW 度量變形數(shù)列相似性時(shí),尺度不一(如某測(cè)點(diǎn)變形δ <10 mm ,而另一測(cè)點(diǎn)變形δ′>20 mm)致使難以對(duì)度量結(jié)果進(jìn)行橫向比較,遂先利用標(biāo)準(zhǔn)化將各因子數(shù)值限定于既定范圍(0,1),后采用DTW度量其相似性,其求解步驟詳見文獻(xiàn)[5]。另外,鑒于序列相似性存在交叉關(guān)系,多測(cè)點(diǎn)變形數(shù)列必須同時(shí)進(jìn)行外推預(yù)測(cè)方能顧及響應(yīng)變量間的關(guān)聯(lián)性,特將SVM由獨(dú)立單輸出改進(jìn)為交叉多輸出模式,主要改進(jìn)如下所述。
本文引入一種分層貝葉斯方法[35-36],將多測(cè)點(diǎn)變形數(shù)列間的交叉相似性集成于常規(guī)SVM中,以改善因子集A ∈?M到多測(cè)點(diǎn)變形量B ∈ ?N的映射關(guān)系。與常規(guī)SVM 相仿,通過(guò)求解權(quán)函數(shù)和偏差向量即可完成數(shù)學(xué)建?!,F(xiàn)假設(shè)wi=w0+vi,wi∈ ?nh,i ∈ ?N,其中vi∈ ?nh承載“相似信息”,序列相似性愈高,vi值愈??;反之,則承載“共性信息”的平均向量w0∈ ?nh值愈小。據(jù)此,最小化下列帶有約束條件的目標(biāo)函數(shù),如式(6)所示,以同時(shí)解得w0、b 和
式中:Ξ 為松弛變量;Z 為將輸入因子集A ∈?M映射到nh維希爾伯特空間(即特征空間)的函數(shù);W=(w0+v1,w0+v2,…,w0+vN)∈?nh×N;γ、λ ∈?+均為正則化參數(shù)。
通過(guò)構(gòu)造拉格朗日函數(shù),結(jié)合Karush-Kuhn-Tucher 條件,簡(jiǎn)化得到下列等價(jià)優(yōu)化問(wèn)題,其約束條件僅涉及V 和b :
式中:IN=[1,1,…,1]T∈?N。
通過(guò)引入核函數(shù)(滿足Mercer 定理)、消除W 和Ξ 得到線性方程組[37],并設(shè)方程組解為和b*,最終獲得多輸出模式下的決策函數(shù)f ( x ):
式中:κ(x,xj)表示核函數(shù)。
基于上述動(dòng)態(tài)建模方法,以某混凝土壩工程多測(cè)點(diǎn)變形監(jiān)測(cè)數(shù)據(jù)為例,對(duì)CMCS模型進(jìn)行有效性和準(zhǔn)確性驗(yàn)證,旨在通過(guò)此實(shí)例說(shuō)明CMCS在大壩變形建模方面的優(yōu)越性。西南地區(qū)某水利樞紐主要由攔河大壩、右岸地下廠房及左岸壩后廠房、通航建筑物和兩岸灌溉取水口組成,其控制流域面積為45.88萬(wàn)km2,總裝機(jī)容量達(dá)775萬(wàn)kW,具有發(fā)電、防洪、灌溉和攔沙等綜合效益。其中,攔河大壩壩頂高程384 m,最大壩高162 m,壩頂全長(zhǎng)909.26 m,壩型為混凝土重力壩?,F(xiàn)采用該壩某一壩段不同高程的垂線測(cè)點(diǎn)PL6Y(高程243 m)、PL6-1Y(高程260 m)、PL6-2Y(高程282 m)、PL6-3Y(高程322 m)以及PL6-4Y(高程350 m)方向變形監(jiān)測(cè)數(shù)據(jù)(Y 方向表示與壩軸線垂直的方向),變形監(jiān)測(cè)時(shí)段為2013 年10 月4 日—2017 年7 月9 日,共計(jì)5×230 個(gè)實(shí)測(cè)變形數(shù)據(jù)。利用三次Hermite 插值方法[38]對(duì)所選測(cè)點(diǎn)的變形原型觀測(cè)數(shù)據(jù)進(jìn)行均勻化處理,得到平均每周一次數(shù)據(jù)采集的插值結(jié)果(即步長(zhǎng)以周(w)為單位),將其與環(huán)境量(如上游水位、氣溫等)監(jiān)測(cè)數(shù)據(jù)匯總于圖2中,以此為模型驗(yàn)證提供必要條件。
4.1 復(fù)雜關(guān)聯(lián)性檢驗(yàn)CMCS模型主要針對(duì)3種關(guān)聯(lián)性并存的最復(fù)雜情況進(jìn)行分析,故復(fù)雜關(guān)聯(lián)性檢驗(yàn)是該模型應(yīng)用的先決條件。為驗(yàn)證考慮多維復(fù)雜關(guān)聯(lián)性的必要性,利用耦合相關(guān)性診斷方法、動(dòng)態(tài)最大信息系數(shù)和標(biāo)準(zhǔn)化動(dòng)態(tài)時(shí)間規(guī)整算法分別檢驗(yàn)大壩原型觀測(cè)數(shù)據(jù)中的因子相關(guān)性、動(dòng)態(tài)因果關(guān)系和序列相似性。
圖2 上游水位、氣溫及變形監(jiān)測(cè)數(shù)據(jù)
4.1.1 因子相關(guān)性檢驗(yàn) 根據(jù)式(2)計(jì)算得到的因子相關(guān)性耦合診斷結(jié)果見表1。采用特征根判定法[27]得到最大條件數(shù)為223.83 >100,顯示因子間存在較為嚴(yán)重的相關(guān)關(guān)系。因子H、H2、θ和lnθ所對(duì)應(yīng)的VIF值均大于10,進(jìn)一步說(shuō)明因子相關(guān)性主要由上述4個(gè)解釋變量所引起。經(jīng)驗(yàn)證,H和H2、θ和lnθ的簡(jiǎn)單相關(guān)系數(shù)分別為0.99和0.98,呈現(xiàn)高度相關(guān)。此外,根據(jù)計(jì)算CI所得方差比例表[27],判定強(qiáng)相關(guān)因子組合有{H,H2,H3} 和{θ,lnθ },在表1中分別用“○”和“△”兩種符號(hào)表示。與VIF僅判定H和H2為強(qiáng)相關(guān)因子有所不同,CI計(jì)算結(jié)果斷定H3同為強(qiáng)相關(guān)因子,通過(guò)計(jì)算得知H和H3、H2和H3的簡(jiǎn)單相關(guān)系數(shù)均為0.99,最終證實(shí)H3確實(shí)參與導(dǎo)致因子相關(guān)性。綜上,所選多測(cè)點(diǎn)變形監(jiān)測(cè)數(shù)據(jù)中存在嚴(yán)重因子相關(guān)性,同時(shí)說(shuō)明耦合VIF與CI能有效提高因子相關(guān)性的診斷率。
表1 因子相關(guān)性耦合診斷結(jié)果
4.1.2 動(dòng)態(tài)因果關(guān)系檢驗(yàn) 不同環(huán)境因子與多測(cè)點(diǎn)變形數(shù)列間的動(dòng)態(tài)因果關(guān)系度量結(jié)果如圖3 所示(由于DMIC不受解釋變量間顯式函數(shù)關(guān)系的影響,特將H、H2、H3和θ、lnθ作統(tǒng)一展示)。DMIC值越大,表示因果關(guān)系越顯著。從圖3中得知:(1)水位因子H、H2和H3與5個(gè)測(cè)點(diǎn)變形數(shù)列的動(dòng)態(tài)演化過(guò)程基本一致。圖形整體波動(dòng)較大,多數(shù)DMIC值小于0.5,說(shuō)明水位對(duì)變形的影響相對(duì)較小,且持續(xù)時(shí)間較短。(2)溫度因子sin(2πt/365)、cos(2πt/365)、sin(4πt/365)和cos(4πt/365)與各測(cè)點(diǎn)變形數(shù)列的動(dòng)態(tài)演化過(guò)程存在差異,但總體上PL6Y 和PL6-1Y、PL6-3Y 和PL6-4Y 演化過(guò)程較為接近,說(shuō)明不同高程下溫度對(duì)變形的影響雖有不同,卻有規(guī)律可循。與圖3(a)相比,圖形整體波動(dòng)減小,DMIC值增大,表明溫度對(duì)變形的影響相對(duì)較大,且具有一定持續(xù)性。(3)時(shí)效因子θ、lnθ與各測(cè)點(diǎn)變形數(shù)列的動(dòng)態(tài)演化過(guò)程差異顯著,表示不同高程下時(shí)效對(duì)變形的影響明顯不同。圖3(f)中,圖形整體波動(dòng)進(jìn)一步減小,DMIC值大多維持在0.75以上,尤以PL6-3Y和PL6-4Y演化過(guò)程為甚,說(shuō)明時(shí)效對(duì)變形的影響持續(xù)顯著。較之于上述動(dòng)態(tài)演化過(guò)程,靜態(tài)因果關(guān)系MIC度量結(jié)果(見表2)僅能表明不同高程下時(shí)效因子θ 和lnθ 對(duì)變形的影響較大。由此可見,通過(guò)度量動(dòng)態(tài)因果關(guān)系能夠提高環(huán)境量、變形等監(jiān)測(cè)數(shù)據(jù)的潛在信息利用率。
圖3 不同環(huán)境因子與多測(cè)點(diǎn)變形數(shù)列間的動(dòng)態(tài)因果關(guān)系度量結(jié)果
表2 靜態(tài)因果關(guān)系MIC度量結(jié)果
4.1.3 序列相似性檢驗(yàn) 多測(cè)點(diǎn)變形數(shù)列相似性度量結(jié)果如圖4所示。NDTW值越小,表示兩變形數(shù)列間相似性越高。由圖4可知,PL6-3Y和PL6-4Y相似度最大,隨后是PL6-2Y和PL6-3Y,其余數(shù)列對(duì)NDTW值均介于10到20之間。簡(jiǎn)言之,5個(gè)測(cè)點(diǎn)變形數(shù)列中PL6-2Y、PL6-3Y和PL6-4Y三者較為相似,表明同一壩段不同高程的垂線測(cè)點(diǎn)變形數(shù)列存在明顯交叉相似性。
圖4 多測(cè)點(diǎn)變形數(shù)列相似性度量結(jié)果
4.2 CMCS模型應(yīng)用由4.1可知,所選多測(cè)點(diǎn)變形監(jiān)測(cè)數(shù)據(jù)中存在因子相關(guān)性和序列相似性,故采用CMCS模型對(duì)其進(jìn)行大壩變形動(dòng)態(tài)建模分析。根據(jù)3.1節(jié)統(tǒng)計(jì)理論推導(dǎo),模型輸入因子集統(tǒng)一確定為{H , H2, H3,sin(2πt 365),cos(2πt 365),sin(4πt 365),cos(4πt 365),θ ,}lnθ ,結(jié)合3.2節(jié)DNCT方法和4.1.2節(jié)動(dòng)態(tài)因果關(guān)系度量結(jié)果,得到動(dòng)態(tài)修正后的輸入因子集分別為{DMIC1хnH,cos(4πt 365),DMIC8×nθ,DMIC9×nlnθ },n=1,2,…,5,對(duì)應(yīng)模型輸出則為PL6Y、PL6-1Y、PL6-2Y、PL6-3Y以及PL6-4Y等5個(gè)測(cè)點(diǎn)的變形量。為驗(yàn)證CMCS模型的可行性和有效性,本文變形預(yù)測(cè)仿真實(shí)驗(yàn)設(shè)定實(shí)測(cè)步長(zhǎng)為200w(2013年10月4日—2017年1月10日,數(shù)據(jù)示于圖2中豎線以左)、預(yù)測(cè)步長(zhǎng)為30w(2017年1月16日—2017年7月9日,數(shù)據(jù)示于圖2中豎線以右),模型應(yīng)用步驟簡(jiǎn)述如下:(1)輸入因子集歸一化處理;(2)選取徑向基函數(shù)(radial basis function,RBF)作為核函數(shù),即初始化模型參數(shù)(γ,λ,p ),其中p 為正則化常數(shù);(3)采用網(wǎng)格搜索和10折交叉驗(yàn)證擬合實(shí)測(cè)期數(shù)據(jù)以尋求最優(yōu)參數(shù)組合并求解超參數(shù)α 和b ;(4)以交叉多輸出模式為基礎(chǔ),利用預(yù)測(cè)期數(shù)據(jù)測(cè)試CMCS模型的多測(cè)點(diǎn)變形預(yù)報(bào)性能。
在大壩變形建模研究中,均方根誤差(root mean squared error,RMSE)、平均絕對(duì)誤差(mean ab?solute error,MAE)、平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)和最大誤差(maxi?mum error,ME)是評(píng)價(jià)大壩變形監(jiān)控模型性能較為常用的4項(xiàng)統(tǒng)計(jì)指標(biāo)[38-40]。
圖5 多模型在不同測(cè)點(diǎn)變形預(yù)測(cè)中的性能對(duì)比結(jié)果
4.3 多模型性能評(píng)估為凸顯CMCS模型的優(yōu)勢(shì),現(xiàn)將其與同樣基于SVM構(gòu)建的時(shí)間序列模型(time series model,TSM)、常規(guī)因果模型(conventional causal model,CCM)進(jìn)行性能對(duì)比,以上模型在5個(gè)測(cè)點(diǎn)變形預(yù)測(cè)中的性能對(duì)比結(jié)果如圖5所示。從圖5可以看出:(1)TSM模型對(duì)15w內(nèi)的整體趨勢(shì)把握較準(zhǔn),15w外其預(yù)測(cè)趨勢(shì)出現(xiàn)較大偏離。該模型預(yù)測(cè)變形曲線較為平滑,故其難以預(yù)測(cè)局部波動(dòng)。(2)相比于TSM模型,CCM模型變形預(yù)測(cè)值與實(shí)測(cè)值波動(dòng)匹配度更高,但仍有部分時(shí)間段偏差較大。該模型預(yù)測(cè)變形曲線起伏較大,說(shuō)明其對(duì)環(huán)境因子變化較為敏感。(3)三者中,CMCS模型在整體趨勢(shì)外推、局部波動(dòng)擬合等方面的性能均比TSM、CCM模型優(yōu)越,可見融合多維復(fù)雜關(guān)聯(lián)性對(duì)于大壩變形監(jiān)控模型性能的改善起到一定作用。上述三種模型在不同測(cè)點(diǎn)變形預(yù)測(cè)中的性能量化評(píng)估結(jié)果(詳見表3 和表4)亦能證明這一觀點(diǎn)。就本文所選變形監(jiān)測(cè)數(shù)據(jù),各模型對(duì)高程300 m 以下PL6Y、PL6-1Y和PL6-2Y三測(cè)點(diǎn)變形預(yù)測(cè)效果按照統(tǒng)計(jì)指標(biāo)(見表3)從優(yōu)到劣排序?yàn)镃MCS>TSM>CCM,而對(duì)高程300 m 以上PL6-3Y 和PL6-4Y 兩測(cè)點(diǎn)變形預(yù)測(cè)效果按照統(tǒng)計(jì)指標(biāo)(見表4)從優(yōu)到劣排序?yàn)镃MCS>CCM>TSM。總體而言,考慮動(dòng)態(tài)因果關(guān)系和序列相似性的CMCS模型對(duì)該壩段多測(cè)點(diǎn)變形監(jiān)測(cè)數(shù)據(jù)的適應(yīng)性尤佳。
表3 多模型在測(cè)點(diǎn)PL6Y、PL6-1Y和PL6-2Y方向變形預(yù)測(cè)中的性能量化評(píng)估結(jié)果
表4 多模型在測(cè)點(diǎn)PL6-3Y和PL6-4Y方向變形預(yù)測(cè)中的性能量化評(píng)估結(jié)果
本文提出一種兼顧相關(guān)性和相似性的大壩變形動(dòng)態(tài)監(jiān)控模型,其采用多種關(guān)聯(lián)性量化和數(shù)學(xué)建模方法將因子相關(guān)性、動(dòng)態(tài)因果關(guān)系和序列相似性集成于同一建??蚣苤校饶艽龠M(jìn)模型的一體化構(gòu)建,又能實(shí)現(xiàn)對(duì)大壩變形監(jiān)測(cè)數(shù)據(jù)的準(zhǔn)確分析。基于所提出的動(dòng)態(tài)建模方法,結(jié)合某混凝土壩工程多測(cè)點(diǎn)變形監(jiān)測(cè)數(shù)據(jù)進(jìn)行多模型性能對(duì)比仿真實(shí)驗(yàn),結(jié)果表明該模型在變形預(yù)報(bào)方面優(yōu)勢(shì)明顯,主要表現(xiàn)為:(1)內(nèi)置多維復(fù)雜關(guān)聯(lián)性檢驗(yàn)方法,可通過(guò)量化關(guān)聯(lián)性來(lái)靈活調(diào)整大壩變形動(dòng)態(tài)建模的流程;(2)采用動(dòng)態(tài)最大信息系數(shù)真實(shí)還原環(huán)境因子與大壩變形間的演化過(guò)程,以實(shí)現(xiàn)對(duì)輸入因子的動(dòng)態(tài)非線性修正;(3)將多測(cè)點(diǎn)變形數(shù)列間的相似性融入大壩變形監(jiān)控模型,增加信息維度的同時(shí),還能完成多測(cè)點(diǎn)變形預(yù)報(bào);(4)根據(jù)多測(cè)點(diǎn)變形特性差異,通過(guò)網(wǎng)格搜索賦予模型以參數(shù)尋優(yōu)能力,從而完成指向性模型的建立;(5)充分考慮多維復(fù)雜關(guān)聯(lián)性,使大壩變形監(jiān)控模型的預(yù)測(cè)性能得以改善。
鑒于大壩變形動(dòng)態(tài)監(jiān)控模型能夠集成解釋變量、響應(yīng)變量以及兩者間的多種關(guān)聯(lián)性,更適合應(yīng)用于各壩段多測(cè)點(diǎn)變形監(jiān)測(cè)數(shù)據(jù)的有效預(yù)報(bào)??紤]到該模型僅融合了三種關(guān)聯(lián)性,仍有部分隱含信息未被顧及,故后續(xù)將重點(diǎn)研究大壩變形與多因子耦聯(lián)系統(tǒng)的演化規(guī)律,并將所得有效信息納入到模型中。