魏迎奇,張 申
(中國(guó)水利水電科學(xué)研究院 巖土工程研究所,北京 100048)
目前,對(duì)大壩滲流資料的統(tǒng)計(jì)回歸分析中,通常采用普通多元回歸分析法,利用該方法進(jìn)行建模的前提條件是自變量因子之間不存在多重相關(guān)性,而大壩滲流過程的滯后效應(yīng)使得自變量間存在共線性的現(xiàn)象,如果強(qiáng)制運(yùn)用該方法進(jìn)行回歸建模,將會(huì)破壞參數(shù)的估計(jì),擴(kuò)大模型誤差,無法對(duì)研究對(duì)象做出合理有效的預(yù)測(cè)。另外,采用普通多元回歸分析法時(shí),需要的樣本數(shù)較多,有時(shí)這在工程實(shí)際中是很難實(shí)現(xiàn)的。鑒于此,采用偏最小二乘法對(duì)滲流變量進(jìn)行回歸建模,解決了變量間共線,樣本少等諸多問題,進(jìn)而可對(duì)大壩的運(yùn)行狀態(tài)做出合理的預(yù)測(cè)和評(píng)價(jià)。
1.1 建模方法偏最小二乘回歸分別在自變量X和因變量Y中提取成分t1和u1,二者必須盡可能多地?cái)y帶它們各自數(shù)據(jù)表中的變異信息,且相關(guān)程度能夠達(dá)到最大[1]。在第一成分t1和u1被提取后,偏最小二乘回歸分別實(shí)施X對(duì)t1的回歸以及Y對(duì)u1的回歸。如果回歸方程已經(jīng)達(dá)到滿意的精度,則算法終止;否則,將利用X被t1解釋后的殘余信息進(jìn)行第二輪的成分提取。如此往復(fù),直到能達(dá)到一個(gè)較滿意的精度為止。
1.2 模型因子的選擇大壩滲流主要受上下游水位差、水位升降速率及降雨量等因素的影響。另外,筑壩材料在庫(kù)區(qū)蓄水過程中,土體結(jié)構(gòu)在滲流過程中發(fā)生相應(yīng)變化,這使得大壩滲流具有時(shí)效性的特點(diǎn)。因此,壩體滲流與水頭和時(shí)效因素等息息相關(guān)。由于這些分量相互獨(dú)立,無交互作用,按各因素對(duì)滲流水頭的作用形式,其分析模型可表達(dá)如下[2-3]:
式中:
式(2)中涉及的待估系數(shù)a(ii=1,2,3)可以通過式(5)求得:
式中:r為相關(guān)系數(shù);m為提取主成分的個(gè)數(shù);
同理,可求出待估系數(shù)b(ii=1,2,…,6)、c(ii=1,2,…,6)、d(ii=1,2)。
利用式(1)求得的滲流水頭來測(cè)算大壩的滲漏量,即:
式中:h為滲流水頭,m;a、b為待估參數(shù),可由觀測(cè)庫(kù)水位和滲漏量求出。
2.1 精度分析在偏最小二乘回歸計(jì)算過程中,測(cè)量th對(duì)X和Y的解釋能力做如下定義[4]:
(1)th對(duì)某自變量xj的解釋能力為
式中:r為相關(guān)系數(shù)。
(2)th對(duì)X的解釋能力為
式中:p為自變量個(gè)數(shù)。
(3)th對(duì)Y的解釋能力為
式中:q為因變量個(gè)數(shù)。
2.2 自變量xj在解釋因變量集合Y時(shí)的作用分析自變量X與因變量Y之間的關(guān)系時(shí),引入變量投影重要性指標(biāo)(VIP)來測(cè)度二者的關(guān)系。
式中:p為自變量個(gè)數(shù);ωhj為軸ωh的第j分量。
通過計(jì)算不同的VIP值可以定性地分析自變量X對(duì)因變量Y的影響作用。
2.3 T2橢圓圖與特異點(diǎn)的發(fā)現(xiàn)樣本中的奇異點(diǎn)就是在95%的檢驗(yàn)水平上,樣本點(diǎn)i對(duì)成分t1,t2,…,tm的貢獻(xiàn)過大,超出了樣本總體的平均水平。當(dāng)提取成分個(gè)數(shù)為2時(shí),則有:
在t1/t2平面圖上做出T2橢圓圖后,若所有的樣本點(diǎn)都落在橢圓區(qū)內(nèi),則認(rèn)為所有樣本點(diǎn)的分布是均勻的;否則,認(rèn)為落在橢圓區(qū)外的樣本點(diǎn)為奇異點(diǎn)。
根據(jù)吉林臺(tái)面板堆石壩工程滲漏實(shí)測(cè)資料[5],首先計(jì)算出水頭H、H2、H3、H5(ii=1,2,…,6)、及θ。θ從測(cè)算日起取零,以后每天遞增0.01。為方便計(jì)算說明,令:x1=H,x2=H2,…,x17=ln(1 +θ)。
從變量因子間的相關(guān)系數(shù)中可以看出,大壩滲流統(tǒng)計(jì)模型中所選的水位因子和時(shí)效因子之間存在很強(qiáng)的相關(guān)性,采用偏最小二乘回歸方法進(jìn)行建模,它能夠較好地解決這一問題。
3.1 模型計(jì)算通過對(duì)該大壩滲流資料的計(jì)算分析,建立偏最小二乘回歸統(tǒng)計(jì)模型如下:
從能量觀點(diǎn)看,滲流邊界條件一定的情況下,滲流區(qū)內(nèi)任一點(diǎn)的滲流水頭與上、下游水位差有關(guān)的變量間的關(guān)系只能成正比,而不能成反比,否則就違反了能量觀點(diǎn)。從式(12)中可以看出,滲流水頭與各水頭因子成正比,且均介于0和1之間,這與工程實(shí)際相符合。
在水頭變量因子間存在很強(qiáng)相關(guān)性的情況下,采用常規(guī)的最小二乘法對(duì)滲流觀測(cè)資料進(jìn)行回歸建模,結(jié)果如下:
從式(13)中可以看出,采用常規(guī)的最小二乘法對(duì)滲流觀測(cè)資料進(jìn)行回歸建模后,滲流水頭與多個(gè)變量因子成反比,即:當(dāng)庫(kù)水頭增加時(shí),大壩滲流水頭反而減小,這顯然與實(shí)際情況不相符。由此說明了在變量因子間存在強(qiáng)相關(guān)性的情況下,運(yùn)用偏最小二乘法進(jìn)行回歸建模是可行的。
3.2 滲流統(tǒng)計(jì)模型的輔助分析
3.2.1 模型的精度分析 在該工程實(shí)例計(jì)算中,從自變量系統(tǒng)中提取了兩個(gè)成分t1與t2,并計(jì)算出它們對(duì)自變量和因變量的累計(jì)解釋能力,結(jié)果如表1所示:
表1 成分t1、t2累計(jì)解釋能力
從表1中可以看出,提取的兩個(gè)成分t1與t2對(duì)自變量和因變量的累計(jì)解釋能力分別為97%和96%,可以認(rèn)為這兩個(gè)成分t1與t2的綜合信息能代替17個(gè)變量因子的信息。
3.2.2 自變量在解釋因變量時(shí)的測(cè)度 用變量投影重要性指標(biāo)VIPj來測(cè)度各個(gè)自變量xj對(duì)解釋因變量y的作用,通過計(jì)算可得到不同自變量的VIPj值。如圖1所示。
從圖1中可以看出,大壩的滲漏量主要受當(dāng)日水頭因子、平均水頭因子和時(shí)效因子的影響,而平均水頭升降速率對(duì)滲漏的影響相對(duì)較弱。
3.2.3 對(duì)樣本點(diǎn)分布結(jié)構(gòu)的觀察與特異點(diǎn)的發(fā)現(xiàn)通過計(jì)算成分t1與t2所對(duì)應(yīng)的方差s1與s2,進(jìn)而求出c值,并在t1/t2平面圖上做出T2橢圓圖,結(jié)果見圖2。
從圖2中可以看出,大部分樣本點(diǎn)都落在橢圓區(qū)內(nèi),但是,還有5個(gè)樣本點(diǎn)落在橢圓區(qū)外,由此可以認(rèn)為總體上各測(cè)值樣本點(diǎn)的分布是均勻的;在橢圓區(qū)外的樣本點(diǎn)取值遠(yuǎn)離了總體樣本點(diǎn)的平均水平,它們對(duì)應(yīng)的滲流測(cè)值為奇異值,這一般由觀測(cè)過程中的偶然誤差所致,在建模時(shí),應(yīng)將這些測(cè)值剔除,以免影響模型的精度。
3.2.4 統(tǒng)計(jì)模型的結(jié)果評(píng)價(jià) 利用偏最小二乘法與常規(guī)預(yù)測(cè)法分別預(yù)測(cè)出滲漏量,并計(jì)算出它們與觀測(cè)滲漏量的誤差值,將其繪制成滲漏量的誤差分布圖,結(jié)果見圖3。
從圖3中可以看出,通過偏最小二乘模型預(yù)測(cè)的滲漏量誤差明顯更接近于X軸,這表明利用該方法對(duì)滲流觀測(cè)資料分析時(shí)弱化了隨機(jī)模糊不確定性因素的影響,從而提高了模型的預(yù)測(cè)精度,也更加充分地反映了大壩滲流的實(shí)際狀態(tài)。
本文根據(jù)大壩滲流變量的特點(diǎn),研究了采用偏最小二乘法對(duì)其建模的可行性和優(yōu)越性。從計(jì)算結(jié)果可以看出該方法能夠在樣本點(diǎn)個(gè)數(shù)較少、自變量因子存在強(qiáng)相關(guān)性的情況下進(jìn)行回歸建模,利用該方法能夠較好地對(duì)滲流水頭做出合理預(yù)測(cè);另外,通過輔助性分析計(jì)算,檢驗(yàn)了模型的擬合精度、辨析了因變量與各自變量之間的關(guān)系、剔除了影響模型精度的奇異點(diǎn),從而達(dá)到對(duì)該大壩滲漏量進(jìn)行科學(xué)預(yù)測(cè)的目的。
[1]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,1999.
[2]酈能惠.土石壩安全監(jiān)測(cè)分析評(píng)價(jià)預(yù)報(bào)系統(tǒng)[M].北京:中國(guó)水利水電出版社,2001.
[3]柳利利.偏最小二乘回歸在大壩安全監(jiān)測(cè)資料分析中的應(yīng)用研究[D].西安:西安理工大學(xué),2008.
[4]王惠文,吳載斌.偏最小二乘回歸的線性與非線性方法[M].北京:國(guó)防工業(yè)出版社,2006.
[5]魏迎奇.新疆吉林臺(tái)一級(jí)水電站混凝土面板堆石壩滲流分析[R].中國(guó)水利水電科學(xué)研究院,2005.
[6]高祥寶,董寒青.數(shù)據(jù)分析與SPSS應(yīng)用[M].北京:清華大學(xué)出版社,2007.