華國(guó)威,婁彥彬,王世杰,胡少華,3
(1.武漢理工大學(xué) 安全科學(xué)與應(yīng)急管理學(xué)院,湖北 武漢 430070;2.河南省電力勘測(cè)設(shè)計(jì)院,河南 鄭州 450007;3.國(guó)家大壩安全工程技術(shù)研究中心,湖北 武漢 430010)
尾礦壩每時(shí)每刻都處于變形狀態(tài),一定程度的變形屬于正常現(xiàn)象,超過(guò)閾值會(huì)導(dǎo)致潰壩。因此,利用已有尾礦壩歷史監(jiān)測(cè)數(shù)據(jù),尋找有效的數(shù)學(xué)模型對(duì)尾礦壩變形進(jìn)行預(yù)測(cè)預(yù)報(bào),對(duì)尾礦壩的安全穩(wěn)定運(yùn)行具有重要意義[1]。
目前,常見(jiàn)預(yù)測(cè)模型有統(tǒng)計(jì)模型、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等,傳統(tǒng)統(tǒng)計(jì)模型無(wú)法準(zhǔn)確描述尾礦壩復(fù)雜的非線性變形規(guī)律;BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度受初值影響,收斂速度慢且易陷入局部最優(yōu)解[2]。而SVM模型具有強(qiáng)大的非線性數(shù)據(jù)處理能力,泛化能力強(qiáng),預(yù)測(cè)精度高[3],可用于尾礦壩的變形預(yù)測(cè)。
在實(shí)際工程應(yīng)用中,參數(shù)的選擇直接影響SVM模型的預(yù)測(cè)性能,目前對(duì)SVM參數(shù)尋優(yōu)的方法主要有網(wǎng)格搜索法(GS)、遺傳算法(GA)、粒子群算法(PSO)等[4],但GS尋優(yōu)效率低,GA和PSO易陷入局部最優(yōu)解。生物地理學(xué)優(yōu)化算法(BBO)具有參數(shù)簡(jiǎn)單、尋優(yōu)范圍大、收斂速度快、不易陷入局部最優(yōu)的特性,可用來(lái)對(duì)SVM參數(shù)進(jìn)行尋優(yōu),提高模型性能。
在選取尾礦壩變形影響因子時(shí),由于各因子間存在一定相關(guān)性,將所有因子輸入會(huì)造成信息冗余,影響模型預(yù)測(cè)結(jié)果。為此,本文利用PCA優(yōu)選出尾礦壩變形的主要影響因子作為輸入量,引入BBO算法對(duì)SVM參數(shù)進(jìn)行尋優(yōu),從而提升模型的預(yù)測(cè)性能,并結(jié)合工程實(shí)例與BP、GS-SVM、GA-SVM、PSO-SVM模型進(jìn)行對(duì)比,驗(yàn)證模型性能。
尾礦壩變形由復(fù)雜反應(yīng)綜合導(dǎo)致,具有非線性特性。一方面由于壩體自身狀態(tài)(筑壩方式、時(shí)間引起的徐變等)使壩體表現(xiàn)出宏觀變形趨勢(shì);另一方面受環(huán)境因素(庫(kù)水位、溫度、浸潤(rùn)線、干灘、降雨量等)影響,使其變形數(shù)據(jù)表現(xiàn)出周期性和隨機(jī)波動(dòng)性[5-8]。一般尾礦壩變形主要影響因子包括:庫(kù)水位(H,H2,H3);溫度因子(sin(T),cos(T)),其中T=sin(2πt/365);時(shí)效因子(θ,lnθ),其中θ=t/100,t為尾礦壩建立到監(jiān)測(cè)日的累積時(shí)長(zhǎng);浸潤(rùn)線長(zhǎng)度、干灘長(zhǎng)度以及降雨量。
由于各影響因子間存在一定相關(guān)性,直接輸入會(huì)使預(yù)測(cè)模型產(chǎn)生過(guò)擬合現(xiàn)象,因此,需要對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行優(yōu)選,選出最具代表性的輸入量。
PCA是多元統(tǒng)計(jì)學(xué)中用于檢驗(yàn)變量?jī)?nèi)部相關(guān)性的方法[9],本文利用PCA優(yōu)選尾礦壩變形影響因子作為預(yù)測(cè)模型的輸入數(shù)據(jù)。PCA優(yōu)選包括以下6個(gè)步驟:
1)輸入尾礦壩變形量和影響因子的監(jiān)測(cè)數(shù)據(jù),形成原始數(shù)據(jù)矩陣X,如式(1)所示:
X=[Xij]n×p
(1)
式中:n代表樣本總數(shù);前p-1列代表尾礦壩變形影響因子;第p列代表尾礦壩變形量。
2)利用Z-Score法對(duì)變形影響因子進(jìn)行歸一化處理,得到新的數(shù)據(jù)矩陣S。
3)計(jì)算矩陣S的協(xié)方差矩陣C,并求C的特征值λ及特征向量u,如式(2)~(3)所示:
C=cov(S)
(2)
Cu=λu
(3)
4)將原始影響因子數(shù)據(jù)投影到特征向量u上,得到主成分y如式(4)所示:
y=uTXT
(4)
5)計(jì)算前k個(gè)主成分的累積貢獻(xiàn)率α,如式(5)所示:
(5)
6)選取累積貢獻(xiàn)率大于85%的前k個(gè)主成分,將與各主成分相關(guān)性高的尾礦壩變形影響因子作為預(yù)測(cè)模型輸入量。
SVM在多維數(shù)、非線性問(wèn)題的處理上具有獨(dú)特優(yōu)勢(shì)[10],可用來(lái)描述尾礦壩變形數(shù)據(jù)與變形影響因子之間的復(fù)雜映射關(guān)系。核函數(shù)是SVM處理非線性函數(shù)的核心,本文核函數(shù)選取徑向基函數(shù)(RBF)如式(6)所示:
(6)
式中:k(x,xi)為核函數(shù);g為核函數(shù)參數(shù);x,xi均為輸入量。
在實(shí)際運(yùn)行過(guò)程中SVM模型預(yù)測(cè)精度由懲罰因子C和核函數(shù)參數(shù)g共同決定[11],因此選擇合適的參數(shù)尋優(yōu)算法可直接影響模型性能和穩(wěn)定性。
本文選擇BBO算法對(duì)SVM參數(shù)進(jìn)行尋優(yōu),BBO算法通過(guò)模擬大自然間物種遷移變異規(guī)律,具有參數(shù)簡(jiǎn)單、收斂速度快、不易陷入局部最優(yōu)的特點(diǎn)[12-13],遷移和變異是BBO算法的核心操作。
1)遷移操作。本文選用余弦遷移模型,如圖1所示。其中,λ為遷入率,μ為遷出率,I為最大遷入率,E為最大遷出率,Smax為最大物種數(shù)量。
圖1 物種遷移模型Fig.1 Species migration model
2)變異操作。物種變異計(jì)算如式(7)所示:
(7)
式中:gs指物種變異概率;gmax為最大變異率;ps表示生物數(shù)量為s時(shí)的概率;pmax為ps的最大值。
本文將平均均方根誤差R作為BBO算法的優(yōu)化目標(biāo),如式(8)所示:
(8)
圖2為PCA-BBO-SVM預(yù)測(cè)模型流程。
圖2 PCA-BBO-SVM預(yù)測(cè)模型流程Fig.2 Flow chart of PCA-BBO-SVM prediction model
以楊家灣尾礦壩變形量為預(yù)測(cè)對(duì)象,建立變形預(yù)測(cè)模型。該尾礦壩采用上游式筑壩方式,初期壩為透水堆石壩,壩高17.4 m,壩長(zhǎng)146.45 m,壩頂寬5 m。選擇同一橫線上4個(gè)測(cè)點(diǎn)GA-2,GB-3,GD-4,GF-3的歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),浸潤(rùn)線數(shù)據(jù)選用A-3,B-3,C-4,G-3,浸潤(rùn)線A、B、C、G間距為15.68,29.60,74.36 m,各測(cè)點(diǎn)與浸潤(rùn)線距離如圖3所示。
圖3 位移測(cè)點(diǎn)與浸潤(rùn)線平面示意Fig.3 Plan view of displacement measuring points and saturation lines
尾礦壩監(jiān)測(cè)數(shù)據(jù)中存在大量噪聲,因此利用小波對(duì)尾礦壩變形數(shù)據(jù)進(jìn)行去噪,再利用PCA對(duì)影響因子進(jìn)行優(yōu)選。各主成分貢獻(xiàn)率及累積貢獻(xiàn)率如圖4所示。由圖4可知,前4個(gè)主成分可以用來(lái)描述原始數(shù)據(jù)信息,各點(diǎn)前4個(gè)主成分原始數(shù)據(jù)特征向量見(jiàn)表1。絕對(duì)值越大代表該因子與主成分相關(guān)性越大[14],由表1可知,各主成分主要特征向量絕對(duì)值均大于0.4。本文優(yōu)選出的輸入量為庫(kù)水位(H,H2,H3)、溫度因子(sin(T),cos(T))、時(shí)效因子(θ,lnθ)、浸潤(rùn)線長(zhǎng)度以及干灘長(zhǎng)度。
表1 前4個(gè)主成分的特征向量Table 1 Feature vectors of first four principal components
圖4 貢獻(xiàn)率與累積貢獻(xiàn)率Fig.4 Contribution rate and cumulative contribution rate
BBO算法尋優(yōu)前需要設(shè)置參數(shù),參考文獻(xiàn)[15-16]并經(jīng)過(guò)多次模擬實(shí)驗(yàn)調(diào)整得到具體參數(shù):Smax=50,I=1,E=1,qmax=0.05,棲息地保持率L=0.2,迭代次數(shù)D=100,BBO算法的尋優(yōu)范圍為[0.001,1000]。本文選擇均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)對(duì)模型性能進(jìn)行評(píng)價(jià),如式(9)~(11)所示:
(9)
(10)
(11)
引入BP、GS-SVM、PSO-SVM、GA-SVM模型與PCA-BBO-SVM模型進(jìn)行對(duì)比,驗(yàn)證可得PCA-BBO-SVM模型性能更優(yōu)。以上模型各測(cè)點(diǎn)的預(yù)測(cè)對(duì)比如圖5所示。由圖5可知,由于預(yù)測(cè)時(shí)間不同,導(dǎo)致尾礦壩變形趨勢(shì)不同。BP模型預(yù)測(cè)性能最差,波動(dòng)預(yù)測(cè)能力和預(yù)測(cè)精度均無(wú)法達(dá)到預(yù)計(jì)效果,僅能預(yù)測(cè)變形總趨勢(shì),與監(jiān)測(cè)值偏差和GS-SVM模型相似;GS-SVM模型預(yù)測(cè)的走向基本與實(shí)測(cè)值相吻合,但該模型并不能精確預(yù)測(cè)局部細(xì)節(jié)波動(dòng),得出的模型不夠穩(wěn)定,GS-SVM模型與實(shí)測(cè)值之間的偏差仍然過(guò)大;GA-SVM和PSO-SVM模型整體預(yù)測(cè)效果優(yōu)于GS-SVM模型,可以預(yù)測(cè)部分波動(dòng)點(diǎn),預(yù)測(cè)精度得到進(jìn)一步提升,但仍有部分波峰波谷無(wú)法精確預(yù)測(cè);PCA-BBO-SVM模型性能在所有模型中最優(yōu),能夠更準(zhǔn)確地預(yù)測(cè)變形監(jiān)測(cè)數(shù)據(jù)中的波峰波谷,同時(shí)其預(yù)測(cè)數(shù)據(jù)更貼近實(shí)際監(jiān)測(cè)數(shù)據(jù),誤差值小。
圖5 不同模型在不同測(cè)點(diǎn)變形預(yù)測(cè)性能對(duì)比Fig.5 Comparison on deformation prediction performance of different models at different measuring points
各模型性能指標(biāo)如表2所示。由表2可知,4個(gè)測(cè)點(diǎn)PCA-BBO-SVM模型的RMSE指標(biāo)分別為0.139 6,0.274 2,0.317 0,0.530 6,MAE指標(biāo)分別為0.112 5,0.213 5,0.269 0,0.412 9,優(yōu)于其他模型;GA-SVM、PSO-SVM、GS-SVM模型指標(biāo)大小相似,其中PSO-SVM模型略優(yōu),BP模型相對(duì)最大。說(shuō)明PCA-BBO-SVM模型的實(shí)際誤差相對(duì)最小,模型更加穩(wěn)定,通過(guò)GS、GA以及PSO尋優(yōu)的SVM模型次之,BP模型誤差最大。4個(gè)測(cè)點(diǎn)中PCA-BBO-SVM模型的MAPE分別為0.525 0%,0.692 3%,2.621 2%,1.311 2%,可以看出PCA-BBO-SVM模型預(yù)測(cè)數(shù)據(jù)貼近實(shí)測(cè)數(shù)據(jù),精度足夠高,可用于尾礦壩變形預(yù)測(cè)。
由圖5和表2可知,BP模型預(yù)測(cè)精度與GS-SVM模型相似,但對(duì)變形趨勢(shì)的預(yù)測(cè)能力弱于GS-SVM模型;GS-SVM模型能夠大致預(yù)測(cè)變形的整體趨勢(shì),但模型精度以及對(duì)波峰波谷預(yù)測(cè)能力不足;由于GA和PSO算法的尋優(yōu)范圍及速度均大于GS算法,參數(shù)選擇更優(yōu),因此GA-SVM和PSO-SVM模型大部分測(cè)點(diǎn)預(yù)測(cè)精度及波峰波谷的預(yù)測(cè)性能優(yōu)于GS-SVM模型,但由于GA與PSO算法易于陷入局部最優(yōu)解,仍有個(gè)別測(cè)點(diǎn)預(yù)測(cè)性能弱于GS-SVM模型;PCA-BBO-SVM模型由于BBO算法不易陷入最優(yōu)解,可以設(shè)置更大的尋優(yōu)范圍,能獲得更為準(zhǔn)確的參數(shù)C和g,使其對(duì)局部細(xì)節(jié)趨勢(shì)的預(yù)測(cè)能力比GS-SVM模型、GA-SVM模型和PSO-SVM模型更完美,能夠更為完美地預(yù)測(cè)數(shù)據(jù)的波峰波谷,且該模型的預(yù)測(cè)數(shù)據(jù)足夠貼近真實(shí)數(shù)據(jù),因此PCA-BBO-SVM模型適用于尾礦壩的變形預(yù)測(cè)。
表2 不同測(cè)點(diǎn)各模型變形預(yù)測(cè)精度統(tǒng)計(jì)Table 2 Statistics on deformation prediction accuracy of each model at different measuring points
1)將PCA優(yōu)選出的尾礦壩變形影響因子作為預(yù)測(cè)輸入量,并利用BBO算法參數(shù)簡(jiǎn)單、不易陷入局部最優(yōu)解的優(yōu)點(diǎn),對(duì)SVM參數(shù)進(jìn)行尋優(yōu),建立基于PCA-BBO-SVM的尾礦壩變形預(yù)測(cè)模型。
2)通過(guò)利用PCA-BBO-SVM模型對(duì)尾礦壩4個(gè)監(jiān)測(cè)點(diǎn)變形數(shù)據(jù)進(jìn)行預(yù)測(cè),均方根誤差分別為0.139 6,0.274 2,0.317 0,0.530 6,平均絕對(duì)誤差分別為0.112 5,0.213 5,0.269 0,0.412 9,平均絕對(duì)百分比誤差為0.525 0%,0.692 3%,2.621 2%,1.311 2%。
3)提出的PCA-BBO-SVM尾礦壩變形預(yù)測(cè)模型的預(yù)測(cè)精度、整體趨勢(shì)預(yù)測(cè)能力及細(xì)節(jié)波動(dòng)預(yù)測(cè)性能優(yōu)于BP、GS-SVM、GA-SVM、PSO-SVM模型,且預(yù)測(cè)數(shù)據(jù)足夠貼近實(shí)測(cè)數(shù)據(jù),研究結(jié)果可為尾礦安全監(jiān)測(cè)提供參考,具有工程實(shí)用性。