張 研,曾建斌,鄧雪沁
(1.桂林理工大學(xué) 廣西巖土力學(xué)與工程重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004; 2.桂林理工大學(xué) 土木與建筑工程學(xué)院,廣西 桂林 541004)
隧道掘進(jìn)機(jī)(Tunnel Boring Machine,TBM)施工的優(yōu)點(diǎn)在于施工快捷、優(yōu)質(zhì)可靠、安全環(huán)保,尤其適合中長(zhǎng)隧道的施工,未來(lái)硬質(zhì)巖體的隧道施工將普遍采用此方法[1-2]。為使該方法在工程實(shí)際中取得最佳效益,人們?cè)絹?lái)越重視施工進(jìn)度及施工成本之間的關(guān)系。合理的掘進(jìn)速度有利于維持圍巖穩(wěn)定性,降低施工造價(jià),這對(duì)TBM隧道安全、高效施工具有重要意義[3]。
自20世紀(jì)70年代以來(lái),涌現(xiàn)出一系列TBM掘進(jìn)速度預(yù)測(cè)模型,包括單因素預(yù)測(cè)模型、綜合預(yù)測(cè)模型、巖體分類(lèi)預(yù)測(cè)模型、概率模型等[4]。其中,以CSM和NTNU模型為代表的綜合預(yù)測(cè)模型應(yīng)用較為廣泛。CSM模型來(lái)自室內(nèi)線性切割試驗(yàn),但未充分考慮巖體中節(jié)理裂隙帶來(lái)的影響;NTNU模型雖然較全面地考慮了各影響因素,但采用的某些指數(shù)不適用于廣泛的巖石試驗(yàn),限制了該模型的應(yīng)用。挪威學(xué)者Barton[5]根據(jù)調(diào)研大量地下開(kāi)挖工程穩(wěn)定性實(shí)例提出了Q模型,該模型考慮了6項(xiàng)質(zhì)量評(píng)價(jià)指標(biāo)后,將影響掘進(jìn)機(jī)和巖體相互作用的因素考慮進(jìn)去,通過(guò)分析來(lái)自隧道施工的大量數(shù)據(jù),對(duì)Q模型加以改進(jìn),確定了QTBM模型,但該模型列出的部分參數(shù)對(duì)掘進(jìn)速度預(yù)測(cè)結(jié)果無(wú)實(shí)質(zhì)性影響。Nelson[6]提出的概率模型采用統(tǒng)計(jì)分析方法能夠?qū)Σ煌A段的施工時(shí)間與費(fèi)用數(shù)據(jù)進(jìn)行概率形式的估算,但它在相似性模擬中存在一定的局限性。
近些年,隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,針對(duì)上述模型存在的不足,許多學(xué)者基于人工智能技術(shù)提出了一些新的隧道TBM掘進(jìn)速度預(yù)測(cè)模型,它們能夠彌補(bǔ)傳統(tǒng)預(yù)測(cè)模型的不足。其中,以Acaroglu等提出的模糊邏輯(FL)模型、溫森等提出的Monte Carlo-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型以及Mahdevari等基于支持向量回歸(SVR)提出的TBM掘進(jìn)速度模型為代表[7-9]。但以上模型本身還是存在一些缺陷,導(dǎo)致模型在應(yīng)用中受到限制,如支持向量回歸核函數(shù)以及參數(shù)難以確定,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)能力對(duì)初始訓(xùn)練樣本的依賴(lài)性強(qiáng)[10]。因此,更加準(zhǔn)確、合理的智能預(yù)測(cè)模型亟待提出。
相關(guān)向量機(jī)方法(Relevance Vector Machine,RVM)是近年來(lái)流行的機(jī)器學(xué)習(xí)方法,它具有高精度、參數(shù)自適應(yīng)獲取和適應(yīng)小樣本問(wèn)題等優(yōu)勢(shì),可以建立各種復(fù)雜工程問(wèn)題的預(yù)測(cè)模型[11]。然而當(dāng)輸入樣本影響因素(即樣本維數(shù))較多時(shí),會(huì)降低RVM模型學(xué)習(xí)效率,增加計(jì)算成本。本文采用主成分分析法(Principal Component Analysis,PCA)提取數(shù)據(jù)特征、降低數(shù)據(jù)維度[12],以降維數(shù)據(jù)作為RVM的輸入量進(jìn)行預(yù)測(cè),可將RVM解決小樣本復(fù)雜問(wèn)題的突出優(yōu)勢(shì)體現(xiàn)出來(lái)[13]。通過(guò)RVM模型建立降維后各因素與TBM掘進(jìn)速度之間的非線性映射關(guān)系,建立基于PCA-RVM的TBM掘進(jìn)速度預(yù)測(cè)模型,為掘進(jìn)速度預(yù)測(cè)提供了一條新途徑。
主成分分析法的主旨在于降維,通過(guò)對(duì)初始觀測(cè)樣本的一系列處理,保留對(duì)樣本總體貢獻(xiàn)率較大的因素,剔除貢獻(xiàn)率較低的因素,以此得到低維度的新變量系統(tǒng)[14]。設(shè)總體觀測(cè)樣本含有m個(gè)樣本,對(duì)n個(gè)變量進(jìn)行觀察,構(gòu)建的主成分分析觀測(cè)模型如式(1)所示:
(1)
對(duì)輸入數(shù)據(jù)標(biāo)準(zhǔn)化處理可避免因數(shù)據(jù)量綱造成的模型精度問(wèn)題。假定觀測(cè)模型的相關(guān)系數(shù)矩陣為R=(rii),將樣本矩陣Xm×n的二維向量設(shè)為Xi與Xj,則rij可由標(biāo)準(zhǔn)化后樣本數(shù)據(jù)的協(xié)方差矩陣轉(zhuǎn)化得到:
(2)
用雅克比方法求特征方程|λE-R|=0的m個(gè)非負(fù)特征根λ1≥λ2≥…λm≥0。
經(jīng)過(guò)主成分分析,初始變量x1,x2,…,xt變換成t個(gè)綜合指標(biāo)因子y1,y2,…,yt,表達(dá)式如下:
(3)
tn=y(xn;ω)+ξn
(4)
式中:ω為權(quán)值向量,ξn為零均值,方差為σ2的附加高斯噪聲,且相互獨(dú)立。故p(tn|x)=N(tn|y(xn),σ2)服從高斯正態(tài)分布,且其分布是由tn、y(xn)的值以及方差σ2所決定的。同時(shí),y(x)的值是由核函數(shù)所決定的。RVM的原理如圖1所示。
圖1 RVM模型工作原理Fig.1 Working principle diagram of the RVM model
本文采用局部線性插值能力較強(qiáng)的高斯核函數(shù)用于TBM掘進(jìn)速度的預(yù)測(cè),其形式為
(5)
式中:xc為核函數(shù)中心,σ為函數(shù)的寬度參數(shù)。
由于前文假設(shè)tn相互獨(dú)立,則訓(xùn)練樣本集的似然函數(shù)可采用下式表達(dá):
(6)
式中:t=(t1,t2,…,tN)T為目標(biāo)向量,參數(shù)向量為ω(ω0,w1,…,ωN)T,Φ為N×(N+1)維由核函數(shù)組成的矩陣,Φ=[φ(X1)φ(x2)…φ(xN)]T,φ(xn)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
(7)
式中:α是決定權(quán)值ω的先驗(yàn)分布的N+1維超參數(shù)。因?yàn)楦咚拐龖B(tài)分布方差倒數(shù)的共軛概率分布服從Γ分布,假定超參數(shù)α和噪聲參數(shù)σ2服從Γ先驗(yàn)概率分布:
P(αi)=Γ(a,b)
(8)
P(σ2)=Γ(c,d)
(9)
Γ(a,b)=Γ(a)-1baaa-1e-ba
(10)
(11)
為使得到的超參數(shù)相對(duì)均勻,通常取a=b=c=d=0。
由貝葉斯原理可以得到后驗(yàn)分布概率的關(guān)系式:
(12)
(13)
式中:P(ω,α,σ2|t)用積分的方法不能求解,因此可以將上式分解為
P(ω,α,σ2|t)=P(ω|t,σ,σ2)P(α,σ2|t)
(14)
經(jīng)變換得出權(quán)重ω的后驗(yàn)分布的表達(dá)式:
(15)
其后驗(yàn)均值和協(xié)方差可以分別表示為
μ=σ-2ΦTt
(16)
∑=(σ-2ΦTΦ+A)-1
(17)
式中:A=diag(α0,α1,…,αN)為對(duì)角矩陣。
在更新超參數(shù)迭代學(xué)習(xí)的過(guò)程中,產(chǎn)生的相關(guān)向量可反映初始訓(xùn)練樣本特征,與用來(lái)預(yù)測(cè)的樣本無(wú)關(guān)[17]。在初始樣本學(xué)習(xí)的過(guò)程中,α和σ2是兩個(gè)必要的超參數(shù),運(yùn)用RVM方法進(jìn)行學(xué)習(xí)時(shí),超參數(shù)可自適應(yīng)獲取。在超先驗(yàn)的條件下,取P(t|α,σ2)最大。
(18)
可以運(yùn)用MacKay法求解α和σ2的值,令式(18)為零,通過(guò)求超參數(shù)的偏導(dǎo)得到:
(19)
(20)
γi=1-α∑ii
(21)
式中:μi是第i個(gè)后驗(yàn)平均權(quán)重,∑ii是第i個(gè)對(duì)角元素。在求解超參數(shù)的過(guò)程中,將趨向無(wú)窮大的超參數(shù)去除,以獲取具有稀疏性的相關(guān)向量機(jī)模型。
設(shè)待測(cè)樣本為x*,預(yù)測(cè)值為t*,則待預(yù)測(cè)的數(shù)據(jù)結(jié)果可由下式求解得到:
(22)
由于式(22)中等號(hào)右側(cè)的被積函數(shù)都服從于高斯正態(tài)分布,故t*也服從高斯正態(tài)分布
(23)
為平衡TBM掘進(jìn)速度與施工成本的關(guān)系,提出一種合理可行的預(yù)測(cè)模型十分必要。依照前述方法進(jìn)行主成分分析,得到各主要影響因素之間的關(guān)系,利用累計(jì)貢獻(xiàn)量這一指標(biāo)確定需要保留的主要因素,將這一結(jié)果輸入到RVM模型,通過(guò)模型對(duì)樣本進(jìn)行學(xué)習(xí),輸出TBM掘進(jìn)速度的預(yù)測(cè)結(jié)果。本文以文獻(xiàn)[8]中的5個(gè)影響因素作為T(mén)BM掘進(jìn)速度(PR)主要影響因子,分別為完整巖石的單軸抗壓強(qiáng)度(UCS)、巴西試驗(yàn)劈裂抗拉強(qiáng)度(BTS)、軟弱結(jié)構(gòu)面的平均間距(DPW)、沖擊試驗(yàn)壓頭的最大荷載與相應(yīng)的位移的比值(PSI)和隧道軸線與軟弱結(jié)構(gòu)面之間的夾角(α)。以上影響因素可通過(guò)巖塊力學(xué)性質(zhì)試驗(yàn)或現(xiàn)場(chǎng)監(jiān)測(cè)獲取,操作方便快捷。將文獻(xiàn)[8]中的TBM掘進(jìn)速度數(shù)據(jù)進(jìn)行整理,以1~15號(hào)數(shù)據(jù)作為學(xué)習(xí)樣本,16~25號(hào)數(shù)據(jù)作為預(yù)測(cè)樣本,如表1所示。
相關(guān)向量機(jī)是監(jiān)督式學(xué)習(xí)的一種,為此需要驗(yàn)證表1中訓(xùn)練樣本集與預(yù)測(cè)樣本集相互獨(dú)立且具有聯(lián)合概率分布。KS-檢驗(yàn)(Kolmogorov-Smirnov test)可通過(guò)比較樣本的經(jīng)驗(yàn)分布函數(shù)和理論分布函數(shù)作擬合適度檢驗(yàn)。經(jīng)檢驗(yàn),在0.05顯著性水平下,每個(gè)輸入量顯著地來(lái)自正態(tài)分布總體,滿(mǎn)足RVM模型對(duì)輸入樣本的要求。
表1 TBM掘進(jìn)速度數(shù)據(jù)集Tab.1 Data set of TBM penetration rate
對(duì)表1中數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,輸出檢驗(yàn)結(jié)果,用KMO來(lái)反映各變量的相關(guān)程度,用Bartlett球形檢驗(yàn)來(lái)驗(yàn)證其矩陣是否為單位矩陣。通過(guò)計(jì)算得到KMO值、Bartlett球形檢驗(yàn)中sig值分別為0.753和0.016,結(jié)果滿(mǎn)足進(jìn)行因子分析的條件。結(jié)合本文所述兩種原理的特征,采用主成分分析法對(duì)表1中的各輸入變量進(jìn)行降維處理,使RVM在處理小樣本問(wèn)題上的優(yōu)勢(shì)充分展現(xiàn)。利用主成分分析法對(duì)影響因素進(jìn)行分析,得到的相關(guān)系數(shù)矩陣如表2所列。
表2 相關(guān)系數(shù)矩陣Tab.2 Matrix of correlation coefficient
由表2可知:前3個(gè)影響因素的相關(guān)系數(shù)較大,反映它們之間具有較大的線性相關(guān)性。如:UCS與前3個(gè)影響因素的相關(guān)系數(shù)分別為1.00,0.643和0.575,其線性相關(guān)性依次降低;而與后2個(gè)影響因素的相關(guān)系數(shù)為-0.107和0.035,表現(xiàn)為負(fù)相關(guān)和幾乎不相關(guān)。由此可初步判定:UCS與前3個(gè)影響因素相關(guān)性較大。為保證原始信息提取充分,確保線性變換后的新數(shù)據(jù)作為輸入樣本不影響相關(guān)向量機(jī)模型的穩(wěn)定性,需進(jìn)一步進(jìn)行主成分分析。用軟件進(jìn)行主成分分析得到的總方差解釋如表3所列。
表3中,前3個(gè)主成分的方差累計(jì)貢獻(xiàn)率已達(dá)86.137%,所以認(rèn)為前3個(gè)主成分能夠反映全體變量包含的信息。各主成分的方差貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率如圖2所示。
表3 總方差解釋Tab.3 Explanation of total variance
因子載荷是第i個(gè)變量在第j個(gè)主成分的權(quán)重,反映了該變量在對(duì)應(yīng)的主成分上的相對(duì)重要性。表4中的因子載荷矩陣反映了提取的主成分與不同影響因素之間的密切程度。
表4 因子載荷矩陣Tab.4 Factor load matrix
利用主成分分析法實(shí)現(xiàn)了對(duì)原始影響因素的降維,提取的3個(gè)主成分經(jīng)線性變換公式獲取新的變量表達(dá)式:
(24)
第一主成分y1所對(duì)應(yīng)的方差貢獻(xiàn)率最大,是反映與PSI、UCS、BTS有正相關(guān)的主成分指標(biāo),是巖石的單軸抗壓強(qiáng)度、巴西試驗(yàn)劈裂抗拉強(qiáng)度和沖擊試驗(yàn)壓頭的最大荷載與相應(yīng)位移的比值的綜合反映,代表該主成分與掘進(jìn)部位巖石的力學(xué)性能有較大相關(guān)性。第二主成分y2對(duì)應(yīng)的方差貢獻(xiàn)率次之,主要反映影響因子α與該主成分有較大的相關(guān)性,而影響因子BTS與該主成分具有較大的負(fù)相關(guān)性,該指標(biāo)主要度量隧道軸線與軟弱結(jié)構(gòu)面之間的夾角和巖石抗拉強(qiáng)度。同樣的,第三主成分y3更能反映巖石抗壓強(qiáng)度UCS和結(jié)構(gòu)面間距DPW中包含的信息。
通過(guò)主成分分析,以矩陣構(gòu)成的新模型代替原先的矩陣,有效降低了數(shù)據(jù)維數(shù)。降維后的3個(gè)主成分包含了5個(gè)影響因素的絕大多數(shù)信息,因此可作為T(mén)BM掘進(jìn)速度預(yù)測(cè)的輸入量。
采用經(jīng)主成分分析法降維后3個(gè)影響因素對(duì)應(yīng)的數(shù)據(jù)集作為輸入值,以掘進(jìn)速度(PR)作為輸出值。對(duì)上述數(shù)據(jù)標(biāo)準(zhǔn)化處理后,選擇局部插值能力較強(qiáng)的高斯核函數(shù)對(duì)1~15號(hào)共15組樣本數(shù)據(jù)進(jìn)行掘進(jìn)速度的驗(yàn)證。為了獲得更有效的模型,選取最優(yōu)核寬度,分別選取0.16,0.18,0.20,0.22,0.24,0.26,0.28作為高斯核寬度對(duì)模型進(jìn)行對(duì)比。初始化程序后對(duì)不同高斯核寬度下驗(yàn)證結(jié)果的最大相對(duì)誤差進(jìn)行計(jì)算和對(duì)比,結(jié)果見(jiàn)圖3。顯然,高斯核寬度,迭代次數(shù)為500時(shí),得到的最大相對(duì)誤差最小。各樣本掘進(jìn)速度的實(shí)測(cè)值、BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值、RVM模型預(yù)測(cè)值以及PCA-RVM預(yù)測(cè)值的輸出結(jié)果如表5所列。
圖3 掘進(jìn)速度對(duì)應(yīng)不同高斯核寬度的最大相對(duì)誤差Fig.3 Maximum relative errors of different core widths corresponded with excavation rate
由表5可以看出:基于PCA-RVM模型得到的相對(duì)誤差均小于其他模型,其相對(duì)誤差值最大的21號(hào)樣本僅為0.41%,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)值的最大相對(duì)誤差高達(dá)17.24%,直接采用RVM方法其預(yù)測(cè)結(jié)果的最大相對(duì)誤差為2.93%。采用PCA-RVM模型的預(yù)測(cè)結(jié)果均好于其他兩種方式。為了更好地觀察不同模型輸出的預(yù)測(cè)值,將表4中3種方法的輸出的掘進(jìn)速度預(yù)測(cè)值進(jìn)行對(duì)比(見(jiàn)圖4)。
表5 不同方法的預(yù)測(cè)結(jié)果比較Tab.5 Comparison of prediction results by different methods
圖4 不同方法掘進(jìn)速度預(yù)測(cè)值對(duì)比Fig.4 Comparison of prediction results by different methods
由圖4可見(jiàn):PCA-RVM模型各預(yù)測(cè)值幾乎與實(shí)際TBM掘進(jìn)速度重合,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果偏離較大,RVM模型預(yù)測(cè)值次之。從圖形可直觀地看出BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值中16,19,21號(hào)樣本偏離明顯,PCA-RVM模型的預(yù)測(cè)精度更高。本文還采用平均相對(duì)誤差A(yù)RE和均方差FMSE來(lái)反映各模型預(yù)測(cè)結(jié)果的整體誤差水平與離散程度,其計(jì)算公式為
(25)
(26)
表6 不同模型ARE與FMSE對(duì)比Tab.6 Comparison of ARE and FMSE by different models
由表6可見(jiàn):本文提出的PCA-RVM模型計(jì)算得到的平均相對(duì)誤差為0.24%,均方差為0.005;而B(niǎo)P神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,其平均相對(duì)誤差為6.53%,均方差為0.172。由此可見(jiàn),與BP神經(jīng)網(wǎng)絡(luò)和RVM模型相比,基于PCA降維后得到的數(shù)據(jù)集更有利于RVM模型的預(yù)測(cè),其預(yù)測(cè)精度高,離散型小,結(jié)果可信。
本文提出一種基于PCA-RVM的TBM掘進(jìn)速度預(yù)測(cè)模型。通過(guò)PCA將5個(gè)影響因素降維成3個(gè)獨(dú)立主成分變量,采用RVM建立主成分變量與掘進(jìn)速度間的非線性映射關(guān)系,主要結(jié)論如下。
(1) 通過(guò)PCA對(duì)原始數(shù)據(jù)進(jìn)行降維處理,使得降維后的數(shù)據(jù)基本能夠保證原數(shù)據(jù)信息的完整性;采用RVM建立降維主成分變量與TBM掘進(jìn)速度間的映射關(guān)系,進(jìn)而預(yù)測(cè)TBM的掘進(jìn)速度,其預(yù)測(cè)結(jié)果精確、擬合程度高、離散性小,為T(mén)BM掘進(jìn)速度的準(zhǔn)確獲取提供一條新途徑。
(2) 3種模型的預(yù)測(cè)結(jié)果表明,采用PCA-RVM進(jìn)行TBM掘進(jìn)速度預(yù)測(cè)得到的平均相對(duì)誤差和均方差均低于BP神經(jīng)網(wǎng)絡(luò)及RVM模型,本文提出的模型在回歸預(yù)測(cè)問(wèn)題上比BP神經(jīng)網(wǎng)絡(luò)和RVM模型更有優(yōu)勢(shì)。
(3) 本文模型的提出是建立在獲得工程實(shí)際TBM掘進(jìn)速度數(shù)據(jù)的基礎(chǔ)上,通過(guò)廣泛收集樣本數(shù)據(jù),以此建立預(yù)測(cè)模型,對(duì)優(yōu)化模型參數(shù),提高模型的適用性和準(zhǔn)確度有重要意義。