馬財龍,王文虎,侯憲龍,謝晨曦,魯成鳳
(1.新疆大學(xué)建筑工程學(xué)院,新疆 烏魯木齊 830017;2.新疆大學(xué)新疆建筑結(jié)構(gòu)與抗震重點實驗室,新疆 烏魯木齊 830017)
我國規(guī)范將跨高比小于5的鋼筋混凝土梁定義為深受彎構(gòu)件[1].RC深受彎構(gòu)件廣泛應(yīng)用于土木工程結(jié)構(gòu)中,如高層建筑中的厚板轉(zhuǎn)換層、地鐵隧道里的厚頂板和地基基礎(chǔ)中的厚條基等[2].RC深受彎構(gòu)件在地震作用下的損傷特性將直接影響鋼筋混凝土結(jié)構(gòu)的抗震性能.RC深受彎構(gòu)件以受剪為主,受剪破壞過程伴隨斜裂縫產(chǎn)生發(fā)展至最終脆性破壞,準(zhǔn)確預(yù)測開裂荷載及剪力對RC深受彎構(gòu)件設(shè)計及安全性具有重要意義.
開裂荷載是深受彎構(gòu)件受剪開裂性能的重要指標(biāo).國內(nèi)外學(xué)者對于開裂荷載的認(rèn)識不統(tǒng)一.Tan等[3]將出現(xiàn)首條斜裂縫或剪跨區(qū)斜裂縫高度超過梁高一半時的荷載稱為開裂荷載.Birrcher等[4]將所測得箍筋應(yīng)變突然增加時對應(yīng)的荷載定義為開裂荷載.有學(xué)者將出現(xiàn)首條斜裂縫定義為開裂荷載[5-8].開裂荷載所對應(yīng)的剪力為開裂剪力.已有研究表明開裂剪力與混凝土抗壓強(qiáng)度、剪跨比、截面尺寸、縱向配筋率有關(guān),并基于試驗數(shù)據(jù)提出了眾多半經(jīng)驗半理論計算模型[9-17].但由于回歸公式形式和關(guān)鍵參數(shù)的差異,導(dǎo)致開裂剪力計算模型各不相同且預(yù)測精度低、離散性大.進(jìn)一步探索RC深受彎構(gòu)件的開裂剪力精準(zhǔn)預(yù)測模型是十分必要的.
隨著大數(shù)據(jù)時代的到來和人工智能的興起,以“數(shù)據(jù)驅(qū)動”建模的機(jī)器學(xué)習(xí)方法擅長挖掘數(shù)據(jù),可消除半經(jīng)驗半理論公式由于依賴數(shù)據(jù)回歸帶來的差異性.各種機(jī)器學(xué)習(xí)方法已廣泛應(yīng)用于混凝土構(gòu)件基本性能的預(yù)測[18-24].Solhmirzaei等[18]采用機(jī)器學(xué)習(xí)單一算法預(yù)測了高性能混凝土梁的破壞模式和受剪承載力.Olalusi等[19]采用隨機(jī)森林算法預(yù)測了鋼纖維梁的受剪承載力.馮德成等[20,24]采用集成算法預(yù)測了不同構(gòu)件的基本性能,如RC柱塑性鉸長度等.于曉輝等[21]基于機(jī)器學(xué)習(xí)方法提出了RC柱的破壞模式兩階段判別方法.上述研究表明,機(jī)器學(xué)習(xí)方法預(yù)測RC結(jié)構(gòu)的基本性能具有特有的優(yōu)勢.尤其是Lundberg和Lee[22]提出了機(jī)器學(xué)習(xí)模型的可解釋方法:SHAP(SHapley Additive exPlanations).SHAP方法可得到各特征的重要性排序以及分析各特征對模型預(yù)測結(jié)果的貢獻(xiàn),克服了無法對機(jī)器學(xué)習(xí)模型的預(yù)測結(jié)果進(jìn)行解釋的問題,即“黑匣子”問題.近年來,SHAP方法也得到廣泛應(yīng)用.Mangalathu等[23]采用SHAP方法解釋了剪力墻的破壞模式預(yù)測結(jié)果.馮德成等[24]采用SHAP方法解釋了混凝土矮墻的受剪承載力預(yù)測結(jié)果.綜上,關(guān)于鋼筋混凝土深受彎構(gòu)件開裂荷載及剪力相關(guān)的研究未見報道.
鑒于此,本文建立了RC深受彎構(gòu)件開裂剪力的可解釋機(jī)器學(xué)習(xí)模型.采用SHAP方法對機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果進(jìn)行解釋.給出了預(yù)測RC深受彎構(gòu)件開裂剪力的基本步驟,然后利用276條試驗數(shù)據(jù)建立機(jī)器學(xué)習(xí)模型,利用統(tǒng)計指標(biāo)將所建立模型與半經(jīng)驗半理論計算方法進(jìn)行對比分析,最后采用SHAP方法對預(yù)測結(jié)果進(jìn)行全局解釋和局部解釋.
通過對比學(xué)者們對開裂荷載的定義[3-8],本文采用Tan等[3]定義的開裂荷載.開裂荷載所對應(yīng)的剪力為開裂剪力.下一章節(jié)介紹的所搜集的試驗開裂荷載均是此含義.
RC深受彎構(gòu)件的斜向開裂剪力受多種因素影響.剪跨比和跨高比決定了RC深受彎構(gòu)件的開裂剪力.混凝土抗拉強(qiáng)度與骨料的最大粒徑影響混凝土壓桿的強(qiáng)度.加載板寬度是試件受力時與外荷載接觸的關(guān)鍵組件,其影響了剪力的傳遞路徑.另外,RC深受彎構(gòu)件在正常服役期間,當(dāng)彎曲裂縫出現(xiàn)后、斜裂縫出現(xiàn)前,底部縱筋起到抗剪及抗彎的作用.底部縱筋配筋率越大、縱筋的直徑越小,裂縫擴(kuò)展得越慢,開裂剪力隨之增加.隨著外荷載的增加,支座處垂直于梁長方向的彎曲裂縫迅速向加載點延伸,此時剪跨區(qū)出現(xiàn)斜向裂縫,與斜裂縫相交的腹筋應(yīng)力顯著增大,腹筋配筋率越大、腹筋的直徑越小、腹筋間距越小,斜向裂縫擴(kuò)展得越慢.
已有開裂剪力計算方法大多是基于試驗數(shù)據(jù)回歸的半經(jīng)驗半理論公式[9-17],計算方法如下.
1)南京工學(xué)院所提計算模型[13]:
2)鄭州工學(xué)院所提計算模型[14]:
3)徐積善團(tuán)隊所提計算模型[15]:
4)彭天明所提計算模型[16]:
5)李朋團(tuán)隊所提計算模型[17]:
式中:λ為剪跨比,ft為混凝土抗拉強(qiáng)度,b為截面寬度,h0為截面有效高度,a為剪跨,ρl為縱筋配筋率.已有的計算方法與剪跨比、混凝土抗拉強(qiáng)度、截面寬度、截面有效高度和縱筋配筋率有關(guān),尚未考慮混凝土骨料的最大粒徑、跨高比、底部縱筋的直徑、腹筋的影響.
綜合上述討論與分析,明確了建立機(jī)器學(xué)習(xí)模型時的擬輸入?yún)?shù):加載板寬度、截面寬度、有效高度、剪跨比、跨高比、混凝土抗壓強(qiáng)度、底部縱筋配筋率、水平腹筋配筋率、豎向腹筋配筋率、混凝土的最大粒徑、腹筋的最大間距和最小直徑.
為建立機(jī)器學(xué)習(xí)模型,從27篇文獻(xiàn)[5,25-50]中收集了276條含開裂荷載信息的受剪破壞的RC深受彎構(gòu)件.試驗數(shù)據(jù)庫中共有109根無腹筋試件、167根雙向腹筋試件.所收集的試驗數(shù)據(jù)庫包含的變量有開裂剪力(Vcr)、截面寬度(b)、加載板寬度(lp)、有效高度(h0)、剪跨比(a/h0)、跨高比(l0/h)、混凝土抗壓強(qiáng)度(f′c)、底部縱筋配筋率(ρl)、水平腹筋配筋率(ρsh)、豎向腹筋配筋率(ρsv)、混凝土的最大粒徑(ag)、腹筋的最大間距(smax)和最小直徑(rmin).?dāng)?shù)據(jù)分布如圖1所示,其中y軸為頻數(shù),表示參數(shù)的每個范圍在數(shù)據(jù)集中出現(xiàn)的次數(shù),詳細(xì)的試驗信息見原始文獻(xiàn).需要說明的是,圖1(l)為機(jī)器學(xué)習(xí)目標(biāo)預(yù)測值,其余均是模型特征輸入?yún)?shù).
圖1 模型特征輸入?yún)?shù)及目標(biāo)預(yù)測值(標(biāo)簽)的分布
RC深受彎構(gòu)件開裂剪力的預(yù)測,主要屬于機(jī)器學(xué)習(xí)中的回歸類問題.目前,常用于解決回歸類問題的機(jī)器學(xué)習(xí)算法主要包括回歸算法、決策樹[51]、支持向量機(jī)[52]、集成學(xué)習(xí)算法bagging[53]、集成學(xué)習(xí)算法boosting[54-55]和人工神經(jīng)網(wǎng)絡(luò)[56]等.集成學(xué)習(xí)算法boosting中的極端梯度提升樹(XGBoost)[57]性能優(yōu)勢突出,增加了正則化項,控制了模型的復(fù)雜度,在保證預(yù)測結(jié)果準(zhǔn)確性的同時避免了過擬合問題[24].Feng等[20]的研究結(jié)果表明XGBoost預(yù)測混凝土構(gòu)件的基本性能時在眾多常見集成算法中具有較好的性能,因此,本文選用XGBoost對RC深受彎構(gòu)件的開裂剪力進(jìn)行預(yù)測.
SHAP[22]是基于博弈論的用于解釋機(jī)器學(xué)習(xí)模型的方法,其是將預(yù)測目標(biāo)定義為輸入特征線性相加的加性特征歸因方法,描述各個特征對模型預(yù)測結(jié)果的貢獻(xiàn),可表示為:
式中:X=(x1,x2,···,xM)為輸入特征,X′=h(X)=(x′1,x′2,···,)為X映射后的簡化輸入(x′i∈[0,1]),M為輸入特征個數(shù),f(X)為原始機(jī)器學(xué)習(xí)模型,g(X′)為解釋模型,φ0為f(X)在數(shù)據(jù)集上的平均預(yù)測結(jié)果,φi為第i個特征的SHAP值(表示貢獻(xiàn)).以5個輸入特征為例,SHAP示意圖如圖2所示;其中:特征1、2、3對于g(X′)為正值貢獻(xiàn),特征4、5對于g(X′)為負(fù)值貢獻(xiàn).
圖2 多特征SHAP示意圖[22]
SHAP方法主要分為Kernel SHAP、Deep SHAP和Tree SHAP.其中Tree SHAP是基于樹模型的解釋方法,適用于決策樹、集成學(xué)習(xí)算法bagging的代表隨機(jī)森林、集成學(xué)習(xí)算法boosting的代表XGBoost等多種性能較好的算法.本文也將采用Tree SHAP方法對機(jī)器學(xué)習(xí)模型進(jìn)行解釋.
RC深受彎構(gòu)件開裂剪力的可解釋機(jī)器學(xué)習(xí)預(yù)測模型建立流程如圖3所示.先將數(shù)據(jù)庫中所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理.然后按照總數(shù)據(jù)70%和30%的比例隨機(jī)劃分成訓(xùn)練集和測試集.最后將數(shù)據(jù)帶入XGBoost算法生成模型,為了提高模型的性能,采用網(wǎng)格搜索技術(shù)和十折交叉驗證(CV)的方法確定最優(yōu)參數(shù).本文確定的最優(yōu)關(guān)鍵參數(shù)為:n_estimators=150、max_depth=3、learning_rate=0.3.對于回歸類模型,主要評價指標(biāo)包括可決系數(shù)(R2)、均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE),詳見式(7~10).式中:Ti表示試驗值,Pi表示模型的預(yù)測值(i=1,2,···),n表示樣本的數(shù)量.
圖3 可解釋機(jī)器學(xué)習(xí)模型建模過程
XGBoost模型與第1節(jié)提到的5個開裂剪力計算方法的預(yù)測結(jié)果如圖4所示.RC深受彎構(gòu)件分為無腹筋構(gòu)件和雙向腹筋構(gòu)件以比較已有計算方法預(yù)測效果.圖4(a)為XGBoost模型的預(yù)測結(jié)果,圖4(b~f)為已有計算方法的預(yù)測結(jié)果.圖4(a)中紅色方塊為訓(xùn)練集數(shù)據(jù),藍(lán)色圓點為測試集數(shù)據(jù);圖4(b~f)中藍(lán)色圓點為雙向腹筋深受彎構(gòu)件,橙色方塊為無腹筋深受彎構(gòu)件.表1列出了已有計算模型和XGBoost模型預(yù)測值/真實值的相關(guān)統(tǒng)計數(shù)據(jù).
表1 已有計算模型與XGBoost模型預(yù)測結(jié)果的統(tǒng)計指標(biāo)
圖4 半經(jīng)驗半理論公式與XGBoost模型的開裂剪力預(yù)測結(jié)果
1)已有計算模型僅考慮了剪跨比、混凝土抗拉強(qiáng)度、有效高度、截面寬度4個參數(shù),而XGBoost模型考慮了11個輸入?yún)?shù)的影響;2)XGBoost模型采用276條試件數(shù)據(jù)進(jìn)行建模,避免了模型過擬合;3)XGBoost模型在損失函數(shù)中增加了正則化項,提高了模型精度;綜上,XGBoost模型性能優(yōu)于已有計算模型.結(jié)合圖4和表1可知,已有計算模型的預(yù)測結(jié)果離散性較大,且散點大多落于y=x斜直線的上方區(qū)域,特別是預(yù)測配有雙向腹筋的深受彎構(gòu)件時.說明已有計算模型普遍高估了開裂剪力.已有計算模型預(yù)測效果最好的是徐積善團(tuán)隊所提的公式[15],預(yù)測結(jié)果的R2為0.64,預(yù)測值與試驗值比值的均值為1.06,標(biāo)準(zhǔn)差為0.53.由XGBoost模型預(yù)測結(jié)果的散點圖可知,散點大多落于y=x斜直線上,且較為集中,說明XGBoost模型的預(yù)測結(jié)果更為接近試驗值.XGBoost模型的統(tǒng)計指標(biāo)也表明預(yù)測效果遠(yuǎn)優(yōu)于已有計算模型,其預(yù)測值與試驗值比值的均值為0.99,標(biāo)準(zhǔn)差為0.27.
本節(jié)將在前一節(jié)預(yù)測結(jié)果的基礎(chǔ)上,采用SHAP方法對模型的預(yù)測結(jié)果進(jìn)行解釋.首先對數(shù)據(jù)庫內(nèi)所有試件進(jìn)行全局解釋,依次分析了關(guān)鍵特征重要性排序和關(guān)鍵特性依賴關(guān)系.然后對數(shù)據(jù)庫的單一樣本進(jìn)行局部解釋,分解了每個輸入變量對RC深受彎構(gòu)件開裂剪力的貢獻(xiàn)值,量化了每個輸入變量對開裂剪力的貢獻(xiàn)程度.需要說明的是,先獲得了特征重要性排序及SHAP值分布,然后是特征依賴圖,最后是單一樣本模型的預(yù)測結(jié)果.
4.1.1 特征重要性分析
特征重要性分析是解釋模型預(yù)測結(jié)果最常用的方法,它直接顯示了每個特征對最終預(yù)測的影響程度,特征對模型預(yù)測的影響程度越大,該特征就越重要.圖5(a)給出了XGBoost模型對開裂剪力的相對特征重要性結(jié)果,可知加載板寬度是最重要的特征,因為加載板寬度的平均絕對SHAP值最大.截面高度是第二重要特征,其重要性僅次于加載板寬度.而混凝土抗壓強(qiáng)度、縱筋配筋率和腹筋最小直徑是第三重要特征,其平均絕對SHAP值約是加載板寬度的1/3.腹筋最大間距、截面寬度和剪跨比對結(jié)果的影響約為加載板寬度的1/5.腹板和縱筋的配筋與鋼筋強(qiáng)度的重要性僅占混凝土抗壓強(qiáng)度的1/10左右.其余特征對結(jié)果的影響相對較?。畧D5(b)展示了每個特征變量對預(yù)測結(jié)果的影響趨勢,按照SHAP的平均絕對值進(jìn)行特征排序.
圖5 SHAP值全局模型解釋
圖5中的x軸表示SHAP值大小,SHAP值藍(lán)色代表該特征對預(yù)測有負(fù)向影響(箭頭向左,SHAP值減少),紅色代表該特征對預(yù)測有正向影響(箭頭向右,SHAP值增加).左側(cè)y軸表示輸入的特征變量;右側(cè)y軸的顏色條表示特征值的大小,紅色表示特征值高,藍(lán)色表示特征值低.每個散點表示數(shù)據(jù)庫中的一個樣本.因此可展現(xiàn)每個特征變量對預(yù)測結(jié)果是如何影響的,以及特征的重要性.比如,對于加載板寬度,其樣本大量聚集shap value為負(fù)的區(qū)域.加載板寬度的值越高,可能使模型的輸出值越大(shap value為正);加載板寬度的值越低,可能使模型的輸出值越?。╯hap value為負(fù)).故加載板寬度與模型的輸出值成正相關(guān);同理,截面高度、混凝土抗壓強(qiáng)度、截面寬度均與模型的輸出值成正相關(guān),剪跨比與模型的輸出值成負(fù)相關(guān).
4.1.2 特征依賴性分析
SHAP特征依賴圖可以用來反映SHAP值隨著輸入特征的變化而變化,在數(shù)學(xué)上包括x軸上的特征值和y軸上相應(yīng)的SHAP值.它可以揭示輸入特性如何影響預(yù)測值,以及這種影響是積極的還是消極的.開裂剪力的SHAP值隨輸入變量的變化如圖6所示.可知有效高度和混凝土抗壓強(qiáng)度的SHAP值會隨著特征值的增長而降低,當(dāng)跨高比小于4.0時,其SHAP值幾乎沒有變化,水平腹筋配筋率的SHAP值變化無明顯規(guī)律.另外,當(dāng)剪跨比大于1.0、有效高度大于750 mm、混凝土抗壓強(qiáng)度小于30 MPa、底部縱筋配筋率小于2.0%、水平腹筋配筋率小于0.50%時,它們的SHAP值為負(fù)值.也就是說,當(dāng)各特征落于上述范圍時,所預(yù)測的開裂剪力減小.還可觀察到特征之間的交互關(guān)系,如圖6(c)顯示了水平腹筋配筋率從0到0.7%的變化對剪跨比的影響.紅色的值代表變量水平腹筋配筋率的高值,而藍(lán)色的值代表低值.由圖6(c)可以發(fā)現(xiàn),當(dāng)剪跨比較大、水平腹筋配筋率較低時,SHAP值極低;可推斷出有效高度與豎向腹筋配筋率之間的關(guān)系對特征的SHAP值的共同影響,當(dāng)有效高度越小、豎向腹筋配筋率越低時,SHAP值越小.混凝土抗壓強(qiáng)度和水平腹筋配筋率、底部縱筋配筋率和跨高比也呈現(xiàn)同樣的上述規(guī)律.
圖6 特征依賴圖
本文對Smith[25]和Walraven[27]等的試驗結(jié)果進(jìn)行單一樣本模型解釋,圖7展示了SHAP值將開裂剪力的預(yù)測分解為每個輸入變量的貢獻(xiàn)之和.圖7的“base value”表示基準(zhǔn)值,即XGBoost模型對數(shù)據(jù)庫內(nèi)所有變量預(yù)測值的平均值(202.2 kN).紅色箭頭表示對基準(zhǔn)開裂剪力有正向貢獻(xiàn)的變量,藍(lán)色箭頭則表示導(dǎo)致基準(zhǔn)開裂剪力降低的變量;箭頭的長短表示增量和減量.對試件DB50/1.86-C1來說,截面寬度、加載板寬度、豎向腹筋屈服強(qiáng)度、截面有效高度、水平腹筋配筋率、水平腹筋屈服強(qiáng)度和跨高比是對基準(zhǔn)開裂剪力有正向貢獻(xiàn)的關(guān)鍵變量,它們的增量依次減小.其余變量(腹筋最大間距、縱筋屈服強(qiáng)度、腹筋的直徑、底部縱筋配筋率和混凝土抗壓強(qiáng)度)是導(dǎo)致基準(zhǔn)開裂剪力降低的關(guān)鍵變量,它們的降低程度依次減小.將所有變量的增量或減量與基準(zhǔn)開裂剪力進(jìn)行代數(shù)相加,即為圖中的模型預(yù)測值228.51 kN,與試驗值240 kN接近.對試件A1.5-0.75-1.33來說,豎向腹筋屈服強(qiáng)度是對基準(zhǔn)開裂剪力有正向貢獻(xiàn)的量.其余變量如加載板寬度、截面寬度、混凝土抗壓強(qiáng)度等是導(dǎo)致基準(zhǔn)開裂剪力降低的變量,它們的減量依次降低.將所有變量的增量或減量與基準(zhǔn)開裂剪力進(jìn)行代數(shù)相加,即為模型預(yù)測值81.74 kN,接近試驗值83.30 kN,且預(yù)測結(jié)果比試驗值低,說明最終預(yù)測結(jié)果是精確且安全的.
圖7 SHAP值單一樣本模型解釋
本文提出了一個可解釋機(jī)器學(xué)習(xí)模型來預(yù)測RC梁的開裂剪力.詳細(xì)介紹了研究思路和方法.收集了包含276條試件的數(shù)據(jù)庫來訓(xùn)練和測試XGBoost模型,然后與半經(jīng)驗半理論公式進(jìn)行比較.最后利用特征重要性、特征依賴性分析、單一樣本來解釋和驗證XGBoost模型.得出以下結(jié)論:
1)與5個半經(jīng)驗半理論公式相比,本文的XGBoost模型在預(yù)測精度和泛化能力方面有明顯的優(yōu)勢.模型的R2為91%,預(yù)測值與試驗值比值的均值為0.99,標(biāo)準(zhǔn)差為0.27.
2)通過特征重要性和特征依賴性分析,可以進(jìn)一步了解輸入?yún)?shù)對開裂剪力的作用.其中:加載板寬度是影響RC深受彎構(gòu)件開裂剪力最重要的特征,截面高度是第二重要特征,混凝土抗壓強(qiáng)度是第三重要特征.
3)通過對單一樣本進(jìn)行分析,表明了XGBoost模型預(yù)測結(jié)果是符合機(jī)理的.
本文詳細(xì)介紹了建立ML預(yù)測模型的每一步,可以幫助讀者使用ML解決自己在結(jié)構(gòu)工程中的問題.然而,在該領(lǐng)域仍有進(jìn)一步改進(jìn)的空間,例如,使用主動學(xué)習(xí)來提高計算效率,開發(fā)基于ML的力學(xué)引導(dǎo)抗剪強(qiáng)度模型以更好地應(yīng)用等.