周宜松,趙傳萍,黃耀明,朱 麗,程 明
(1.信陽學院 土木工程學院,河南 信陽 464000;2.中國建筑第五工程局有限公司,長沙 410000)
混凝土是世界上最常用的建筑材料之一。在混凝土的力學性能中,抗壓強度是最基本也是最重要的力學性能之一。為了通過合理的混合比達到粉煤灰混凝土的預期抗壓強度,傳統(tǒng)的方法需要不斷調(diào)整混凝土的混合比來制作實驗室混凝土試樣,然后進行壓縮試驗,以獲得其抗壓強度。如果強度沒有達到預期標準,就需要重新制作試樣。這顯然是一項非常耗費時間和人力的工作。如果能用一種方法在壓縮試驗前對給定混合料的混凝土抗壓強度進行粗略估計,將大大節(jié)省試驗和試樣的時間和成本。
隨著機器學習的出現(xiàn)及其在土木工程領域的發(fā)展,各種機器學習模型在預測混凝土力學性能方面得到了應用并取得了良好的效果[1-5]。李地紅等[6]采用BP神經(jīng)網(wǎng)絡對混凝土的抗壓強度和坍落度等綜合性能進行預測,與試驗值相比,預測相對誤差集中在15%以內(nèi),基本滿足工程實踐要求。梁寧慧等[7]利用決策樹、支持向量回歸(SVR)和人工神經(jīng)網(wǎng)絡(ANN)三種方法預測高溫后聚丙烯纖維混凝土強度,其中ANN達到了最佳的預測效果。Shamiri等[8]開發(fā)了一個極端學習機(ELM)模型來預測高強度混凝土的強度,該模型取得了較高的精度和良好的泛化能力。吳賢國等[9]采用隨機森林方法(RF)預測高性能混凝土的抗壓強度,結果表明所提的隨機森林方法在高性能混凝土抗壓強度預測方面具有良好的優(yōu)勢。Xu等[10]提出了一個改進的隨機森林模型來預測高性能混凝土的抗壓強度。結果表明,該模型的預測精度高于其他算法,而且該方法表現(xiàn)出很強的泛化能力。
總的來講,機器學習模型在混凝土力學性能的預測中表現(xiàn)出良好的適用性。但利用隨機森林來分析混凝土力學性能的研究仍是相對較少的。為了更好地理解和應用隨機森林模型,需要在這個領域進行進一步探索。為此本文嘗試采用隨機森林模型對混凝土抗壓強度進行預測,并將預測結果與傳統(tǒng)的ELM和SVR比較。
隨機森林是最先進的集成算法之一,具有模型參數(shù)少、抗過擬合能力強的優(yōu)點。決策樹是隨機森林的基本預測器。如圖1所示,隨機森林回歸算法以決策樹為基本模型,通過構建不同的訓練數(shù)據(jù)集和不同的特征空間,產(chǎn)生一系列差異化的決策樹模型,通常采用投票或平均法得到最終結果。其數(shù)學表達式為
圖1 隨機森林模型示意圖[11]
其中,H(x)表示隨機森林回歸模型的預測值,hi(x)表示第i個決策樹模型的輸出。
一共收集了270組數(shù)據(jù)集。這些數(shù)據(jù)包括八個輸入變量和一個輸出變量。這些變量分別是水泥、粉煤灰、水、減水劑、粗集料、細集料、齡期和水膠比。表1和圖2顯示了這些變量的統(tǒng)計特征和分布。這些變量的分布表明,這些變量是高度離散的,而且任意一個輸入變量與輸出抗壓強度之間的皮爾遜系數(shù)都未超過0.8。這也從側面說明了多個輸入變量和抗壓強度之間存在著復雜的非線性相關關系。本文的目的是旨在建立這種非線性的關聯(lián)性。從所有的數(shù)據(jù)樣本中隨機選擇216組數(shù)據(jù)作為訓練集,其余的作為測試集。
圖2 輸入和輸出變量的分布直方圖
表1 參數(shù)的統(tǒng)計特征
表1(續(xù))
為了量化模型訓練和預測的效果,引入相應的評價指標[12-13]。這些指標的計算公式是:
其中R可以反映預測抗壓強度和實際抗壓強度之間的相關性,R越接近1表示相關性越強。誤差指標可以反映預測抗壓強度和測量抗壓強度之間的偏差和分散程度。式中Ye是抗壓強度的真實結果,Yp是抗壓強度的預測結果。
模型的訓練和測試結果如圖3所示。從圖3可以看出,相比于ELM和SVR,隨機森林模型無論訓練還是預測其結果的相關系數(shù)R是最高的,均超過了0.93。圖4展示了每個樣本點的實際值和預測結果之間的比值。在預測結果的基礎上計算對應的誤差評價指標如圖5所示。對于隨機森林而言,MAE 和RMSE均是三種模型中的最小值,表明誤差越小,預測準確率越高。
圖3 三種模型預測結果與實際值之間的相關性
圖4 模型訓練和測試結果
圖5 三種模型的誤差評價指標
①本文所介紹的三種機器學習算法均可以有效地映射出多輸入?yún)?shù)和輸出抗壓強度之間的復雜非線性關系。
②相比于極限學習機和支持向量回歸模型,本文所提出的隨機森林模型預測精度高,預測誤差更小,建議推廣至工程實踐使用。
③本文所提的抗壓強度預測方法可以部分替代實驗室壓縮試驗,大大減少實驗工作量,對科學研究和工程應用具有重要的參考意義。