葛賽
摘要:影響渠道糙率的因素相當復雜,且因素間又存在一定的相關關系。為取得更為精確的糙率預測效果,采用偏最小二乘(PLS)法對影響人工加糙渠道糙率的因素進行分析,提取影響自變量的重要成分,結(jié)合最小二乘支持向量機(LSSVM)建立了人工加糙渠道糙率預測模型。結(jié)合實例,通過對某人工加糙渠道相關試驗數(shù)據(jù)進行PLSLSSVM模型的訓練及預測,并將預測結(jié)果與單獨使用PLS、LSSVM及公式法的預測結(jié)果進行對比,其結(jié)果顯示:基于PLSLSSVM模型的預測平均絕對百分比誤差MAPE為138%,均方根誤差RMSE為224×10-4,預測精度均優(yōu)于PLS、LSSVM及公式法的預測結(jié)果。結(jié)果表明,將PLS與LSSVM相結(jié)合的PLSLSSVM模型,綜合了PLS與LSSVM各自的優(yōu)勢,應用PLSLSSVM模型可有效進行人工加糙渠道糙率的預測。
關鍵詞:偏最小二乘(PLS);最小二乘支持向量機(LSSVM);人工加糙渠道;糙率;預測
中圖分類號:TV135.3文獻標志碼:A文章編號:
16721683(2018)04018906
Roughness prediction model for artificially roughened channel based on partial least square and least square support vector machine
GE Sai1,ZHAO Tao1,WU Si2,WU Yangfeng1
(
1.College of Water Conservancy and Civil Engineering,Xinjiang Agricultural University,Urumqi 830052,China;2.Yellow River Engineering Consulting Co.,Ltd,Zhengzhou 450003,China
)
Abstract:
The factors that affect the roughness of a channel are quite complex,and there is a certain correlation between the factors.In order to obtain a more accurate prediction of the roughness,we used the partial least squares (PLS) method to analyze the factors that affect the roughness of artificially roughened channels,and we extracted the important components that affect the independent variables.Then we established the roughness prediction model for artificially roughened channels based on least square support vector machine (LSSVM).We used the experimental data of an artificially roughened channel for training and prediction of the PLSLSSVM model,and compared the prediction results with the prediction results of PLS,LSSVM,and formula methods.The results showed that the mean absolute percentage error (MAPE) of prediction based on PLSLSSVM model was 138%,and the root mean square error (RMSE) was 224×104 .Its prediction accuracy was better than that of the PLS,LSSVM,and formula methods.The results showed that the PLSLSSVM model which combines PLS and LSSVM can integrate the advantages of PLS and LSSVM.PLSLSSVM model can effectively predict the roughness of artificially roughened channels.
Key words:
partial least squares (PLS);least square support vector machine (LSSVM);artificially roughened channel;roughness;prediction
糙率[1][JP+1]與河流阻力有關,是衡量渠道邊壁粗糙程度對運動水流產(chǎn)生影響的一個無量綱數(shù),其值重要且敏感,糙率的精確取值是明渠水流的水力計算向精準方向發(fā)展擬解決的關鍵問題之一。明渠糙率研究可分為兩個方向,即天然渠道糙率和人工渠道糙率。人工渠道以其較為規(guī)則的結(jié)構形式及沿程均勻的粗糙程度,簡化天然渠道復雜多變的水力要素,同時加糙處理后的人工渠道增加了多種邊壁粗糙條件,更易于對糙率進行更為全面深入的研究[23]。
多年以來,有許多學者[49]從分析糙率與關鍵水力要素的相關關系出發(fā),力求推導出普遍適用的糙率經(jīng)驗公式,[JP+1]但取得的成果有限。隨著計算機技術的發(fā)展,有學者打破糙率研究的傳統(tǒng)思維方式,通過構建數(shù)學模型進行糙率預測并取得豐碩成果。Becker 等[1011]提出將改進的單純形算法用于糙率數(shù)學模型的建立,金忠青等[1213]采用復合形法構建河網(wǎng)糙率預測模型,程偉平等[1415]引入廣義逆理論及帶參數(shù)的卡爾曼濾波構建糙率預測模型,雷燕等[16]運用遺傳算法建立糙率數(shù)學模型,辛小康等[17]對遺傳算法優(yōu)化構建預測模型,漲潮等[1819]基于BP神經(jīng)網(wǎng)絡并對算法進行改進構建糙率數(shù)學模型。雖然糙率預測模型依舊在不斷完善創(chuàng)新,但仍存在多種限制因素,例如模型需大量樣本數(shù)據(jù)進行學習訓練且運算效率較低,極易陷入局部最優(yōu)狀態(tài),而且模型參數(shù)的選擇難度較大將會影響計算精準度。最小二乘支持向量機(Least Square Support Vector Machine,簡稱LSSVM)是由Suykens 等[2022]提出的對標準支持向量機(Support Vector Machine,簡稱SVM)[23]的改進優(yōu)化,除擁有SVM解決小樣本、非線性、避免陷入局部極值、參數(shù)尋優(yōu)方法簡便等優(yōu)勢外,又通過在目標函數(shù)中引入誤差平方和項進一步降低計算復雜度提高運算效率,減小SVM迭代誤差可能對算法精度產(chǎn)生的影響。本文提出應用LSSVM進行人工加糙渠道糙率預測,并預先對多個主要影響因素進行偏最小二乘(Partial Least Squares,簡稱PLS)[24]分析,提取影響糙率的重要成分,降低無關成分及變量間不獨立對模型的影響。
因此,本文采用PLS法對數(shù)據(jù)預處理,結(jié)合LSSVM建立模型,構建基于偏最小二乘及最小二乘支持向量機(簡稱PLSLSSVM)的人工加糙渠道糙率預測模型。并以某矩形人工加糙渠道為例進行模型訓練及預測,驗證模型可靠性及適用性。
1模型算法原理
1.1偏最小二乘(PLS)算法
偏最小二乘是一種用于多元統(tǒng)計數(shù)據(jù)分析的新型算法,在消除變量間相關性問題及提取變量的重要信息方面表現(xiàn)突出,綜合了典型相關分析、主成分分析及多元線性回歸分析在數(shù)據(jù)分析處理方面的優(yōu)勢于一體。根據(jù)本文實際情況,針對多自變量及單因變量進行研究,假設樣本數(shù)為m,自變量個數(shù)為n,構成自變量矩陣[WTHX]X[WTBX]=(xij)m×n,因變量矩陣[WTHX]y[WTBX]=(yi)m×1。算法具體計算步驟如下。
2.1PLSLSSVM模型
在處理實際工程問題時,經(jīng)常會遇到存在多種影響因素的情況,[JP+1]直接將數(shù)據(jù)帶入到模型中不僅會干擾模型計算的精度,甚至可能會嚴重影響模型運算效率。偏最小二乘PLS法通過對原變量進行預處理,提取出反映變量信息的重要成分,這些新提取的成分包含了原變量的所有信息,且各個成分間相互獨立,消除了原變量間存在的線性相關的情況,同時,重要成分的個數(shù)小于原變量的個數(shù),實現(xiàn)了對原數(shù)據(jù)組的降維。最小二乘支持向量機LSSVM是一種優(yōu)質(zhì)的機器學習方法,其可通過對訓練集進行學習訓練,掌握事物內(nèi)部的變化規(guī)律,從而對測試集做出客觀合理的預測。偏最小二乘及最小二乘支持向量機PLSLSSVM模型是將偏最小二乘PLS與最小二乘支持向量機LSSVM相結(jié)合,首先運用PLS法對樣本數(shù)據(jù)進行預處理,并將預處理提取的重要成分作為LSSVM的輸入,以減小模型對數(shù)據(jù)的識別難度,進一步發(fā)揮LSSVM在預測方面的優(yōu)勢。
2.2人工加糙渠道糙率物理模型
某人工渠道長20 m、寬04 m、深03 m,斷面形狀為矩形,底坡為可自動調(diào)節(jié)裝置,采用PVC材質(zhì)制作。試驗系統(tǒng)由供水裝置、靜水箱、可進行坡度調(diào)節(jié)的渠道、尾門、量水堰、回水裝置等組成,試驗系統(tǒng)見圖1。測量段選取去除渠道首尾各3 m的中間部分,每間隔1 m作為一個測量斷面,每個斷面布設左、中、右三個測點。渠道通過保持光滑壁面條件及在底部、兩側(cè)粘貼粒徑d為1~2 mm、2~3 mm、3~5 mm砂粒的方式,模擬出絕對粗糙度Δ為0015 mm、15 mm、25 mm、40 mm的4種不同邊壁條件。在滿足某一邊壁條件下,調(diào)節(jié)0004~003[JP+1]共8種不同底坡,設置12~41 L/s共10組不同流量,采用水位測針量測每個測點的水深從而得出渠道的平均水深,根據(jù)相關已知條件計算得到各關鍵水力要素及糙率值,試驗共獲得320組試驗數(shù)據(jù)。
2.3基于PLSLSSVM的人工加糙渠道糙率預測模型建立
劃分訓練集及測試集。由前期研究成果[2526]可知,影響人工加糙渠道糙率的主要因素間存在相關性,冗余信息會對預測模型產(chǎn)生干擾。將絕對粗糙度Δ(x1)、佛汝德數(shù)Fr(x2)、渠道平均水深h(x3)、底坡i(x4)作為PLSLSSVM模型的自變量,人工加糙渠道糙率n值(y)作為PLSLSSVM模型的因變量,構成數(shù)據(jù)矩陣[WTHX]A[WTBZ]為32×5。將320組樣本數(shù)據(jù)隨機選取240組作為訓練集,其余80組數(shù)據(jù)作為測試集。
提取重要成分。對數(shù)據(jù)矩陣A進行偏最小二乘PLS提取重要成分并進行交叉有限性檢驗,得到Q21、Q22、Q23分別為04889、01548、00694。其中,Q21、Q22、Q23分別表示提取一個、兩個和三個成分的交叉有效性檢驗值。由于Q23<00975,故可提取前兩個重要成分表示自變量的特征信息,將提取的重要成分作為LSSVM模型的輸入。
選取核函數(shù)及參數(shù)。將徑向基函數(shù)(Radial Basis Function,簡稱RBF)作為核函數(shù),其在此模型條件下表現(xiàn)出較其他核函數(shù)更為出色的泛化能力,并且已在許多領域廣泛應用。采用交叉驗證法進行參數(shù)尋優(yōu),得到正則化參數(shù)γ=618933 3,核參數(shù)σ2=0137 9。
模型訓練預測。對已構建好的PLSLSSVM模型進行學習訓練,并對測試集進行預測。選取平均絕對百分比誤差MAPE及均方根誤差RMSE作為模型精確性度量標準,反映預測值和觀測值之間的偏差程度,對預測結(jié)果可靠性進行評價。公式分別如下:
2.4基于PLSLSSVM的人工加糙渠道糙率預測模型結(jié)果及分析
采用PLS法對人工加糙渠道糙率相關樣本數(shù)據(jù)進行預處理,并將預處理后的結(jié)果作為LSSVM的輸入。通過對組合模型PLSLSSVM進行學習訓練,在模型掌握事物相應的內(nèi)部規(guī)律后,對測試集做出預測。為驗證組合模型的預測精度,將預測結(jié)果分別與單獨使用PLS、LSSVM模型的預測結(jié)果進行對比,同時,為更進一步說明預測模型的優(yōu)勢,將模型預測效果與公式法的預測效果進行對比。借鑒李榕[27]基于量綱分析法及利用大量的試驗數(shù)據(jù)推求的適用于明渠均勻流的糙率回歸方程形式,如式(23)所示,通過擬合可知,式(23)中的系數(shù)n0及α與底坡i具有良好的對數(shù)函數(shù)關系。擬合得到的4種不同邊壁條件下的系數(shù)n0及α如表1所示,并將其分別帶入式(23)中進行糙率預測,總的預測效果對比見圖2及表2。
n=n0+α[JB((][SX(]B[]B+2h[SX)][JB))]0.35lgFr[JY](23)
式中:n表示糙率;n0及α為系數(shù);B表示渠道寬度, 在本試驗中為04 m;Fr表示佛汝德數(shù);B/(B+2h)035lgFr為回歸方程中的自變量。
在明渠水流的水力計算中,對糙率取值的精度要求較為嚴格。采用PLS法進行糙率預測,預測數(shù)據(jù)的平均絕對百分比誤差MAPE為769%,均方根誤差RMSE為1.10×103 ,而采用公式法進行糙率預測,預測數(shù)據(jù)的平均絕對百分比誤差MAPE為481%,均方根誤差RMSE為839×104,預測精度較PLS法有了一定程度的提升。LSSVM模型預測數(shù)據(jù)的平均絕對百分比誤差MAPE為290%,均方根誤差RMSE為401×104,與公式法的預測結(jié)果相比,在預測精度方面有了進一步的提升,但LSSVM模型將樣本數(shù)據(jù)直接作為模型的輸入,可能會對模型訓練產(chǎn)生干擾從而影響預測結(jié)果。PLSLSSVM模型融合了PLS及LSSVM模型的優(yōu)點,預測數(shù)據(jù)的平均絕對百分比誤差MAPE為138%,均方根誤差RMSE為2.24×104,預測性能較單獨使用LSSVM模型有了更進一步的提升。由此可見,在對人工加糙渠道的研究過程中,PLSLSSVM模型相對于PLS、LSSVM模型及公式法來說,更適合用于進行人工加糙渠道糙率方面的相關預測。
2.5不同變量組合下的PLSLSSVM模型預測效果對比
以在人工加糙渠道糙率預測方面表現(xiàn)良好的PLSLSSVM作為預測模型,基于上文選用的作為模型輸入的自變量組合形式:絕對粗糙度Δ(x1)、佛汝德數(shù)Fr(x2)、渠道平均水深h(x3)、底坡i(x4),嘗試另外3種自變量組合形式;絕對粗糙度Δ(x1)、佛汝德數(shù)Fr(x2)、渠道平均水深h(x3);絕對粗糙度Δ(x1)、渠道平均水深h(x2)、底坡i(x3);絕對粗糙度Δ(x1)、渠道平均水深h(x2)進行模型的訓練及預測,不同變量組合下的預測效果對比如表3所示。
從表3中可以看出,新選用的3種變量組合形式下模型預測精度均低于原變量組合形式下的預測精度。其中,同時去除變量Fr、i的組合形式對模型預測精度影響最大,去除變量Fr比去除變量i的組合形式對模型預測精度的影響更大。
3結(jié)論
(1)文章采用偏最小二乘及最小二乘支持向量機PLSLSSVM模型,進行人工加糙渠道糙率的相關預測。對影響人工加糙渠道糙率的主要因素進行PLS重要成分的提取,消除變量間的多重相關性,綜合全面描述事物的本質(zhì)因素,并將提取的重要成分作為最小二乘支持向量機LSSVM的輸入,減小數(shù)據(jù)對模型的干擾,更有助于模型的訓練及預測。
(2)預測結(jié)果顯示,PLSLSSVM模型預測數(shù)據(jù)的平均絕對百分比誤差MAPE為138%,均方根誤差RMSE為2.24×104,優(yōu)于單獨使用PLS模型、公式法的預測效果,較優(yōu)于單獨使用LSSVM的預測效果。PLSLSSVM模型綜合了PLS、LSSVM各自的優(yōu)勢性能,進一步提高了預測精度。
(3)選取更為合理的糙率,提高明渠水流水力計算的精度,不僅有利于渠道正常投入運行,更有利于對其進行科學的規(guī)劃與管理。選取適用的自變量組合形式,基于PLSLSSVM模型進行渠道糙率預測,具有良好的應用前景。
參考文獻(References):
[1]邱秀云.水力學[M].烏魯木齊:新疆電子出版社,2008.(QIU X Y.Hydraulics[M].Urumqi:Xinjiang Electronic Press,2008.(in Chinese))
[2]張羅號.明渠水流阻力研究現(xiàn)狀分析[J].水利學報,2012,43(10):11541162.(ZHANG L H.Research status of flow resistance in open channel[J].Journal of Hydraulic Engineering,2012,43(10):11541162.(in Chinese)) DOI:10.13243/j.cnki.slxb.2012.10.007.
[3]楊岑,路澤生,欒維功,等.矩形渠道人工加糙壁面阻力規(guī)律試驗研究[J].長江科學院院報,2011,28(1):3438.(YANG C,LU Z S,LUAN W G,et al.Experimental study on friction law of artificial roughwall rectangle channel[J].Journal of Yangtze River Scientific Research Institute,2011,28 (1):3438.(in Chinese))
[4]戴路,李瑞杰,豐青,等.一般形式的阻力系數(shù)公式及其在挾沙力計算中的應用[J].泥沙研究,2016(2):713.(DAI L,LI R J,F(xiàn)ENG Q,et al.General form of resistance coefficient formula and its application in calculation of sedimentcarrying capacity[J].Journal of Sediment Research,2016(2):713.(in Chinese)) DOI:10.16239/j.cnki.0468155x.2016.02.002.
[5]馮繽予,喻國良.浮簾群水流阻力特性試驗研究[J].水利水電科技進展,2017,37(1):2732.(FENG B Y,YU G L.Experimental study on flow resistance of suspended flexible curtain group[J].Advances in Science and Technology of Water Resources,2017,37(1):2732.(in Chinese)) DOI:10.3880/j.issn.10067647.2017.01.005.
[6]張小峰,楊雯婷,陳建良,等.壅水情況下非均勻流糙率系數(shù)研究[J].泥沙研究,2014,(5):6572.(ZHANG X F,YANG W T,CHEN J L,et al.Study on roughness coefficient of nonuniform flow in backwater[J].Journal of Sediment Research,2014(5):6572.(in Chinese)) DOI:10.16239/j.cnki.0468155x.2014.05.002.
[7]李乾龍,李乃穩(wěn),陳小攀,等.不同邊壁條件下矩形明渠水力特性實驗研究[J].南水北調(diào)與水利科技,2016,14(3):8489.(LI Q L,LI N E,CHEN X P,et al.Experimental study on hydraulic characteristics of rectangular open channels under different boudary conditions[J].SouthtoNorth Water Transfers and Water Science ? Technology,2016,14(3):8489.(in Chinese)) DOI:10.13476/j.cnki.nsbdqk.2016.03.015.
[8]楊開林.明渠冰蓋下流動的綜合糙率[J].水利學報,2014,45(11):13101317.(YANG K L.Under the ice canopy flow under the comprehensive roughness[J].Journal of Hydraulic Engineering,2014,45(11):13101317.(in Chinese)) DOI:10.13243/j.cnki.slxb.2014.11.006.
[9]朱長軍,郝振純,江恩惠,等.挾極細沙水流的明渠綜合糙率系數(shù)變化規(guī)律研究[J].三峽大學學報(自然科學版),2008(5):13.(ZHU C J,HAO Z C,JIANG E H,et al.A Study of roughness with extra fine sediment in open channel[J].Journal of China Three Gorges University (Natural Sciences),2008(5):13.(in Chinese))
[10]BECKER L,YEH W W G.Identification of parametersin unsteady open channel flows[J].Water Resources Research,1972,8(4):956965.
[11]Becker L,Yeh W W G.Identification of multiple reach channel parameters[J].Water Resources Research,1973,9(2):326335.
[12]金忠青,韓龍喜,張健.復雜河網(wǎng)的水力計算及參數(shù)反問題[J].水動力學研究與進展A輯,1998,13(3):280285.(JIN Z Q,HAN L X,ZHANG J.Hydraulic calculation and inverse problem of complex river network[J].Chinese Journal of Hydrodynamics,1998,13(3):280285.(in Chinese))
[13]韓龍喜,金忠青.三角聯(lián)解法力水質(zhì)模型的糙率反演及面污染源計算[J].水利學報,1998(7):3034.( HAN L X,JIN Z Q.Roughness inversion and surface pollution source calculation of triangle solution manpower water quality model[J].Journal of Hydraulic Engineering,1998(7):3034.(in Chinese))
[14]程偉平,劉國華.基于廣義逆理論的河網(wǎng)糙率反演研究[J].浙江大學學報(工學版),2005(10):145150.( CHENG W P,LIU G H.Inverse analysis of channel friction based on generalized inverse theory[J].Journal of Zhejiang University (Engineering Science),2005(10):145150.(in Chinese))
[15]程偉平,毛根海.基于帶參數(shù)的卡爾曼濾波的河道糙率動態(tài)反演研究[J].水力發(fā)電學報,2005(2):123127.(CHENG W P,MAO G H.Study on channel friction parameter inversion based on Kalman filter with unknown parameter vector[J].Journal of Hydroelectric Engineering,2005(2):123127.(in Chinese)) DOI:10.3969/j.issn.10031243.2005.02.027.
[16]雷燕,唐洪武,周宜林,等.遺傳算法在河網(wǎng)糙率參數(shù)反演中的應用[J].水動力學研究與進展A輯,2008,23(6):613616.(LEI Y,TANG H W,ZHOU Y L,et al.Application of genetic algorithm for back analysis of roughness parameters in river networks[J].Chinese Journal of Hydrodynamics,2008,23(6):613616.(in Chinese)) DOI:10.16076/j.cnki.cjhd.2008.06.013.
[17]辛小康,劉剛,張向東,等.基于遺傳優(yōu)化的河網(wǎng)數(shù)學模型糙率參數(shù)反演[J].水利水電科技進展進展,2009,29(6):2124.(XIN X K,LIU G,ZHANG X D,et al.Investigation on parameter identification for river network model by using genetic algorithm[J].Advances in Science and Technology of Water Resources,2009,29(6):2124.(in Chinese)) DOI:10.3880/j.issn.10067647.2009.06.006.
[18]張潮,毛根海,張土喬,等.基于數(shù)據(jù)挖掘的河網(wǎng)糙率直接反演方法[J].水力發(fā)電學報,2009,28(1):108112.(ZHANG C,MAO G H,ZHANG T Q,et al.Direct inversion method of river network roughness based on data mining[J].Journal of Hydroelectric Engineering,2009,28(1):108112.(in Chinese))
[19]張潮,毛根海,張土喬,等.基于 BPBayesian方法的河網(wǎng)糙率反演[J].江蘇大學學報自然科學版,2008,29(1):4851.(ZHANG C,MAO G H,ZHANG T Q,et al.Inversion of roughness parameter of river network based on BPBayesian method[J].Journal of Jiangsu University Natural Science Edition,2008,29(1):4851.(in Chinese))
[20]SUYKENS J A K,VANDEWALLE J.Least squares support vector machine classifiers[J].Neural Processing Letters,1999,9(3):293300.
[21]GRITIANINI N,SHAW ETAYLOR J.An introduction to support vector machines[M].Cambridge:Cambridge University Press,2000.
[22]LUKAS L,SUYKENS J A K,Vandewalle J.Least squares support vector machines classifiers:A multi twospiral benchmark problem[C].// Proceedings of the Indonesian Student Scientific Meeting.Manchester,2001:289292.
[23]CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995,20(3):273 297.