国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于稀疏偏最小二乘的大壩安全監(jiān)測(cè)模型研究

2022-12-08 13:33:08周子玉李艷玲朱斯楊李詩婉
水利規(guī)劃與設(shè)計(jì) 2022年11期
關(guān)鍵詞:解釋性共線性回歸系數(shù)

周子玉,李艷玲,朱斯楊,李詩婉

(1.四川大學(xué)水力學(xué)與山區(qū)河流開發(fā)保護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室 水利水電學(xué)院,四川 成都 610065;2.四川省遂寧市水利局,四川 遂寧 629000)

大壩安全監(jiān)測(cè)是保障大壩安全運(yùn)行的重要措施[1],隨著互聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)的發(fā)展,大壩監(jiān)測(cè)邁向自動(dòng)化與智能化,產(chǎn)生了大量的監(jiān)測(cè)數(shù)據(jù)[2- 3]。利用原觀數(shù)據(jù)構(gòu)建合理的監(jiān)測(cè)模型對(duì)于準(zhǔn)確掌握大壩安全性態(tài)具有重大意義[4- 5]。

傳統(tǒng)統(tǒng)計(jì)回歸由于原理簡(jiǎn)單、計(jì)算便捷且能反應(yīng)環(huán)境量對(duì)監(jiān)測(cè)效應(yīng)量的影響而在大壩監(jiān)測(cè)數(shù)據(jù)分析中應(yīng)用最為廣泛。其中逐步回歸能剔除不顯著的環(huán)境量因子、偏最小二乘回歸(PLS)能解決變量中高度相關(guān)的問題[6- 7]。王佳林[8]等結(jié)合偏最小二乘回歸和遺傳算法對(duì)回歸系數(shù)的選取進(jìn)行了優(yōu)化,李麒[9]等通過SWT小波去噪后再采用SVR構(gòu)建變形預(yù)測(cè)模型,均提升了模型的精度;Belmokre[10]等和Chen[11]等采用機(jī)器學(xué)習(xí)方法改進(jìn)統(tǒng)計(jì)回歸模型,消除了傳統(tǒng)統(tǒng)計(jì)回歸模型多重共線性帶來的預(yù)測(cè)誤差。

受施工、荷載等外界環(huán)境變化,人為或監(jiān)測(cè)設(shè)備短期測(cè)值異常等因素影響,大壩安全監(jiān)測(cè)數(shù)據(jù)中不可避免會(huì)出現(xiàn)單點(diǎn)離群、多點(diǎn)離群、臺(tái)階型等數(shù)據(jù)序列[12- 13]。以上對(duì)于周期型、直線型數(shù)據(jù)擬合較好,但是對(duì)于異常波動(dòng)型、臺(tái)階型等含大量離群點(diǎn)的數(shù)據(jù)適用性低,且上述方法因不能準(zhǔn)確進(jìn)行變量篩選,導(dǎo)致模型解釋性很差。為此,本文針對(duì)逐步回歸、偏最小二乘回歸在大壩統(tǒng)計(jì)回歸中存在的主要問題,分析了其產(chǎn)生的原因,構(gòu)建了基于稀疏偏最小二乘的大壩監(jiān)測(cè)數(shù)據(jù)模型,將其運(yùn)用于周期型、直線型、異常波動(dòng)型、異常臺(tái)階型等多種原觀監(jiān)測(cè)數(shù)據(jù)序列中,并將結(jié)果與傳統(tǒng)方法對(duì)比,分析其模型的擬合精度、預(yù)測(cè)精度與模型解釋性能的改善情況,論證該模型的合理性與有效性。

1 基本原理

(1)

(2)

F0=t1r1+F1

(3)

判斷模型是否到達(dá)滿意的精度,如果沒有則繼續(xù)提取主成分。假設(shè)提取k個(gè)主成分后的回歸方程(4)。

(4)

稀疏偏最小二乘法(SPLS,Sparse Partial Least Square)是在偏最小二乘法的基礎(chǔ)上,通過在求解方向向量過程中施加懲罰來產(chǎn)生稀疏的估計(jì)結(jié)果,從而放大重要變量的回歸系數(shù),壓縮無關(guān)變量的回歸系數(shù)甚至移除變量,達(dá)到變量篩選的目的[14]。

SPLS模型的核心在于方向向量的求解,下面重點(diǎn)介紹方向向量的求解方法。首先引入SPLS中第一個(gè)方向向量,第一個(gè)主成分的稀疏化方向向量可以在方向向量w1上施加L1-懲罰(lasso懲罰)獲得,即給式(1)增加一個(gè)權(quán)重,即:

(5)

(6)

式中,c1—w1的替代向量,兩者高度相關(guān);λ1和λ2—加權(quán)懲罰因子;κ—一個(gè)用來控制問題凹凸性的參數(shù),可通過c1和w1進(jìn)行求解。當(dāng)κ=1時(shí)即可等價(jià)為PLS中初始最大特征值的求解。

針對(duì)于SIMPLS或NIPALS迭代算法結(jié)合史密斯正交化方法存在造成向量不收斂,得到的結(jié)果不準(zhǔn)確的問題。本模型采取Hyonho Chun和Sunduz Kele[16]提出新的算法,通過記錄NIPALS或SIMPLS算法的每一步來尋找活躍變量,使方向向量得到不斷更新[17],從而進(jìn)行求解。SPLS算法的步驟如下:

設(shè)A為活躍變量的指標(biāo)集,K為方向向量的個(gè)數(shù),令XA為監(jiān)測(cè)環(huán)境量X的子矩陣,XA其列指標(biāo)都包含在A中。

Step1:環(huán)境量X和效應(yīng)量Y經(jīng)過標(biāo)準(zhǔn)化。

Step3:若k?K,則

稀疏偏最小二乘回歸有4個(gè)參數(shù)(κ,λ1,λ2,K),為了讓結(jié)果收斂,約束條件λ2需要足夠大,即λ2→∞,κ取值范圍為κ∈[0,0.5],對(duì)結(jié)果不起決定作用。因此這4個(gè)參數(shù)中只有閥值參數(shù)λ1和成分個(gè)數(shù)K是關(guān)鍵參數(shù),可以使用交叉有效性判別來確定λ1和K的最優(yōu)值,這里不作過多的介紹。

這樣在提取主成分時(shí),對(duì)方向向量施加懲罰,可以使不相關(guān)變量的回歸系數(shù)被懲罰為零,達(dá)到變量篩選的目的。

2 工程校驗(yàn)與精度分析

2.1 模型擬合精度分析

以大壩監(jiān)測(cè)數(shù)據(jù)中較為典型的測(cè)點(diǎn)TP10X(周期型)、P43(直線型)、P37(異常波動(dòng)型)、TP32(異常臺(tái)階型)為例。經(jīng)計(jì)算,對(duì)周期規(guī)律型、直線型等數(shù)據(jù)序列,本文提出的模型較逐步回歸及PLS回歸模型的擬合精度略有提升;對(duì)含有異常波動(dòng)、臺(tái)階等異常測(cè)值的數(shù)據(jù)序列則提升明顯,見表1,如圖1所示。分析其原因在于異常測(cè)值影響到原始數(shù)據(jù)序列的變化規(guī)律,逐步回歸、PLS模型不能正常提取解釋能力最強(qiáng)的綜合變量所致;而SPLS模型能夠在方向向量求解過程中施加懲罰函數(shù),將無關(guān)變量壓縮至零,修正異常數(shù)據(jù)集合的估計(jì)結(jié)果,從而減小數(shù)據(jù)異常波動(dòng)或飄逸的影響。

表1 各模型擬合精度對(duì)比表

圖1 逐步回歸、PLS、SPLS模型擬合效果對(duì)比圖

2.2 模型預(yù)測(cè)精度分析

以某土石壩壩頂水平位移測(cè)點(diǎn)TP36為例,SPLS模型預(yù)測(cè)精度略優(yōu)于偏最小二乘回歸模型,較逐步回歸模型預(yù)測(cè)精度提升明顯,見表2,如圖2所示。分析其原因在于逐步回歸中變量之間共線性增加會(huì)使回歸系數(shù)估計(jì)方差迅速增大,導(dǎo)致無法正常進(jìn)行變量篩選,模型中因保留很多相關(guān)密切的變量而產(chǎn)生過擬合現(xiàn)象,從而導(dǎo)致出現(xiàn)模型擬合精度高,但是泛化性能差,預(yù)測(cè)精度低的情況;而PLS回歸能助信息分解和篩選提取出解釋性最強(qiáng)的綜合變量,剔除多重相關(guān)信息的干擾,消除了變量間多重共線性影響,使模型不再出現(xiàn)過擬合現(xiàn)象,從而提高模型預(yù)測(cè)精度;SPLS模型是以PLS為基礎(chǔ),并對(duì)其變量進(jìn)行稀疏化處理,更能有效消除變量間多重共線性影響,提高模型的泛化能力,避免產(chǎn)生過擬合現(xiàn)象,擬合精度得到進(jìn)一步提升。

表2 各模型相同測(cè)點(diǎn)預(yù)測(cè)精度對(duì)比表

圖2 某壩壩頂水平位移測(cè)點(diǎn)TP36 三種模型擬合效果和預(yù)測(cè)效果圖

2.3 模型的解釋性分析

以某土石壩高程2138.00m壩頂軸線水平位移測(cè)點(diǎn)TP28—TP36為例,通過逐步回歸、PLS回歸、SPLS回歸模型進(jìn)行環(huán)境效應(yīng)量對(duì)比分析。其測(cè)點(diǎn)實(shí)測(cè)過程線如圖3所示,環(huán)境效應(yīng)量占比如圖4所示。

逐步回歸模型中,環(huán)境量影響因子差異較大,多數(shù)測(cè)點(diǎn)主要受時(shí)效影響。壩頂右岸測(cè)點(diǎn)TP36時(shí)效分量占比接近70%,而相鄰測(cè)點(diǎn)TP35模型中卻不含時(shí)效因子;就河床壩段測(cè)點(diǎn)TP30—TP34溫度

圖3 某土石壩壩頂水平位移測(cè)點(diǎn)TP28-TP36實(shí)測(cè)過程線

圖4 某土石壩壩頂水平位移測(cè)點(diǎn)TP28-TP36 三種模型各樣本環(huán)境效應(yīng)量占比圖

分量占比而言,占比分別為12%、12%、29%、10%、10%,其中TP32測(cè)點(diǎn)溫度占比為相鄰測(cè)點(diǎn)的3倍,均與土石壩水平位移變化規(guī)律不吻合。其原因在于變量之間的高度相關(guān)性會(huì)影響回歸參數(shù)的顯著性檢驗(yàn),可能將重要變量誤刪除,同時(shí)在變量高度相關(guān)的條件下,樣本數(shù)據(jù)的微小變化對(duì)回歸系數(shù)的估計(jì)值影響很大,因此同類測(cè)點(diǎn)的數(shù)據(jù)雖然變化規(guī)律類似,但得到的模型結(jié)果可能并不相似。

PLS回歸模型消除了變量間多重共線性影響,但該模型不能進(jìn)行變量篩選,模型中含有所有自變量,大量的無關(guān)變量使得模型解釋性很差。各測(cè)點(diǎn)溫度占比均在40%左右,效應(yīng)量占比整體表現(xiàn)為土石壩主要受溫度影響,時(shí)效次之,水壓影響最小。然而對(duì)于土石壩而言,壩體變形主要受溫度影響則不符合工程實(shí)際情況。

SPLS模型為PLS的改進(jìn),不僅能有效消除變量間多重共線性影響,而且由于該模型在提取方向向量時(shí)加入懲罰函數(shù),能剔除無關(guān)變量,并擴(kuò)大重要變量的回歸系數(shù),壓縮影響程度較小但仍具有一定相關(guān)性的變量的回歸系數(shù),使得同類測(cè)點(diǎn)的模型穩(wěn)定性和整體性很好。各測(cè)點(diǎn)水平位移主要受水位和時(shí)效影響,占比分別為55%、40%左右;時(shí)效占比均在5%以內(nèi),符合實(shí)際情況,其模型解釋性較逐步回歸及PLS模型顯著提升。

3 結(jié)語

(1)常用的逐步回歸模型能進(jìn)行變量篩選但抗噪能力弱,易受到變量間多重共線性的影響,出現(xiàn)模型穩(wěn)定性、解釋性差,擬合精度高但預(yù)測(cè)精度低等問題。偏最小二乘回歸模型解決了變量間多重共線性的影響,但仍存在抗干擾能力弱,不能進(jìn)行變量篩選和解釋性差等問題。

(2)稀疏偏最小二乘回歸模型以偏最小二乘的基礎(chǔ),在方向向量的求解過程中施加懲罰函數(shù)產(chǎn)生稀疏估計(jì),壓縮無關(guān)變量,放大重要變量,因此可以消除變量間多重共線性,并且能夠進(jìn)行變量篩選。

(3)工程應(yīng)用及對(duì)比分析表明,稀疏偏最小二乘回歸模型對(duì)周期型、直線型、異常波動(dòng)、異常臺(tái)階型等多種實(shí)測(cè)監(jiān)測(cè)序列的適用性均較好,模型擬合、預(yù)測(cè)精度均有所提升,并且能夠更加準(zhǔn)確地挖掘監(jiān)測(cè)環(huán)境量與效應(yīng)量之間的潛在相關(guān)性,從而提高了模型的解釋性,為大壩安全監(jiān)測(cè)分析提供了一種新方式。

猜你喜歡
解釋性共線性回歸系數(shù)
著力構(gòu)建可解釋性模型
論行政自由裁量的“解釋性控權(quán)”
法律方法(2021年4期)2021-03-16 05:35:16
銀行不良貸款額影響因素分析
文氏圖在計(jì)量統(tǒng)計(jì)類課程教學(xué)中的應(yīng)用
——以多重共線性內(nèi)容為例
不完全多重共線性定義存在的問題及其修正建議
多元線性回歸的估值漂移及其判定方法
電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
融媒體時(shí)代解釋性報(bào)道的發(fā)展之路
傳播力研究(2017年5期)2017-03-28 09:08:30
多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時(shí)Bayes估計(jì)及優(yōu)良性
非解釋性憲法適用論
彩票| 通化县| 丽水市| 霸州市| 玛纳斯县| 泸定县| 闵行区| 中山市| 门头沟区| 衡南县| 巧家县| 大丰市| 闽清县| 永嘉县| 庐江县| 佳木斯市| 玉环县| 溆浦县| 洪湖市| 米易县| 剑阁县| 瓮安县| 册亨县| 广水市| 罗城| 黎平县| 社旗县| 大名县| 怀宁县| 溆浦县| 邯郸县| 东阿县| 湄潭县| 天气| 莆田市| 宁远县| 敦煌市| 维西| 旅游| 丁青县| 安乡县|