鄭茂輝,劉少非,,柳婭楠,李浩楠
(1.同濟大學(xué) 上海防災(zāi)救災(zāi)研究所,上海 200092;2.同濟大學(xué)土木工程學(xué)院,上海 200092)
隨著城市地下管道設(shè)施規(guī)模的不斷擴大和服役年限的增長,管道老化和運行安全問題得到越來越多的研究和關(guān)注[1-2]。城市排水管道狀況評價是制定管網(wǎng)養(yǎng)護計劃和修復(fù)計劃的重要依據(jù),也是城市安全監(jiān)管的重要內(nèi)容之一。
排水管道狀況包括結(jié)構(gòu)性狀況和功能性狀況兩方面,它們分別描述管道內(nèi)部結(jié)構(gòu)性缺陷類型、等級,以及管道過流受阻等水力狀況[3]。CCTV(closed circuit television,管道內(nèi)窺檢測)是目前國內(nèi)外排水管道檢測評估先進、有效的技術(shù)手段,其關(guān)鍵內(nèi)容就是對管道影像數(shù)據(jù)信息的判讀,包括確定內(nèi)部缺陷種類、位置表述、等級和狀況評估計算。由于CCTV檢測成本高昂,通常只是針對城市特定區(qū)域或運行年限較長的排水管道設(shè)施。而對于其他缺乏檢測資料的城市管道網(wǎng)絡(luò),其健康狀況診斷和病害趨勢預(yù)判等則亟待更多深入的研究。近些年,國內(nèi)外學(xué)者采用隨機統(tǒng)計和機器學(xué)習(xí)方法研究建立了多種管道狀況模型,如多元回歸模型[4-6]、馬爾科夫鏈模型[7-9]、神經(jīng)網(wǎng)絡(luò)模型[10-12],等等。鑒于管道老化因素眾多、過程復(fù)雜,數(shù)據(jù)驅(qū)動的神經(jīng)網(wǎng)絡(luò)模型無需深入理解老化機理,只要通過數(shù)據(jù)樣本監(jiān)督學(xué)習(xí)即可建立管道狀況同相關(guān)特征變量的關(guān)聯(lián)模式,無疑具有更好的適用性和應(yīng)用前景[10]。
極限學(xué)習(xí)機(extreme learning machine,ELM)是Huang等[13]基于廣義逆矩陣?yán)碚撎岢龅囊环N單隱含層前饋神經(jīng)網(wǎng)絡(luò)的監(jiān)督型學(xué)習(xí)算法。本文充分利用ELM計算速度快、泛化性能好的特點,將粒子群優(yōu)化(particle swarm optimization,PSO)[14]方法與其相結(jié)合,選擇最優(yōu)的網(wǎng)絡(luò)參數(shù),建立一個適用于城市排水管道狀況評價的分類器模型,并以上海市洋山港保稅區(qū)排水管網(wǎng)為例進行實證研究,驗證模型方法的合理性。
設(shè)n、L、m分別為輸入層、隱含層和輸出層的節(jié)點數(shù)。給定N組任意的樣本(xi,ti)∈Rn×Rm,ELM算法的輸出函數(shù)可以表示為
式中:g(x)為激勵函數(shù);wi=[wi1wi2…win]T,表示隱含層第i個神經(jīng)元與輸入層的連接權(quán)值;βi=[βi1βi2…βim]T,表示隱含層第i個神經(jīng)元與輸出層的連接權(quán)值;bi是隱含層神經(jīng)元的閾值;wi·xj表示wi和xj的內(nèi)積。
假定訓(xùn)練樣本數(shù)量N與隱含層神經(jīng)元節(jié)點數(shù)L相等,則對于任意給定的βi和wi,ELM能零誤差逼近學(xué)習(xí)樣本[13],即
將其以矩陣形式表達為
其中
對ELM的網(wǎng)絡(luò)訓(xùn)練等價于如下優(yōu)化問題:
當(dāng)g(x)無限可微時,隨機給定網(wǎng)絡(luò)參數(shù)wi和bi,ELM模型訓(xùn)練過程可看作求解線性系統(tǒng)Hβ=T關(guān)于的最小二乘解
式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
ELM模型隨機生成輸入權(quán)值矩陣和隱含層神經(jīng)元的閾值,無需迭代調(diào)整就可以解析計算得出網(wǎng)絡(luò)輸出值。不過參數(shù)隨機產(chǎn)生使結(jié)果存在一定的隨機性[15],容易產(chǎn)生較差的分類效果。本文結(jié)合PSO算法,優(yōu)化ELM網(wǎng)絡(luò)參數(shù)wi和bi,以改善ELM算法輸出權(quán)值βi不穩(wěn)定的缺點。
PSO算法是一種模擬鳥群覓食行為的群體智能優(yōu)化算法,其核心是粒子更新速度和位置,即
式中:pi表示粒子的個體最優(yōu)位置;gi表示搜索到的群體最優(yōu)位置;ωmax和ωmin分別為慣性權(quán)重的最大值和最小值;c1和c2均為學(xué)習(xí)因子,也稱為加速常數(shù);r1和r2為[0,1]范圍內(nèi)的均勻隨機數(shù);tmax和t分別為最大迭代次數(shù)和當(dāng)前的迭代次數(shù)。
將ELM輸入權(quán)值wi和隱含層神經(jīng)元偏置bi作為PSO算法的粒子,以極限學(xué)習(xí)機訓(xùn)練集的均方根誤差作為適應(yīng)度函數(shù),計算每個粒子的適應(yīng)度值,通過比較不斷更新粒子的速度和位置,直至達到最小誤差或最大迭代次數(shù),得到經(jīng)過PSO優(yōu)化的ELM網(wǎng)絡(luò)參數(shù)。
影響排水管道結(jié)構(gòu)性狀況的因素較多。為了簡化網(wǎng)絡(luò)模型,根據(jù)文獻[6],選取管材、管齡、管徑、埋深、管長、坡度和所在道路類型7項影響因素,作為管道結(jié)構(gòu)性狀況評價的輸入向量,以CCTV檢測結(jié)果中管道修復(fù)指數(shù)(RI)所對應(yīng)的結(jié)構(gòu)性狀況等級作為網(wǎng)絡(luò)輸出,利用PSO-ELM算法建立分類器,通過樣本數(shù)據(jù)訓(xùn)練學(xué)習(xí)確定影響因素與結(jié)構(gòu)性狀況之間的非線性關(guān)系。表1給出的管道修復(fù)指數(shù)及其對應(yīng)的結(jié)構(gòu)性狀況等級、修復(fù)建議[3]。其中,等級Ⅰ(RI≤1)表示基本完好,等級Ⅱ(1<RI≤4)表示輕微破壞,等級Ⅲ(4<RI≤ 7)表示中等破壞,等級Ⅳ(RI>7)表示嚴(yán)重破壞。
根據(jù)上述輸入、輸出向量建立排水管道結(jié)構(gòu)性狀態(tài)評價的PSO-ELM網(wǎng)絡(luò)拓撲模型,并在Matlab R2016b軟件平臺中實現(xiàn)。模型仿真時將采用試驗方法設(shè)定不同的神經(jīng)元節(jié)點數(shù)L和激勵函數(shù)g(x),對標(biāo)準(zhǔn)ELM和PSO-ELM模型訓(xùn)練測試結(jié)果進行比較分析。
表1 管道修復(fù)指數(shù)與等級劃分Tab.1 Pipeline rehabilitation index(RI)
混淆矩陣分析方法是評價分類器性能好壞最直接有效的方法。假定nij表示被分類為j類的i類樣本數(shù),則分類準(zhǔn)確率以正確分類的樣本數(shù)與總樣本數(shù)N的比值來表示
定義Ri是第i類樣本的查全率
定義G為樣本所有類別查全率的幾何平均值
指標(biāo)G適于評價不平衡數(shù)據(jù)集上分類器性能,其基本思想是使每一分類正確率盡可能大的同時,保持各類之間的平衡。
以上海市浦東新區(qū)洋山港保稅港區(qū)公共排水管道為例,采用標(biāo)準(zhǔn)ELM模型以及優(yōu)化后的PSOELM模型開展試驗研究,預(yù)測、判定排水管道結(jié)構(gòu)性狀況等級。
試驗區(qū)基礎(chǔ)數(shù)據(jù)包含兩部分:一是排水管道GIS(地理信息系統(tǒng))數(shù)據(jù),包含管材、管齡、管徑、埋深、管長、坡度和所在道路類型等模型輸入的特征數(shù)據(jù);二是試驗區(qū)2018年10月份排水管道CCTV檢測數(shù)據(jù),檢測管道里程20.3 km。基于管段唯一性標(biāo)識建立GIS數(shù)據(jù)和CCTV檢測數(shù)據(jù)對應(yīng)關(guān)系,提取有效樣本數(shù)據(jù)共559條,采用4折交叉驗證法將樣本集平均分為4份,每次驗證抽取1份作為測試集,余下3份作為訓(xùn)練集,重復(fù)進行4次,取4次測試驗證結(jié)果的平均值作為模型的誤差估計。另外,為避免各指標(biāo)量綱和數(shù)量級不同造成的不平衡性,采用最大最小法對原始數(shù)據(jù)進行了量綱一化處理,使得處理后的數(shù)據(jù)分布范圍在[0,1],公式如下:
式中:x為實測值;xmin為樣本數(shù)據(jù)的最小值;xmax為樣本數(shù)據(jù)的最大值。
利用標(biāo)準(zhǔn)ELM構(gòu)建管道狀態(tài)分類評價模型時,僅需要設(shè)定隱含層神經(jīng)元節(jié)點數(shù)L和激勵函數(shù)g(x)的構(gòu)造形式就可以求算輸出權(quán)值矩陣。實際工程應(yīng)用中隱含層神經(jīng)元節(jié)點數(shù)L一般遠小于樣本數(shù)N,L過小網(wǎng)絡(luò)預(yù)測誤差較大,L過大則會增加模型預(yù)測的時間、空間成本,容易出現(xiàn)過擬合現(xiàn)象。圖1給出sigmoid、sin和hardlim 3種常見激勵函數(shù)下隱含層神經(jīng)元節(jié)點數(shù)L對分類器能力的影響。其中,sigmoid函數(shù)和sin函數(shù)的分類器性能接近,L增至300時分類準(zhǔn)確率相對較高,約為60%。因此,對于未優(yōu)化的ELM管道狀況分類評價模型,激勵函數(shù)選擇整體性能較優(yōu)的sigmoid函數(shù),隱含層神經(jīng)元節(jié)點數(shù)L設(shè)定為300。
圖1 3種激勵函數(shù)下隱含層節(jié)點數(shù)對ELM分類性能的影響Fig.1 Effect of number of hidden nodes on ELM performance in different activation functions
為方便比較,同樣選擇sigmoid激勵函數(shù),對PSO-ELM分類器性能進行仿真分析。經(jīng)測試比較,設(shè)定PSO種群數(shù)m=40,c1=c2=1.5,ωmax=0.95,ωmin=0.4,tmax=200。如圖2所示,L=70時,PSOELM分類準(zhǔn)確率約為61%;L=130時,分類準(zhǔn)確率達到90%以上。可見,采用PSO優(yōu)化ELM的網(wǎng)絡(luò)參數(shù),能夠以更少的隱含層神經(jīng)元節(jié)點獲得更高的分類準(zhǔn)確率。需要說明的是,在復(fù)雜性程度上PSOELM比標(biāo)準(zhǔn)ELM增加了網(wǎng)絡(luò)參數(shù)尋優(yōu)的步驟,但PSO算法可以較為快速地獲取到最優(yōu)參數(shù),能夠有效避免ELM可能存在的結(jié)果不穩(wěn)健的缺點。
圖2 PSO-ELM隱含層節(jié)點數(shù)影響Fig.2 Effect of number of hidden nodes on PSO--ELM performance
通過多次試驗后,確定PSO-ELM和ELM的隱含層神經(jīng)元節(jié)點數(shù)分別為130和300時分類效果最佳。如表2所示,經(jīng)PSO優(yōu)化ELM網(wǎng)絡(luò)參數(shù)后,不光分類準(zhǔn)確率P顯著提升,G數(shù)值也由58.36%增至91.0%。通常,城市排水管道的結(jié)構(gòu)性狀況是非均衡分布的,除了整體準(zhǔn)確率,不同分類準(zhǔn)確度、查全率及相互之間的平衡也是分類器的重要評價指標(biāo)。
表2 PSO-ELM和ELM模型分類性能比較Tab.2 Comparison of performance of PSO-ELM and ELM
表3以混淆矩陣形式給出PSO-ELM和ELM在測試集上的分類結(jié)果對比。其中,結(jié)構(gòu)性損壞比較嚴(yán)重的Ⅲ類管道樣本17條,PSO-ELM準(zhǔn)確預(yù)測15條,查全率88.2%;Ⅳ類管道樣本23條,準(zhǔn)確預(yù)測21條,查全率91.3%。ELM分類器的相應(yīng)查全率則分別為64.7%和43.5%。結(jié)果可見,相比較ELM,PSOELM對于非均衡數(shù)據(jù)集顯然具有更優(yōu)的分類預(yù)測能力。
表3 分類結(jié)果混淆矩陣Tab.3 Confusion matrix for PSO-ELM
圖3給出了測試集上逐個樣本的PSO-ELM分類結(jié)果與實測值的對照。結(jié)果也表明,PSO-ELM具備較高的分類精度和擬合能力,能夠較好滿足排水管道結(jié)構(gòu)性狀況評價的應(yīng)用要求。
圖3 PSO-ELM分類測試結(jié)果Fig.3 Predicted versus observed result for PSO-ELM
(1)提出了PSO-ELM排水管道結(jié)構(gòu)性狀況評價模型,采用PSO算法優(yōu)化ELM輸入連接權(quán)值和隱含層偏置,避免參數(shù)隨機初始化造成的分類結(jié)果不穩(wěn)定、準(zhǔn)確率偏低的弊端。
(2)利用CCTV檢測樣本集對PSO-ELM、ELM進行仿真測試,試驗結(jié)果表明,PSO-ELM能夠以較少的隱含層神經(jīng)元節(jié)點達到更高的分類精度,提高了ELM模型的擬合能力。
(3)本文為城市排水管道結(jié)構(gòu)性狀況評價提供了一個新型的數(shù)據(jù)驅(qū)動的建模方法,具有較好的可行性和適用性。后續(xù)將利用更多的樣本數(shù)據(jù)訓(xùn)練優(yōu)化模型,進一步提高預(yù)測精度和泛化能力。