尚保玉 郭順生 郭 鈞
(武漢理工大學機電工程學院 武漢 430070)
基于粗糙集和RBF神經(jīng)網(wǎng)絡的高速公路路面使用性能評價方法,就是把粗糙集理論和RBF神經(jīng)網(wǎng)絡相結(jié)合,并在高速公路路面使用性能評價中的綜合應用,旨在提高對路面使用性能評價的精度和效率.該方法繼承了粗糙集理論和RBF神經(jīng)網(wǎng)絡各自的特點,形成優(yōu)缺點互補,使兩者的優(yōu)勢得到充分發(fā)揮.不僅具有粗糙集理論的約簡特性,而且兼?zhèn)淞薘BF神經(jīng)網(wǎng)絡逼近能力強、學習速度快等優(yōu)點.通過實證分析,結(jié)果表明該方法具有很高的評價精度,較大程度的提高了運算能力和收斂速度,使決策者能夠快速的、準確的給出實時的養(yǎng)護決策,具有很高的使用價值[1].
筆者提出的引入粗糙集理論的路面使用性能評價模型見圖1.在保留人工神經(jīng)網(wǎng)絡自學習、自組織特性的基礎上,利用粗糙集理論對數(shù)據(jù)進行優(yōu)化處理[2],提取其中關鍵要素作為網(wǎng)絡的輸入,從而簡化了神經(jīng)網(wǎng)絡的結(jié)構(gòu),提高了分類精度.
圖1 基于粗糙集神經(jīng)網(wǎng)絡的路面使用性能評價模型流程圖
在保證具有良好的分類質(zhì)量和精度的前提下,對神經(jīng)網(wǎng)絡模型的輸入數(shù)據(jù)進行屬性約簡.基于粗糙集和RBF神經(jīng)網(wǎng)絡的使用性能評價模型的流程圖見圖2.具體步驟如下.
步驟1樣本采集 從高速公路路面管理處數(shù)據(jù)庫中抽調(diào)樣本數(shù)據(jù),按照指標屬性構(gòu)建初始的寬泛屬性集,并按照一定的比例選擇訓練樣本和測試樣本.
圖2 路面使用性能評價的粗糙集和RBF神經(jīng)網(wǎng)絡系統(tǒng)框架
步驟2構(gòu)建決策表 對數(shù)據(jù)首先進行預處理,填補空缺值等以保證樣本數(shù)據(jù)適合挖掘;對指標值進行語義界定,確定每個指標值的界定屬性值,建立決策表[3].
步驟3屬性約簡 利用決策表建立可辨識矩陣,并通過邏輯表達式計算出決策表的屬性約簡集和屬性核.
步驟4創(chuàng)建RBF神經(jīng)網(wǎng)絡 由屬性約簡集和屬性核確定RBF神經(jīng)網(wǎng)絡的輸入神經(jīng)元個數(shù),進而確定整個RBF神經(jīng)網(wǎng)絡的結(jié)構(gòu)構(gòu)成.
步驟5網(wǎng)絡訓練 用訓練樣本對RBF神經(jīng)網(wǎng)絡進行訓練[4].
步驟6網(wǎng)絡仿真 用測試樣本對訓練后的RBF神經(jīng)網(wǎng)絡進行仿真驗證網(wǎng)絡的可靠性及使用性等.
根據(jù)高速公路的路面數(shù)據(jù)的特點以及上文所述,確定粗糙集理論的屬性約簡建模步驟.具體約簡步驟如下.
步驟1確定屬性集 通過對高速公路路面使用性能評價研究,對所有能夠影響到路面性能評價的指標進行分析,確定寬泛的屬性集,即評價指標集,又稱為條件屬性,并明確決策屬性,即最終能夠?qū)β访媸褂眯阅苓M行評價的綜合指標.
步驟2數(shù)據(jù)收集 主要是收集路面歷史數(shù)據(jù)樣本或獲取路面的實時數(shù)據(jù),為路面使用性能評價做前提準備.
步驟3數(shù)據(jù)預處理 如某些指標值因為現(xiàn)有設備故障沒辦法測得或數(shù)值丟失等原因所致的數(shù)據(jù)同其他數(shù)據(jù)不一致,達不到?jīng)Q策表的完整性.需要用一些方法對這些數(shù)值進行預處理,使之達到使用要求,如用某些特殊方法(Mean completer算法、Combinational completer算法等)來對丟失的數(shù)據(jù)進行預先處理.
步驟4數(shù)據(jù)歸一化處理 對指標數(shù)據(jù)進行歸一化處理,定性數(shù)據(jù)轉(zhuǎn)化為數(shù)值型,如路面裂縫的有輕、重兩個級別,分別用0和1來表示.
步驟5構(gòu)建決策表系統(tǒng) 屬性約簡的決策表和關系型數(shù)據(jù)庫中的二維表一樣,其中每一個樣本數(shù)據(jù)就是論域中的一個元素,每一列為一個指標,最后一列是決策指標.
步驟6構(gòu)建可辨識矩陣 按照公式(1)確定可辨識矩陣的每一個元素值.
步驟7約簡指標 通過可辨識函數(shù)f(A)=∧(∨mij)對指標進行約簡,最終篩選出對路面使用性能評價最具有價值、最約簡的指標集.
約簡主要包括2部分:屬性約簡和值約簡[5].考慮到高速公路數(shù)據(jù)指標量大等實際情況,這里采用條件屬性約簡.隨著研究的深入,基于可辨識矩陣的算法已經(jīng)相當?shù)某墒?,而且可辨識矩陣在處理具有大量指標時有其獨特的優(yōu)勢,并且已經(jīng)在一些實際的約簡問題中得到普遍的使用,因此這里應用可辨識矩陣來對數(shù)據(jù)進行屬性約簡.
可辨識矩陣主要根據(jù)決策屬性或條件屬性的值是否相同來確定矩陣的元素值的.具體方法按照公式(1)可得出.
根據(jù)可辨識矩陣,利用可辨識函數(shù)f(A)=∧(∨mij)即可求出最簡屬性集.該函數(shù)是布爾函數(shù).如果出現(xiàn)屬性集合mij為空,那么就定函數(shù)值為1,從可辨識矩陣的定義和公式可以看出,矩陣M中屬性組合為1的元素項的全部集合構(gòu)成粗糙集決策表的核[6].
在RBF神經(jīng)網(wǎng)絡中,設輸入層、隱含層和輸出層的神經(jīng)元數(shù)分別為L,M和N.其中L是經(jīng)過指標約簡而定的,由上文可知為6;N為系統(tǒng)要求的路面綜合評價指標PQI,因此N為1.利用newrbe創(chuàng)建一個精確的RBF神經(jīng)網(wǎng)絡,能夠自動選擇隱含層數(shù)目,使得誤差達到最小.因此,選擇RBF神經(jīng)網(wǎng)絡為6×Y×1的結(jié)構(gòu).其結(jié)構(gòu)圖限于篇幅這里不予給出.
4.1.1 屬性集確定與收集 由于本研究是基于河南省某高速公路(瀝青路面)管理處而實施的,所以僅對瀝青路面型的高速公路路面數(shù)據(jù)進行采集和約簡,以驗證粗糙集理論在路面使用性能評價指標約簡中的良好應用.為了能夠可靠的、真實的反映路面使用性能評價模型的評價能力,這里選取路面數(shù)據(jù)中對路面狀況影響較大的15種指標作為路面使用性能評價的寬泛指標.下面是在該管理處高速公路的不同地段、不同時間隨機抽樣的3組共70項樣本數(shù)據(jù).其中前50項作為訓練樣本,后20項作為測試樣本之用.這15種指標分別為:日交通量Nm,輛/d;瀝青面層厚度h,mm;路面損壞狀況指數(shù)PCI;路面行駛質(zhì)量指數(shù)RQI;路面整體承載能力SSI;路面抗滑能力指數(shù)SRI(路面抗滑性能指數(shù)采用抗滑系數(shù)作為評價指標,抗滑系數(shù)以橫向力系數(shù)SFC或擺式儀的擺值BPN表示,這里選取橫向力抗滑系數(shù)作為路面抗滑性能指標);縱向裂縫LC;橫向裂縫TC;坑槽S;龜裂C;麻面松散R;沉陷M;日均氣溫t,℃;抗壓強度p,MPa和路面綜合評價指標PQI.PQI是決策屬性指標,其余全部為條件屬性指標.數(shù)據(jù)屬性信息見表1.
表1 瀝青路面抽樣數(shù)據(jù)
4.1.2 數(shù)據(jù)預處理和歸一化處理 利用基于粗糙集理論下的可辨識矩陣對表1進行指標約簡,找出影響路面使用性能評價指標的約簡核,并建立決策表.對表1數(shù)據(jù)進行歸一化處理,把定性指標轉(zhuǎn)化為數(shù)值型[7],如縱向裂縫有輕、重2種破損程度之分,分別用數(shù)字1和0來表示.把PCI,RQI,SSI,SFC等按照各自的評價標準分類轉(zhuǎn)化為數(shù)值型.各指標等級劃分標準見表2.
表2 瀝青路面評價標準[8]
通過歸一化處理,使各種指標都轉(zhuǎn)化為數(shù)值型,并構(gòu)建決策表,限于篇幅,不再給出決策表.
4.1.3 構(gòu)建可辨識矩陣并篩選指標 通過以上對數(shù)據(jù)的處理,然后由可辨識函數(shù)推算出可辨識矩陣,見表3.
表3 可辨識矩陣M
式(2)表明,屬性b,c,d,e,f和m是必須的,而其余的屬性則是冗余的.由此可以知道,采用可辨識矩陣的屬性約簡的結(jié)果集為{瀝青面層厚度h,路面損壞狀況指數(shù)PCI,路面行駛質(zhì)量指數(shù)RQI,路面整體承載能力SSI,路面抗滑能力指數(shù)SRI,抗壓強度p}.即使用這6個指標作為RBF神經(jīng)網(wǎng)絡的輸入.
在表1中,前50組數(shù)據(jù)作為訓練樣本,后20組作為測試樣本.利用MATLAB神經(jīng)網(wǎng)絡工具箱直接調(diào)用RBF函數(shù),在網(wǎng)絡的學習過程中,為了減少學習時間,防止數(shù)據(jù)過大而溢出,需要對網(wǎng)絡進行歸一化處理,即直接調(diào)用premnmx函數(shù),把數(shù)據(jù)都整理在區(qū)間[-1,1]之間.
選取約簡后的6個指標作為網(wǎng)絡的輸入,以路面綜合評價指標PQI為輸出.根據(jù)表2,把70組樣本數(shù)據(jù)的PQI按照{優(yōu)、良、中、次、差}5個等依次用5個向量表示,即,優(yōu)=[1 0 0 0 0]′、良=[0 1 0 0 0]′、中=[0 0 1 0 0]′、次=[0 0 0 1 0]′、差=[0 0 0 0 1]′,具體見表5.這里以是否加入粗糙集的2個網(wǎng)絡對數(shù)據(jù)進行仿真分類評價.經(jīng)過一定的試算發(fā)現(xiàn),當SPREAD=0.85時,網(wǎng)絡的訓練誤差較小,因此,SPREAD定為0.85.見表4.
表4 路面使用性能評價模型的加入粗糙集前后分類仿真誤差對比
從表4中可見,加入粗糙集并對屬性約簡后,網(wǎng)絡的仿真效果較理想,整體誤差比未進行屬性約簡的網(wǎng)絡仿真的結(jié)果小,未進行屬性約簡的結(jié)果在第69組數(shù)據(jù)仿真時出現(xiàn)失真,誤差較大.由于本次數(shù)據(jù)采集有限,約簡后的評價精度仍然較大,如果訓練數(shù)據(jù)足夠充足,則預測與仿真效果將會越好.
提出了基于粗糙集和RBF神經(jīng)網(wǎng)絡在路面性能評價上的應用,并研究了其評價的精度等問題,通過算例分析表明,在路面使用性能評價的數(shù)據(jù)分類仿真方面,輸出結(jié)果都與采集的樣本結(jié)果基本保持一致.基于粗糙集和RBF神經(jīng)網(wǎng)絡的使用性能評價的提出,加快了對高速公路養(yǎng)護決策的響應速度和面向大規(guī)模的路面養(yǎng)護管理提供了一個有效而又便捷的解決途徑,具有較大的使用價值和重要的實際意義.
[1]Mak B,Munakata T.Rule extraction from expert heuristics:A comparative study of rough set with neural networks and ID3[J].European Journal of Operational Research,2002,136:212-229.
[2]Hung Y H.A neural network classifier with rough set-based feature selection to classify multiclass IC package products[J].Advanced Engineering Informatics,2009,23:348-357.
[3]Hou Zhijian,Lian Zhiwei,Yao Ye,et al.Cooling-load prediction by the combination of rough set theory and an artificial neural-network based on data-fusion technique[J].Applied Energy,2006,83:1033-1046.
[4]Li Renpu,Wang Zhengou.Mining classification rules using rough sets and neural networks[J].European Journal of Operational Research,2004,157:439-448.
[5]王忠浩,邵新宇,張國軍,等.基于粗糙集神經(jīng)網(wǎng)絡的產(chǎn)品族配置性能預測方法[J].機械工程學報,2007,43(5):85-90.
[6]劉曉兵,潘瑞林,崔發(fā)婧,等.基于隨即分布的費用分配系數(shù)確定方法[J].計算機集成制造系統(tǒng),2010,16(1):215-223.
[7]劉冠權(quán).基于粗糙集理論的區(qū)域虛擬企業(yè)資源優(yōu)化決策[J].計算機集成制造系統(tǒng),2007,13(11):2 178-2 182.
[8]《高速公路養(yǎng)護管理手冊》編委會.高速公路養(yǎng)護管理手冊[M].北京:人民交通出版社,2002.