黃 德,劉 劍,劉 永,李向陽,鄧立軍,劉永紅,黃萍萍,洪昌壽
(1.南華大學(xué) 資源環(huán)境與安全工程學(xué)院,湖南 衡陽 421001;2.遼寧工程技術(shù)大學(xué) 安全科學(xué)與工程學(xué)院,遼寧 葫蘆島 125105)
礦井通風(fēng)系統(tǒng)不僅為井下提供新鮮風(fēng)流,排出污染空氣和稀釋有毒有害氣體,也在礦井生產(chǎn)安全保障、災(zāi)害防治、隱患排除及應(yīng)急救災(zāi)中有著不可或缺的作用[1-4]。但當(dāng)?shù)V井通風(fēng)系統(tǒng)中的巷道發(fā)生冒落、片幫等現(xiàn)象時(shí),會導(dǎo)致其斷面積發(fā)生持久性變化,從而引起對應(yīng)風(fēng)阻發(fā)生持久性變化,文獻(xiàn)[5]將這種風(fēng)阻發(fā)生持久性變化的現(xiàn)象稱為礦井通風(fēng)阻變型故障,并將礦井通風(fēng)阻變型故障診斷轉(zhuǎn)換為分類問題,利用支持向量機(jī)(SVM)進(jìn)行求解,獲得了較好的診斷性能。為了避免風(fēng)量單一特征所產(chǎn)生的不適定性,文獻(xiàn)[6]提出風(fēng)量與風(fēng)壓相結(jié)合的復(fù)合特征阻變型故障位置診斷方法,以多維互補(bǔ)的特征信息提高阻變型故障診斷的準(zhǔn)確率。文獻(xiàn)[7-8]針對監(jiān)控系統(tǒng)無法直接確定阻變故障位置和大小的問題,利用監(jiān)控系統(tǒng)風(fēng)速、風(fēng)壓等監(jiān)測值進(jìn)行網(wǎng)絡(luò)分析,提出了逐步線性回歸分析法,并根據(jù)建立的阻變故障專家系統(tǒng)獲取阻變故障位置及可能發(fā)生阻變的原因。文獻(xiàn)[9]根據(jù)層次分析法中權(quán)重的大小制定了礦井通風(fēng)網(wǎng)絡(luò)異常的判別準(zhǔn)則,并利用BP神經(jīng)網(wǎng)絡(luò)和監(jiān)控系統(tǒng)監(jiān)測的風(fēng)速、風(fēng)壓等數(shù)據(jù)實(shí)現(xiàn)了大平煤礦通風(fēng)網(wǎng)絡(luò)異常的原因判別。文獻(xiàn)[10]針對阻變型故障診斷分類需要故障樣本參與訓(xùn)練的問題,提出了一種混合編碼方式的自適應(yīng)進(jìn)化策略算法,在阻變型故障診斷時(shí)不僅可同時(shí)進(jìn)行阻變故障位置和故障量的診斷,也避免了故障樣本的參與,以風(fēng)量作為特征進(jìn)行試驗(yàn),結(jié)果表明基于多目標(biāo)優(yōu)化的觀測特征選擇模型的可行性和準(zhǔn)確性。文獻(xiàn)[11]分別以風(fēng)量、風(fēng)壓單一特征和風(fēng)量-風(fēng)壓復(fù)合特征作為進(jìn)化算法的適應(yīng)函數(shù)參數(shù),利用協(xié)方差矩陣進(jìn)化策略方法進(jìn)行求解,試驗(yàn)得出風(fēng)量-風(fēng)壓復(fù)合特征比風(fēng)量或風(fēng)壓單一特征獲得更高的阻變故障位置診斷準(zhǔn)確率和更低誤差的阻變故障量診斷性能,并指出少量觀測特征也可獲得較高準(zhǔn)確率的故障診斷性能。
目前針對礦井通風(fēng)阻變型故障診斷觀測特征選擇的研究主要集中于風(fēng)速傳感器布設(shè)位置方面。文獻(xiàn)[12]以逐步線性回歸分析方法,確定了引起礦井通風(fēng)網(wǎng)絡(luò)風(fēng)速傳感器報(bào)警的分支集合,確定了角聯(lián)結(jié)構(gòu)礦井通風(fēng)網(wǎng)絡(luò)風(fēng)速傳感器布設(shè)方案。文獻(xiàn)[13]為擴(kuò)大煤礦瓦斯監(jiān)測子系統(tǒng)的監(jiān)測范圍,實(shí)現(xiàn)對局部瓦斯超限事故的及時(shí)預(yù)警,提出了一種結(jié)合遺傳算法和離散二元粒子群優(yōu)化算法的傳感器覆蓋模型混合算法,以實(shí)現(xiàn)用最少數(shù)量的氣體傳感器來預(yù)測整個(gè)礦井瓦斯體積分?jǐn)?shù)的目標(biāo)。文獻(xiàn)[14]針對風(fēng)速觀測點(diǎn)位置進(jìn)行了優(yōu)化布設(shè)研究,基于鄰域粗糙集屬性約簡算法提出了阻變型故障診斷的風(fēng)速觀測點(diǎn)位置優(yōu)化方法,并建立了風(fēng)速觀測點(diǎn)掃帚布設(shè)模型。在礦井通風(fēng)阻變型故障診斷觀測點(diǎn)選擇方面,單一觀測特征數(shù)量和復(fù)合特征組合優(yōu)化選擇方面的研究尚少,導(dǎo)致阻變型故障診斷難免出現(xiàn)以下情況:① 不必要的位置布設(shè)觀測點(diǎn),在一定程度上增加了阻變型故障診斷的成本;② 所有分支或節(jié)點(diǎn)作為觀測點(diǎn)易導(dǎo)致觀測點(diǎn)之間出現(xiàn)冗余或不相關(guān)特征,限制甚至降低了阻變型故障診斷學(xué)習(xí)器的性能;③ 當(dāng)監(jiān)督學(xué)習(xí)模型的樣本數(shù)量受到限制時(shí),未經(jīng)優(yōu)化選擇的觀測特征在訓(xùn)練和預(yù)測過程中容易出現(xiàn)過擬合或欠擬合的現(xiàn)象,從而降低了故障診斷模型的泛化能力,無監(jiān)督學(xué)習(xí)模型的種群參數(shù)大小隨特征維度的增加而增大,從而導(dǎo)致求解模型的復(fù)雜度遞增。
監(jiān)督學(xué)習(xí)下的訓(xùn)練樣本集往往具有高維特征的特點(diǎn),但并不是所有訓(xùn)練樣本集的特征都是必須的,甚至存在很多與阻變故障診斷任務(wù)無關(guān)的特征,特征維度的降低對提高診斷性能具有極其重要的意義[15-17]。為了消除屬性中多余和無關(guān)的特征,可使用多種方法對高維特征數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆诸惖靡越鉀Q,而理論和實(shí)踐表明特征選擇是剔除冗余無關(guān)特征最為行之有效的方法之一[18-20]。基于此,筆者以最小的觀測點(diǎn)數(shù)量和訓(xùn)練交叉驗(yàn)證誤差為目標(biāo),建立基于多目標(biāo)優(yōu)化的觀測特征選擇模型。以基于統(tǒng)計(jì)的數(shù)據(jù)挖掘算法k-近鄰算法(kNN)[21]作為阻變故障診斷方法,非支配排序遺傳算法II(NSGA-II)[22]作為多目標(biāo)優(yōu)化求解方法,對礦井通風(fēng)網(wǎng)絡(luò)實(shí)例分別對風(fēng)量單一特征、風(fēng)壓單一特征、節(jié)點(diǎn)壓能單一特征、風(fēng)量-風(fēng)壓復(fù)合特征、風(fēng)量-節(jié)點(diǎn)壓能復(fù)合特征、風(fēng)壓-節(jié)點(diǎn)壓能復(fù)合特征和風(fēng)量-風(fēng)壓-節(jié)點(diǎn)壓能復(fù)合特征等7種特征方案進(jìn)行觀測特征選擇試驗(yàn),以未進(jìn)行觀測點(diǎn)優(yōu)化選擇和相同觀測點(diǎn)數(shù)量下的隨機(jī)觀測點(diǎn)位置方案作為對照組,在相同試驗(yàn)條件下,分別進(jìn)行監(jiān)督學(xué)習(xí)的阻變故障診斷試驗(yàn),分析礦井通風(fēng)阻變故障觀測特征類型、位置及其數(shù)量的優(yōu)劣性。最后通過文獻(xiàn)[10]所提供的無監(jiān)督學(xué)習(xí)阻變故障診斷模型對優(yōu)化選擇的觀測特征方案進(jìn)行驗(yàn)證分析。
基于多目標(biāo)優(yōu)化的觀測特征選擇模型可有效避免不必要地點(diǎn)安裝傳感器,降低傳感器安裝數(shù)量,從而節(jié)省礦井通風(fēng)阻變故障診斷所需成本;在有效剔除冗余或不相關(guān)觀測特征后,可提高阻變故障診斷學(xué)習(xí)器的性能和泛化能力。為礦井通風(fēng)系統(tǒng)故障診斷觀測特征選擇提供新的理論和方法,可及時(shí)發(fā)現(xiàn)礦井通風(fēng)系統(tǒng)中阻變的位置和程度,對保障通風(fēng)系統(tǒng)可靠性有重要的應(yīng)用價(jià)值,同時(shí)為礦井通風(fēng)實(shí)時(shí)網(wǎng)絡(luò)解算監(jiān)控系統(tǒng)搭建方案提供決策性依據(jù),在礦井智能通風(fēng)的實(shí)踐中可廣泛應(yīng)用。
對于一個(gè)礦井通風(fēng)網(wǎng)絡(luò)圖G=(V,E),V為網(wǎng)絡(luò)中節(jié)點(diǎn)的集合,其中|V|=m,即V={v1,v2,v3,…,vm},m為節(jié)點(diǎn)數(shù)量;E為網(wǎng)絡(luò)分支的集合,其中|E|=n,即E={e1,e2,e3,…,en},n為分支數(shù)量。礦井通風(fēng)阻變故障位置僅考慮分支對應(yīng)位置,以eλ表示阻變發(fā)生的位置,稱為阻變故障位置或故障位置,其中λ為阻變故障位置對應(yīng)分支編號索引,λ∈[1,n];以Δrλ表示阻變分支eλ發(fā)生故障的阻變故障量,rλ為未發(fā)生阻變故障時(shí)分支eλ的風(fēng)阻,其中Δrλ∈(-rλ,+∞),單位為N·s2/m8。對于整個(gè)礦井通風(fēng)網(wǎng)絡(luò),阻變故障量ΔR=(Δr1,Δr2,…,Δri,…,Δrn),當(dāng)Δri=0時(shí),表示分支ei未發(fā)生故障,不屬于故障位置,其中i=1,2,…,n。筆者所研究的是單故障源[5],因此每次僅考慮礦井通風(fēng)網(wǎng)絡(luò)中的一個(gè)故障位置進(jìn)行研究,即Δrλ≠0,Δri=0,且i≠λ,λ及其對應(yīng)的Δrλ為故障診斷模型的求解變量。以巷道風(fēng)速轉(zhuǎn)換的風(fēng)量q、巷道兩端靜壓差h和節(jié)點(diǎn)壓能p作為阻變故障診斷的觀測點(diǎn),每一個(gè)故障位置發(fā)生一次阻變故障對應(yīng)一組觀測值,因此,阻變故障位置診斷訓(xùn)練樣本T可描述為
(1)
(1)在指定距離度量的情況下,分別計(jì)算輸入診斷實(shí)例xλ與訓(xùn)練樣本T中所有樣本的距離;
(2)對所有距離進(jìn)行排序,找出k個(gè)距離最小的點(diǎn),將所獲得的k個(gè)點(diǎn)所組成的鄰域記作Nk(xλ);
(3)獲取Nk(xλ)中的k個(gè)鄰近訓(xùn)練樣本對應(yīng)的故障位置ez,其中z∈[1,n];
(4)從k個(gè)故障位置中尋找類別出現(xiàn)次數(shù)最多的故障位置,并定義為預(yù)測的阻變故障位置eλ,即
(2)
其中,I為指示函數(shù),當(dāng)ei=ec時(shí),I=1,否則I=0。
筆者以歐式距離作為距離度量,即在求樣本實(shí)例之間的距離時(shí),以式(3)進(jìn)行計(jì)算。
(3)
對于阻變故障量回歸診斷,則根據(jù)最小均方根誤差(RSME)確定步驟(4)中的最優(yōu)值Δrλ,即
(4)
其中,Δri為第i個(gè)故障位置回歸預(yù)測的阻變故障量;Δrc為第c個(gè)樣本實(shí)例對應(yīng)的阻變故障量。
由此,根據(jù)式(1)的訓(xùn)練樣本和式(2)可獲得礦井通風(fēng)阻變故障位置eλ,由式(1)變換所得的阻變故障量訓(xùn)練樣本和式(4)可獲得對應(yīng)的礦井通風(fēng)阻變量,即阻變故障量Δrλ。
設(shè)風(fēng)量觀測點(diǎn)數(shù)量為nq,風(fēng)壓觀測點(diǎn)數(shù)量為nh,節(jié)點(diǎn)壓能觀測點(diǎn)數(shù)量為np,被選擇的觀測點(diǎn)數(shù)量分別為nfq,nfh和nfp。在進(jìn)行觀測特征選擇時(shí),以所有分支的風(fēng)量、風(fēng)壓或所有節(jié)點(diǎn)的壓能作為候選特征,即nq=nh=n,np=m。以阻變故障位置診斷觀測點(diǎn)選擇為例,最小的觀測點(diǎn)數(shù)量和訓(xùn)練交叉驗(yàn)證誤差為目標(biāo)的觀測特征選擇模型可表示為
(5)
(6)
(7)
觀測特征優(yōu)化選擇模型的編碼為布爾類型,“0”表示未被選擇的觀測點(diǎn),“1”表示被選擇的觀測點(diǎn)。函數(shù)f1為編碼為“1”對應(yīng)的所有觀測特征進(jìn)行ncv次交叉驗(yàn)證的平均誤差,函數(shù)f2為求解編碼中非零的數(shù)量,可由L0范數(shù)表示,但考慮L0范數(shù)不易于優(yōu)化求解,因此使用L2范數(shù)進(jìn)行求解,不僅防止過擬合現(xiàn)象,也可提升觀測特征選擇模型的泛化能力。稱被選擇的觀測點(diǎn)占候選觀測點(diǎn)數(shù)量的比例為觀測點(diǎn)覆蓋率,則目標(biāo)函數(shù)f2表示相對觀測點(diǎn)覆蓋率。
試驗(yàn)過程使用NSGA-Ⅱ多目標(biāo)優(yōu)化求解方法求解觀測特征選擇模型,其求解過程如下。
步驟1:模型參數(shù)設(shè)定和初始化。由礦井通風(fēng)網(wǎng)絡(luò)拓?fù)湫畔@取分支數(shù)量n和節(jié)點(diǎn)數(shù)量m,根據(jù)觀測點(diǎn)類型初始化觀測點(diǎn)對應(yīng)的候選特征數(shù)。初始化NSGA-Ⅱ算法的參數(shù),包括最大迭代代數(shù)NI,種群大小NG,交叉概率cr,變異概率mr。
步驟2:染色體編碼。由設(shè)定的各觀測點(diǎn)類型對應(yīng)的候選特征數(shù)確定編碼長度為M=nq+nh+np,則使用二進(jìn)制編碼方式得到實(shí)數(shù)對應(yīng)的編碼B∈[0,2M-1]。
步驟3:染色體解碼。對二進(jìn)制編碼B=[b1,b2,…,bnq,bnq+1,…,bnq+nh,bnq+nh+1,…,bnq+nh+np]進(jìn)行解碼,編碼長度為候選特征長度M=nq+nh+np。解碼原則為:若bl=1,則第l個(gè)編碼對應(yīng)的特征x(l)被選擇,否則不被選擇。染色體解碼過程如圖1所示,其中(a)表示編碼對應(yīng)的二進(jìn)制數(shù)值,(b)表示假定的一個(gè)種群編碼,(c)為以解碼原則獲取特征對應(yīng)的樣本,樣本總數(shù)為N,特征數(shù)為(b)中編碼對應(yīng)實(shí)數(shù)之和。
圖1 染色體解碼示例
步驟4:適應(yīng)值計(jì)算。將步驟3中所獲取的樣本按訓(xùn)練集80%,測試集20%的原則進(jìn)行ncv次交叉分割,利用k-近鄰阻變故障診斷模型進(jìn)行對所有交叉驗(yàn)證集進(jìn)行訓(xùn)練和預(yù)測,通過式(5)計(jì)算獲得f1對應(yīng)的適應(yīng)值,利用編碼原則及圖1(b)中“1”的數(shù)量統(tǒng)計(jì)可獲得nfq,nfh和nfp,通過式(6)和式(7)計(jì)算得到f2對應(yīng)的適應(yīng)值。
步驟5:快速非支配排序。將步驟4中計(jì)算所得的適應(yīng)值采用快速非支配排序方法得到多樣的非優(yōu)劣解[22],將種群中的個(gè)體調(diào)配到不同的非優(yōu)劣支配前沿集合中,根據(jù)適應(yīng)值之間的差異性計(jì)算出個(gè)體之間的擁擠度,并通過二進(jìn)制錦標(biāo)賽操作求出種群密度最小的個(gè)體,從而獲取得到新種群。
步驟6:交叉變異操作。對步驟5所獲取的新種群進(jìn)行交叉和變異操作,將交叉變異產(chǎn)生的新個(gè)體與父代的種群進(jìn)行合并,進(jìn)一步得到新種群。
步驟7:終止條件。利用交叉變異后的新種群編碼,根據(jù)步驟3解碼原則和步驟4適應(yīng)值計(jì)算方法重新進(jìn)行適應(yīng)值計(jì)算、快速非支配排序和交叉變異操作,直至達(dá)到最大迭代次數(shù),獲取相對最小的f1和f2,以及此時(shí)染色體編碼對應(yīng)的觀測特征。
為了驗(yàn)證基于多目標(biāo)優(yōu)化的觀測特征選擇模型的可行性和適應(yīng)性,分別以風(fēng)量、風(fēng)壓、節(jié)點(diǎn)壓能3種單一特征和風(fēng)量-風(fēng)壓、風(fēng)量-節(jié)點(diǎn)壓能、風(fēng)壓-節(jié)點(diǎn)壓能和風(fēng)量-風(fēng)量-節(jié)點(diǎn)壓能4種復(fù)合特征作為特征選擇方案,進(jìn)行觀測特征選擇組合試驗(yàn)。
使用文獻(xiàn)[5]中的多源多匯礦井通風(fēng)網(wǎng)絡(luò)作為試驗(yàn)實(shí)例,如圖2所示,其中|V|=71,|E|=100,e1和e2為進(jìn)風(fēng)井分支,e9,e39和e78為回風(fēng)井分支。1,2,3號主要通風(fēng)機(jī)分別安裝在e39,e9和e78分支對應(yīng)的回風(fēng)井末端,特性方程分別為
圖2 試驗(yàn)礦井通風(fēng)網(wǎng)絡(luò)實(shí)例
式中,h1,h2,h3分別為1,2,3號風(fēng)機(jī)的靜壓。
以文獻(xiàn)[5]中表4對應(yīng)的風(fēng)阻作為礦井通風(fēng)網(wǎng)絡(luò)實(shí)例的初始風(fēng)阻,在未發(fā)生阻變故障的情況下,1號風(fēng)機(jī)的工況風(fēng)量為205.95 m3/s,風(fēng)壓為2 350.97 Pa;2號風(fēng)機(jī)的工況風(fēng)量為65.11 m3/s,風(fēng)壓為2 131.98 Pa;3號風(fēng)機(jī)的工況風(fēng)量為203.61 m3/s,風(fēng)壓為2 644.41 Pa。
假設(shè)故障位置不包括源匯對應(yīng)的分支,根據(jù)式(1)描述的樣本,針對試驗(yàn)礦井通風(fēng)實(shí)例的每條潛在故障位置進(jìn)行不同程度的500次阻變故障模擬,獲得對應(yīng)的故障訓(xùn)練樣本。
考慮有風(fēng)門或風(fēng)窗等構(gòu)筑物的巷道風(fēng)阻降低的概率較大,其對應(yīng)的潛在故障位置樣本中90%阻變范圍為[0.01r,0],10%的阻變范圍為[0,2.1r]。而對于無構(gòu)筑物巷道發(fā)生風(fēng)阻增大的概率較大,其對應(yīng)的潛在阻變分支樣本90%阻變范圍為[0,201r],10%的阻變范圍為[0.9r,0]。共設(shè)計(jì)7組試驗(yàn)方案,具體描述見表1,每組試驗(yàn)方案均對應(yīng)一個(gè)對照試驗(yàn)組,分別以全部候選、優(yōu)化選擇和相同維度的隨機(jī)特征作為觀測點(diǎn)進(jìn)行比對試驗(yàn)。
表1 觀測特征組合試驗(yàn)方案
由礦井通風(fēng)網(wǎng)絡(luò)試驗(yàn)實(shí)例可知,候選觀測特征維度最小為71,最大為271,樣本數(shù)量為47 500,故障位置類別數(shù)為95。試驗(yàn)包括試驗(yàn)準(zhǔn)備、阻變模擬、觀測特征選擇和驗(yàn)證4個(gè)階段,觀測特征組合試驗(yàn)的流程如圖3所示。
試驗(yàn)準(zhǔn)備階段包括礦井通風(fēng)網(wǎng)絡(luò)拓?fù)錂z查和模型參數(shù)設(shè)定,根據(jù)對不同試驗(yàn)方案獲取候選觀測點(diǎn)類型和數(shù)量的多次試驗(yàn)測試,設(shè)定模型參數(shù)的最大迭代次數(shù)為1 000,種群大小為觀測候選特征維度的2倍,交叉概率為0.95,變異概率為0.01,風(fēng)量精度為0.001 m3/s,風(fēng)壓精度為0.1 Pa,k為3,交叉驗(yàn)證次數(shù)ncv為3。阻變模擬即樣本構(gòu)造階段,通過隨機(jī)不重復(fù)地改變指定故障位置的風(fēng)阻大小進(jìn)行仿真模擬,根據(jù)候選觀測點(diǎn)類型獲取阻變故障樣本。為了確保樣本的多樣性和均衡性,訓(xùn)練樣本按潛在故障位置編號升序方式進(jìn)行重排后,每間隔400個(gè)樣本隨機(jī)選取一個(gè)樣本進(jìn)行樣本重組,并選擇其中的80%作為交叉驗(yàn)證集,剩余的20%作為測試集。對交叉驗(yàn)證集進(jìn)行3折交叉分割得到S1,S2和S3三個(gè)訓(xùn)練子集,分別以S1,S2和S3作為交叉驗(yàn)證測試集,其他2項(xiàng)作為訓(xùn)練集進(jìn)行訓(xùn)練和預(yù)測即可計(jì)算平均交叉驗(yàn)證誤差。利用k-近鄰阻變故障診斷模型和基于多目標(biāo)優(yōu)化的觀測特征選擇模型對樣本進(jìn)行訓(xùn)練和最優(yōu)求解可得到被選擇的觀測點(diǎn)。利用選擇的觀測點(diǎn),對相同的樣本進(jìn)行訓(xùn)練,并以剩余的20%樣本作為測試集進(jìn)行阻變故障位置診斷和阻變故障量預(yù)測驗(yàn)證試驗(yàn),同時(shí)以相同的特征作為適應(yīng)值參數(shù),利用混合編碼的自適應(yīng)進(jìn)化策略算法進(jìn)行無樣本模型驗(yàn)證試驗(yàn),分析驗(yàn)證試驗(yàn)結(jié)果的精度和誤差以驗(yàn)證阻變故障診斷模型的準(zhǔn)確性和觀測特征選擇模型的可行性。
通過比較不同樣本比例與訓(xùn)練和交叉驗(yàn)證準(zhǔn)確率之間的關(guān)系,確定試驗(yàn)樣本數(shù)量是否達(dá)到訓(xùn)練的需求,每組方案均以樣本數(shù)的10%~100%進(jìn)行隨機(jī)均衡選擇和三折交叉分割,得到如圖4所示的試驗(yàn)結(jié)果,其中橫坐標(biāo)為訓(xùn)練樣本比例,左側(cè)縱坐標(biāo)為表示訓(xùn)練或交叉驗(yàn)證準(zhǔn)確率,右側(cè)縱坐標(biāo)為訓(xùn)練時(shí)間。
不同樣本比例模型復(fù)雜度與預(yù)測能力關(guān)系的試驗(yàn)結(jié)果顯示,方案Ⅰ中所有分支的風(fēng)量作為候選特征時(shí),0.3的樣本比例即可達(dá)到90%以上平穩(wěn)的交叉驗(yàn)證準(zhǔn)確率和95%的訓(xùn)練準(zhǔn)確率,直到100%樣本的驗(yàn)證準(zhǔn)確率未超過91%,訓(xùn)練準(zhǔn)確率穩(wěn)定保持在95%,診斷準(zhǔn)確率高于文獻(xiàn)[5]支持向量機(jī)阻變故障診斷模型的78.11%。方案Ⅱ中所有分支的風(fēng)壓作為候選特征時(shí),即使0.1的樣本比例也可達(dá)到96%以上的交叉驗(yàn)證準(zhǔn)確率和100%的訓(xùn)練準(zhǔn)確率。方案Ⅲ中所有節(jié)點(diǎn)的壓能作為候選特征時(shí),0.3的樣本比例可達(dá)到92%以上的交叉驗(yàn)證準(zhǔn)確率和100%的訓(xùn)練準(zhǔn)確率,當(dāng)樣本比例超過0.6時(shí),驗(yàn)證準(zhǔn)確率穩(wěn)定保持在96%~98%。方案Ⅳ中所有分支的風(fēng)量和風(fēng)壓作為候選特征時(shí),0.1的樣本比例樣本數(shù)為4 750,可達(dá)到97.5%以上的交叉驗(yàn)證準(zhǔn)確率和100%的訓(xùn)練準(zhǔn)確率,略低于文獻(xiàn)[6]樣本數(shù)量23 550時(shí),使用支持向量機(jī)的98.23%準(zhǔn)確率。方案Ⅴ中所有節(jié)點(diǎn)的壓能和分支的風(fēng)量作為候選特征時(shí),0.4的樣本比例可達(dá)到96%以上的交叉驗(yàn)證準(zhǔn)確率和100%的訓(xùn)練準(zhǔn)確率,當(dāng)樣本比例超過0.4時(shí),驗(yàn)證準(zhǔn)確率穩(wěn)定保持在96%~98%。方案Ⅵ中所有節(jié)點(diǎn)的壓能和分支的風(fēng)壓作為候選特征時(shí),訓(xùn)練和交叉驗(yàn)證準(zhǔn)確率與方案Ⅲ的結(jié)果保持相同趨勢。方案Ⅶ中所有節(jié)點(diǎn)的壓能和分支的風(fēng)壓和風(fēng)量作為候選特征時(shí),訓(xùn)練和交叉驗(yàn)證準(zhǔn)確率與方案Ⅴ的結(jié)果保持相同趨勢。
綜上所述,當(dāng)樣本比例增加時(shí),模型的訓(xùn)練準(zhǔn)確率均保持較高且穩(wěn)定的狀態(tài),交叉驗(yàn)證準(zhǔn)確率先快速增大而后保持穩(wěn)定狀態(tài),樣本數(shù)量達(dá)到模型預(yù)測的需求。由圖4中平均訓(xùn)練時(shí)間與樣本比例的關(guān)系可知,訓(xùn)練時(shí)間與樣本比例(模型復(fù)雜度)呈線性遞增的關(guān)系,在故障診斷過程中應(yīng)綜合考慮預(yù)測能力與模型復(fù)雜度確定樣本數(shù)量。筆者為了便于組合方案測試分析,組合特征選擇所涉及試驗(yàn)的樣本數(shù)均為47 500,即總數(shù)的100%樣本作為訓(xùn)練和交叉驗(yàn)證樣本進(jìn)行試驗(yàn)。
統(tǒng)計(jì)所有試驗(yàn)方案的不同樣本比例平均訓(xùn)練時(shí)間,結(jié)果如圖5所示。試驗(yàn)結(jié)果顯示,無論樣本比例如何變化,方案Ⅳ所需要的訓(xùn)練時(shí)間最大,即模型復(fù)雜度最大,預(yù)測能力結(jié)果(圖4)顯示,此方案對應(yīng)的預(yù)測能力最強(qiáng)。方案Ⅲ所需要的訓(xùn)練時(shí)間最少,單其預(yù)測能力強(qiáng)于方案Ⅰ的預(yù)測能力。方案Ⅰ、方案Ⅱ和方案Ⅶ的訓(xùn)練時(shí)間保持一致,方案Ⅴ和方案Ⅵ的訓(xùn)練時(shí)間保持一致,均高于方案Ⅲ和低于方案Ⅳ的訓(xùn)練時(shí)間。
因此,在未進(jìn)行特征優(yōu)化選擇時(shí),平均訓(xùn)練時(shí)間與觀測點(diǎn)類型數(shù)無明顯關(guān)系,但2種觀測點(diǎn)類型方案中有節(jié)點(diǎn)壓能觀測點(diǎn)類型參與診斷的訓(xùn)練時(shí)間均較少,而模型復(fù)雜度與預(yù)測能力并非呈遞增關(guān)系。因此,礦井通風(fēng)阻變故障觀測點(diǎn)類型及組合方案有優(yōu)化選擇的空間。
使用式(5)~(7)基于多目標(biāo)優(yōu)化的觀測特征選擇模型對所有試驗(yàn)方案分別進(jìn)行觀測點(diǎn)多目標(biāo)優(yōu)化選擇試驗(yàn),其求解的Pareto解集如圖6所示,其中橫坐標(biāo)表示10倍的相對觀測點(diǎn)覆蓋率,縱坐標(biāo)表示10倍的平均交叉驗(yàn)證誤差。結(jié)果顯示,Pareto解集分布較平滑而均勻,要得到更低的交叉驗(yàn)證誤差,需要有更多的觀測點(diǎn)布設(shè),但當(dāng)觀測點(diǎn)覆蓋率達(dá)到一定量級時(shí),交叉驗(yàn)證誤差趨于平穩(wěn),即交叉驗(yàn)證誤差不受觀測點(diǎn)覆蓋率的支配。所有方案試驗(yàn)結(jié)果的相對觀測點(diǎn)覆蓋率均小于0.5,即理論觀測點(diǎn)數(shù)應(yīng)為候選觀測點(diǎn)的一半以下,其對應(yīng)的交叉驗(yàn)證誤差均小于0.2,在相同觀測點(diǎn)覆蓋率的情況下方案Ⅳ可獲得更低的交叉驗(yàn)證誤差,方案Ⅰ對應(yīng)的交叉驗(yàn)證誤差最高,交叉驗(yàn)證誤差排序?yàn)榉桨涪?方案Ⅶ<方案Ⅴ<方案Ⅱ<方案Ⅲ<方案Ⅵ<方案Ⅰ,與未進(jìn)行觀測點(diǎn)選擇的故障診斷結(jié)果保持一致,如圖4所示,由此可說明阻變故障診斷準(zhǔn)確率與觀測特征類型存在著密切的關(guān)系。
圖6 不同方案Pareto解集
以0.05為步長,選擇Pareto解集中相對觀測點(diǎn)覆蓋率0.05~0.40對應(yīng)的被選觀測特征,利用各試驗(yàn)方案中剩余的20%測試集進(jìn)行k-近鄰阻變故障診斷試驗(yàn),得到結(jié)果如圖7所示。結(jié)果表明無論觀測特征類型及其組合方式如何變化,相對觀測點(diǎn)覆蓋率低于0.2時(shí),與測試準(zhǔn)確率呈遞增關(guān)系,高于0.2時(shí)其對應(yīng)的準(zhǔn)確率保持穩(wěn)定不變。對于確定的特征類型或組合特征類型,其觀測點(diǎn)覆蓋率高于0.2后,隨觀測點(diǎn)覆蓋率的增加,其準(zhǔn)確率未見明顯提高趨勢,即故障診斷準(zhǔn)確率收斂于穩(wěn)定的狀態(tài),風(fēng)量特征類型對應(yīng)的測試準(zhǔn)確率收斂于90%,其他觀測點(diǎn)類型和組合方式收斂于98%,與相同樣本不進(jìn)行觀測特征選擇方案的交叉驗(yàn)證準(zhǔn)確率接近。因此,無論觀測點(diǎn)類型如何變化,僅需候選觀測點(diǎn)數(shù)量的20%左右即可獲得與觀測點(diǎn)覆蓋率為100%對應(yīng)的故障診斷準(zhǔn)確率。
圖7 觀測點(diǎn)覆蓋率對測試準(zhǔn)確率的影響
以所有觀測點(diǎn)作為特征,即觀測點(diǎn)覆蓋率為100%的方案作為試驗(yàn)對照組,以k-近鄰阻變故障位置診斷訓(xùn)練集的交叉驗(yàn)證誤差最接近且不大于對照組誤差的方案作為驗(yàn)證組,以與驗(yàn)證組具有相同觀測點(diǎn)覆蓋率為0.2的隨機(jī)觀測特征方案作為試驗(yàn)組,分別進(jìn)行監(jiān)督學(xué)習(xí)模型阻變故障位置和阻變故障量診斷試驗(yàn)分析,試驗(yàn)結(jié)果分別如圖8,9所示。阻變故障位置診斷模型試驗(yàn)結(jié)果顯示,各試驗(yàn)方案中驗(yàn)證組與對照組具有相同且大于90%的阻變故障位置診斷準(zhǔn)確率,試驗(yàn)組故障診斷準(zhǔn)確率均低于90%,且不同觀測點(diǎn)類型其準(zhǔn)確率不穩(wěn)定;而驗(yàn)證組與試驗(yàn)組的訓(xùn)練時(shí)間保持一致,對照組的訓(xùn)練時(shí)間為驗(yàn)證組的3~10倍不等。以用于評價(jià)回歸模型優(yōu)劣程度的R2作為阻變故障量回歸預(yù)測評價(jià)指標(biāo)。阻變故障量回歸預(yù)測試驗(yàn)中驗(yàn)證組和對照組的R2保持在0.99,試驗(yàn)組最高R2也可達(dá)到0.99,最低低于0.8;驗(yàn)證組與試驗(yàn)組具有相同的觀測點(diǎn)覆蓋率,試驗(yàn)過程中訓(xùn)練時(shí)間相同,且受到觀測點(diǎn)類型變化的影響較小,對照組的訓(xùn)練時(shí)間為驗(yàn)證組的6~10倍。綜上,觀測點(diǎn)優(yōu)化選擇后20%的觀測點(diǎn)覆蓋率可達(dá)到觀測點(diǎn)覆蓋率100%的阻變故障位置診斷準(zhǔn)確率和阻變故障量回歸預(yù)測R2,訓(xùn)練時(shí)間可縮短60%,甚至可縮短至90%,說明觀測特征優(yōu)化選擇在確保故障診斷性能的情況下,很大程度上降低了阻變故障診斷模型的復(fù)雜度。隨機(jī)選擇的觀測點(diǎn)位置也有一定概率會獲得較高的故障診斷性能,但故障診斷性能難以保持穩(wěn)定的狀態(tài),試驗(yàn)結(jié)果與文獻(xiàn)[14]使用粗糙集進(jìn)行特征選擇的結(jié)果保持一致。
圖8 監(jiān)督模型k-近鄰阻變故障位置對比分析
圖9 監(jiān)督模型k-近阻變故障量對比分析
為了驗(yàn)證觀測特征優(yōu)化選擇的有效性,以監(jiān)督學(xué)習(xí)模型的觀測特征作為無樣本模型的適應(yīng)值參數(shù),在相同試驗(yàn)參數(shù)設(shè)置的條件下,利用混合編碼自適應(yīng)進(jìn)化策略算法對驗(yàn)證組、對照組和試驗(yàn)組分別進(jìn)行阻變故障位置診斷和阻變故障量回歸預(yù)測一體化試驗(yàn),試驗(yàn)結(jié)果如圖10所示。結(jié)果顯示對照組的故障診斷準(zhǔn)確率集中于95%,驗(yàn)證組結(jié)果在80%~90%,試驗(yàn)組低于50%~70%。對于阻變故障量回歸預(yù)測的R2,驗(yàn)證組除風(fēng)量單一特征為0.86外,其他方案所選擇的特征均高于0.95,對照組除風(fēng)量、風(fēng)壓和節(jié)點(diǎn)壓能綜合特征為0.82外,其他方案結(jié)果均高于0.95,試驗(yàn)組保持在0.90~0.95。因此,基于多目標(biāo)優(yōu)化的觀測特征選擇模型得到的優(yōu)化特征同樣適用于無樣本模型,說明利用觀測特征選擇模型進(jìn)行阻變故障特征選擇所得的結(jié)果具有一定的有效性和可靠性,但未完全剔除無樣本故障診斷模型中的冗余和不相關(guān)特征,仍有優(yōu)化提升的空間。
圖10 無樣本模型驗(yàn)證對比分析
通過保持無樣本模型的種群大小和迭代次數(shù)等參數(shù)不變,對所有試驗(yàn)方案的不同觀測點(diǎn)覆蓋率分別進(jìn)行試驗(yàn),得到如圖11(a)~(g)所示阻變故障位置診斷時(shí)間消耗與觀測點(diǎn)覆蓋率的結(jié)果,通過控制其他參數(shù)不變,改變種群大小進(jìn)行試驗(yàn),得到如圖11(h)所示阻變故障位置診斷時(shí)間消耗與種群大小關(guān)系結(jié)果。由觀測點(diǎn)覆蓋率、種群大小與無樣本模型阻變故障位置診斷所消耗時(shí)間的試驗(yàn)結(jié)果可知,在相同種群大小的條件下,觀測點(diǎn)類型的變化和觀測點(diǎn)覆蓋率的增加并不會導(dǎo)致模型復(fù)雜度的改變,但是種群大小與模型復(fù)雜度呈線性遞增的關(guān)系,試驗(yàn)結(jié)果與文獻(xiàn)[10]和[11]一致,且文獻(xiàn)研究表明模型復(fù)雜度的增加很大程度上會提升模型的故障診斷準(zhǔn)確率和降低診斷誤差。因此,在實(shí)際應(yīng)用時(shí)需綜合考慮模型復(fù)雜度與故障診斷的性能,同時(shí)對于無樣本模型可適量增加觀測點(diǎn)覆蓋率。
圖11 無樣本模型特征類型與預(yù)測時(shí)間消耗關(guān)系
(1)建立了礦井通風(fēng)阻變故障觀測特征組合優(yōu)化選擇方案,提出了一種基于多目標(biāo)優(yōu)化的觀測特征選擇模型,在降低觀測點(diǎn)數(shù)量的同時(shí),確保故障診斷監(jiān)督模型和無監(jiān)督模型的診斷性能。
(2)組合觀測點(diǎn)類型的布設(shè)方案更利于進(jìn)行阻變故障診斷,在條件允許的情況下,監(jiān)督阻變模型不宜單獨(dú)將風(fēng)速傳感器作為觀測特征。
(3)觀測點(diǎn)優(yōu)化選擇后20%的觀測點(diǎn)覆蓋率可達(dá)到未進(jìn)行優(yōu)化選擇的阻變故障位置診斷準(zhǔn)確率和阻變故障量回歸預(yù)測性能,訓(xùn)練時(shí)間可縮短60%~90%,觀測特征優(yōu)化選擇在確保故障診斷性能的情況下,很大程度上降低了阻變故障診斷模型復(fù)雜度。隨機(jī)選擇的觀測點(diǎn)位置也有一定概率會獲得較高的故障診斷性能,但故障診斷性能難以保持穩(wěn)定狀態(tài)。
(4)多目標(biāo)觀測特征選擇方法所確定的觀測點(diǎn)布設(shè)方案對無樣本模型仍有效,但在實(shí)際應(yīng)用時(shí)需綜合考慮模型復(fù)雜度與故障診斷的性能,同時(shí)對于無樣本模型可適量增加觀測點(diǎn)覆蓋率。