陽富強,劉廣寧,郭樂樂
(福州大學(xué)環(huán)境與資源學(xué)院,福州350108)
礦井突水水源辨識的改進SVM和GA-BP神經(jīng)網(wǎng)絡(luò)模型
陽富強,劉廣寧,郭樂樂
(福州大學(xué)環(huán)境與資源學(xué)院,福州350108)
及時辨識突水水源是有效預(yù)防和控制礦井突水災(zāi)害的重要工作之一?;诤幽辖棺髂车V區(qū)不同水層的測試樣本,利用嵌入梯度的支持向量機(SVM)對常用的[SO4]2-、K+、Mg2+、Na+、Ca2+、Cl-、[HCO3]-、F-8種水化學(xué)成分進行因子約簡,確定以K+、Mg2+、Ca2+、Cl-、[HCO3]-、F-作為礦井突水水源辨識的主要判別因子。運用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(GA-BP)對新體系下的30組學(xué)習(xí)樣本進行訓(xùn)練擬合,用所建立的分析模型對10組待檢驗水源類別進行辨識,預(yù)測平均正確率達到了94.27%。研究結(jié)果表明,該指標(biāo)體系在礦井突水水源辨識中具有可行性,且GA-BP模型分類性能好,誤判率低,可以用于礦井突水水源的辨識。
礦井突水;水源判別;SVM;GA-BP
礦井突水災(zāi)害一直制約著我國礦山的健康發(fā)展,快速判別突(涌)水水源是有效預(yù)防礦井突水事故發(fā)生的重要工序之一。鑒于離子含量差異性較大的地下水,其水文地球化學(xué)成因及來源各不相同,因此水化學(xué)方法已成為辨識突水水源的有效方法[1]。當(dāng)前大部分研究主要圍繞突水水源中的化學(xué)成分含量進行測定,再基于數(shù)理統(tǒng)計和各種判別預(yù)測方法進行分類判別預(yù)測,但對于選取水中哪些化學(xué)成分作為判別體系并沒有一個明確的定論,過多的指標(biāo)測試不僅增加了測試的難度而且可能會影響測試的準(zhǔn)確性。目前針對礦井突水水源的辨識,研究人員提出了多種判別方法,如等效數(shù)值法[2]、模糊綜合評判法[3]、最大效果測度值法[4]、距離判別法[5]等。等效數(shù)值法是將數(shù)據(jù)轉(zhuǎn)化為(0,1)區(qū)間后進行模擬,適合轉(zhuǎn)化不同量綱的換算,但其優(yōu)越性在突水判別中難以體現(xiàn);模糊綜合評判法由于受主觀因素影響較多,容易造成預(yù)測結(jié)果不準(zhǔn)確;最大效果測度值在礦井透水預(yù)測中應(yīng)用較多,但其理論基礎(chǔ)薄弱,未能得到普遍認(rèn)可;距離判別法的界限優(yōu)勢難以區(qū)分,對于離子種類含量少的樣本會給判別結(jié)果造成較大誤差。
隨著礦山開采深度的逐漸增加,地下水混合程度逐漸增強,多類水源組分參與了混合作用,導(dǎo)致地下水水質(zhì)組分過渡類型增多,這些方法在礦井突水辨識中均存在明顯不足。為此,本文擬采用嵌入梯度支持向量機對礦井突水水源進行分類指標(biāo)確定,并利用GA-BP在新指標(biāo)下進行分類預(yù)測,旨在提高礦井突水水源判別的準(zhǔn)確率。
1.1 嵌入梯度的SVM理論
SVM多用于指標(biāo)多、樣本少的模型判別,已成為當(dāng)前國際機器學(xué)習(xí)界的研究熱點,具有適應(yīng)性強、全局優(yōu)化、適應(yīng)時間短等優(yōu)點,在實際生產(chǎn)中得到廣泛應(yīng)用。例如,王成武利用支持向量機建立了室內(nèi)轟燃預(yù)測模型[6];師旭超基于支持向量機建立的煤與瓦斯突出模型也取得了較好的預(yù)測效果[7];舒彤等將支持向量機應(yīng)用到供應(yīng)鏈風(fēng)險評估的研究中[8];趙吉文等利用支持向量機為直線電機建模[9];黃東利用模糊支持向量機進行了車輛碰撞信號的檢測[10],均取得了較好的應(yīng)用效果。
梯度能夠反映各個維度的投影變化,而且每個維度投影可以描述維度的重要性。設(shè)在二維空間有梯度A=ax+by,如圖1所示A在x方向的投影a要小于在y方向的投影b,則梯度A在y方向的重要性更大。
圖1 二維梯度在2個維度的重要性比較Fig.1 Two-dimension gradient importance on two dimensions
為了評測各個指標(biāo)對決策超曲面g(c)的影響,首先求取該函數(shù)在點x的梯度:
其中,n為樣本數(shù)目。
采用徑向基函數(shù):
對應(yīng)的梯度為:
1.2 嵌入梯度選擇分量與實例分析
利用嵌入梯度對指標(biāo)體系進行優(yōu)化的過程主要包括嵌入梯度分量選擇和指標(biāo)體系優(yōu)化約簡兩個方面。選擇分量的過程主要包括SVM分類器的生成,求取集合Iε中各樣本點處"xg(x)值,在集合Iε中將"g(x)歸一化后求和:V=(其中 lε為滿足的樣本集合),令,依次篩選出各分量中比較大的指標(biāo)體系作為優(yōu)化結(jié)果。
礦山突水水源識別指標(biāo)體系優(yōu)化約簡過程如圖1所示,利用分類器確定初級指標(biāo)的重要度;根據(jù)其大小建立多個評價指標(biāo)體系,利用SVM進行訓(xùn)練、預(yù)測得出不同體系下的預(yù)測正確率,進而獲得最優(yōu)評價體系。
圖1 指標(biāo)體系優(yōu)化、約簡過程Fig.1 Reduction process of index system
礦井突水的主要來源為大氣降水及地表水的滲漏、相鄰含水層地下水的突涌以及老窯水的揭露[12]。一般礦區(qū)地下含水層包括奧灰水、太灰水、第四系水和砂巖水。不同突(透)水水源都有其特殊的化學(xué)特征。當(dāng)前,水化學(xué)方法被認(rèn)為是識別礦井突水的有效手段之一,離子含量差異性較大的地下水,其水溫、地球化學(xué)成因、來源都不相同[13-14]。
在此,本文選取河南焦作礦區(qū)40個樣本數(shù)據(jù)[15],如表1所示,以[SO4]2-(X1)、K+(X2)、Mg2+(X3),Na+(X4)、Ca2+(X5)、Cl-(X6)、[HCO3]-(X7)、F-(X8)8種常用判別離子的濃度作為判別分析模型的原始判別因子。將4種水源類型分別用數(shù)字表示:1(奧灰水)、2(太灰水)、3(第四系水)、4 (砂巖水),實際類型是指水質(zhì)經(jīng)過測定后綜合分析得到的結(jié)果。
表1 地下水樣水化學(xué)分析及預(yù)測結(jié)果 /(mmol·L-1)Table 1 Chemical analysis and predicting results of groundwater samples
利用林智仁開發(fā)的Libsvm軟件包對支持向量機的參數(shù)進行仿真模擬,SVM的各項參數(shù)經(jīng)過交叉驗證,設(shè)置值見表2,其中核函數(shù)是根據(jù)不同核函數(shù)對樣本的預(yù)測結(jié)果準(zhǔn)確率高低確定的(RBF核函數(shù)的準(zhǔn)確率最高),懲罰參數(shù)和參數(shù)Gamma則是利用程序Python27和Gnuplot進行演算得出的,且給出尋優(yōu)準(zhǔn)確率為100%。
將各項參數(shù)和樣本數(shù)據(jù)輸入到MATBLE的嵌入梯度支持向量機程序中運行,各指標(biāo)重要性從低到高依次為X1、X4、X2、X8、X6、X3、X5、X7。為進一步驗證重要度分析的正確性,根據(jù)指標(biāo)重要度大小分成8個不同的指標(biāo)體系,從F1-F8依次剔除指標(biāo)重要度相對較低的指標(biāo)。對實際礦樣的前30組進行訓(xùn)練后,在不同指標(biāo)體系對10個待測樣本進行預(yù)測,得到判別結(jié)果正確率如表3所示??梢钥闯?,指標(biāo)體系F1、F2的正確識別率始終保持在70%,說明指標(biāo)X1對判別結(jié)果影響并不大,剔除指標(biāo)X4,F(xiàn)3的預(yù)測正確率達到80%;之后繼續(xù)剔除新指標(biāo),體系F4-F8的識別率降低,說明剔除過多的指標(biāo)會影響分 類的 效 果,確 定 K+,Mg2+,Ca2+,Cl-,[HCO3]-,F(xiàn)-作為最佳判別體系,此時該指標(biāo)體系預(yù)測準(zhǔn)確率最高。
表2 SVM參數(shù)設(shè)置Table 2 SVM parameter setting
表3 不同指標(biāo)體系對應(yīng)符號以及預(yù)測正確率Table 3 Symbols and prediction accuracy of different index systems
BP神經(jīng)網(wǎng)絡(luò)應(yīng)用廣泛,但存在易陷入當(dāng)學(xué)習(xí)率選擇過小時收斂速度慢,反之又可能因回饋過度而產(chǎn)生震蕩等缺陷[16]。遺傳算法(Genetic Algorithm,GA)是模擬生物進化和遺傳而發(fā)展起來的一種搜索和優(yōu)化算法,具有較強的群體尋優(yōu)學(xué)習(xí)能力[17]。因此,將遺傳算法與神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過遺傳算法對BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)或參數(shù)加以優(yōu)化,將優(yōu)化后的權(quán)值和閥值參數(shù)賦給BP神經(jīng)網(wǎng)絡(luò),不僅能發(fā)揮神經(jīng)網(wǎng)絡(luò)強大的非線性映射能力,而且能使神經(jīng)網(wǎng)絡(luò)具有更快的收斂性和更強的學(xué)習(xí)能力。
遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法應(yīng)用領(lǐng)域廣泛,例如,王德民將應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)對風(fēng)電功率進行預(yù)測[17];可華明利用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對遙感圖像進行了分類[18];湯井田應(yīng)用該算法對異丙酚血藥濃度進行了預(yù)測[19],均取得了較好的效果。
以文獻[2]、[4]、[5]、[15]中所測得的大量實驗數(shù)據(jù)作為參考,選取其中30個典型礦樣的突水水樣指標(biāo)測試值作為訓(xùn)練樣本,10個作為待預(yù)測樣本,如表1所示。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的各項參數(shù)設(shè)定如表4所示,根據(jù)評價因子和預(yù)測結(jié)果確定其節(jié)點為6、輸出節(jié)點為1,其隱節(jié)點根據(jù)經(jīng)驗公式(m=2n+1),預(yù)測的結(jié)果并沒有滿足要求,繼續(xù)根據(jù)m值上限浮動選優(yōu),最終得到隱節(jié)點為6,訓(xùn)練步數(shù)和變異、交叉根據(jù)經(jīng)驗試驗得出。
表4 遺傳算法參數(shù)設(shè)置Table 4 Genetic algorithm parameter settings
將樣本和各參數(shù)輸入到MATBLE程序中運行,得出最佳權(quán)值和閥值分別為0.877和21,將該權(quán)值和閥值賦值給BP神經(jīng)網(wǎng)絡(luò)后。對樣本序號1~30號樣本進行訓(xùn)練擬合,并對待預(yù)測樣本進行預(yù)測,判別分析結(jié)果如表5所示(括號內(nèi)為GA-BP的預(yù)測結(jié)果)??梢?,40*號樣本的預(yù)測值和實際值的誤差達到20.6%,與實際相差較大;測試樣本33*、34*、36*、37*、39*的預(yù)測誤差都在1%以下,整體樣本預(yù)測平均正確率達到94.27%。為驗證優(yōu)化后結(jié)果的優(yōu)越性,利用GA-BP判別模型對指標(biāo)優(yōu)化之前的相同樣本進行預(yù)測,結(jié)果見表5,預(yù)測平均正確率僅為44.73%。這充分表明利用該指標(biāo)體系的優(yōu)越性和GA-BP分析模型對礦井突水水源劃分的適用性。
表5 判別分析結(jié)果Table 5 The results of discriminant analysis
利用嵌入梯度的支持向量機方法對國內(nèi)某礦井突水水源判別的指標(biāo)評系進行了優(yōu)化,根據(jù)各指標(biāo)的梯度重要度大小和對不同體系下預(yù)測礦井突水水源正確率的比較,對[SO4]2-、K+、Mg2+、Na+、Ca2+、Cl-、[HCO3]-、F-等8項水化學(xué)成分進行約簡,最終選擇K+、Mg2+、Ca2+、Cl-、[HCO3]-、F-等6項離子含量作為突水水源的判別因子。
選用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)對新指標(biāo)指體系下的河南焦作礦區(qū)的30個突水水源離子測試數(shù)據(jù)進行訓(xùn)練,并對10個待測樣本進行判別,預(yù)測正確率達到了94.27%。這表明新的指標(biāo)體系應(yīng)用于礦井突水水源識別判定是合理、有效的,同時也驗證了GA-BP在礦井突水水源預(yù)測領(lǐng)域的適用性,為礦井突水水源識別提供了一條新途徑。
[1]魯金濤,李夕兵,宮鳳強.基于主成分分析與Fisher判別分析法的礦井突水水源識別方法[J].中國安全科學(xué)學(xué)報,2012,22(7):109-115.
[2]李明山.等效數(shù)值法在礦井突水水源判別中的應(yīng)用[J].礦業(yè)安全與環(huán)保,1998(4):35-38.
[3]余克林,楊永生,章臣平.模糊綜合評判法在判別礦井突水水源中的應(yīng)用[J].金屬礦山,2007(3):47-50.
[4]洪雷,彭華,燕文,等.最大效果測度值法研究礦井突水水源[J].中國煤田地質(zhì),2002,14(2):45-46,73.
[5]王心義,徐濤,黃 丹.距離判別法在相似礦區(qū)突水水源識別中的應(yīng)用[J].煤炭學(xué)報,2011,36(8):1354-1358.
[6]王成武.基于支持向量機的室內(nèi)轟燃預(yù)測模型研究[J].中國安全科學(xué)學(xué)報,2011,21(4):45-52.
[7]師旭超,韓陽.煤與瓦斯突出預(yù)測的支持向量機(SVM)模型[J].中國安全科學(xué)學(xué)報,2009,19(7):26-32.
[8]舒彤,葛佳麗,陳 收.基于支持向量機的供應(yīng)鏈風(fēng)險評估研究[J].經(jīng)濟經(jīng)緯,2014,31(1):130-135.
[9]趙吉文,汪婭驊,陳盼盼,等.組合核函數(shù)多支持向量機的直線電機建模[J].電機與控制學(xué)報,2014,18(2):90-95.
[10]黃東.基于模糊支持向量機的車輛碰撞信號檢測[J].計算機仿真,2014,31(1):157-160.
[11]蘇盈盈,劉興華,李景哲,等.礦井通風(fēng)系統(tǒng)指標(biāo)體系的約簡及其安全評價[J].中國安全科學(xué)學(xué)報,2013,23(9):83-89.
[12]Jiang Y,Yuan D,Xie S,et al.Groundwater quality and land use change in a typical karst agricultural region[J].Journal of Geographical Sciences,2006,16(4):405-414.
[13]姚銀佩,李夕兵,宮鳳強,等.加權(quán)距離判別分析法在巖體質(zhì)量等級分類中的應(yīng)用[J].巖石力學(xué)與工程學(xué)報,2010,29 (增刊2):4119-4122.
[14]王敏,張占松,胡松.基于主成分分析的Fisher判別法在L地區(qū)水淹層識別中的應(yīng)用[J].長江大學(xué)學(xué)報,2010,7(4):79-82.
[15]黃平華,陳建生.基于多元統(tǒng)計分析的礦井突水水源Fisher識別及混合模型[J].煤炭學(xué)報,2011,36(增刊1):131-137.
[16]曾孟佳,程兆麟.改進GA神經(jīng)網(wǎng)絡(luò)在可持續(xù)發(fā)展水平研究中的應(yīng)用[J].系統(tǒng)工程理論與實踐,2007,27(4):120-125.
[17]王德民.基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J].電子設(shè)計工程,2013,21(22):95-98.
[18]可華明,陳朝鎮(zhèn),張新合,等.遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)遙感圖像分類研究[J].西南大學(xué)學(xué)報,2010,32(7):128-132.
[19]湯井田,曹揚,肖嘉瑩,等.遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的異丙酚血藥濃度預(yù)測[J].科學(xué)技術(shù)與工程,2013,13(13): 3552-3558.
Improved SVM and GA-BP neural network model of mine water inrush sources identification
YANG Fuqiang,LIU Guangning,GUO Lele
(College of Environment and Resources,F(xiàn)uzhou University,F(xiàn)uzhou 350108,China)
Timely identification of water inrush is one of the most important jobs to prevent and control the mine water inrush disaster effectively.Based on the test samples with different water layers in Jiaozuo mine area,the embeded gradient Support Vector Machine(SVM)is used to rank eight kinds of water chemical compositions,including[SO4]2-,K+,Mg2+,Na+,Ca2+,Cl-,[HCO3]-,F(xiàn)-.The compositions of K+,Mg2+,Ca2+,Cl-,[HCO3]-,F(xiàn)-are selected as the main distinguishing factors of mine water inrush sources identification.Thirty groups of learning samples under the new system are carried out to train fitting by BP neural network genetic algorithm(GA-BP).The established analysis model is used to predict ten groups of water sources,and the average accuracy rate of forecast is 94.27%.The research result shows that the new index system is feasible in the mine water inrush identification,and the GA-BP model classification performance is effective with low misjudgment rate,which can be used for identification of mine water inrush water.
water inrush;source identification;SVM;GA-BP
TD74
Α
1671-4172(2015)01-0087-05
國家自然科學(xué)基金(51304051);福建省自然科學(xué)基金(2012J05088);福州大學(xué)科技發(fā)展基金(2013-XQ-18);福州大學(xué)科研啟動基金(XRC-1174)
陽富強(1982-),男,副教授,博士,安全工程專業(yè),主要從事礦山安全領(lǐng)域的教學(xué)與科研工作。
10.3969/j.issn.1671-4172.2015.01.020