陳文飛, 劉啟蒙, 劉 瑜, 金洲洋, 張文濤
(安徽理工大學(xué) 地球與環(huán)境學(xué)院,安徽 淮南232001)
礦井突水是煤礦重大自然災(zāi)害之一,通常會(huì)造成重大的人員傷亡和經(jīng)濟(jì)損失,嚴(yán)重威脅煤礦安全生產(chǎn)[1-2]。及時(shí)準(zhǔn)確地判別礦井涌水水源,對煤礦防治水工作具有重要意義[3-5]。在地下水滲流及從補(bǔ)給區(qū)接受補(bǔ)給到排泄區(qū)的徑流過程中,水質(zhì)特征有著巨大的差異[6-7]。同時(shí),受煤礦采動(dòng)影響,各含水層間存在極為復(fù)雜的水力聯(lián)系,水質(zhì)特征變得更加復(fù)雜,難以應(yīng)用經(jīng)典數(shù)學(xué)方法建立精確的預(yù)測模型[8]。為此,筆者采用主成分分析和BP 神經(jīng)網(wǎng)絡(luò)方法,對礦井涌水水源進(jìn)行判別,以期為礦井防治水提供借鑒。
主成分分析法(Principal component analysis,PCA)是一種應(yīng)用數(shù)學(xué)降維的方法。該方法通過找出幾個(gè)綜合變量來代替原來眾多的變量,使得這些綜合變量盡可能地代表原來變量的信息量,且彼此之間互不相關(guān),從而達(dá)到對特征信息提取和降維的目的[9-10]。
PCA 法就是將p 個(gè)觀測量綜合成為p 個(gè)新的觀測量(綜合變量),計(jì)算式為
式(1)中,Yi與Yj互不相關(guān)(i≠j,i,j =1,2,…,p);Y1的方差大于Y2的方差,Y2的方差大于Y3的方差,以此類推。主成分?jǐn)?shù)量K 主要依據(jù)主成分的累積貢獻(xiàn)率確定,一般要求累積貢獻(xiàn)率達(dá)到85%以上,這樣才能保證綜合變量代表原始變量的絕大多數(shù)信息。
BP 神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)如圖1 所示。網(wǎng)絡(luò)權(quán)值的調(diào)整規(guī)則采用誤差反向傳播算法及BP 算法。其基本思想是,學(xué)習(xí)過程由信號的正向傳播與誤差的反向傳播兩個(gè)過程組成。正向傳播時(shí),輸入樣本從輸入層傳入,經(jīng)各隱層逐層處理后,傳向輸出層,若輸出層實(shí)際輸出與期望的輸入不符,則轉(zhuǎn)入誤差反向傳播階段。這不斷重復(fù)的過程也就是網(wǎng)絡(luò)權(quán)值不斷調(diào)整的過程[11-12]。
圖1 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 BP neural network structure
謝橋煤礦位于淮南煤田潘謝礦區(qū),井田內(nèi)主要含水層為新生界孔隙含水組、煤系砂巖裂隙含水層及灰?guī)r巖溶含水組。新生界松散層下部含水層是淺部煤層開采的主要補(bǔ)給水源,煤系砂巖含水組一般以靜儲(chǔ)量為主,易疏放,是礦井涌水的直接水源。隨著開采深度增加,煤礦生產(chǎn)受灰?guī)r水的影響日益嚴(yán)重。
謝橋煤礦含水層(組)自下而上分別為奧陶系灰?guī)r裂隙巖溶含水層(組)、石炭系太原組灰?guī)r溶裂隙含水層(組)(以下簡稱“太灰”)、二疊系砂巖裂隙含水層(組)、新生界含水層(組)。其中,新生界含水層(組)又可分為上、中、下三個(gè)含水層(組)(以下分別簡稱為“上含”、“中含”和“下含”),下含與中含、上含之間有穩(wěn)定的黏土隔水層(組)。
2.3.1 主成分分析
利用謝橋煤礦的水樣數(shù)據(jù)進(jìn)行研究,判別因素為常規(guī)水化學(xué)特征離子和總?cè)芙夤腆w,共有水樣數(shù)據(jù)81 個(gè),包括上含水樣6 個(gè)、中含水樣2 個(gè)、下含水樣3 個(gè)、煤系砂巖水樣43 個(gè)、太灰水樣27 個(gè)。選取64 個(gè)水樣數(shù)據(jù)用于建模研究,其余水樣作為驗(yàn)證樣本。
計(jì)算水化學(xué)特征離子間相關(guān)系數(shù),結(jié)果見表1。
表1 各水化學(xué)成分指標(biāo)的Pearson 相關(guān)系數(shù)矩陣Table 1 Pearson correlation coefficient matrix of each water chemical component
由各水化學(xué)成分指標(biāo)的Pearson 相關(guān)系數(shù)矩陣可知,Ca2+與Mg2+相關(guān)系數(shù),K++ Na+、Cl-與TDS相關(guān)系數(shù)均較高,分別為0.70、0.98 和0.81。這說明謝橋煤礦水樣堿土金屬相關(guān)性比較明顯,TDS 受K++Na+、Cl-影響十分明顯。水質(zhì)信息中存在重疊信息,有必要進(jìn)行主成分分析,消除重疊信息的影響。
根據(jù)主成分計(jì)算方法,計(jì)算提取因子解釋方差,結(jié)果見表2,其中,D1、K1、ΣK1分別為初始特征值方差、方差百分比、累積方差百分比,K2、ΣK2分別為被提取的載荷平方和方差百分比累積方差百分比。
由表2 可知,按照累積貢獻(xiàn)率達(dá)到85%以上的原則,Ca2+、Mg2+、K++Na+三個(gè)主成分包含了所有信息量的89.597%,因此,三個(gè)主成分可較為有效地概括原始樣本信息。
表2 提取因子解釋方差Table 2 Extraction factor of explained variance
經(jīng)計(jì)算,主成分得分系數(shù)矩陣見表3。
表3 主成分得分系數(shù)矩陣Table 3 Component score cofficient matrix
計(jì)算可得到各評價(jià)指標(biāo)在主成分中的載荷值,從主成分載荷大小可以看出,與第一主成分密切相關(guān)的是K++Na+、TDS 和,將第一主成分命名為TDS-K++Na+主成分,它們與第一主成分的載荷值均超過了0.80。各評價(jià)指標(biāo)與第二主成分密切相關(guān)的是Cl-和Mg2+。將第二主成分命名為Cl-主成分。各指標(biāo)中與第三主成分密切相關(guān)的評價(jià)指標(biāo)是,可將第三主成分命名為主成分。選取的三個(gè)主成分在下文中以Y1、Y2和Y3表示。從方差貢獻(xiàn)率可以看出,Y1的方差貢獻(xiàn)率為48.77%,大于Y2、Y3的方差貢獻(xiàn)率30.18%和10.65%。所以,謝橋礦突水水源的水化學(xué)特征主要由K++ Na+和TDS 控 制,其 次 受 控 于Mg2+、Cl-和
2.3.2 BP 神經(jīng)網(wǎng)絡(luò)差別模型
采用64 個(gè)樣本作為訓(xùn)練樣本,17 個(gè)樣本作為待判樣本,利用PCA 處理過的原始數(shù)據(jù)建立的新指標(biāo)數(shù)據(jù)集{Y1、Y2、Y3},建立BP 神經(jīng)網(wǎng)絡(luò)判別模型,模型計(jì)算在MATLAB 軟件上完成。
利用MATLAB 庫函數(shù)newff 創(chuàng)建BP 神經(jīng)網(wǎng)絡(luò):net = newff(P-1,T,[20,5],{’tansig’,’purelin’},’traingdm’)。
其中,P-1 是訓(xùn)練樣本;T 為目標(biāo)矩陣;[20,5]分別指隱層和輸出層的神經(jīng)元數(shù)目;’tansig’和’purelin’分別指隱層和輸出層的傳遞函數(shù);’traingdm’是選取的訓(xùn)練函數(shù)。
在訓(xùn)練網(wǎng)絡(luò)階段,首先確定訓(xùn)練目標(biāo)。這是一個(gè)非線性多元函數(shù)逼近問題,通過使來源于同一含水層的所有訓(xùn)練樣本逼近同一個(gè)目標(biāo)來訓(xùn)練網(wǎng)絡(luò),調(diào)整網(wǎng)絡(luò)的權(quán)值和閥值。目標(biāo)矩陣T 為:
然后,調(diào)用trainscg 算法訓(xùn)練BP 神經(jīng)網(wǎng)絡(luò):[net,tr]=train(net,P-1,T)。訓(xùn)練最大迭代次數(shù)設(shè)為10 000,目標(biāo)誤差設(shè)為1e-5,訓(xùn)練達(dá)到兩者之一時(shí)停止。
2.3.3 結(jié)果與分析
輸入檢驗(yàn)樣本,調(diào)用sim 函數(shù)對訓(xùn)練好的BP 網(wǎng)絡(luò)進(jìn)行仿真,輸出的結(jié)果矩陣的五個(gè)元素中距離1最近的元素列數(shù)代表該水樣的含水層類型,17 個(gè)待判樣本的判別結(jié)果見表4。
從表4 中可以看出,有一個(gè)煤系水樣被誤判為太灰水樣,兩個(gè)太灰水樣分別被誤判為上含水和煤系水,識別的正確率為82.35%。
Bayes 判別方法以計(jì)算值最大所在列為判別結(jié)果,如表5 所示。從表5 中可以看出,有一個(gè)煤系水被誤判為中含水,一個(gè)太灰水被誤判為上含水,兩個(gè)太灰水被誤判為下含水,總體判別正確率為76.47%。BP 神經(jīng)網(wǎng)絡(luò)判別結(jié)果以煤系水和太灰水誤判為主,而Bayes 判別方法對太灰水和下含水的區(qū)分效果不理想,不利于煤礦防治水工作的開展。
表4 待判水樣判別結(jié)果Table 4 Discriminant results of samples
表5 Bayes 判別結(jié)果Table 5 Discriminant results of bayes method
(1)應(yīng)用主成分分析方法處理原始變量數(shù)據(jù),能夠很好地消除變量間的信息重疊,從而極大地提高突水水源的識別精度。BP 神經(jīng)網(wǎng)絡(luò)具有較高的非線性、容錯(cuò)性和學(xué)習(xí)性,兩者結(jié)合可提高突水水源判別準(zhǔn)確率。
(2)與Bayes 判別相比,BP 神經(jīng)網(wǎng)絡(luò)對新生界水樣識別效果較好,具有較高的準(zhǔn)確率。
[1]祝 翠,錢家忠,周小平,等.BP 神經(jīng)網(wǎng)絡(luò)在潘三煤礦突水水源判別中的應(yīng)用[J].安徽建筑工業(yè)學(xué)院學(xué)報(bào):自然科學(xué)版,2010(5):35 -38.
[2]聶榮花,晏 偉,薩賢春.Bayes 逐步判別法在邢臺(tái)煤礦突水水源判別中的應(yīng)用[J].中國西部科技,2012(6):30 -32.
[3]孫莉?qū)?,張之源,羅定貴.基于MATLAB 實(shí)現(xiàn)的ANN 方法在巢湖水質(zhì)評價(jià)中的應(yīng)用[J].安徽大學(xué)學(xué)報(bào):自然科學(xué)版,2005(2):90 -94.
[4]朱代雙,許光泉,常靖靖,等.多元逐步Bayes 判別法在突水水源判別中的應(yīng)用[J].煤炭與化工,2013(9):11 -13,16.
[5]萬 文.礦井突水水源分析的Bayes 判別分析模型及其應(yīng)用[J].礦業(yè)工程研究,2009(3):27 -30.
[6]魯金濤,李夕兵,宮鳳強(qiáng),等.基于主成分分析與Fisher 判別分析法的礦井突水水源識別方法[J].中國安全科學(xué)學(xué)報(bào),2012(7):109 -115.
[7]楊海軍,王廣才.煤礦突水水源判別與水量預(yù)測方法綜述[J].煤田地質(zhì)與勘探,2012(3):48 -54,58.
[8]汪嘉楊,李祚泳,張雪喬,等.基于粒子群徑向基神經(jīng)網(wǎng)絡(luò)的礦井突水水源判別[J].安全與環(huán)境工程,2013(5):118-121.
[9]譚 博,高艷衛(wèi).基于多元統(tǒng)計(jì)分析的礦井水源的Bayes 逐步判別及混合模型[J].中國煤炭,2013(5):111 -115.
[10]楊永國,黃福臣.非線性方法在礦井突水水源判別中的應(yīng)用研究[J].中國礦業(yè)大學(xué)學(xué)報(bào),2007(3):283 -286.
[11]張 磊,許光泉.礦井突水水源的水化學(xué)特征分析及其判別模型[J].礦業(yè)安全與環(huán)保,2010(2):7 -10,91.
[12]高志強(qiáng).基于GIS 的淮南煤田礦井水害預(yù)測預(yù)警研究——以謝橋礦為例[D].合肥:合肥工業(yè)大學(xué),2012.