扶祥祥,江澤標(biāo), ,余照陽(yáng), ,郭亞玲,吳少康
(1.貴州大學(xué) 礦業(yè)學(xué)院, 貴州 貴陽(yáng) 550025;2.貴州省非金屬礦產(chǎn)資源綜合利用重點(diǎn)實(shí)驗(yàn)室, 貴州 貴陽(yáng) 550025)
在煤礦的生產(chǎn)過(guò)程中,礦井突水事故是礦井安全事故中危害最大的自然災(zāi)害之一[1?2]。當(dāng)?shù)V井突水事故時(shí),及時(shí)、有效、準(zhǔn)確地判別突水水源的種類是預(yù)防和解決突水事故的重要前提。因此,準(zhǔn)確判斷突水水源類型,預(yù)測(cè)其涌水量,對(duì)于礦井水害防治和礦井生產(chǎn)安全具有十分重要的意義。
利用水文地球化學(xué)數(shù)據(jù)進(jìn)行判別分析突水水源的方法,得到廣泛的應(yīng)用和研究,取得了一些進(jìn)步和發(fā)現(xiàn)[3?4]。水文地球化學(xué)數(shù)據(jù)的差異性是水源的本質(zhì)特征,通過(guò)這些有差異性的數(shù)據(jù)結(jié)合各種方法來(lái)判別分析突水水源類別必然十分快捷、有效[5?6]。聶榮花等[7]以邢臺(tái)煤礦為研究對(duì)象,通過(guò)Bayes逐步判別法建立了礦山涌水快速判別模型。張春雷等[8]以淮南顧橋礦為例,結(jié)果表明,貝葉斯多類線性判別模型優(yōu)于神經(jīng)網(wǎng)絡(luò)模型,其計(jì)算過(guò)程簡(jiǎn)單,模型結(jié)構(gòu)穩(wěn)定。徐星等[9]用逐步 Bayes 判別方法判別突水水源,結(jié)果表明其具有易建模、準(zhǔn)確率高的優(yōu)點(diǎn)。曲興玥等[10]用因子分析和距離判別法判別突水水源,提高了判別準(zhǔn)確率。
本文采用PCA法和Bayes逐步判別法建立Bayes逐步判別模型和PCA-Bayes綜合判別模型對(duì)福建煤礦突水水源進(jìn)行判別分析,通過(guò)結(jié)果預(yù)測(cè)對(duì)比,PCA-Bayes綜合判別法比Bayes逐步判別法更準(zhǔn)確。
突水水源的含水層中的水源水化學(xué)成分眾多。本文選取Na++K+、Ca2+、Mg2+、Cl?、SO42?、HCO3?等6種離子及酸堿度共7項(xiàng)指標(biāo)的組分作為預(yù)測(cè)礦井突水的判別因子。
以文獻(xiàn)[11]中福建典型煤礦的35個(gè)水源數(shù)據(jù)為樣本,其中老空水13份,灰?guī)r水7份,地表水6份,裂隙水9份。隨機(jī)選取樣本編號(hào)為2,5,10,17,25為待測(cè)樣本,以剩余樣本為訓(xùn)練樣本。樣本數(shù)據(jù)見(jiàn)表1。
利用SPSS軟件[12]對(duì)訓(xùn)練的樣本數(shù)據(jù)進(jìn)行Bayes逐步判別處理,可以得到4種水源的判別分類函數(shù),其函數(shù)表達(dá)式:
表1 福建典型煤礦突水水源數(shù)據(jù)
式中,S1、S2、S3、S4分別為老空水、裂隙水、灰?guī)r水以及地表水的判別函數(shù)值;X1、X2、X3分別為碳酸氫根離子濃度、硫酸根離子濃度、pH值。
將每一組樣本數(shù)據(jù)代入表達(dá)式,得到最大值的樣本數(shù)據(jù)歸于該類。由SPSS判別的分類結(jié)果可知,第1類水源誤判率為0,第2類水源誤判率為37.5%,即有3個(gè)第2類水源被判為第3類水源,第3類水源誤判率為0,第4類水源誤判率為0,在該模型下判別正確率為90.0%。
2.2.1 訓(xùn)練樣本的主成分分析
先對(duì)原始樣本數(shù)據(jù)進(jìn)行因子分析,從因子分析的結(jié)果中可知KMO的值為0.647,顯著性值為0,小于0.05,說(shuō)明變量間存在相關(guān)關(guān)系,適合進(jìn)行因子分析,亦適合進(jìn)行主成分分析。
各主成分的解釋總方差見(jiàn)表2,從表2中可知,提取3個(gè)主成分累積貢獻(xiàn)率已達(dá)到86.18%,提取3個(gè)成分即可,可以達(dá)到降維的目的。
表2 解釋的總方差
根據(jù)主成分分析的成分矩陣可以得到特征向量矩陣,從而得到成分矩陣和特征向量矩陣(見(jiàn)表3),從而可以得到PCA處理的綜合指標(biāo)數(shù)據(jù)的表達(dá)式:
式中,X1、X2、X3、X4、X5、X6、X7分別代表鈉鉀離子濃度、鈣離子濃度、鎂離子濃度、氯離子濃度、碳酸氫根離子濃度、硫酸根離子濃度、pH值。
表3 成分矩陣和特征向量矩陣
將原始數(shù)據(jù)標(biāo)準(zhǔn)化處理后,代入函數(shù)表達(dá)式,即可得到主成分分析后的綜合指標(biāo)數(shù)據(jù)(見(jiàn)表4),用于建立綜合模型。
2.2.2 PCA-Bayes綜合模型
用PCA處理過(guò)的綜合指標(biāo)數(shù)據(jù)在SPSS軟件上進(jìn)行Bayes判別處理,可以得到4類突水水源的判別分類函數(shù)表達(dá)式:
表4 PCA處理得到的綜合指標(biāo)數(shù)據(jù)
式中,W1、W2、W3、W4分別為老空水、裂隙水、灰?guī)r水以及地表水的判別函數(shù)值;X1、X2分別為綜合指標(biāo)Z1、Z2的值。
由SPSS判別的分類結(jié)果可知,第1類水源誤判率為18.2%,一個(gè)判別為2類水源,一個(gè)判別為3類水源;第2類水源誤判率為0;第3類水源誤判率為0;第4類水源誤判率為0。所以該樣本數(shù)據(jù)在PCA-Bayes綜合判別模型下判別正確率為93.3%。
首先將待測(cè)樣本代入Bayes逐步判別模型得到判別函數(shù),然后將待測(cè)函數(shù)進(jìn)行主成分分析并將所得到的主成分樣本數(shù)據(jù)代入PCA-Bayes綜合判別模型得到判別函數(shù)(見(jiàn)表5)。
由表5可知,5個(gè)待測(cè)樣本在Bayes逐步判別模型中有一個(gè)判別錯(cuò)誤,判別的正確率為80%,5個(gè)待測(cè)樣本在PCA-Bayes綜合判別模型下的判別全部正確,判別正確率為100%。
(1)本文對(duì)福建典型礦的突水水源建立Bayes判別模型和PCA-Bayes綜合判別模型,并對(duì)待判樣本進(jìn)行判別。
(2)運(yùn)用Bayes逐步判別模型對(duì)訓(xùn)練樣本的回判正確率為90%,待測(cè)樣本的判別正確率為80%;運(yùn)用PCA-Bayes綜合判別模型對(duì)訓(xùn)練樣本的回判正確率為93.3%,待測(cè)樣本的判別正確率為100%。
(3)從兩個(gè)模型的對(duì)比分析可以看出,通過(guò)PCA降維的PCA-Bayes綜合判別法的正確率要優(yōu)于單一的Bayes逐步判別法,PCA-Bayes綜合判別法是一種對(duì)突水水源判別快捷、準(zhǔn)確、有效的方法。
表5 待測(cè)樣本模型驗(yàn)證