薛峰 李希建
摘? 要:為提高小樣本數(shù)據(jù)預(yù)測(cè)煤層底板突水狀態(tài)可靠性,結(jié)合主成分分析(Principal Component Analysis,PCA)與Fisher判別法構(gòu)建煤層底板突水預(yù)測(cè)模型。以華北典型礦區(qū)為例,選取12項(xiàng)可直接測(cè)量指標(biāo)作為煤層底板突水評(píng)價(jià)指標(biāo),采用主成分分析處理評(píng)價(jià)指標(biāo),用5項(xiàng)主成分代替原有12項(xiàng)指標(biāo),定性分析煤層底板突水狀態(tài)。利用Fisher判別法分析主成分分析處理結(jié)果,確定評(píng)價(jià)集與兩類(lèi)突水狀態(tài)的距離,進(jìn)行樣本歸類(lèi)判別。研究表明:回判15組訓(xùn)練樣本并預(yù)測(cè)3組待測(cè)樣本,誤判率為0%。PCA-Fisher判別模型可減弱指標(biāo)間關(guān)聯(lián)度,在煤層底板突水樣本數(shù)據(jù)有限的情況下,可獲得良好的預(yù)測(cè)效果。
關(guān)鍵詞:煤層底板突水 主成分分析(PCA)判別法(Fisher)模型研究
由于我國(guó)煤田水文地質(zhì)條件的復(fù)雜性,在煤層開(kāi)采過(guò)程中極易受水害威脅。盡管采取了大量防治措施,但隨著開(kāi)采深度的增加,煤層水壓逐漸升高,突水災(zāi)害日益加深。煤層底板突水受多種因素的控制,其機(jī)理非常復(fù)雜,且突水?dāng)?shù)據(jù)難以獲得。因此,基于小樣本數(shù)據(jù)高效準(zhǔn)確預(yù)測(cè)煤層底板突水狀態(tài)已成為目前研究的迫切需求。
近年來(lái),諸多學(xué)者對(duì)煤層底板突水問(wèn)題的研究取得了一定成果。劉磊、趙德康、申建軍、徐德寶等分別采用灰色理論、熵權(quán)-未確知測(cè)度理論、可拓物元模型和突變理論確定指標(biāo)權(quán)重,對(duì)煤層底板突水危險(xiǎn)性趨勢(shì)進(jìn)行了預(yù)測(cè),但對(duì)煤層底板突水影響因素重要程度賦值具有主觀性及隨意性,影響預(yù)測(cè)精度。LSTM(Long Short-Term Memory,長(zhǎng)短時(shí)記憶)神經(jīng)網(wǎng)絡(luò)、改進(jìn)脆弱性指數(shù)法、未確知測(cè)度理論等方法利用現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù),驗(yàn)證預(yù)測(cè)煤層突水模型準(zhǔn)確性;盡管上述研究方法可預(yù)測(cè)煤層底板突水狀態(tài),但評(píng)價(jià)指標(biāo)間重疊性強(qiáng),計(jì)算過(guò)程復(fù)雜,在樣本數(shù)據(jù)有限的情況下,難以精準(zhǔn)預(yù)測(cè)突水狀態(tài)。Fisher判別法可很好預(yù)測(cè)小樣本數(shù)據(jù),周健、孫文潔、畢建武、侯恩科等利用Fisher判別法分別預(yù)測(cè)了地下礦山礦柱穩(wěn)定性、礦井水文地質(zhì)類(lèi)型、煤與瓦斯突出類(lèi)型、風(fēng)化基巖富水性,減少樣本數(shù)據(jù)有限時(shí)對(duì)預(yù)測(cè)精度的影響。但預(yù)測(cè)模型中評(píng)價(jià)指標(biāo)眾多且關(guān)聯(lián)性強(qiáng),僅采用Fisher判別法預(yù)測(cè),計(jì)算過(guò)程冗雜,影響預(yù)測(cè)精度。
為此,筆者基于主成分分析(PCA)和Fisher判別法建立煤層底板突水預(yù)測(cè)模型,選取12項(xiàng)可直接測(cè)量指標(biāo)作為煤層底板突水評(píng)價(jià)指標(biāo),減少賦值主觀性,提取煤層底板突水評(píng)價(jià)指標(biāo)特征信息,用少量主成分代替原有眾多評(píng)價(jià)指標(biāo),減弱指標(biāo)間關(guān)聯(lián)度,簡(jiǎn)化計(jì)算過(guò)程,確定評(píng)價(jià)集與兩類(lèi)突水狀態(tài)距離,提高預(yù)測(cè)精度,以期在樣本數(shù)據(jù)有限情況下,得到更合理、可靠的煤層底板突水預(yù)測(cè)結(jié)果,為礦井防治煤層底板突水事故提供一定理論支撐。
1? 建立PCA-Fisher判別模型
1.1 主成分分析方法
主成分分析本質(zhì)上是一種有效的降維手段,其核心是將原始數(shù)據(jù)通過(guò)線性組合,利用矩陣正交變換將初始信息提煉,用較少主成分線性函數(shù)與特定成分之和表達(dá)原有眾多指標(biāo),消除指標(biāo)間相關(guān)性,降低預(yù)測(cè)樣本復(fù)雜度、提高預(yù)測(cè)精度。分析步驟如下:
1)建立原始數(shù)據(jù)矩陣,表達(dá)式為:
2)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,可表示為:
3)求相關(guān)系數(shù)矩陣G,表達(dá)式為:
4)計(jì)算矩陣G特征值及特征向量,表達(dá)式為:
經(jīng)計(jì)算得出特征值λi(i=1,2,3,,p),并按其大小順序進(jìn)行排列后分別求出特征值所對(duì)應(yīng)的特征向量。
5)確定主成分?jǐn)?shù)目。計(jì)算單個(gè)主成分的貢獻(xiàn)率及主成分累計(jì)貢獻(xiàn)率,取累計(jì)貢獻(xiàn)率S≥85%所對(duì)應(yīng)的前h個(gè)主成分。
第h個(gè)主成分的貢獻(xiàn)率,可表示為:
前h個(gè)主成分累計(jì)貢獻(xiàn)率,可表示為:
6)經(jīng)線性組合后可得y=AX,即:
式(7)中線性變換要滿足以下條件:①;②;③yi是與y1,y2,…,yi-1都不相關(guān)的x1,x2,…,xi全部線性組合中方差最大者。
組合中方差最大者。
1.2 Fisher判別模型
Fisher判別法中心思想為投影,即將原始的n組p維數(shù)據(jù)依據(jù)方差分析原理投影到某方向,將原始的多維數(shù)據(jù)簡(jiǎn)化為一維函數(shù)。設(shè)從總體中選取m組具有p項(xiàng)指標(biāo)的樣本作為觀測(cè)數(shù)據(jù),運(yùn)用方差分析原理構(gòu)造一個(gè)或多個(gè)判別函數(shù)為[15]。
預(yù)測(cè)煤層底板是否突水時(shí)Fisher判別準(zhǔn)則如下:
煤層底板突水樣本共有2個(gè)類(lèi)別,即突水與未突水。設(shè)樣本數(shù)為ni,每個(gè)樣本有p項(xiàng)指標(biāo),協(xié)方差矩陣及均值分別為x(i),。為判定新樣本是否突水,構(gòu)建判別函數(shù)為:
式中。
y(x)在總體上的樣本均值及樣本方差為:
式中,和Si表示總體內(nèi)x的樣本均值向量和樣本協(xié)方差陣。若為樣本總均值向量,則。
最大離差比γ可表示為:
式中,,為組內(nèi)離差平方和;,為組間離差平方和。
根據(jù)極值存在必要條件,經(jīng)代數(shù)計(jì)算,可構(gòu)造t(t為E-1B非零特征值個(gè)數(shù))個(gè)判別函數(shù)。
單個(gè)判別函數(shù)的判別能力定義為:
式中,λ為E-1B對(duì)應(yīng)的特征值。
前h個(gè)判別函數(shù)的判別能力定義為:
若Ps≥85%,可采用前h判別函數(shù)進(jìn)行判別。將新樣本p項(xiàng)指標(biāo)函數(shù)帶入判別函數(shù)中即可求出y值,將其與判別臨界值進(jìn)行比較,即可判定該樣本是否突水。
2? 煤層底板突水主成分分析
2.1 煤層底板突水預(yù)測(cè)指標(biāo)的確定
煤層底板突水事故的影響因素多而復(fù)雜,所選取的指標(biāo)將直接影響評(píng)價(jià)結(jié)果。為減少主觀性,提高預(yù)測(cè)準(zhǔn)確性,根據(jù)華北典型礦區(qū)資料,結(jié)合前人研究結(jié)果選取12項(xiàng)可直接測(cè)量指標(biāo)作為煤層底板突水評(píng)價(jià)指標(biāo),18組煤層底板樣本數(shù)據(jù)進(jìn)行分析,編號(hào)為1~18。X1為含水層厚度、X2為水壓、X3為隔水層厚度、X4為砂石比、X5為泥石比、X6為煤層底板標(biāo)高、X7為煤層傾角、X8為斷層落差、X9為距斷層距離、X10為開(kāi)采高度、X11為開(kāi)采深度、X12為采動(dòng)速度。具體煤層底板突水樣本數(shù)據(jù)見(jiàn)表1。
2.2 主成分分析結(jié)果
利用SPSS(Statistical Product and Service Solutions),統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案軟件),對(duì)表1中18組樣本數(shù)據(jù)、12項(xiàng)評(píng)價(jià)指標(biāo)進(jìn)行主成分分析,由此得出煤層底板突水各主成分的特征值及貢獻(xiàn)率,見(jiàn)表2;煤層底板突水PCA碎石特征值及累計(jì)貢獻(xiàn)率圖,見(jiàn)圖2。由表2可知,前5項(xiàng)主成分的累計(jì)貢獻(xiàn)率為85.044%,說(shuō)明前5項(xiàng)主成分包含原有指標(biāo)數(shù)據(jù)85.044%的信息。由圖2可知,前5個(gè)主成分特征值散點(diǎn)圖呈陡坡形,后5個(gè)主成分特征散點(diǎn)圖趨于平緩,表明前5項(xiàng)主成分可以較好的解釋煤層底板突水原始指標(biāo)的絕大部分信息,且各成分間的重疊性弱。因此,提取前5項(xiàng)主成分代替原有的12項(xiàng)指標(biāo)更為合適。
利用SPSS軟件,求得煤層底板突水5個(gè)主成分的因子載荷矩陣,見(jiàn)表3。其中,第1主成分Y1與指標(biāo)X6、X1、X12、X8、X4、X5、X10、X11顯著相關(guān),表明Y1包含煤層底板標(biāo)高、含水層厚度、采動(dòng)速度、斷層落差、砂石比、泥石比、開(kāi)采高度及開(kāi)采深度的指標(biāo)信息;第2主成分Y2與指標(biāo)X2顯著相關(guān),表明Y2包含水壓的指標(biāo)信息。同樣可以確定,第3主成分Y3包含X3隔水層厚度的指標(biāo)信息;第4主成分Y4包含X9距斷層距離的指標(biāo)信息;第5主成分Y5包含X7煤層傾角的指標(biāo)信息。
2.3 主成分分析煤層底板突水狀態(tài)
表4為主成分得分?jǐn)?shù)據(jù)。根據(jù)主成分Y1和Y2得分?jǐn)?shù)據(jù),畫(huà)出樣本得分散點(diǎn)圖,如圖3所示。由表4和圖3可知:Y1和Y2主成分分別包含原始指標(biāo)信息的38.632%和18.080%。樣本編號(hào)為1、5、11、15、17的5個(gè)樣本分布在主成分Y1、Y2的正向區(qū)間(第Ⅰ象限),Y1、Y2主成分得分較大,結(jié)合實(shí)際情況可知,這5個(gè)樣本都屬于突水狀態(tài)。樣本編號(hào)為4、12、13、16、18的5個(gè)樣本分布在主成分Y1、Y2的負(fù)向區(qū)間(第Ⅲ象限),結(jié)合實(shí)際情況可知,這5個(gè)樣本都屬于未突水狀態(tài)。
由表2和圖3可知:Y1和Y2主成分得分散點(diǎn)圖包含原始數(shù)據(jù)54.712%信息,且Y1、Y2特征值均大于2。除Y1、Y2外,其他主因子對(duì)原有信息涵蓋較少,無(wú)法定性描述煤層底板突水狀態(tài)。
3? 評(píng)價(jià)煤層底板突水狀態(tài)
3.1 預(yù)測(cè)煤層底板突水狀態(tài)
基于主成分分析法,將提取的5個(gè)主成分,即Y1~Y5作為Fisher判別指標(biāo)輸入層,將樣本編號(hào)1~15組數(shù)據(jù)作為訓(xùn)練樣本輸入,16~18組數(shù)據(jù)作為預(yù)測(cè)樣本輸出,輸出參數(shù)為煤層底板突水狀態(tài)。利用SPSS軟件,由Fisher判別法計(jì)算可得判別函數(shù),見(jiàn)式(13)。
判別函數(shù)G對(duì)應(yīng)的特征值為7.066,典型相關(guān)性達(dá)到0.936,大于0.85,說(shuō)明其判別能力顯著,方差為100.00%,表明運(yùn)用函數(shù)G即可解釋樣本全部信息。
煤層底板突水狀態(tài)中心值,見(jiàn)表5。在判別函數(shù)G中,未突水的中心值為-2.645,突水的中心值為2.315。通過(guò)比較預(yù)測(cè)樣本函數(shù)值與突水狀態(tài)中心值的距離,即取兩者差值絕對(duì)值,根據(jù)絕對(duì)值最小所在類(lèi)別確定樣本最終突水狀態(tài)。
為檢驗(yàn)PCA-Fsher判別模型的準(zhǔn)確性及可靠性,將15組訓(xùn)練樣本數(shù)據(jù)逐一回代,通過(guò)比較樣本函數(shù)值與突水狀態(tài)中心值的距離,確定樣本的突水狀態(tài)。1~15組回判函數(shù)、16~18組判斷函數(shù)值,結(jié)果見(jiàn)表6。
3.2 結(jié)果分析
PCA-Fisher判別對(duì)1~15組訓(xùn)練樣本回判結(jié)果全部正確,16~18組預(yù)測(cè)樣本全部正確,回判及預(yù)測(cè)過(guò)程中都沒(méi)有造成誤判。主成分分析提取影響煤層底板突水指標(biāo)主成分,減弱各指標(biāo)間關(guān)聯(lián)性。Fisher判別模型預(yù)測(cè)煤層底板突水狀態(tài),利用判別函數(shù)對(duì)訓(xùn)練樣本進(jìn)行回判,提高小樣本預(yù)測(cè)效率及精度。綜上表明:PCA-Fisher判別模型預(yù)測(cè)小樣本煤層底板突水穩(wěn)定程度高且較為可靠,能滿足突水判別的實(shí)際要求。
4? 結(jié)論
1)采用主成分分析對(duì)影響煤層底板突水指標(biāo)進(jìn)行降維處理,確定5個(gè)主成分代替原有的12項(xiàng)評(píng)價(jià)指標(biāo),降低指標(biāo)信息間關(guān)聯(lián)度,提高預(yù)測(cè)精度。
2)將確定的主成分,帶入Fisher判別中,前15組樣本數(shù)據(jù)逐一回判,后3組樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果均與實(shí)際數(shù)據(jù)一致。
3)煤層底板突水預(yù)測(cè)的PCA-Fisher判別模型具有較高的穩(wěn)定性及可靠性,簡(jiǎn)化了判別模型,提高了預(yù)測(cè)效率。
參考文獻(xiàn)
[1]李博,武強(qiáng),班文韜。 掘進(jìn)巷道富水型斷層突水多場(chǎng)災(zāi)變演化規(guī)律研究[J]。 煤炭科學(xué)技術(shù),2019,47(12):161-167。
[2]陳星明,曹樹(shù)凱。 石炭-二疊系煤層底板高承壓巖溶水防治技術(shù)[J]。 煤炭科學(xué)技術(shù),2018,46(3):182-187。
[3]劉磊,于小鴿,王丹丹等。 基于灰色理論的底板突水危險(xiǎn)性評(píng)價(jià)[J]。 礦業(yè)安全與環(huán)保,2016,43(5):45-49+61。
[4]趙德康,張健。 基于熵權(quán)-未確知測(cè)度理論的煤層底板突水危險(xiǎn)性評(píng)價(jià)數(shù)學(xué)模型[J]。 煤炭工程,2016,48(S2):121-124。
[5]申建軍,劉偉韜,許珂。 基于可拓物元模型的煤層底板突水危險(xiǎn)性評(píng)價(jià)[J]。 河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,35(4):451-457。
[6]徐德寶,曹始友,徐孚效等。 基于突變理論的煤層底板突水危險(xiǎn)性評(píng)價(jià)[J]。 煤礦安全,2014,45(12):197-200。
[7]董麗麗,費(fèi)城,張翔等。 基于LSTM神經(jīng)網(wǎng)絡(luò)的煤礦突水預(yù)測(cè)[J]。煤田地質(zhì)與勘探,2019,47(2):137-143。
[8]陳建平,李金柱,王雪冬等。 改進(jìn)脆弱性指數(shù)法在煤礦底板突水評(píng)價(jià)中的應(yīng)用[J]。 中國(guó)地質(zhì)災(zāi)害與防治學(xué)報(bào),2019,30(3):67-74。
[9]葉世雄,賈明濤,潘傳鵬,陳建宏。 基于未確知測(cè)度理論的煤層底板突水危險(xiǎn)性評(píng)價(jià)[J]。 安全與環(huán)境學(xué)報(bào),2015,15(1):26-30。
[10]孫文潔,武強(qiáng),董東林等。 礦井水文地質(zhì)類(lèi)型劃分的Fisher判別分析法-以開(kāi)灤礦區(qū)為例[J]。 中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2012,41(2):231-235。
[11]畢建武,賈進(jìn)章,趙博琦等。 煤與瓦斯突出預(yù)測(cè)的Fisher判別分析法及應(yīng)用[J]。 安全與環(huán)境學(xué)報(bào),2014,14(5):57-60。
[12]侯恩科,童仁劍,王蘇健等。 陜北侏羅紀(jì)煤田風(fēng)化基巖富水性Fisher模型預(yù)測(cè)方法[J]。 煤炭學(xué)報(bào),2016,41(9):2312-2318。
[13]任雪松,于秀林。 多元統(tǒng)計(jì)分析(第2版)[M]。 北京:中國(guó)統(tǒng)計(jì)出版社,2011:184-198。
[14]張紫昭,陳凱,程文瑜等。 基于Fisher判別分析法的井巷圍巖質(zhì)量分類(lèi)研究[J]。 煤炭科學(xué)技術(shù),2016,44(11):36-41。