于小鴿 ,劉燚菲 ,翟培合
(1.江西應(yīng)用技術(shù)職業(yè)學(xué)院,江西 贛州 341000;2.山東科技大學(xué) 資源學(xué)院, 山東 泰安 271019;3.山東科技大學(xué) 地球科學(xué)與工程學(xué)院, 山東 青島 266590)
中國是以煤炭能源為主的國家,煤炭在相當(dāng)長的時期內(nèi)仍將是我國的主要能源,在歷經(jīng)近一個世紀的開采后,淺部的煤炭資源已開采殆盡,華北型煤田最為突出,大部分礦井已開采至石炭系下部煤層,煤礦受巖溶水威脅尤為嚴重[1]。據(jù)統(tǒng)計,2010-2019年,全國共發(fā)生煤礦水害事故182 起,死亡839 人,約是世界上主要采煤國家死亡總?cè)藬?shù)的4 倍,直接經(jīng)濟損失數(shù)十億元,僅次于瓦斯事故造成的損失[2]。由此可見,煤礦水害是煤礦安全生產(chǎn)中長期存在的、需要不斷解決的實際問題??焖佟蚀_識別礦井突水水源成為當(dāng)前煤礦安全研究的重要課題。
目前,眾多學(xué)者通過構(gòu)建高效精準的水源判別模型來指導(dǎo)礦井安全生產(chǎn)。馬雷等[3]構(gòu)建基于GIS的利用水溫識別突水水源的模型,該法較好地適用于含水層之間存在較大的地溫差(埋深差)情況下的突水水源識別。陳建平[4]基于含水層環(huán)境同位素差異研究了隆德礦區(qū)煤層識別礦井涌水來源,較好地識別了礦井水源,并估算了混合比例。王心義等[5]建立了距離判別分析模型,針對河南焦作礦區(qū)和新安礦區(qū)進行突水水源識別,該模型簡單有效,具有較強的判別能力,可解決水文地質(zhì)條件相似礦區(qū)的突水水源的判定。陳紅江[6]建立多組逐步Bayes 判別模型,張春雷[7]建立Bayes 多類線性判別模型對礦井水源進行識別,計算過程簡單、模型結(jié)構(gòu)穩(wěn)定,克服了距離判別法的缺點,但結(jié)構(gòu)受到樣本的限制,且結(jié)果易出現(xiàn)分類模糊現(xiàn)象。Fisher 水源判別模型[8-10]建立在有限的工程實例原始數(shù)據(jù)資料基礎(chǔ)上,模型的判別精度受原始資料數(shù)據(jù)代表性、準確性的影響。神經(jīng)網(wǎng)絡(luò)技術(shù)[11-13]、支持向量機(SVM)[14-15]、可拓識別方法[16-17]等方法均已在礦井突水水源判別中得到了廣泛應(yīng)用。
筆者以岱莊煤礦為例,為克服ELM 模型泛化能力不足,穩(wěn)定性較差和過度擬合的問題,構(gòu)建了主成分分析(Principal Component Analysis,PAC)、自適應(yīng)鯨魚優(yōu)化算法(Ameliorative Whale Optimization Algorithm,AWOA)和極限學(xué)習(xí)機(Extreme Learning Machine,ELM))相耦合的礦井突水水源識別模型,并與PCA-WOA-ELM 模型、WOA-ELM 模型、ELM模型的判別結(jié)果進行對比,結(jié)果表明,PCA-AWOAELM 模型識別精度、運行速度、穩(wěn)定性均明顯高于其他三者,為礦井安全生產(chǎn)提供了重要保障。
WOA 算法的收斂精度較低且收斂速度較慢,為了克服上述缺陷,引入AWOA 算法對ELM 模型進行優(yōu)化[18]。
在鯨魚探索階段(圖1),加入精英個體引導(dǎo)機制。
圖1 座頭鯨覓食行為示意Fig.1 Schematic diagram of foraging behavior of humpback whales
式中:Xp(t)為第t次迭代時,種群的適應(yīng)度最優(yōu)時的個體位置;當(dāng)前種群最優(yōu)個體的適應(yīng)度的值大于上一代種群最優(yōu)個體適應(yīng)度的值時,dir為種群搜索因子,·為向量點乘,D=|CXrand(t)-X(t)|,表示個體距離隨機個體Xrand的長度;t表示當(dāng)前迭代次數(shù);A和C表示系數(shù);Xrand表示種群中隨機個體的位置向量;X(t)表示鯨魚個體(解)的位置向量;dir即為單位向量,反之,dir向量每一維的值由下式可得:
式中:Xmax、Xmin為 搜索空間的下界以及上界;r為隨機向量。
在鯨魚氣泡網(wǎng)攻擊階段,引入動態(tài)混沌權(quán)重因子及收斂因子λ,具體步驟如下:
利用ω 及 λ 進行鯨魚位置優(yōu)化的公式如下:
式中:ω (t)為區(qū)間[0,1]的隨機數(shù)。
極限學(xué)習(xí)機訓(xùn)練模型如圖2 所示,ELM 算法學(xué)習(xí)步驟[19-20]如下:
圖2 ELM 訓(xùn)練模型Fig.2 ELM training model
1)設(shè)定隱含層神經(jīng)元個數(shù)。
2)選擇無限可微的隱含層神經(jīng)元的激活函數(shù),通過激活函數(shù)可以將樣本映射到另一個特征空間,通過映射得到矩陣H,H表達式如下:
式中,H為隱含層輸出矩陣;T為網(wǎng)絡(luò)的輸出矩陣;β為隱含層節(jié)點與輸出層節(jié)點的連接權(quán)值矩陣。
3)在新的特征空間下,利用最小二乘法計算輸出層最優(yōu)輸出權(quán)重 β*:
式中,H+為H的Moore-Penrose 廣義逆矩陣。
岱莊煤礦位于濟寧市區(qū)正北約4.0 km 處,北起17 煤層露頭,南到濟寧市城市規(guī)劃邊界線,西起濟寧斷層與唐口煤礦相毗鄰,東北部與何崗井田接壤,東南部以八里鋪斷層、許廠煤礦相鄰。礦井自上而下主要含水層有第四系砂礫層孔隙含水層、山西組3煤層頂、底板砂巖裂隙含水層、三灰?guī)r溶裂隙含水層、十下灰?guī)r溶裂隙含水層、十三灰?guī)r溶裂隙含水層、奧陶系石灰?guī)r巖溶裂隙含水層,近年礦井涌水量如(圖3)所示。
圖3 近年礦井涌水量曲線Fig.3 Curve of mine water inflow in recent years
基于48 組實測數(shù)據(jù),采用AqQA 對井田內(nèi)主要充水含水層(三灰含水層(Ⅰ)、十下灰含水層(Ⅱ)、十三灰含水層(Ⅲ),奧灰含水層(Ⅳ))進行水質(zhì)分析(圖4)。從圖4 中可以看出,三灰、十下灰、十三灰、奧灰的水質(zhì)類型相近,按舒卡列夫分類,屬SO-4Ca·Mg·Na 型水。
圖4 地下水水化學(xué)piper 三線圖Fig.4 Piper three line diagram of groundwater chemistry
選取岱莊煤礦三灰(Ⅰ)、十下灰(Ⅱ)、十三灰(Ⅲ)、奧灰(Ⅳ)共48 組實測水樣數(shù)據(jù)(38 組訓(xùn)練樣本,10 組預(yù)測樣本),以Na+、Ca2+、Mg2+、Cl-、SO24-、HCO-3六種離子作為判別指標(biāo),建立PCA-AWOAELM 模型對礦井突水水源進行判別,流程圖如圖5所示。訓(xùn)練水樣實測數(shù)據(jù)見表1,預(yù)測水樣實測數(shù)據(jù)見表2。
圖5 PCA-AWOA-ELM 模型流程Fig.5 Flow chart of PCA-AWOA-ELM model
表1 岱莊煤礦水樣實測數(shù)據(jù)表(訓(xùn)練集)Table 1 Actual measurement data of water samples in Daizhuang Coal Mine (training set)
表2 岱莊煤礦水樣實測數(shù)據(jù)表(預(yù)測集)Table 2 Measured data of water samples in Daizhuang coal mine (prediction set)
首先,對訓(xùn)練樣本實測數(shù)據(jù)進行主成分分析,筆者使用SPSS.26 軟件實現(xiàn),根據(jù)相關(guān)性系數(shù)表(表3)知,6 種離子間相關(guān)性較大,Ca2+和Mg2+,Ca2+、Mg2+與SO24-、Cl-之間的相關(guān)性均達到了0.7 以上,S-和Cl-之間的相關(guān)性也達0.68,由此看出,樣本指標(biāo)之間的信息出現(xiàn)了較大的重復(fù),對水源判別模型的精度造成影響,故對數(shù)據(jù)進行主成分分析是十分有必要的。
表3 水化學(xué)成分指標(biāo)相關(guān)系數(shù)矩陣Table 3 Correlation coefficient matrix of water chemical composition index
按照累計貢獻率大于85%的原則,提取3 個主成分(表4),主成分與標(biāo)準化原始變量間相關(guān)關(guān)系如下:
表4 主成分總方差解釋Table 4 Explanation of total variance of principal components
設(shè)置模型最大迭代次數(shù)100,種群規(guī)模30,輸入層節(jié)點數(shù)3,輸出層節(jié)點數(shù)4,隱含層神經(jīng)元個數(shù)38 個,網(wǎng)絡(luò)輸出狀態(tài)為4,將訓(xùn)練好的參數(shù)及模型對并測試集進行測試,結(jié)果如圖6 所示。
圖6 不同迭代次數(shù)尋優(yōu)收斂曲線比較Fig.6 Comparison of convergence curve of different iterations
由圖6 尋優(yōu)收斂能力曲線比較可知,通過自適應(yīng)權(quán)重的鯨魚優(yōu)化算法在迭代次數(shù)不同的情況下,尋優(yōu)能力,收斂速度和尋優(yōu)精度都較鯨魚優(yōu)化算法強很多,且穩(wěn)定性好,因此,在ELM 模型中引入AWOA 優(yōu)化在水源判別模型中能夠以快速且準確的優(yōu)勢取得較好的結(jié)果。
將PCA-AWOA-ELM 模型預(yù)測結(jié)果與PCAWOA-ELM 模型、PCA-ELM 模型和ELM 模型進行對比(圖7)可知,PCA-AWOA-ELM 模型的預(yù)測精度達到了100%。由圖7b 和圖7c 對比可知,鯨魚算法對極限學(xué)習(xí)機權(quán)值和閾值的優(yōu)化成效很大,改進了極限學(xué)習(xí)機隨機產(chǎn)生權(quán)值與閾值而導(dǎo)致的預(yù)測性能不穩(wěn)定,預(yù)測結(jié)果正確率低,隨機性太強的缺點。在圖7a 和圖7b 的對比中可知,精英引導(dǎo)機制及動態(tài)混沌因子的引入,加強了鯨魚優(yōu)化算法的尋優(yōu)能力與精度,從而更好的優(yōu)化ELM 模型的泛化能力及預(yù)測精度。由圖8 可知,改進的鯨魚優(yōu)化算法在迭代100 次的情況下迭代誤差極小,且在迭代63 次處迭代誤差達0.01,由此可知改進的鯨魚優(yōu)化算法的精度明顯提高。綜上所知,AWOA-ELM 模型在水源識別的應(yīng)用上有著泛化能力強,穩(wěn)定性高,預(yù)測精度高的優(yōu)勢。
圖7 各模型預(yù)測結(jié)果對比Fig.7 Comparison of prediction results of various models
圖8 AWOA-ELM 模型迭代誤差Fig.8 Iteration error diagram of AWOA-ELM mode
1)運用因子分析進行主成分提取,有效地減少了各指標(biāo)間的信息重復(fù)和AWOA-ELM 模型輸入層的個數(shù),提高了算法的運行速度。
2)改進的鯨魚優(yōu)化算法克服了極限學(xué)習(xí)機權(quán)值閾值隨機取值的缺點,對權(quán)值和閾值進行全局尋優(yōu)挖掘,提高了算法的收斂速度、精度。
3)將PCA-AWOA-ELM 突水水源識別模型應(yīng)用于岱莊煤礦,并與PCA-WOA-ELM 模型、PCAELM 模型、ELM 模型預(yù)測結(jié)果進行對比,實踐證明,該模型識別精度較高,為礦井安全生產(chǎn)提供了重要保障。