任海峰,嚴(yán)由吉,吳青海
(西安科技大學(xué) 安全科學(xué)與工程學(xué)院,陜西 西安 710054)
為了有效防止瓦斯事故的發(fā)生,煤礦瓦斯涌出量的準(zhǔn)確預(yù)測對安全管理有十分重要的作用[1]。傳統(tǒng)的瓦斯涌出量預(yù)測方法有礦山統(tǒng)計(jì)法、分源預(yù)測法等[2]。由于煤層地質(zhì)條件和自然因素的差異,傳統(tǒng)的瓦斯涌出量預(yù)測法在實(shí)際應(yīng)用上存在一定的局限性。國內(nèi)外學(xué)者在傳統(tǒng)預(yù)測方法的基礎(chǔ)上不斷進(jìn)行優(yōu)化,如徐剛等[3]提出了基于因子分析法與BP神經(jīng)網(wǎng)絡(luò)的工作面瓦斯涌出量預(yù)測方法。于健等[4]提出了以核熵成分分析與粒子群支持向量機(jī)相結(jié)合的預(yù)測模型。李振興等[5]采用BP神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)瓦斯涌出量的預(yù)測,通過對預(yù)測模型的訓(xùn)練及仿真,對BP算法進(jìn)行了改進(jìn)優(yōu)化。溫廷新等[6]建立了基于PSOBP-AdaBoost 算法的瓦斯涌出量分源預(yù)測模型。謝國民等[7]提出一種多元混沌時(shí)間序列的加權(quán)極端學(xué)習(xí)機(jī)瓦斯涌出量預(yù)測模型。P.Booth等[8]研究了瓦斯排放預(yù)測局限性的改進(jìn)方法,提高了瓦斯涌出量預(yù)測的精度。M.Borowski等[9]基于多層感知網(wǎng)絡(luò)MLP建立瓦斯涌出量預(yù)測模型并對煤礦瓦斯涌出量進(jìn)行預(yù)測。WANG Yan等[10]提出采用灰色系統(tǒng)建模預(yù)測瓦斯涌出量。
以上研究在一定程度上提高了預(yù)測精度,但瓦斯涌出量具有影響因素多、非線性等特征,且影響因素之間存在多重相關(guān)性,會增加預(yù)測模型的復(fù)雜性,這就導(dǎo)致不同地質(zhì)條件下瓦斯涌出量預(yù)測結(jié)果的準(zhǔn)確性和預(yù)測精度的提高受到了一定的限制。
為了更加精確和高效地預(yù)測瓦斯涌出量,在分源預(yù)測的理論基礎(chǔ)上,采用主成分分析法,在保留原始變量主要信息的基礎(chǔ)上對各涌出源的瓦斯涌出量影響因素進(jìn)行降維;針對極限學(xué)習(xí)機(jī)(ELM)存在的輸入權(quán)值矩陣與隱含層閾值隨機(jī)生成的問題,利用模擬退火粒子群算法(SAPSO)對極限學(xué)習(xí)機(jī)的參數(shù)尋優(yōu),建立基于SAPSO-ELM的瓦斯涌出量分源預(yù)測模型,對開采層、鄰近層、采空區(qū)3個(gè)涌出源進(jìn)行預(yù)測,再將涌出源的預(yù)測結(jié)果進(jìn)行疊加,得到最終的預(yù)測結(jié)果。
主成分分析法是一種降維的方法,在保留主要信息的原則下,對多影響因素?cái)?shù)據(jù)進(jìn)行最佳綜合簡化的多元統(tǒng)計(jì)方法[11]。主成分是原始變量的線性組合,且主成分之間互不相關(guān),這樣既不丟失原始數(shù)據(jù)的主要信息,又能夠提高分析精度[12]。
對于n個(gè)樣本,每個(gè)樣本有p個(gè)指標(biāo)。設(shè)Xi=(xi1,xi2,…,xip),則樣本數(shù)據(jù)可表示成
對矩陣X進(jìn)行線性變換,得到新的綜合變量,F(xiàn)1、F2、…、Fp為原始變量x1、x2、…、xp的第1,第2、…、第p主成分。
主成分系數(shù)λij需滿足以下條件:
①各個(gè)主成分互不相關(guān);
②主成分方差大小為F1>F2>…>Fp;
③各個(gè)主成分里的系數(shù)平方和為1。
采用SPSS軟件進(jìn)行主成分分析[13],基本步驟如下。
①數(shù)據(jù)預(yù)處理。瓦斯涌出量的各影響因素之間的數(shù)量級和量綱不同,數(shù)據(jù)之間存在差異性,在主成分分析之前,需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
②主成分分析計(jì)算。由SPSS中的因子分析功能獲得總方差解釋表、因子載荷矩陣等結(jié)果,最后按照上述原理進(jìn)行主成分分析計(jì)算。
③確定主成分。根據(jù)累計(jì)貢獻(xiàn)率來選取主成分,一般規(guī)定,累計(jì)貢獻(xiàn)率>80%時(shí),選取的主成分即滿足要求。
④統(tǒng)計(jì)主成分得分。通過主成分系數(shù)矩陣可以列出主成分的表達(dá)式,再將標(biāo)準(zhǔn)化后的數(shù)值代入主成分表達(dá)式計(jì)算出主成分得分。主成分得分即為降維后的數(shù)據(jù)。
⑤因子旋轉(zhuǎn)。對因子載荷矩陣進(jìn)行因子旋轉(zhuǎn),根據(jù)旋轉(zhuǎn)后的主成分載荷矩陣可以看出每一主成分所代表的原始變量的信息。
極限學(xué)習(xí)機(jī)(ELM)是一種新型的單隱層前向型神經(jīng)網(wǎng)絡(luò)。其通過隨機(jī)方式生成隱含層輸入權(quán)值和偏差,只需要設(shè)定網(wǎng)絡(luò)結(jié)構(gòu),便可僅通過一步計(jì)算得到網(wǎng)絡(luò)的輸出權(quán)值,具有較強(qiáng)的非線性擬合能力,計(jì)算能力快,而且泛化能力強(qiáng)[14]。根據(jù)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)最佳隱含層節(jié)點(diǎn)數(shù)的設(shè)定原則進(jìn)行多次參數(shù)調(diào)試,當(dāng)預(yù)測結(jié)果最優(yōu)時(shí)確定最佳隱含層節(jié)點(diǎn)數(shù)[15]。
ELM算法主要步驟為:
①隱含層神經(jīng)元個(gè)數(shù)的設(shè)定,輸入層與隱含層間連接權(quán)值ω及隱含層神經(jīng)元閾值b的隨機(jī)生成;
②選擇無限可微的隱含層神經(jīng)元的激活函數(shù),計(jì)算出隱含層輸出矩陣H;
式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆矩陣;R′為網(wǎng)絡(luò)輸出矩陣的轉(zhuǎn)置。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種基于群體智能優(yōu)化算法,采用實(shí)數(shù)求解,且需要調(diào)整的參數(shù)較少[16],是一種通用的全局搜索算法。針對粒子群優(yōu)化算法(PSO)容易陷入局部極值點(diǎn)、進(jìn)化后期收斂慢的問題,引入模擬退火思想。模擬退火算法(Simulated Annea-ling,簡稱SA)用熱力學(xué)系統(tǒng)來模擬求解優(yōu)化問題,搜索初期SA溫度較高,具有較強(qiáng)的全局搜索能力,隨迭代的進(jìn)行,SA溫度逐漸降低,進(jìn)行精細(xì)搜索,在搜索過程中利用具有概率突跳特性的 Metropolis 抽樣準(zhǔn)則,能夠有效地避免陷入局部極小解[17]。
SAPSO算法以粒子群算法為主流程,在其中引入固體退火原理,并結(jié)合自適應(yīng)慣性權(quán)重調(diào)整策略和群體適應(yīng)度方差來平衡PSO算法的全局和局部搜索能力[18]。針對ELM隨機(jī)產(chǎn)生輸入權(quán)值及隱含層閾值的問題,由于SAPSO具有全局搜索和跳出局部最優(yōu)解的能力,采用SAPSO對ELM的輸入權(quán)值與隱含層閾值動態(tài)尋優(yōu),使ELM只需要較少的隱含層神經(jīng)元數(shù)就能達(dá)到較好的預(yù)測效果,從而避免算法容易陷入局部極值點(diǎn),提高后期算法的收斂速度和精度及網(wǎng)絡(luò)的泛化性[19]。利用 SAPSO 算法優(yōu)化 ELM 的輸入層權(quán)值(慣性權(quán)重因子)ω及隱含層閾值b,具體步驟如下。
第1步:樣本歸一化處理;設(shè)置隱藏節(jié)點(diǎn)數(shù)和神經(jīng)元個(gè)數(shù),選中并激活函數(shù)。
第2步:模型參數(shù)初始化。參數(shù)包括起始溫度T、降溫速度α、學(xué)習(xí)因子c1和c2、慣性權(quán)重因子ω、目標(biāo)空間所有粒子的速度v和位置p,設(shè)置迭代終止條件等。
第3步:載入標(biāo)準(zhǔn)化后的訓(xùn)練樣本,按照訓(xùn)練樣本誤差的均方差計(jì)算適應(yīng)度函數(shù),見式(3)。
式中:N為樣本個(gè)數(shù);yi、yi′分別為第i個(gè)樣本的實(shí)際值和預(yù)測值。
第4步:每次迭代中,產(chǎn)生新解x并計(jì)算各個(gè)粒子的適應(yīng)度函數(shù)值,按式(4)計(jì)算其增量,其中f(x)為評價(jià)函數(shù)。
式中:k為當(dāng)前迭代次數(shù);f(x)為評價(jià)函數(shù)。
第5步:若ΔE<0,則接受x作為新的當(dāng)前解,根據(jù)式(6)對系統(tǒng)溫度進(jìn)行更新;否則溫度不變,經(jīng)過迭代T逐漸減小并趨于0。
式中:rand為一種產(chǎn)生隨機(jī)數(shù)的函數(shù)。
第6步:按照式(7)-式(8)更新粒子的速度和位置,同時(shí)按照式(9)自適應(yīng)調(diào)整慣性權(quán)重因子ω,并計(jì)算各粒子的適應(yīng)度函數(shù)。找出所有粒子當(dāng)前最優(yōu)位置pid和全局最優(yōu)位置pgd。
式中:i=1,2,3,…,M為粒子編號;d=1,2,3,…,D為維度;r1和r2為區(qū)間[0,1]的隨機(jī)數(shù);t為時(shí)間;xid和vid分別為粒子i在第d維的位置和速度。
第7步:判斷系統(tǒng)是否達(dá)到迭代終止條件。若達(dá)到,停止迭代,此時(shí)的pgd即為最優(yōu)(ω,b),將其代入ELM網(wǎng)格中進(jìn)行訓(xùn)練,計(jì)算輸出權(quán)重β和實(shí)際輸出矩陣R;否則轉(zhuǎn)至第3步繼續(xù)迭代。
運(yùn)用Matlab軟件對SAPSO-ELM模型和ELM模型進(jìn)行訓(xùn)練,其均方誤差曲線如圖1所示。由圖1可看出,隨迭代次數(shù)增加,SAPSO-ELM模型在80次即達(dá)到收斂,而ELM模型在100次之后才達(dá)到收斂。SAPSO-ELM模型的均方誤差下降速度比較快,在最短的次數(shù)內(nèi)到達(dá)收斂精度附近,比較而言,SAPSO-ELM模型尋優(yōu)速度更快且收斂精度更高,明顯提高了ELM模型的學(xué)習(xí)效率。
利用SAPSO算法優(yōu)化ELM所建立的SAPSOELM模型,避免了ELM參數(shù)隨機(jī)生成導(dǎo)致的網(wǎng)絡(luò)不穩(wěn)定以及PSO在尋優(yōu)過程中易陷入局部極小值問題。與原始ELM模型相比SAPSO-ELM模型具有算法穩(wěn)定性和預(yù)測精度更高的優(yōu)勢。
圖1 均方誤差曲線Fig.1 Mean square error curves
根據(jù)上述理論分析及SAPSO-ELM算法可建立瓦斯涌出量的預(yù)測模型,模型的具體建立過程如下。
第一步:依據(jù)分源預(yù)測理論確定瓦斯涌出來源并選取影響因素;
第二步:采用主成分分析法選取預(yù)測指標(biāo),得到降維后的數(shù)據(jù)集;
第三步:劃分訓(xùn)練集、測試集,輸入樣本數(shù)據(jù);
第四步:SAPSO-ELM算法參數(shù)的設(shè)置;
第五步:先得到各涌出源預(yù)測結(jié)果再進(jìn)行疊加得到回采工作面預(yù)測結(jié)果。
根據(jù)分源預(yù)測理論,回采工作面瓦斯的主要來源為開采層、鄰近層、采空區(qū)[20]。選取影響瓦斯涌出量的各個(gè)來源的變量因素,影響因素用x1,x2,…,x9來表示,其對應(yīng)關(guān)系見表1,其中,該煤礦回采工作面頂板管理方式均為全部垮落法,因此,可忽略頂板管理因素[21]。
表1 瓦斯涌出來源及其影響因素Table 1 Source of gas emission and its influencing factors
針對煤礦瓦斯涌出量影響因素分析,根據(jù)神經(jīng)網(wǎng)絡(luò)的輸入輸出向量構(gòu)成,將新疆某煤礦回采工作面現(xiàn)場實(shí)測的分源瓦斯涌出量及其各影響因素的指標(biāo)形成原始數(shù)據(jù)集,以便進(jìn)行網(wǎng)絡(luò)訓(xùn)練,為了更符合實(shí)際情況,根據(jù)數(shù)量化理論將難以量化的圍巖巖性、斷層、褶皺等定性影響因素轉(zhuǎn)化為二分變量進(jìn)而量化,即以“0.5”和“1”表示某個(gè)定性指標(biāo)的“不存在”和“存在”。原始數(shù)據(jù)集見表2。
表2 瓦斯涌出量及各影響因素原始數(shù)據(jù)統(tǒng)計(jì)Table 2 Raw data statistics of gas emission and various influencing factors
對各影響因素原始數(shù)據(jù)采用SPSS軟件進(jìn)行歸一化處理,以消除影響因素之間的差異性。再對歸一化后的數(shù)據(jù)進(jìn)行因子分析,分別得到開采層、鄰近層、采空區(qū)的總方差解釋圖,以此來選擇主成分的個(gè)數(shù)。各個(gè)涌出源的累計(jì)貢獻(xiàn)率如圖2所示。
依據(jù)圖2累計(jì)貢獻(xiàn)率來選取主成分,在保留大部分原始信息的前提下,分別選取開采層5個(gè)主成分、鄰近層4個(gè)主成分、采空區(qū)2個(gè)主成分;其累計(jì)貢獻(xiàn)率分別是86.709%、83.403%、76.235%。依據(jù)選取的主成分以及因子載荷矩陣計(jì)算主成分得分系數(shù)矩陣,其計(jì)算方法是用因子載荷矩陣中每個(gè)主成分的數(shù)值除以對應(yīng)主成分的特征根的平方根,依次得到各個(gè)主成分中每個(gè)變量的系數(shù),結(jié)果見表3。
圖2 主成分累計(jì)貢獻(xiàn)率Fig.2 Cumulative contribution rate of principal components
表3 主成分得分系數(shù)Table 3 Principal components score coefficient
通過主成分得分系數(shù)可以寫出主成分表達(dá)式,從而計(jì)算出主成分得分,即降維后的數(shù)據(jù),由主成分得分可知,對于開采層、鄰近層、采空區(qū)3個(gè)瓦斯涌出來源,其影響因素由原來的9維、7維、4維降到5維、4維、2維。將前12組數(shù)據(jù)形成訓(xùn)練集,后6組形成測試集,檢驗(yàn)SAPSOELM模型的預(yù)測效果。通過旋轉(zhuǎn)因子載荷矩陣的方法,從而得到旋轉(zhuǎn)后的主成分載荷矩陣,結(jié)果見表4。
表4 主成分載荷Table 4 Principal components load
忽略每個(gè)主成分中不相關(guān)的影響因素,可以更好地反映每個(gè)主成分所代表的原始信息。對于開采層:第一主成分主要有煤層傾角、煤層厚度、回采率影響因素;第二主成分主要有斷層、褶皺因素;第三主成分主要有煤層瓦斯含量、圍巖巖性因素;第四主成分主要有煤層傾角、配風(fēng)量;第五主成分主要有日進(jìn)尺影響因素。對于鄰近層:第一主成分主要有鄰近層瓦斯含量、斷層、褶皺影響因素;第二主成分主要有層間距離、圍巖巖性因素;第三主成分主要有日進(jìn)尺因素;第四主成分主要有鄰近層厚度影響因素。對于采空區(qū):第一主成分主要有煤層厚度、回采率影響因素;第二主成分主要有煤層瓦斯含量、日進(jìn)尺影響因素。
將各涌出源主成分得分的1-12組作為訓(xùn)練集,13-18組作為測試集,使用SAPSO-ELM模型對測試集進(jìn)行仿真計(jì)算,SAPSO-ELM模型的預(yù)測結(jié)果見表5。結(jié)果顯示,SAPSO-ELM模型的瓦斯涌出量預(yù)測值與新疆某煤礦回采工作面實(shí)際瓦斯涌出量的平均相對誤差為3.47%,說明訓(xùn)練好的SAPSO-ELM模型具有較好的預(yù)測精度。
為了驗(yàn)證SAPSO-ELM模型對于礦井的普適性和應(yīng)用價(jià)值,另以陜西某煤礦為例,收集6組瓦斯涌出量數(shù)據(jù)作為驗(yàn)證樣本,分別使用訓(xùn)練好的SAPSO-ELM模型、ELM模型對驗(yàn)證樣本進(jìn)行仿真計(jì)算,兩種模型的參數(shù)設(shè)置保持一致,SAPSO-ELM模型與ELM模型以及陜西某煤礦回采工作面瓦斯涌出量實(shí)際值的對照圖如圖3所示,SAPSO-ELM模型的瓦斯涌出量預(yù)測曲線更貼近瓦斯涌出量實(shí)際曲線。2種模型與實(shí)際值的相對誤差對比圖如圖4所示,SAPSO-ELM模型的瓦斯涌出量預(yù)測值與該煤礦回采工作面實(shí)際瓦斯涌出量的平均相對誤差為3.45%,而ELM模型的瓦斯涌出量預(yù)測值與該煤礦回采工作面實(shí)際瓦斯涌出量的平均相對誤差為8.81%,說明SAPSO-ELM模型的預(yù)測精度較高。而且SAPSO-ELM模型曲線的趨勢要平緩,說明主成分分析對數(shù)據(jù)起到了降維效果,降低了模型預(yù)測的復(fù)雜度,提高了瓦斯涌出量預(yù)測的可靠性和穩(wěn)定性。
表5 測試樣本瓦斯涌出量預(yù)測結(jié)果Table 5 Prediction results of gas emission of test samples
圖3 預(yù)測值與實(shí)際值對照Fig.3 Comparison of the predicted and actual values
圖4 ELM、SAPSO-ELM模型預(yù)測值較實(shí)際值誤差對比Fig.4 Comparison of the error between the predicted values of ELM and SAPSO-ELM model compared to the actual values
a.將分源預(yù)測理論和基于智能算法的預(yù)測方法相結(jié)合,建立了基于SAPSO-ELM的瓦斯涌出量分源預(yù)測模型。采用主成分分析法對開采層、鄰近層、采空區(qū)3個(gè)瓦斯涌出來源的影響因素?cái)?shù)據(jù)進(jìn)行降維,提高了瓦斯涌出量預(yù)測的可靠性和穩(wěn)定性。
b.針對極限學(xué)習(xí)機(jī)(ELM)存在的輸入權(quán)值矩陣與隱含層閾值隨機(jī)生成的問題,利用模擬退火粒子群算法(SAPO-ELM)對極限學(xué)習(xí)機(jī)的參數(shù)進(jìn)行尋優(yōu),使SAPO-ELM模型尋優(yōu)速度更快且收斂精度更高。
c.針對陜西某煤礦回采工作面,應(yīng)用訓(xùn)練好的SAPSO-ELM瓦斯涌出量分源預(yù)測模型進(jìn)行瓦斯涌出量預(yù)測,預(yù)測結(jié)果與該煤礦回采工作面實(shí)際瓦斯涌出量之間的平均相對誤差為3.45%,ELM模型的預(yù)測結(jié)果與該煤礦回采工作面實(shí)際瓦斯涌出量之間的平均相對誤差為8.81%。表明采用主成分分析法與分源預(yù)測理論相結(jié)合的方法構(gòu)建的SAPSO-ELM預(yù)測模型可進(jìn)一步提高瓦斯涌出量的預(yù)測精度。