王居堯,王凱君
(潞安礦業(yè)集團公司,山西 長治 046204)
瓦斯涌出異常特征對煤礦瓦斯等災(zāi)害預(yù)警指標的研究具有極其重要的理論與實際意義。陳亮[1]對河南、貴州等地的礦井掘進期間的瓦斯涌出規(guī)律進行分析發(fā)現(xiàn),掘進工作面瓦斯涌出受掘進速度、地質(zhì)構(gòu)造、瓦斯含量、煤層厚度及煤體強度等影響十分顯著,導致瓦斯涌出表現(xiàn)出多種動態(tài)特征。目前,很多非線性的瓦斯涌出量預(yù)測方法得到應(yīng)用,并且顯示出了較好的性能。比如,神經(jīng)網(wǎng)絡(luò)法、灰色系統(tǒng)法、遺傳規(guī)劃法、基因表達式程序設(shè)計法[2]等。但是對于這種非線性系統(tǒng)預(yù)測問題,預(yù)測模型規(guī)模急劇增大,運行時間變長,而且瓦斯涌出量受到的影響因素多且具有一定的相關(guān)性[3],存在復雜非線性和大量擾動成分,導致輸入信息存在重疊部分和無效的干擾成分[4],降低預(yù)測模型的準確度。
考慮眾多復雜的影響因素最終的作用結(jié)果都會體現(xiàn)在綜采工作面瓦斯?jié)舛葦?shù)據(jù)上,最后會形成一個具有時序性的隨機過程,瓦斯參量時間序列信息必然按照其數(shù)據(jù)順序和數(shù)據(jù)大小蘊含大量有關(guān)系統(tǒng)動態(tài)演化過程的痕跡和特征信息[5]。瓦斯參量時間序列中先前狀態(tài)的信號特征必然包含其后續(xù)狀態(tài)發(fā)展變化的趨勢特征信息。近年來,很多學者已經(jīng)把時間序列分析方法應(yīng)用到礦井瓦斯相關(guān)參量的預(yù)測問題中,如王栓林等[6]對煤礦安全監(jiān)控系統(tǒng)采集的瓦斯?jié)舛刃蛄羞M行分析,運用時間序列分析法建立了突出危險前兆信息獲取模型;黃凱峰[7]提出了煤礦安全監(jiān)測監(jiān)控系統(tǒng)瓦斯?jié)舛犬惓P盘柋孀R算法,建立了安全監(jiān)測監(jiān)控系統(tǒng)瓦斯?jié)舛犬惓P盘柲P汀1疚奶岢鰧⒑藰O端學習機(Extreme Learning Machine with Kernels,KELM)以及萬有引力算法(Gravitational Search Algorithm,GSA)相結(jié)合建立瓦斯涌出量預(yù)測模型,在結(jié)合方式和算法方面進行了優(yōu)化改進,提高預(yù)測模型的預(yù)測精度和預(yù)測效率,為瓦斯涌出量預(yù)測提供研究依據(jù),為煤礦瓦斯災(zāi)害的防治提供新的方法,提高煤礦瓦斯災(zāi)害的防治水平。
核極端學習機網(wǎng)絡(luò)因為引入了核函數(shù),所以無需設(shè)定隱含層節(jié)點數(shù),但是需要確定核函數(shù),而核函數(shù)的參數(shù)對核極端學習機的性能有很大影響,核極端學習機不能自動設(shè)定核參數(shù)[8],需要人為設(shè)定,故本文采用改進的萬有引力算法對核極端學習機的核參數(shù)進行尋優(yōu),以確保核極端學習機的性能最優(yōu)。將核極端學習機與改進的萬有引力算法相結(jié)合建立基于改進萬有引力算法—KELM的瓦斯涌出量預(yù)測模型(IGSA-KELM瓦斯涌出量預(yù)測模型)。首先將輸入樣本作為KELM網(wǎng)絡(luò)的輸入量,然后采用改進的萬有引力搜索算法對KELM網(wǎng)絡(luò)的核參數(shù)和輸出權(quán)值尋優(yōu),優(yōu)化KELM網(wǎng)絡(luò)的性能。
萬有引力搜索算法(Gravitational Search Algorithm,GSA)[9-10]是受物理學中牛頓引力理論啟發(fā)而提出的一種元啟發(fā)式算法,具備全局優(yōu)化能力強、流程簡單易行等優(yōu)點,在非線性問題的處理中更能凸顯其優(yōu)越性。萬有引力算法會高效的搜尋到核極端學習機的最優(yōu)參數(shù),提高模型的預(yù)測精度和效率。但是其仍然存在易陷入局部極值和早熟收斂的缺陷,故本文對萬有引力算法進行改進,以提高算法的尋優(yōu)性能,滿足瓦斯涌出量預(yù)測的需求。
極端學習機[11-12](Extreme Learning Machine,ELM) 是一種單隱層前饋神經(jīng)網(wǎng)絡(luò) (Single-hidden Layer Feedforward Neural Networks,SLFNs),由Huang G.B等人在2004年用來解決回歸問題時提出的,主要針對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法訓練速度慢、反向感知機(Back Propagation,BP)網(wǎng)絡(luò)效率低且易陷入局部極值等問題而提出的。把迭代求解隱層輸出權(quán)值的方式變?yōu)榍蠼饩€性方程組的方式[13],克服了傳統(tǒng)機器學習算法的缺陷,提供更好的整體性能,更快地學習速度和更低的計算成本。KELM引入了非線性映射效果更好的核函數(shù)理論,具有更加強大的函數(shù)逼近能力,通過設(shè)定合適的核參數(shù),能夠提高算法的穩(wěn)定性和識別率,具備更高的精度,更快地學習速度和更強大的泛化能力。
核極端學習機在極端學習機的基礎(chǔ)上引入了核函數(shù),雖然解決了極端學習機對隱含層節(jié)點數(shù)選擇、初始權(quán)值和閾值設(shè)定的隨機性等問題,降低了算法的不穩(wěn)定性,提高了算法的預(yù)測精度和效率,但是核極端學習機也因此增加了對核參數(shù)的依賴性,只有選定合適的核參數(shù)才可以保證核極端學習機的穩(wěn)定性和預(yù)測的精度及效率。本文采用改進的萬有引力算法來優(yōu)化核極端學習機,對核極端學習機的核參數(shù)和輸出權(quán)值進行尋優(yōu),以提高本文建立模型對瓦斯涌出量預(yù)測的精度和速度。
萬有引力算法模仿了物體間的萬有引力作用,用于解決優(yōu)化問題,主要包含四個特征屬性:粒子位置、慣性質(zhì)量、主動引力質(zhì)量以及被動引力質(zhì)量。粒子位置向量由所要尋優(yōu)的參數(shù)構(gòu)成,質(zhì)量最大的粒子位置最好,即是所要尋優(yōu)參數(shù)的最優(yōu)解。
萬有引力算法的流程如圖1所示。
萬有引力算法具備全局優(yōu)化能力強、流程簡單易行等優(yōu)點,在實際問題中能得到很好的運用,在非線性問題的處理中更能凸顯其優(yōu)越性,已經(jīng)成功應(yīng)用于工程和其他領(lǐng)域的許多問題中,但是作為智能算法的一員,萬有引力算法也存在易陷入局部極值和早熟收斂的缺陷。為克服上述缺點,采用反向?qū)W習機制(Opposition Based Learning, OBL)來初始化GSA的初始種群,使初始種群分布更加均勻,引入Tent混沌映射提高種群的多樣性,促進GSA算法的探索與開發(fā)能力。
OBL生成初始種群的步驟如下:①確定初始種群個數(shù)為隨機生成初始種群(即第一組候選解),計算每個個體的適應(yīng)度值;②生成反向估計值,得到第二組候選解并適應(yīng)度值;③將兩組候選解按照個體適應(yīng)度值的大小排序,取前個粒子構(gòu)成問題的解空間,即GSA初始種群。
TENT混沌映射產(chǎn)生混沌序列步驟如下:①將種群迄今搜索到的最優(yōu)解歸一化到(0,1)區(qū)間內(nèi),令其等于初值x0,即k=0;②迭代產(chǎn)生混沌序列X,k自增1;③當達到最大迭代次數(shù)時則停止迭代,保存X序列;④將序列X反歸一化載波到原解空間,得到新解;⑤比較新舊解的適應(yīng)度值,留下性能更好的解。
目前,對于核參數(shù)和輸出權(quán)值還沒有具體且有效的設(shè)定依據(jù),故采用改進的萬有引力搜索算法來智能選取最佳的核參數(shù)和輸出權(quán)值,對KELM神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,以保證模型預(yù)測的準確性。
將核極端學習機與改進的萬有引力算法相結(jié)合建立基于改進萬有引力算法—KELM的瓦斯涌出量預(yù)測模型(IGSA-KELM瓦斯涌出量預(yù)測模型)。首先將輸入樣本作為KELM網(wǎng)絡(luò)的輸入量,然后采用改進的萬有引力搜索算法對KELM網(wǎng)絡(luò)的核參數(shù)和輸出權(quán)值尋優(yōu),優(yōu)化KELM網(wǎng)絡(luò)的性能。
基于改進萬有引力算法—KELM的瓦斯涌出量預(yù)測模型的主要流程如下:①搜集整理數(shù)據(jù),得到原始輸入樣本數(shù)據(jù);②按照貢獻率確定P個主成分,主成分個數(shù)P等于KELM網(wǎng)絡(luò)的輸入節(jié)點個數(shù),初始化核極端學習機;③利用改進的萬有引力搜索算法對KELM網(wǎng)絡(luò)的核參數(shù)和輸出權(quán)值進行尋優(yōu),將尋優(yōu)結(jié)果映射到網(wǎng)絡(luò)模型的核參數(shù)和輸出權(quán)值;④將訓練集作為KELM網(wǎng)絡(luò)的輸入訓練核極端學習機;⑤計算網(wǎng)絡(luò)誤差,若滿足條件,繼續(xù)步驟⑥,否則返回步驟③;⑥將測試集輸入到核極端學習機,進行測試分析。
采用某煤礦的實際數(shù)據(jù)(18個樣本)進行實驗分析。由于影響瓦斯涌出量的因素很多,這里選取了掘進工作面瓦斯絕對涌出量的13個影響因素,分別是煤層瓦斯含量(X1)、煤層深度(X2)、煤層厚度(X3)、煤層傾角(X4)、采高(X5)、工作面長度(X6)、推進速度(X7)、工作面采出率(X8)、鄰近層瓦斯含量(X9)、鄰近層厚度(X10)、層間距(X11)、層間巖性(X12)、開采強度(X13),將這些影響因素作為瓦斯涌出量的特征指標,用主成分分析法對這13個影響因素的樣本數(shù)據(jù)進行處理,并結(jié)合改進的萬有引力算法建立基于IGSA-KELM的瓦斯涌出量預(yù)測模型,實現(xiàn)對掘進工作面的絕對瓦斯涌出量Y的預(yù)測。部分實驗數(shù)據(jù)如表1所示。
表1 瓦斯涌出量影響因素原始數(shù)據(jù)
表2 原始數(shù)據(jù)平均值和標準差
根據(jù)主成分分析的步驟,數(shù)據(jù)標準化處理后,要求出協(xié)方差矩陣及其特征根和特征向量,根據(jù)方差貢獻率確定主成分。特征根的計算結(jié)果如表3所示。
表3 特征根計算結(jié)果
本文選取前五個主元作為KELM網(wǎng)絡(luò)的輸入向量。
網(wǎng)絡(luò)模型共有三層:一個輸入層,一個隱含層,一個輸出層。上節(jié)根據(jù)主成分分析選定五個主成分,因此設(shè)定KELM網(wǎng)絡(luò)有五個輸入節(jié)點,分別對應(yīng)五個主成分。KELM網(wǎng)絡(luò)模型的目的是預(yù)測瓦斯涌出量,因此本文有一個輸出節(jié)點,即瓦斯涌出量。將確定主成分后的18個樣本的前15個作為訓練集,后3個作為測試集。將15個訓練樣本及其結(jié)果輸入到模型中進行訓練,同時建立GSA-KELM和PSO-KELM瓦斯涌出量預(yù)測模型,將這三種模型進行比較,用測試樣本來驗證所建立模型的預(yù)測效果。
圖2為三種模型的瓦斯涌出量預(yù)測值與實際值的對比曲線。
圖2 瓦斯涌出量預(yù)測值與實際值對比
由圖2可以看出,三種模型總體的預(yù)測都相對比較準確。但IGSA-KELM的預(yù)測結(jié)果更能逼近瓦斯涌出量的實際值,具有更好的擬合精度,而且IGSA-KELM神經(jīng)網(wǎng)絡(luò)預(yù)測模型的最小誤差為0.02,最大誤差為0.09,平均相對誤差為0.01。因此,IGSA-KELM 神經(jīng)網(wǎng)絡(luò)預(yù)測模型能更準確地預(yù)測出掘進面絕對瓦斯涌出量,得到更高精度的預(yù)測結(jié)果。
針對瓦斯涌出量受其他因素的影響,并且存在著復雜的非線性關(guān)系,缺少相應(yīng)的歷史監(jiān)測數(shù)據(jù)分析算法,難以發(fā)現(xiàn)參量發(fā)展變化趨勢,用一般的線性模型很難準確預(yù)測,本文從瓦斯涌出量模型出發(fā),進行基于時間序列的預(yù)測方法的研究,提出將核極端學習機及萬有引力算法相結(jié)合,建立瓦斯涌出量預(yù)測模型,在結(jié)合方式和算法方面進行了優(yōu)化改進,提高了預(yù)測模型的預(yù)測精度和預(yù)測效率,為瓦斯涌出量預(yù)測提供了新的方法。