韓金亮 韋昊然 蔣欣欣 陳夢潔 韓瑞澤
(中國礦業(yè)大學(xué) 徐州 221116)
隨著我國煤礦行業(yè)的進(jìn)一步深化改革,煤礦行業(yè)的安全風(fēng)險(xiǎn)管控工作面臨更大挑戰(zhàn),其中礦井突水事故頻頻發(fā)生,對煤礦生產(chǎn)及人員生命安全造成嚴(yán)重危害。礦井突水指煤礦開采過程中煤層底板受地下水的高壓而被突破,地下水迅速滲入礦井,造成淹井現(xiàn)象,嚴(yán)重制約我國煤炭行業(yè)生產(chǎn)發(fā)展。突水事故發(fā)生的主要原因是開采條件、巖石力學(xué)、水文地質(zhì)等諸多復(fù)雜因素綜合作用,其中礦井不同水層的水化學(xué)成分能夠有效反映對應(yīng)水層的本質(zhì)特征,地下水化學(xué)成分的遷移、集聚與分散都與水層環(huán)境變化有著密切聯(lián)系[1],因此水源判別技術(shù)成為了近年來煤礦開采突水預(yù)警的重要技術(shù)之一,在煤礦災(zāi)害防治工作中起到重大作用。
近年來,對煤礦突水預(yù)警機(jī)領(lǐng)域研究方法較多,如數(shù)值模擬法、主成分分析法、熵值法、灰色系統(tǒng)法、神經(jīng)網(wǎng)絡(luò)法等。姜諳男[2]等提出運(yùn)用最小二乘支持向量機(jī)原理進(jìn)行礦井突水煤層底板突水量的預(yù)測,提高了傳統(tǒng)支持向量機(jī)對煤層底板突水量的預(yù)測準(zhǔn)確率;陳紅江等[3]利用距離判別分析法對底板突水量進(jìn)行有效預(yù)測;呂純[4]運(yùn)用Elman 神經(jīng)網(wǎng)絡(luò)算法對謝一礦地下進(jìn)行水化學(xué)特征分析及突水水源判別,實(shí)現(xiàn)人工智能在煤礦防控領(lǐng)域的突破性進(jìn)展;李紅梅等[5]建立Bayes 判別分析模型對煤層底板突水危險(xiǎn)性進(jìn)行有效評價(jià),對礦井水害進(jìn)行有效防控;劉德旺[6]通過概率模型建立突水系數(shù)法對回坡底煤礦奧灰突水危險(xiǎn)性進(jìn)行評價(jià);徐星[7~8]等利用神經(jīng)網(wǎng)絡(luò)的強(qiáng)泛化性特點(diǎn)進(jìn)行礦井水源的判別,改進(jìn)的提出粒子群算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)算法與改進(jìn)的Elman 神經(jīng)網(wǎng)絡(luò)進(jìn)行突水水源的判別,有效推動(dòng)煤礦水害防控工作。但不同的研究方法存在一定的局限性,如傳統(tǒng)前饋式神經(jīng)網(wǎng)絡(luò)的魯棒性較弱,訓(xùn)練過程的權(quán)值閾值對數(shù)據(jù)變化非常敏感、距離判別法的高度線性導(dǎo)致非線性關(guān)系難以發(fā)掘等問題。針對上訴問題,Huang 等[9,17]提出的極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)方法可以有效提高神經(jīng)網(wǎng)絡(luò)的計(jì)算效率,解決傳統(tǒng)網(wǎng)絡(luò)的訓(xùn)練缺點(diǎn),實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)在工程應(yīng)用領(lǐng)域的重大突破。
ELM 是一類具有快速學(xué)習(xí)能力的單隱含層神經(jīng)網(wǎng)絡(luò)算法,其學(xué)習(xí)方式基于最小二乘法思想,克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的反饋式誤差更新低效等缺點(diǎn)。但在建立ELM 模型時(shí)初始權(quán)值閾值隨機(jī)確定使得最小二乘法得到的最終權(quán)值閾值有較大差異,從而導(dǎo)致ELM 模型的隱含層輸出矩陣隨著訓(xùn)練樣本不同而產(chǎn)生較大差異。為了解決上述問題,本文引入GWO(Grey Wolf Optimizer)灰狼算法[10,16]進(jìn)行極限學(xué)習(xí)機(jī)算法(ELM)的優(yōu)化改進(jìn),將模型誤判率作為目標(biāo)函數(shù)運(yùn)用GWO 灰狼算法優(yōu)化ELM 的初始權(quán)值閾值,提出一種改進(jìn)GWO-ELM 算法進(jìn)行礦井水源識(shí)別,為高效判斷突水水源提供理論依據(jù),進(jìn)行有效的煤礦水害的防控。
極限學(xué)習(xí)機(jī)是一種特殊的單隱層神經(jīng)網(wǎng)絡(luò)算法。相對于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)尤其是單隱層前饋神經(jīng)網(wǎng)絡(luò)其不同之處在于學(xué)習(xí)的方法不同[17]。傳統(tǒng)的前饋式神經(jīng)網(wǎng)絡(luò)算法是通過梯度下降法利用反向傳播的方式迭代來更新權(quán)值和閾值,而ELM 極限學(xué)習(xí)機(jī)則是通過增加隱層節(jié)點(diǎn)的個(gè)數(shù)來達(dá)到精確學(xué)習(xí)的目的,隱層節(jié)點(diǎn)的個(gè)數(shù)一般根據(jù)樣本的個(gè)數(shù)來確定,由于許多前向神經(jīng)網(wǎng)絡(luò)中,默認(rèn)最大的隱層節(jié)點(diǎn)的個(gè)數(shù)就是樣本數(shù),因此無需通過迭代即可達(dá)到精確非線性擬合的效果。
設(shè)輸入層與隱含層間的連接權(quán)值矩陣w 、隱含層神經(jīng)元與輸出層神經(jīng)元的連接權(quán)值矩陣β 分別為
其中wij為隱含層第i 個(gè)神經(jīng)元與輸入層第j 個(gè)神經(jīng)元xj的連接權(quán)值,βik為隱含層第i個(gè)神經(jīng)元與輸出層第k 個(gè)神經(jīng)元的連接權(quán)值。同時(shí),假設(shè)單隱含層神經(jīng)元閾值向量b 為
則由則極限學(xué)習(xí)機(jī)ELM 得到的輸出神經(jīng)元y的擬合統(tǒng)一表達(dá)式為
其中g(shù)(x)為選定函數(shù),稱之為網(wǎng)絡(luò)激活函數(shù)。一般原理選擇:
為了計(jì)算仿真模型的輸出函數(shù),我們需要將訓(xùn)練集輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練擬合,設(shè)含有q 個(gè)訓(xùn)練集樣本的輸入矩陣X和輸出矩陣Y分別為
用向量wi表示神經(jīng)結(jié)構(gòu)中單隱含層第i 個(gè)神經(jīng)元與輸入層神經(jīng)元的連接權(quán)值向量,向量xj表示第p 個(gè)訓(xùn)練樣本的輸入層神經(jīng)元向量,即
設(shè)置該神經(jīng)結(jié)構(gòu)中的神經(jīng)元激活函數(shù)為
對于一個(gè)有l(wèi) 個(gè)隱含層節(jié)點(diǎn)的神經(jīng)結(jié)構(gòu)模型,H 假設(shè)為極限學(xué)習(xí)機(jī)ELM 的單隱含層輸出矩陣,自變量與權(quán)值的內(nèi)積,則ELM 神經(jīng)元的輸出矩陣H可以表示為
設(shè)該樣本訓(xùn)練集的輸出神經(jīng)元函數(shù)為t,則將所有輸出函數(shù)排成矩陣構(gòu)成網(wǎng)絡(luò)輸出矩陣T,T 的結(jié)構(gòu)簡單表示如下:
其中T′表示矩陣輸出矩陣T的轉(zhuǎn)置。
GWO灰狼算法由Mirjalili等于2014年[10]提出,該算法以系統(tǒng)化、層次化思想、遞進(jìn)化思想與導(dǎo)向隨機(jī)思想為基本框架,是一種基于灰狼的狩獵生存特點(diǎn)而提出的一種新型群體智能算法。相關(guān)研究[10,16]表明該算法的優(yōu)化性能高于一般群算法,具有簡單和高效等特點(diǎn)。
GWO 灰狼算法分為狩獵、圍捕、攻擊三大主要步驟[10,16]?;依堑尼鳙C過程首先進(jìn)行目標(biāo)包圍,該步驟的數(shù)學(xué)公式為
其中t 為當(dāng)前的群體更新的迭代數(shù),A 和B 為系數(shù)向量;Xp為全局最優(yōu)解向量,表示目標(biāo)獵物所在的空間位置;X 為優(yōu)化問題的潛在解向量,表示灰狼狩獵過程所在的空間位置。A 和B 的運(yùn)用群算法中動(dòng)態(tài)搜索的改進(jìn)思想進(jìn)行更新,計(jì)算方式表示為
其中a(t)的值隨迭代數(shù)t 的增加從2 遞減到0,r1和r2為[0,1]內(nèi)的隨機(jī)向量。
在鎖定獵物進(jìn)行包圍后灰狼開始進(jìn)行圍捕,該過程的灰狼分為4個(gè)等級α、β、δ、ω進(jìn)行不同層次的圍捕行為。搜索單位ω依照根據(jù)當(dāng)前最佳搜索單位α、β、δ進(jìn)行更新,α、β、δ 3個(gè)等級對應(yīng)的搜索單位灰狼圍捕方式為
其中搜索單位λ=α、β、δ,X(t+1)為更新后的潛在最優(yōu)解向量。
灰狼算法的最后階段是攻擊,在進(jìn)行獵物圍捕后灰狼開始抓獲目標(biāo)獵物,即搜索到GWO 算法獲得最優(yōu)解。該過程的灰狼行為構(gòu)建通過式a(t)的線性遞減來實(shí)現(xiàn)。對灰狼算法進(jìn)行改進(jìn),在猛狼圍攻行為中取消狼群定位的判定距離,提出多維圍攻半徑的概念,并依據(jù)狼群更新的位置此判斷子代狼是否轉(zhuǎn)入圍攻行為,提高灰狼的全局搜索能力與收斂速度。
改進(jìn)灰狼算法優(yōu)化ELM 極限學(xué)習(xí)機(jī)的思想是初始化灰狼算法的參數(shù),通過極限學(xué)習(xí)機(jī)算法隨機(jī)給定的初始權(quán)值閾值訓(xùn)練,通過誤差反饋調(diào)整灰狼更新的空間位置,使得灰狼的適應(yīng)度值不斷優(yōu)化,直到獲得符合條件的全局最優(yōu)解,即ELM 模式識(shí)別的最優(yōu)權(quán)值與閾值,形成最優(yōu)的識(shí)別模型。簡要步驟為
Step 1 參數(shù)初始化。隨機(jī)設(shè)定灰狼坐標(biāo)參數(shù)與位移參數(shù),隨機(jī)設(shè)定極限學(xué)習(xí)機(jī)的網(wǎng)絡(luò)權(quán)值與閾值。
Step 2 計(jì)算訓(xùn)練誤差與獵物搜索。通過計(jì)算初始ELM 訓(xùn)練的網(wǎng)絡(luò)進(jìn)行仿真誤差或誤判率的計(jì)算,將最低誤判率的網(wǎng)絡(luò)對象作為獵物進(jìn)行灰狼圍捕。
Step 3 網(wǎng)絡(luò)權(quán)值閾值更新。根據(jù)灰狼的獵物圍捕進(jìn)行網(wǎng)絡(luò)初始權(quán)值閾值更新,通過ELM 的計(jì)算方式重新訓(xùn)練網(wǎng)絡(luò)的權(quán)值與閾值。
Step 4 迭代更新。將新的網(wǎng)絡(luò)作為新的獵物對象進(jìn)行灰狼圍攻,返回2),如果得到更新的網(wǎng)絡(luò)仿真誤判率低于前一代網(wǎng)絡(luò)誤判率,則進(jìn)行3),否則回到2)。當(dāng)誤判率低于設(shè)定值或迭代次數(shù)達(dá)到最大值則停止更新。
Step 5 將最終得到的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行礦井水源判別,進(jìn)行有效的煤層底板突水水源識(shí)別。
本文選取的研究對象是位于安徽省淮南市的顧北礦區(qū)。顧北礦區(qū)主要含水層按照自上而下的順序有第四系石炭系裂隙巖溶含水層、第四系孔隙潛水含水層、奧陶系碳酸鹽巖溶巖含水層、二疊系灰?guī)r含水層,其中第八層灰?guī)r含水層、第二層灰?guī)r含水層、奧陶系碳酸鹽巖含水層為底板的主要含水層。第八灰?guī)r層厚6m~8m,水壓高,富水性強(qiáng),多次發(fā)生突水;第二灰?guī)r層厚12m~20m,水壓高,富水性強(qiáng),導(dǎo)水性強(qiáng)。在地下開采過程中,井下開采時(shí)二灰層的巖層水往往依靠垂向?qū)當(dāng)鄬佑咳氲V井造成大型礦井突水災(zāi)害。來自煤層底部的奧陶系碳酸鹽巖因其富水性強(qiáng)、水壓強(qiáng)度高而對煤礦開采構(gòu)成最大威脅,多次發(fā)生大規(guī)模突水事故。因此,在開采第四系孔隙潛水含水層與石炭紀(jì)裂隙巖溶含水層時(shí),若采樣水的大部分組成來自于奧陶紀(jì)碳酸鹽巖溶含水層等低含水層,則發(fā)生礦井水害的可能性較大[12~15],對采礦人員的生命財(cái)產(chǎn)造成嚴(yán)重威脅。
在GWO-ELM 水源判別的過程中,將第四系孔隙潛水含水層、二疊紀(jì)灰?guī)r含水層、石炭紀(jì)裂隙巖溶含水層和奧陶紀(jì)碳酸鹽巖溶含水層分別作為第一層水源、第二層水源、第三層水源與第四層水源進(jìn)行模式識(shí)別。含水層中水化學(xué)成分多,針對離子對于不同水源的差異性問題以及不同水源數(shù)據(jù)的有效性問題,根據(jù)有關(guān)文獻(xiàn)[7~8]選取(Na++ K+)、Ca2+、Mg2+、Cl-、SO42-、HCO3-共6 種不同離子(組)的濃度(dB/L-1)作為GWO-ELM 模式識(shí)別的樣本數(shù)據(jù),樣本數(shù)據(jù)如表1所示。
依據(jù)ELM 理論,輸入樣本共有6 組向量,因此隱含層節(jié)點(diǎn)數(shù)設(shè)為6;由于不同離子的度量差異較大,根據(jù)統(tǒng)計(jì)學(xué)原理將原始數(shù)據(jù)進(jìn)行最小歸一化處理后作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)源,即將樣本水化學(xué)源數(shù)據(jù)的每一個(gè)指標(biāo)數(shù)據(jù)xij按照公式:
進(jìn)行歸一變換。不失一般性,每一次ELM 更新訓(xùn)練的輸入矩陣由隨機(jī)選取的70%樣本矩陣構(gòu)成,將剩下30%的樣本數(shù)據(jù)作為回判樣本進(jìn)行誤判率的計(jì)算。為了增強(qiáng)網(wǎng)絡(luò)的魯棒性在訓(xùn)練樣本進(jìn)行±噪聲處理,使最終訓(xùn)練得到的網(wǎng)絡(luò)權(quán)值與閾值穩(wěn)定性提高。將GWO 的迭代上限設(shè)置為500 次,將訓(xùn)練結(jié)束后的網(wǎng)絡(luò)作為礦井突水水源判別模型,隨機(jī)選取未訓(xùn)練的樣本水源進(jìn)行回判驗(yàn)證。實(shí)驗(yàn)數(shù)據(jù)共計(jì)25組,計(jì)算結(jié)果如表2所示。
表1 顧北礦區(qū)不同水層樣本數(shù)據(jù)
根據(jù)回判驗(yàn)證結(jié)果,25 項(xiàng)隨機(jī)樣本中傳統(tǒng)ELM 錯(cuò)判8 項(xiàng),判斷正確率為68.5%;GWO-ELM 錯(cuò)判3項(xiàng),判斷正確率高達(dá)92.3%,較傳統(tǒng)判別方法判別準(zhǔn)確率高20 個(gè)百分點(diǎn),將礦井水源的判別結(jié)果進(jìn)行圖1可視化分析。
表2 回判計(jì)算結(jié)果
圖1 回判結(jié)果可視化
將不同的ELM 算法的水源判別結(jié)果與實(shí)際水源進(jìn)行比對,根據(jù)比對圖可知傳統(tǒng)ELM 對第2、3層的判別準(zhǔn)確率最低,GWO-ELM 算法對第4 層水源判斷完全正確,第2、3 層同樣存在誤判對象,因此第2、3層水源的判別準(zhǔn)確率仍然可以提高。
將GWO 的迭代過程進(jìn)行圖2 可視化分析,分別計(jì)算每一代的灰狼集體平均誤判率與頭狼最低誤判率,訓(xùn)練的最低誤判率在480 代后收斂于5%以內(nèi),平均誤判率隨著代數(shù)振幅不斷縮小,整體呈下降趨勢,說明GWO 對ELM 的權(quán)值閾值更新具有高效性。能夠有效利用于礦井突水水源判別。
圖2 GWO-ELM算法軌跡
本文以顧北礦區(qū)不同水層的水源樣本作為實(shí)驗(yàn)對象,按照改進(jìn)灰狼算法的優(yōu)化方式對ELM 極限學(xué)習(xí)機(jī)算法進(jìn)行改進(jìn),建立改進(jìn)GWO-ELM 算法對樣本水源進(jìn)行預(yù)判,將水化學(xué)指標(biāo)作為網(wǎng)絡(luò)輸入向量,對應(yīng)水源層為輸出向量,通過GWO對網(wǎng)絡(luò)初始權(quán)值閾值的更新迭代有效得到適用于礦井突水水源判別的單隱含層神經(jīng)網(wǎng)絡(luò)模型,解決了礦井水源判別的低效率、低準(zhǔn)確率突破等問題,提高了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的穩(wěn)定性與魯棒性,實(shí)現(xiàn)了機(jī)器學(xué)習(xí)在煤礦安全領(lǐng)域的實(shí)質(zhì)性,對煤礦災(zāi)害防治工作中起到重大推進(jìn)作用。