張津鵬,李 林,劉光偉,郭直清,郭偉強(qiáng)
(1.國能寶日希勒能源有限公司,內(nèi)蒙古 呼倫貝爾 021000;2.遼寧工程技術(shù)大學(xué) 礦業(yè)學(xué)院,遼寧 阜新 123000)
半連續(xù)開采工藝作為當(dāng)前我國露天煤礦中常采用的一種作業(yè)方式,因其單位能耗少、能量消耗低、設(shè)備定員少等優(yōu)點(diǎn)被公認(rèn)為是“最有生命力”的露天開采工藝[1,2]。而露天礦卡車作為露天礦半連續(xù)開采工藝系統(tǒng)中的重要組成部分之一,卡車的有效利用直接影響了企業(yè)的經(jīng)濟(jì)效益和生產(chǎn)效率[3]。但在實(shí)際露天礦生產(chǎn)過程中,由于外部環(huán)境、人員等多方面因素的影響,露天礦卡車的故障十分頻繁,維修費(fèi)用極高,幾乎占據(jù)了整個(gè)生產(chǎn)成本的30%~50%[4,5],同時(shí)卡車的突然故障還易導(dǎo)致安全事故的發(fā)生[6]。因此,提前預(yù)知露天礦卡車故障情況并基于此制定合理有效的維修管理方案對(duì)實(shí)現(xiàn)安全智慧礦山具有十分重要的現(xiàn)實(shí)意義和經(jīng)濟(jì)意義。
針對(duì)露天礦卡車的事前維修和故障預(yù)測(cè)問題,胡明振等[7]運(yùn)用數(shù)理統(tǒng)計(jì)回歸分析等方法綜合分析某露天礦電動(dòng)輪汽車的維修成本數(shù)據(jù),建立了露天礦電動(dòng)輪汽車運(yùn)行效率和維修成本模型,成功實(shí)現(xiàn)了對(duì)露天礦電動(dòng)輪汽車壽命的有效預(yù)測(cè);白潤才等[8]通過分析露天礦卡車的故障時(shí)序數(shù)據(jù),建立了一種基于小波分析與自回歸滑動(dòng)平均模型的露天礦車故障率預(yù)測(cè)方法,實(shí)現(xiàn)了對(duì)露天礦卡車故障率的有效預(yù)測(cè);劉威等[3]建立了基于MCMC的露天礦典型設(shè)備預(yù)測(cè)方法,預(yù)測(cè)了露天礦典型設(shè)備的發(fā)生時(shí)間和故障類別,揭示了露天礦典型設(shè)備的故障規(guī)律;PERALTA[9]和ANGELES[10]等通過分析露天礦卡車的歷史故障數(shù)據(jù),分別提出了相對(duì)應(yīng)的可靠性數(shù)學(xué)模型,對(duì)實(shí)現(xiàn)和制定露天礦卡車的維修計(jì)劃起到了關(guān)鍵作用。
本文以神華寶日希勒露天煤礦的TR100類型卡車維修數(shù)據(jù)為研究目標(biāo),提出了基于改進(jìn)灰狼優(yōu)化算法的BP神經(jīng)網(wǎng)絡(luò)(BP neural network,BPNN)模型,并將其用于預(yù)測(cè)TR100類型卡車故障情況,突破了傳統(tǒng)以經(jīng)驗(yàn)式為主的卡車故障類型分析方式,成功實(shí)現(xiàn)了以數(shù)據(jù)為驅(qū)動(dòng)的露天礦卡車故障分析預(yù)測(cè)新方法。
灰狼優(yōu)化算法[11,12](GWO)作為一種典型的受生物啟發(fā)的仿生智能優(yōu)化算法,其數(shù)學(xué)模型主要來源于對(duì)自然界中灰狼群等級(jí)制度和捕食狩獵行為的模擬。假設(shè)灰狼種群數(shù)為N,第i只灰狼的位置為Xi,α狼所在位置為群體最優(yōu)解,β狼所在位置為第二最優(yōu)解,δ狼所在位置為第三最優(yōu)解,則根據(jù)灰狼群捕食狩獵行為,灰狼優(yōu)化算法可分為三個(gè)部分。
1)算法迭代中前期—迭代搜索過程:
D=|CXP(t)-X(t)|
(1)
Dα=|C1Xα-X|
(2)
Dβ=|C2Xβ-X|
(3)
Dδ=|C3Xδ-X|
(4)
式中,t為當(dāng)前的迭代次數(shù);D為灰狼與獵物兩者之間的距離;P為獵物;XP(t)為第t次迭代時(shí)獵物所在的位置;X(t)為灰狼個(gè)體所在位置;Dα、Dβ和Dδ分別為α狼、β狼和δ狼與ω狼間的距離;Xα、Xβ、Xδ和X分別為α狼、β狼、δ狼和ω狼所在位置;C為控制算法收斂性能的關(guān)鍵參數(shù)之一,表示為:
C=C1=C2=C3=2r2
(5)
式中,r2為[0,1]間的隨機(jī)數(shù)。
2)算法迭代中后期—迭代包圍過程:
X(t+1)=XP(t)-AD
(6)
X1=Xα-A1(Dα)
(7)
X2=Xβ-A2(Dβ)
(8)
X3=Xδ-A3(Dδ)
(9)
A=A1=A2=A3=2ar1-a
(10)
式中,X1、X2和X3分別為α狼、β狼和δ狼在第t次迭代更新時(shí)的最佳位置;A為控制算法收斂性能的另一關(guān)鍵參數(shù);r1為[0,1]間的隨機(jī)數(shù);a為算法收斂因子,其取值范圍隨迭代次數(shù)由2線性遞減到0;t為當(dāng)前迭代次數(shù);tmax為最大迭代次數(shù)。
3)算法迭代終止條件—迭代更新方程:
式中,X1、X2和X3分別為α狼、β狼和δ狼在第t次迭代更新時(shí)的最佳位置;X(t+1)表示灰狼群中第t+1次迭代時(shí)的種群個(gè)體位置;當(dāng)?shù)趖+1次和第t次迭代時(shí)種群內(nèi)個(gè)體不發(fā)生明顯變化時(shí),算法迭代終止,即認(rèn)為算法找尋到當(dāng)前搜索空間中的最優(yōu)值。
對(duì)智能優(yōu)化算法來說,初始群體在解空間中的分布越均勻,算法最終逃逸極值取得全局最優(yōu)值的概率越大[13]。當(dāng)灰狼優(yōu)化算法產(chǎn)生的初始灰狼群在搜索空間中的分布越均勻,那么灰狼搜索捕獲獵物的概率越大,即求解全局最優(yōu)值的概率越大。與傳統(tǒng)隨機(jī)搜索策略生成初始種群相比,混沌搜索策略生成初始種群能更好的覆蓋搜索空間,能保證初始群體在搜索空間的分布性[13]。因此,本文引入混沌映射對(duì)灰狼群進(jìn)行初始化。然而由于不同混沌映射生成的初始群體對(duì)算法性能有影響。故本文對(duì)隨機(jī)搜索、Gauss映射、Tent映射和Circle映射進(jìn)行對(duì)比分析,選擇更優(yōu)的策略來生成初始灰狼群,以保證灰狼群在初始解空間中的均勻分布性。綜上,得到四種初始種群生成策略的映射值如圖1所示。
圖1 四種策略生成的映射值
圖1(a)—(d)代表使用隨機(jī)搜索、Gauss映射、Tent映射和Circle映射在1000次下生成的映射值。由圖1可知,隨機(jī)搜索、Gauss映射和Tent映射生成的函數(shù)值未有效覆蓋整個(gè)解空間,易導(dǎo)致生成的初始種群多樣性不足,進(jìn)而使得算法在搜索過程中陷入局部極值。而對(duì)于Circle映射來說(圖2(d)),其映射值在解空間中的分布更均勻,各映射值間不存在重疊現(xiàn)象,故由Circle映射生成的初始灰狼群效果更佳。綜上,本文采用Circle混沌策略生成初始灰狼種群,表示為:
圖2 原始參數(shù)a的函數(shù)值
式中,mod為取余函數(shù);C(t)和C(t+1)分別代表第t次和第t+1次的Circle混沌迭代值;初始值C(0)為0到1間的隨機(jī)數(shù)。
在GWO中,參數(shù)A是保證算法收斂性能的重要參數(shù),而a的取值是決定參數(shù)A的唯一參數(shù)。因此,參數(shù)a對(duì)GWO的尋優(yōu)性能十分重要。參數(shù)a在迭代過程中的函數(shù)值如圖2所示。
由圖2可知,在GWO中,參數(shù)a隨算法迭代依次由2線性遞減到0。這表明隨算法迭代的進(jìn)行,參數(shù)a對(duì)算法性能影響呈現(xiàn)線性趨勢(shì),這與自然界中的灰狼捕食行為不符。在自然界中,灰狼群在追捕獵物過程中,狼群和獵物的體力都會(huì)發(fā)生下降,這種下降趨勢(shì)應(yīng)該呈現(xiàn)非線性下降趨勢(shì)。因此,為模擬自然界中的灰狼群速度下降過程及更好提升算法收斂性能,參數(shù)a被修正為:
式中,t表示當(dāng)前的迭代次數(shù);tmax為最大迭代次數(shù)。為保證生成的參數(shù)a的取值范圍在0到1之間,式(14)被修正為:
式中,min(a)和max(a)分別為在1000次迭代過程中利用式(14)生成的參數(shù)a的最小值和最大值。根據(jù)式(14)和式(15)繪制出更新后的參數(shù)a的圖像如圖3所示。
圖3 修正參數(shù)a函數(shù)值
由圖3可知,在迭代前期,參數(shù)a先由0非線性增長到1,模擬灰狼群體力充足時(shí)追蹤搜索并包圍獵物過程。在迭代后期,參數(shù)a從1呈現(xiàn)非線性遞減趨勢(shì),模擬后期灰狼群體力下降但快速捕獲獵物的過程。同時(shí)參數(shù)a在迭代前期數(shù)值呈現(xiàn)非線性增加是為了增大算法在解空間中的搜索步長,增強(qiáng)算法逃逸局部極值的能力;而在迭代后期呈現(xiàn)非線性遞減是為了加快算法的局部收斂性;當(dāng)算法進(jìn)入全局最優(yōu)鄰域而未尋到全局最優(yōu)點(diǎn)時(shí),參數(shù)a非線性遞減可有效加快算法收斂速度。因此,對(duì)比圖2和圖3可知,修正后的參數(shù)a不僅可以增強(qiáng)算法全局勘探能力,而且還能加快算法局部開發(fā)性能。
在自然界中,灰狼群雖然是由α狼領(lǐng)導(dǎo)其余灰狼對(duì)獵物進(jìn)行追蹤搜索,但各等級(jí)間的灰狼存在著相互交流,用于實(shí)時(shí)共享每個(gè)個(gè)體信息。但在GWO中,由式(12)可知,在最后的灰狼種群更新時(shí),各等級(jí)間的灰狼權(quán)重一致,表明各等級(jí)間的灰狼沒有交互過程。因此,為更好模擬灰狼群體間的個(gè)體交互過程,受線性插值啟發(fā),得到新的更新公式為:
式中,由于β狼是作為中間等級(jí)的狼負(fù)責(zé)聯(lián)系更低等級(jí)和更高等級(jí)的狼群,故在新的種群更新公式中,β狼占據(jù)交流的主導(dǎo)地位。
綜上,將三種改進(jìn)策略相互融合并作用于GWO中即可得到改進(jìn)的灰狼優(yōu)化算法,如圖4所示。
圖4 改進(jìn)灰狼優(yōu)化算法流程
傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)通過反向傳播算法和梯度下降法調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而對(duì)網(wǎng)絡(luò)訓(xùn)練結(jié)果和測(cè)試結(jié)果進(jìn)行誤差修正,直到輸出值與理論值滿足約束條件時(shí)完成任務(wù)[13]。而露天礦中卡車發(fā)生故障的數(shù)據(jù)集為非線性的非結(jié)構(gòu)化數(shù)據(jù),這導(dǎo)致傳統(tǒng)以梯度下降法來修正網(wǎng)絡(luò)權(quán)值和閾值的方法不再適用。
因此,為避免因非結(jié)構(gòu)化數(shù)據(jù)帶來的梯度爆炸問題,本文將改進(jìn)灰狼優(yōu)化算法(Improved Gray Wolf Optimizer,IGWO)引入到BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值搜索中,提出了一種基于IGWO的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化方法用于預(yù)測(cè)卡車故障問題。
假設(shè)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為Net(Ω,Φ),其中Ω∈[ωmin,ωmax]為BP神經(jīng)網(wǎng)絡(luò)的權(quán)值空間;Φ∈[θmin,θmax]為BP神經(jīng)網(wǎng)絡(luò)的閾值空間。則本文優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)表示為:
minNet{Ω,Φ}
(17)
但在BP神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)權(quán)值和閾值的好壞實(shí)質(zhì)上是通過優(yōu)化最小誤差來確定的,也即是用最小均方誤差來衡量每次網(wǎng)絡(luò)結(jié)構(gòu)的好壞程度從而篩選出最優(yōu)的權(quán)值和閾值空間。因此,基于IGWO-BPNN模型優(yōu)化的目標(biāo)應(yīng)為:
假定IGWO中的每個(gè)灰狼個(gè)體都對(duì)應(yīng)一個(gè)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),則最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)的搜索即是對(duì)式(18)的優(yōu)化求解過程。假設(shè)IGWO算法的初始種群個(gè)數(shù)為N,最大迭代次數(shù)為tmax,上下邊界分別為ub和lb,則IGWO-BPNN的實(shí)現(xiàn)流程如圖5所示。
圖5 IGWO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程
寶日希勒露天煤礦位于內(nèi)蒙古呼倫貝爾市,其露天煤礦的開采面積達(dá)43.7 km2,地質(zhì)儲(chǔ)量為15.73億t,可采的煤礦儲(chǔ)量達(dá)13.28億t[14]。據(jù)2020年有關(guān)數(shù)據(jù)統(tǒng)計(jì),在寶日希勒露天礦山上同時(shí)工作的100~220 t的電動(dòng)輪自卸卡車超過了60臺(tái),同時(shí)還有外委土方施工單位不同型號(hào)的采裝和運(yùn)輸設(shè)備超過了500臺(tái)[14]。
3.2.1 實(shí)驗(yàn)數(shù)據(jù)說明
1)原始數(shù)據(jù)來源及采集。從神華寶日希勒能源有限公司露天煤礦的設(shè)備維修管理系統(tǒng)提取了30多輛卡車的維修數(shù)據(jù),其中卡車類型主要以TR100型、108型和220型為主,采集的時(shí)間維度為2010年1月1日到2013年12月31日,共采集原始卡車故障數(shù)據(jù)超過5萬條,其中包括空值數(shù)據(jù)、重復(fù)數(shù)據(jù)及各種混亂不符合常識(shí)的數(shù)據(jù)。
2)原始數(shù)據(jù)的簡(jiǎn)單預(yù)處理。因原始數(shù)據(jù)中包含各種有噪聲的數(shù)據(jù),故在對(duì)卡車數(shù)據(jù)進(jìn)行分析預(yù)測(cè)前需要先對(duì)原始數(shù)據(jù)進(jìn)行簡(jiǎn)單預(yù)處理,即:平滑法填補(bǔ)缺失值,去除重復(fù)值及不合常理數(shù)據(jù),得到簡(jiǎn)單預(yù)處理后的卡車故障數(shù)據(jù)見表1。
表1 簡(jiǎn)單預(yù)處理后的卡車故障數(shù)據(jù)
3)數(shù)據(jù)預(yù)處理與整合。由表1可知,簡(jiǎn)單預(yù)處理后的卡車故障數(shù)據(jù)仍存在日期與車型混亂、故障持續(xù)時(shí)間不清晰等情況,而若要精準(zhǔn)分析卡車故障情況,應(yīng)針對(duì)某一類型卡車在某一段時(shí)間內(nèi)的具體情況進(jìn)行分析。本文以TR100類型卡車為主進(jìn)行研究。同時(shí)為更好的對(duì)卡車故障數(shù)據(jù)進(jìn)行分析,對(duì)表1數(shù)據(jù)再次進(jìn)行預(yù)處理和整合,具體過程如下:①時(shí)序排列,為更好分析卡車發(fā)生故障與卡車運(yùn)行時(shí)間的聯(lián)系,將采集的數(shù)據(jù)按照時(shí)間順序依次排列;②計(jì)算故障持續(xù)時(shí)間。根據(jù)卡車進(jìn)廠維修和出廠工作的時(shí)間計(jì)算其故障持續(xù)時(shí)間;③故障分類,卡車故障持續(xù)時(shí)間的長短直接影響到了礦區(qū)內(nèi)正常工作質(zhì)量,當(dāng)卡車故障時(shí)間越長,現(xiàn)場(chǎng)正常工作的卡車數(shù)量就越少。因此,根據(jù)卡車故障時(shí)間長短劃分故障類型對(duì)后續(xù)制定生產(chǎn)計(jì)劃有著重要意義。本文采取論文[3]的故障劃分規(guī)則見表2。
表2 卡車故障分類
綜上,得到預(yù)處理好的卡車故障數(shù)據(jù)見表3。
表3 預(yù)處理后的卡車故障數(shù)據(jù)
3.2.2 實(shí)驗(yàn)結(jié)果及分析
因不同類型卡車設(shè)備軟硬件老化程度不同會(huì)導(dǎo)致故障情況不一致,故在研究預(yù)測(cè)時(shí)需以同一類型卡車為例進(jìn)行研究。
1)卡車發(fā)生故障次數(shù)預(yù)測(cè)研究。以TR100類型卡車為例,因卡車發(fā)生故障次數(shù)為離散型整數(shù)變量,故基于IGWO-BPNN模型的卡車發(fā)生故障次數(shù)預(yù)測(cè)研究是一個(gè)預(yù)測(cè)問題。同時(shí)因本文根據(jù)卡車故障持續(xù)時(shí)間對(duì)卡車故障類型進(jìn)行了分類,故對(duì)TR100類型卡車發(fā)生故障的次數(shù)預(yù)測(cè)應(yīng)分為卡車整體發(fā)生故障的次數(shù)預(yù)測(cè)和不同故障類型卡車發(fā)生故障的次數(shù)預(yù)測(cè)。針對(duì)于此,本文對(duì)預(yù)處理后的數(shù)據(jù)再次進(jìn)行整合,得到以月份為基礎(chǔ)的數(shù)據(jù)進(jìn)行模型預(yù)測(cè)。
對(duì)TR100類型卡車發(fā)生故障的次數(shù)研究分為兩部分。①對(duì)整體TR100類型卡車的故障數(shù)據(jù)進(jìn)行預(yù)測(cè),用于研究TR100類型卡車整體故障情況;②對(duì)TR100類型卡車每一類故障數(shù)據(jù)分別進(jìn)行預(yù)測(cè),用于研究TR100類型卡車每一類型故障情況。同時(shí)為驗(yàn)證IGWO-BPNN模型具有更好的性能,將BP神經(jīng)網(wǎng)絡(luò)模型(BPNN)和基于GWO的BP神經(jīng)網(wǎng)絡(luò)模型(GWO-BPNN)作為對(duì)比算法。
以數(shù)據(jù)集中的前三年數(shù)據(jù)作為訓(xùn)練集,最后一年數(shù)據(jù)為測(cè)試集;分別利用BPNN、GWO-BPNN及IGWO-BPNN對(duì)TR100型卡車2010年1月—2013年12月發(fā)生故障的次數(shù)進(jìn)行預(yù)測(cè),得到實(shí)驗(yàn)結(jié)果如圖6所示。(注:為更好的分析TR100類型卡車故障情況,圖中卡車發(fā)生故障總次數(shù)預(yù)測(cè)結(jié)果并非5類故障的加和,而是單獨(dú)的模型預(yù)測(cè)結(jié)果)。由圖6可知,在同一實(shí)驗(yàn)環(huán)境中,相較于BP神經(jīng)網(wǎng)絡(luò)模型和GWO-BPNN模型,IGWO-BPNN模型預(yù)測(cè)得到的結(jié)果更接近于真實(shí)的TR100類型卡車的發(fā)生故障次數(shù)。
圖6 不同算法的TR100類型卡車發(fā)生故障次數(shù)預(yù)測(cè)結(jié)果
為更清晰的對(duì)比三種模型的預(yù)測(cè)性能,得到其預(yù)測(cè)結(jié)果數(shù)值見表4(受篇幅所限,僅展示2013年1月份和2月份的數(shù)據(jù))。在表4中,加粗字體表示與真實(shí)卡車發(fā)生故障次數(shù)最接近的預(yù)測(cè)值,GBPN代表GWO-BPNN,IGBPN代表IGWO-BPNN。由表4可知,整體而言,IGWO-BPNN具有最好的性能。結(jié)合圖6可知,對(duì)于TR100類型卡車而言,無論是從故障發(fā)生總次數(shù)還是5類故障發(fā)生次數(shù)的預(yù)測(cè)結(jié)果來說,在同一實(shí)驗(yàn)環(huán)境下,本文提出的IGWO-BPNN具有更好的預(yù)測(cè)性能。
表4 不同算法TR100類型卡車故障次數(shù)預(yù)測(cè)結(jié)果
2)卡車故障持續(xù)時(shí)間(故障類型)預(yù)測(cè)。因每輛卡車的故障持續(xù)時(shí)間都不一致,故為更合理分析卡車故障情況,以1#、10#和20#三輛卡車為例進(jìn)行分析。由于對(duì)卡車故障持續(xù)時(shí)間進(jìn)行了分類,故基于IGWO-BPNN的卡車故障持續(xù)時(shí)間預(yù)測(cè)研究是一個(gè)多分類問題。
與基于IGWO-BPNN的預(yù)測(cè)模型一樣,基于IGWO-BPNN的分類模型本質(zhì)上也是尋找BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值。為使提出的算法適用于分類問題,需將連續(xù)空間的值映射到二元空間,其主要方法為當(dāng)適應(yīng)度值大于0.5時(shí)取1,小于等于0.5時(shí)取0。
利用基于IGWO-BPNN模型對(duì)三輛卡車2010年1月—2013年12月的故障類型進(jìn)行分類預(yù)測(cè),得到其故障類型分類結(jié)果如圖7所示。
圖7 各算法對(duì)3輛卡車發(fā)生故障類型的分類精度
由圖7可知,利用三種方法分別對(duì)3輛TR100卡車故障情況進(jìn)行研究時(shí),IGWO-BPNN模型的分類精度高于其余兩種方法,驗(yàn)證了本文提出的方法具有更好的分類性能。
綜上所述,針對(duì)TR100類型卡車的故障情況,IGWO-BPNN不僅能很好地對(duì)每個(gè)月卡車發(fā)生故障類型進(jìn)行有效分類,而且還能有效預(yù)測(cè)出卡車每月具體發(fā)生故障的次數(shù)。
1)本文針對(duì)傳統(tǒng)灰狼優(yōu)化算法在尋優(yōu)能力上的不足,通過引入Circle映射,非線性收斂因子和線性插值理論,提出了改進(jìn)的灰狼優(yōu)化算法(IGWO)。然后再將該算法引入到BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值優(yōu)化中,提出了一種(IGWO-BPNN)模型。
2)以神華寶日希勒露天煤礦提取的TR100類型卡車維修數(shù)據(jù)為研究目標(biāo),通過大量的數(shù)據(jù)預(yù)處理分析過程,基于提出的IGWO-BPNN模型對(duì)TR100類型卡車故障情況進(jìn)行了有效預(yù)測(cè),實(shí)驗(yàn)結(jié)果可為卡車維修管理計(jì)劃安排以及智慧礦山建設(shè)提供基礎(chǔ)數(shù)據(jù)支撐。