田鳳亮, 王忠鑫,2, 孫效玉, 辛鳳陽(yáng), 宋波, 王金金, 曾祥玉, 周浩, 趙明
(1. 中煤科工集團(tuán)沈陽(yáng)設(shè)計(jì)研究院有限公司,遼寧 沈陽(yáng) 110015;2. 遼寧工程技術(shù)大學(xué) 礦業(yè)學(xué)院,遼寧 阜新 123000;3. 東北大學(xué) 資源與土木工程學(xué)院,遼寧 沈陽(yáng) 110015)
就露天礦電鏟-卡車間斷工藝生產(chǎn)效率而言,1個(gè)卡車作業(yè)周期內(nèi)卡車行程時(shí)間的占比最高、變動(dòng)幅度最大。準(zhǔn)確的卡車行程時(shí)間預(yù)測(cè)是卡車優(yōu)化調(diào)度的前提。受制于露天礦復(fù)雜多變的道路條件,實(shí)際生產(chǎn)中卡車優(yōu)化調(diào)度系統(tǒng)在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)只實(shí)現(xiàn)了調(diào)度而非優(yōu)化[1-3],其中一個(gè)重要原因是卡車在復(fù)合路段上的行程時(shí)間難以精準(zhǔn)預(yù)測(cè)。
露天礦卡車行程時(shí)間受卡車性能、道路狀況與環(huán)境因素的共同影響。一般來說,卡車行程時(shí)間可通過人工統(tǒng)計(jì)獲取。但由于露天礦道路變動(dòng)頻繁,人工獲取的時(shí)間往往很難用于生產(chǎn)組織工作[4]。當(dāng)一條道路上的行程時(shí)間數(shù)據(jù)量足夠支撐行程時(shí)間統(tǒng)計(jì)結(jié)果時(shí),該道路可能已接近廢棄。
在市政交通領(lǐng)域,國(guó)內(nèi)外專家學(xué)者結(jié)合實(shí)際開展了行程時(shí)間預(yù)測(cè)研究[5],預(yù)測(cè)方法主要有歷史趨勢(shì)法、參數(shù)回歸模型、時(shí)間序列、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、卡爾曼濾波等[6-10]。露天礦卡車行程時(shí)間預(yù)測(cè)也可采用上述方法。從研究對(duì)象角度出發(fā),可將露天礦卡車行程時(shí)間預(yù)測(cè)問題分為固定路段預(yù)測(cè)與動(dòng)態(tài)預(yù)測(cè)兩類[10]。固定路段行程時(shí)間預(yù)測(cè)的研究對(duì)象為固定起點(diǎn)與終點(diǎn)路段上的行程時(shí)間,而動(dòng)態(tài)行程時(shí)間預(yù)測(cè)則研究道路上任意2點(diǎn)之間的行程時(shí)間。
固定路段行程時(shí)間預(yù)測(cè)的研究單元為單一路段。白潤(rùn)才[1]針對(duì)人工統(tǒng)計(jì)平均速度方法的局限性,提出了基于人工神經(jīng)網(wǎng)絡(luò)的露天礦卡車路段行程時(shí)間實(shí)時(shí)預(yù)測(cè)方法,較人工方法在預(yù)測(cè)精度和操作復(fù)雜度上都有明顯改善。E. K. Chanda等[9]針對(duì)人工神經(jīng)網(wǎng)絡(luò)迭代次數(shù)多、收斂速度慢、容易陷入局部最小值而非全局最小值的問題,提出了基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)模糊系統(tǒng)的露天礦卡車行程時(shí)間預(yù)測(cè)方法,較人工神經(jīng)網(wǎng)絡(luò)在收斂速度和預(yù)測(cè)精度上有了進(jìn)一步改善。Sun Xiaoyu等[10]提出了一種基于隨機(jī)森林的卡車行程時(shí)間預(yù)測(cè)方法,將道路長(zhǎng)度、卡車型號(hào)、駕駛?cè)藛T等作為輸入,獲得了較高的預(yù)測(cè)精度。
與固定路段行程時(shí)間預(yù)測(cè)相比,動(dòng)態(tài)行程時(shí)間預(yù)測(cè)更具實(shí)用性。孟小前[4]通過研究認(rèn)為,進(jìn)行露天礦卡車動(dòng)態(tài)行程時(shí)間預(yù)測(cè)時(shí),支持向量機(jī)的預(yù)測(cè)結(jié)果在一定程度上優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。K. Erarslan[11]研發(fā)了一套計(jì)算機(jī)輔助系統(tǒng)來預(yù)測(cè)卡車行程時(shí)間,可實(shí)時(shí)采集卡車速度,將距離除以速度來獲得卡車行程時(shí)間預(yù)測(cè)結(jié)果。
上述文獻(xiàn)研究的卡車行程時(shí)間預(yù)測(cè)方法或是在機(jī)理上進(jìn)行細(xì)致刻畫,或是從統(tǒng)計(jì)角度進(jìn)行描述,預(yù)測(cè)結(jié)果往往具有很高的準(zhǔn)確性。但露天礦道路復(fù)雜,導(dǎo)致上述理論方法在實(shí)際部署中存在困難。鑒此,本文提出一種基于速度場(chǎng)的露天礦卡車多路段行程時(shí)間組合預(yù)測(cè)模型,以歷史數(shù)據(jù)構(gòu)建卡車速度場(chǎng),用于表征道路對(duì)卡車速度的影響,在此基礎(chǔ)上分路段建立基于隨機(jī)森林的行程時(shí)間單元預(yù)測(cè)模型,最終將單元預(yù)測(cè)模型預(yù)測(cè)結(jié)果累加,得出卡車在復(fù)合路段的行駛時(shí)間預(yù)測(cè)值。
露天礦卡車多路段行程時(shí)間組合預(yù)測(cè)模型由單元預(yù)測(cè)模型、累加器、速度場(chǎng)組成,其原理如圖1所示。單元預(yù)測(cè)模型負(fù)責(zé)預(yù)測(cè)卡車在每一路段所需的具體時(shí)間。但該時(shí)間受卡車在路段上行駛的平均速度影響,而平均速度同樣為未知數(shù)。這就要求在預(yù)測(cè)卡車行程時(shí)間之前,先估計(jì)卡車在該路段的平均速度。平均速度估計(jì)依賴卡車速度場(chǎng),其可給出該路段任意一點(diǎn)上卡車可能的速度。以該速度為基礎(chǔ),單元預(yù)測(cè)模型可預(yù)測(cè)卡車經(jīng)過該路段所需的時(shí)間。累加器負(fù)責(zé)將每個(gè)單元預(yù)測(cè)模型的預(yù)測(cè)結(jié)果相加,并作為最終預(yù)測(cè)結(jié)果輸出。
圖1 露天礦卡車多路段行程時(shí)間組合預(yù)測(cè)模型原理Fig. 1 Principle of combined prediction model of multi section travel time of truck in open-pit mine
場(chǎng)指物體在空間的分布情況,一般以空間位置函數(shù)表示。本文引入場(chǎng)的概念來表征卡車在整個(gè)礦區(qū)各條道路上的速度分布情況??ㄜ囁俣葓?chǎng)反映了卡車速度與其在道路上具體位置的關(guān)系,卡車在道路上的位置不同,其速度也不同,如圖2所示。其中x,y分別為礦區(qū)二維坐標(biāo),箭頭指向?yàn)榭ㄜ囆羞M(jìn)方向,箭頭長(zhǎng)短表示卡車速度,箭頭越長(zhǎng)則速度越快??煽闯霎?dāng)卡車行駛在右側(cè)路段時(shí),速度始終偏??;當(dāng)卡車駛?cè)胱髠?cè)路段后,速度明顯提升。這也驗(yàn)證了在預(yù)測(cè)卡車行程時(shí)間時(shí),將整個(gè)行程作為研究對(duì)象是不合理的。
圖2 露天礦卡車速度分布Fig. 2 Speed distribution of truck in open-pit mine
速度場(chǎng)可看作典型的二維場(chǎng)模型。二維場(chǎng)模型一般可通過不規(guī)則分布點(diǎn)法、規(guī)則分布點(diǎn)法、矩形區(qū)域法、不規(guī)則三角形法等表征[12]。速度數(shù)據(jù)在空間上均勻分布于各條道路,采用矩形區(qū)域法表征較合理。因此,選擇矩形區(qū)域法表征卡車速度場(chǎng)。將整個(gè)礦山所在區(qū)域離散化為二維網(wǎng)格,將采集到的卡車速度信息映射到對(duì)應(yīng)網(wǎng)格中。每個(gè)網(wǎng)格中的屬性值為該網(wǎng)格中卡車速度平均值。當(dāng)網(wǎng)格中無對(duì)應(yīng)速度信息時(shí),網(wǎng)格屬性值為0。
露天礦卡車速度場(chǎng)如圖3所示。顏色越亮,表示速度越大??煽闯隹ㄜ囋诓煌范紊系乃俣炔煌?,在道路終點(diǎn)、兩側(cè)、交叉口處存在明顯的減速現(xiàn)象。
圖3 露天礦卡車速度場(chǎng)Fig. 3 Truck speed field in open-pit mine
從統(tǒng)計(jì)角度看,卡車行程時(shí)間具有明顯的規(guī)律性。但卡車行程時(shí)間是多因素耦合的結(jié)果[13-15],影響因素大致分為卡車屬性、環(huán)境特征、道路因素3類??ㄜ噷傩灾饕ㄜ囆吞?hào)和載重狀態(tài)。針對(duì)不同的生產(chǎn)需求,露天礦中卡車型號(hào)往往有多種。這些卡車的購(gòu)入時(shí)間、保養(yǎng)狀況、動(dòng)力條件等不盡相同??ㄜ囎鳂I(yè)時(shí)分為空載和重載2種狀態(tài),重載狀態(tài)下卡車行駛速度較慢。環(huán)境特征主要包括氣象條件、晝夜變化等。露天礦卡車在不同季節(jié)的行程時(shí)間不同,晝夜行程時(shí)間也不同。道路因素主要指卡車行駛的路線信息,包括卡車行駛的起點(diǎn)、終點(diǎn)位置及其所經(jīng)過路段的長(zhǎng)度、提升高度等。道路因素是影響卡車行程時(shí)間最重要的因素。道路長(zhǎng)度與提升高度會(huì)極大地影響卡車行程時(shí)間。當(dāng)其他因素不變時(shí),道路越長(zhǎng),提升高度越大,則卡車所需的行程時(shí)間越長(zhǎng)。
卡車在路段上的平均速度影響卡車行程時(shí)間。定義卡車在某路段s上的速度為v(s),則理想狀況下卡車行駛時(shí)間為
卡車速度不同時(shí),其在該路段的行駛時(shí)間不同。
可見,影響卡車行程時(shí)間的主要因素有卡車型號(hào)、卡車載重狀態(tài)、氣象條件、卡車所經(jīng)路段及其在該路段上的平均速度。這些因素有的是連續(xù)量,如道路長(zhǎng)度、提升高度等;有的是離散量,如卡車型號(hào)、氣象條件等。若采用支持向量機(jī)等算法,則需將離散信息量化,不可避免地存在一定程度的主觀性。為了降低量化的主觀性造成的精度損失,采用隨機(jī)森林算法構(gòu)建行程時(shí)間單元預(yù)測(cè)模型[16-18]。隨機(jī)森林算法由多棵決策樹組成。在構(gòu)建決策樹時(shí),從訓(xùn)練數(shù)據(jù)集中有放回地隨機(jī)選取部分樣本,且隨機(jī)選取部分特征進(jìn)行訓(xùn)練。每棵決策樹使用的樣本和特征不同,訓(xùn)練結(jié)果也不同,可避免模型出現(xiàn)過擬合現(xiàn)象。
單元預(yù)測(cè)模型的輸入包括卡車在所經(jīng)過路段上的平均速度及文獻(xiàn)[10]中的輸入量,包括卡車ID、卡車類型、卡車狀態(tài)、路段起點(diǎn)及終點(diǎn)位置、道路信息、氣壓、風(fēng)速、溫度、相對(duì)濕度、行駛時(shí)間等。
卡車在所經(jīng)過路段上的平均速度是卡車行程時(shí)間預(yù)測(cè)的重要參數(shù)。將道路劃分為多個(gè)單一路段后,單元預(yù)測(cè)模型并行計(jì)算每條路段上的卡車行駛時(shí)間??ㄜ囋诓煌范紊系乃俣炔煌?,而速度場(chǎng)只反映道路上各點(diǎn)卡車速度平均值,不是卡車在具體路段的平均速度,因此,對(duì)整條路段上所有點(diǎn)的卡車速度求平均值,將其近似為卡車在該路段的平均速度,即
式中:R為某路段上的所有網(wǎng)格區(qū)域;N為R中網(wǎng)格數(shù);vr為網(wǎng)格r中卡車速度。
卡車不可能經(jīng)過R中所有網(wǎng)格,因此只能近似表示卡車實(shí)際平均速度。本文中單元預(yù)測(cè)模型為隨機(jī)森林算法,其為一種典型的統(tǒng)計(jì)學(xué)習(xí)算法,盡管并不嚴(yán)格等于平均速度,但在統(tǒng)計(jì)意義上依然是一種有效輸入。以作為單元預(yù)測(cè)模型的輸入,能更準(zhǔn)確地預(yù)測(cè)卡車經(jīng)過該路段所需的時(shí)間。
以2019年6-11月華能伊敏煤電有限責(zé)任公司伊敏露天礦卡車調(diào)度系統(tǒng)中220 t卡車1.8萬條行程信息為基礎(chǔ)數(shù)據(jù),將其中1.5萬條數(shù)據(jù)作為訓(xùn)練集,剩余0.3萬條數(shù)據(jù)作為測(cè)試集,研究露天礦卡車多路段行程時(shí)間組合預(yù)測(cè)模型精度。采用隨機(jī)森林?jǐn)M合算法預(yù)測(cè)卡車行駛時(shí)間,以sklearn機(jī)器學(xué)習(xí)庫(kù)中的RandomForestClassifier構(gòu)建預(yù)測(cè)模型。采用分散訓(xùn)練、集中使用策略,先分別訓(xùn)練各路段上的單元預(yù)測(cè)模型,之后利用速度場(chǎng)將各單元預(yù)測(cè)模型整合。
模型輸入變量中,離散量(如設(shè)備型號(hào)、日期、時(shí)間等)可直接輸入模型,連續(xù)量中需要注意的是,道路信息既包括道路水平長(zhǎng)度,也包含豎直方向的提升高度。本文通過計(jì)算道路中心線的方式獲取道路信息。定義某路段上點(diǎn)的集合為P={x0,y0,z0,x1,y1,z1,···,xm,ym,zm},(xi,yi,zi)為 該 路 段 上 第i(i=1,2,…,m)個(gè)點(diǎn)的坐標(biāo),m為該路段上的點(diǎn)數(shù)。則該路段水平長(zhǎng)度為
當(dāng)卡車在該路段上處于上坡行駛時(shí),提升高度為
式中zmax,zmin分別為運(yùn)輸過程中高程最大值與最小值。
當(dāng)卡車處于下坡行駛時(shí),提升高度為
對(duì)于大多數(shù)機(jī)器學(xué)習(xí)算法,需采用梯度下降方法求解最優(yōu)解。為了保證模型有解,同時(shí)提高迭代速度,對(duì)輸入的各連續(xù)變量進(jìn)行歸一化處理。
式中:Xnorm為輸入量歸一化值;X為輸入量;Xmin,Xmax分別為輸入量最小、最大值。
在模型訓(xùn)練過程中,采用窮舉方法,通過在訓(xùn)練集中交叉驗(yàn)證方式尋找決策樹數(shù)量最優(yōu)值(本文為75)。該過程中參數(shù)設(shè)置:弱學(xué)習(xí)器數(shù)量為5~150,搜索步長(zhǎng)為5,交叉驗(yàn)證可迭代次數(shù)為10。
采用測(cè)試集驗(yàn)證模型精度,預(yù)測(cè)結(jié)果與真實(shí)值之間的誤差分布如圖4所示??煽闯鲱A(yù)測(cè)誤差主要集中在0~40 s,90%以上的預(yù)測(cè)誤差小于1 min,1~2 min誤差極少。通過分析誤差來源,發(fā)現(xiàn)誤差較大的行程時(shí)間其對(duì)應(yīng)的路段數(shù)較多。
圖4 組合預(yù)測(cè)模型的預(yù)測(cè)誤差分布Fig. 4 Prediction error distribution of the combined prediction model
采用平均絕對(duì)誤差百分比(Mean Absolute Percentage Error,MAPE)檢驗(yàn)?zāi)P皖A(yù)測(cè)精度[19]。經(jīng)計(jì)算,本文模型對(duì)卡車行程時(shí)間預(yù)測(cè)的MAPE為4.81%。
為了驗(yàn)證本文模型引入速度場(chǎng)及組合預(yù)測(cè)方法的優(yōu)勢(shì),將其與文獻(xiàn)[10]中的行程時(shí)間預(yù)測(cè)模型進(jìn)行對(duì)比?;谙嗤臄?shù)據(jù)集,文獻(xiàn)[10]模型的預(yù)測(cè)誤差分布如圖5所示。經(jīng)計(jì)算,MAPE為7.02%。
圖5 文獻(xiàn)[10]中模型的預(yù)測(cè)誤差分布Fig. 5 Prediction error distribution of the model in reference [10]
對(duì)比圖4、圖5可看出,本文模型所得結(jié)果較文獻(xiàn)[10]方法準(zhǔn)確,在相同的數(shù)據(jù)集下,MAPE降低2%以上。特別是針對(duì)地表維修站-坑下工作面之間幾條較長(zhǎng)的道路,本文模型的預(yù)測(cè)精度優(yōu)勢(shì)更明顯:本文模型預(yù)測(cè)誤差基本不超過120 s,而文獻(xiàn)[10]中模型預(yù)測(cè)誤差為100~215 s。
為了明確預(yù)測(cè)精度提高的原因,選取若干單一路段作為實(shí)驗(yàn)對(duì)象。經(jīng)計(jì)算,在單一路段上,本文模型的MAPE為4.01%,文獻(xiàn)[10]中模型的MAPE為4.33%,二者差別不大。文獻(xiàn)[10]中預(yù)測(cè)模型也是基于隨機(jī)森林算法構(gòu)建的,與本文模型在特征選取及參數(shù)設(shè)置上無太大區(qū)別。不同之處是,本文模型考慮了每一條路段的特殊情況,是一種路段組合模型,且模型充分考慮了卡車在道路上行駛的平均速度。可見,將單一模型進(jìn)行組合可有效提高預(yù)測(cè)精度。
本文模型輸入量包括平均速度,因此在卡車處于任意位置、速度情況下,模型均能預(yù)測(cè)到達(dá)目的地的時(shí)間,即可實(shí)現(xiàn)卡車行駛時(shí)間動(dòng)態(tài)預(yù)測(cè)。實(shí)時(shí)性是動(dòng)態(tài)預(yù)測(cè)的重要指標(biāo)。模型從接收數(shù)據(jù)到輸出預(yù)測(cè)結(jié)果的平均運(yùn)算時(shí)間如圖6所示??煽闯瞿P瓦\(yùn)算時(shí)間不超過1 s,可實(shí)時(shí)預(yù)測(cè)露天礦卡車行程時(shí)間。
圖6 組合預(yù)測(cè)模型運(yùn)算時(shí)間Fig. 6 Operation time of the combined prediction model
(1) 基于速度場(chǎng)的露天礦卡車多路段行程時(shí)間組合預(yù)測(cè)模型具有較高的預(yù)測(cè)精度,其MAPE較文獻(xiàn)[10]中模型降低2%以上。
(2) 針對(duì)單一路段的行程時(shí)間預(yù)測(cè),組合預(yù)測(cè)模型與單一模型相比無太大差別;針對(duì)復(fù)合路段行程時(shí)間預(yù)測(cè),組合預(yù)測(cè)模型預(yù)測(cè)精度較單一模型高。露天礦實(shí)際生產(chǎn)中更多的是由不同行駛條件路段組成的復(fù)合道路,因此組合預(yù)測(cè)模型更適用于露天礦卡車行程時(shí)間預(yù)測(cè)。
(3) 露天礦卡車多路段行程時(shí)間組合預(yù)測(cè)模型中引入速度場(chǎng),以卡車平均速度作為模型輸入量之一,使得卡車行程時(shí)間動(dòng)態(tài)預(yù)測(cè)成為可能。實(shí)驗(yàn)結(jié)果表明,該組合預(yù)測(cè)模型的運(yùn)算時(shí)間不超過1 s,可實(shí)時(shí)預(yù)測(cè)卡車行程時(shí)間。