姚 輝,張潤畦,蔣知廷,劉 鑫
(華北科技學(xué)院 河北省礦井災(zāi)害防治重點(diǎn)實(shí)驗(yàn)室,北京 東燕郊 065201)
礦井涌水量是在礦井建設(shè)和開采過程中,單位時(shí)間內(nèi)通過各種途徑涌入井巷的水量[1],其指標(biāo)大小是制定合理開采方案、選用合理排放水設(shè)施的依據(jù)[2]。如果短時(shí)間內(nèi)礦井涌水量超出礦井排放水設(shè)施負(fù)荷,將會導(dǎo)致煤礦透水事故的發(fā)生,造成人員傷亡和財(cái)產(chǎn)損失。因此,對礦井涌水量的預(yù)測將直接影響到礦井建設(shè)安全。
隨著生產(chǎn)技術(shù)的飛速發(fā)展,涌水量預(yù)測方法也在進(jìn)行著革新。從傳統(tǒng)意義上純粹的利用數(shù)學(xué)公式進(jìn)行推導(dǎo)——大井法及水文地質(zhì)比擬法,到后來融入了計(jì)算機(jī)模擬技術(shù)的數(shù)值法,再到現(xiàn)在融合了數(shù)理統(tǒng)計(jì)及計(jì)算機(jī)分析的各種不確定性分析方法的提出——BP神經(jīng)網(wǎng)絡(luò)[3]、灰色系統(tǒng)理論[4],預(yù)測方法呈現(xiàn)形式多樣化的變化趨勢。但綜合來看,礦井涌水量是受各種因素共同影響的結(jié)果,拋開礦井現(xiàn)有生產(chǎn)資料所造成的影響去進(jìn)行涌水量分析顯然過于片面,預(yù)測精度會降低很多[5]。
本文以時(shí)間序列季節(jié)加法模型為基礎(chǔ),以河南某礦近20年月度平均涌水量數(shù)據(jù)為研究對象,綜合考慮上述分析方法中未曾考慮到的季節(jié)因素及不確定性因素,建立起涌水量預(yù)測模型,以期實(shí)現(xiàn)礦井涌水量預(yù)測精度的提升。
時(shí)間序列是研究對象中某一變量按照時(shí)間排序形成的數(shù)值序列。通過對變量在一定時(shí)期內(nèi)的變化過程進(jìn)行研究,可以得到該研究對象的演變規(guī)律及趨勢,從而預(yù)測其未來走向[6,7]。
自回歸移動(dòng)平均模型(ARIMA)是自回歸模型(AR)及移動(dòng)平均模型(MA)的綜合形式[8],通過差分手段,將非平穩(wěn)時(shí)間序列準(zhǔn)平穩(wěn)化后再建立起ARIMA(p,d,q)模型[9]。其中p為自回歸階數(shù),d為序列平穩(wěn)化所采用的差分階數(shù),q為移動(dòng)平均階數(shù)。
當(dāng)p,d,q已知時(shí),ARIMA的數(shù)學(xué)表示形式[10]為
(1)
式中,yt為t時(shí)刻y的預(yù)測值;φ為自回歸系數(shù);θ為移動(dòng)平均系數(shù);μ為常數(shù);ζ為t時(shí)刻的誤差。
一般來講,時(shí)間序列有4種主要影響因素分別是:Tt,長期趨勢,表示序列值隨時(shí)間變化所展現(xiàn)的長期發(fā)展趨勢;St,季節(jié)趨勢,表示因季節(jié)性因素而呈現(xiàn)的規(guī)律性變化;Ct,循環(huán)趨勢,表示序列值循環(huán)變動(dòng);It,不規(guī)則變動(dòng),表示剔除其他因素后剩余的隨機(jī)波動(dòng)[11,12]。
其數(shù)學(xué)表達(dá)式為
yt=f(Tt,St,Ct,It)
(2)
f函數(shù)表示模型的加法和乘法運(yùn)算。
選取河南某煤礦2000年~2020年的月度涌水量數(shù)據(jù),將2000年~2019年的數(shù)據(jù)作為分析處理數(shù)據(jù),將2020上半年的數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù)。
原始數(shù)據(jù)如表1所示。
表1 某礦近20年月度涌水量數(shù)據(jù)統(tǒng)計(jì)表
續(xù)表
表2 某礦近20年月度涌水量數(shù)據(jù)統(tǒng)計(jì)表
利用SPSS軟件做出涌水量時(shí)間序列圖如圖1所示。
圖1 涌水量時(shí)間序列圖
由圖1可以看出涌水量的月度平均值波動(dòng)較大,為非平穩(wěn)序列。需要對其進(jìn)行一階差分處理使其平穩(wěn)化;波動(dòng)幅度隨時(shí)間變化并無逐漸增大或減小的趨勢,因此選用加法模型。
經(jīng)一階差分過的數(shù)據(jù)如圖2所示。
圖2 一階差分后的涌水量時(shí)間序列圖
可以看出,在經(jīng)過一階差分以后,涌水量數(shù)據(jù)基本呈平穩(wěn)化發(fā)展趨勢。檢測數(shù)據(jù)平穩(wěn)化一般常用的方法是單位根檢驗(yàn)[13],即ADF檢驗(yàn)。利用Eviews軟件完成一階差分序列的單位根檢驗(yàn)。單位根檢驗(yàn)結(jié)果如表2所示。
得到的顯著性檢驗(yàn)值t值為-18.13316,小于1%、5%、10%水平的臨界值,且得到的概率值p=0。證明一階差分序列為平穩(wěn)序列。
表3 ADF檢驗(yàn)水平對應(yīng)表
經(jīng)過平穩(wěn)性檢驗(yàn)后,通過對p值和q值的多次設(shè)定,最終確定ARIMA(1,1,1)模型擬合效果較好,殘差檢驗(yàn)結(jié)果如圖3所示。結(jié)果表明,殘差序列通過了白噪聲檢驗(yàn),模型已經(jīng)得到了較好的擬合[14]。
根據(jù)擬合結(jié)果,確定自回歸系數(shù)φ為0.68;移動(dòng)平均系數(shù)θ為0.673,常數(shù)為48.633。由此建立不考慮相關(guān)因素的傳統(tǒng)ARIMA模型:
yt=0.68yt-1+0.673ζt-1+48.633
(3)
預(yù)測結(jié)果與實(shí)測數(shù)據(jù)擬合曲線如圖4所示,其中日期為從2000年1月開始計(jì)數(shù)的月數(shù)。
由擬合圖可以看出,在前半段數(shù)據(jù)波動(dòng)較為強(qiáng)烈時(shí),擬合結(jié)果較好,當(dāng)后半段數(shù)據(jù)變化轉(zhuǎn)為平緩時(shí),擬合曲線與實(shí)測曲線有較大差距,且在一段時(shí)間內(nèi)的數(shù)據(jù)波峰及谷底表現(xiàn)尤為明顯。
礦區(qū)資料顯示,大氣降水為礦區(qū)主要充水水源,且考慮到涌水量大小是多種因素共同影響的結(jié)果,因此有必要考慮其他因素,建立季節(jié)分解加法模型,以提高預(yù)測精度。
2.2.1 趨勢—循環(huán)因子(T-C)提取
考慮到涌水量的長期變化趨勢恰恰是一種以年份為單位的循環(huán),且在所選取數(shù)據(jù)年限跨度長的情況下,忽略短期波動(dòng),直接將趨勢因子和循環(huán)因子合并為一項(xiàng)提取,進(jìn)行長期預(yù)測。
季節(jié)變動(dòng)和隨機(jī)變動(dòng)通過移動(dòng)平均法予以消除[15]??紤]到本文是以月度涌水量數(shù)據(jù)進(jìn)行統(tǒng)計(jì),以季節(jié)為移動(dòng)區(qū)間,因此選用跨度N=3進(jìn)行相加平均。得到的數(shù)據(jù)既通過移動(dòng)消除了季節(jié)的影響,又通過平均消除了隨機(jī)誤差的影響。而為了提升預(yù)測精度,需要對得到的數(shù)據(jù)再進(jìn)行多次循環(huán)移動(dòng)平均。經(jīng)過多次實(shí)驗(yàn)后,發(fā)現(xiàn)進(jìn)行7次移動(dòng)平均后的數(shù)據(jù)和原始數(shù)據(jù)擬合效果較好。
觀察到原始數(shù)據(jù)有較多峰值波動(dòng),因此選用傅里葉公式進(jìn)行擬合;利用Matlab軟件完成對擬合曲線的參數(shù)計(jì)算。
趨勢—循環(huán)預(yù)測方程為:
(4)
式中,x為從2000年1月開始算起的月數(shù)。
第7次移動(dòng)平均線及擬合曲線對比圖如圖5所示。
2.2.2 季節(jié)指數(shù)(S)提取
利用SPSS軟件,以12為周期長度進(jìn)行季節(jié)性分解。所得季節(jié)因子為:1.976、3.880、2.307、7.288、1.731、-6.324、3.816、-4.254、-4.954、-6.853、1.334、0.053。從2000年1月開始,以一個(gè)月為單位,以12為周期長度進(jìn)行循環(huán),獲得研究時(shí)段內(nèi)每月所對應(yīng)的季節(jié)指數(shù)。
2.2.3 隨機(jī)變動(dòng)(I)的提取
提取完趨勢因子、循環(huán)因子以及季節(jié)因子后,通過式2得到隨機(jī)變動(dòng)因子。
隨機(jī)變動(dòng)的趨勢圖如圖6所示。
圖3 殘差檢驗(yàn)結(jié)果
圖4 實(shí)測數(shù)據(jù)與預(yù)測數(shù)據(jù)對比圖
圖5 第七次移動(dòng)平均線及擬合曲線對比圖
可以看出,月度涌水量的變化集中在[-50,50]區(qū)間內(nèi),利用Excel軟件的隨機(jī)函數(shù)功能來實(shí)現(xiàn)隨機(jī)波動(dòng)的模擬預(yù)測。
具體代碼為“=RAND*100-50”
2.2.4 重新建立回歸模型
將上述提取出的趨勢-循環(huán)因子、季節(jié)指數(shù)和隨機(jī)變動(dòng)歸類整理相加,重新建立起工作面涌水量的預(yù)測模型,其數(shù)學(xué)模型表現(xiàn)形式為:
(5)
式中,Yt為涌水量預(yù)測值,x為從2000年1月開始算起的月數(shù),St為所對應(yīng)的季節(jié)指數(shù),It為通過函數(shù)所隨機(jī)生產(chǎn)的波動(dòng)值。
分別用傳統(tǒng)的ARIMA模型和季節(jié)分解加法模型對2020年上半年6組數(shù)據(jù)進(jìn)行預(yù)測,結(jié)果見表4。
表4 傳統(tǒng)模型與季節(jié)分解加法模型預(yù)測結(jié)果對比圖
結(jié)果表明,利用傳統(tǒng)的ARIMA模型對礦區(qū)2020年上半年涌水量進(jìn)行預(yù)測,預(yù)測結(jié)果的相對誤差基本在13%~15%范圍內(nèi),誤差較大,而通過對ARIMA模型實(shí)現(xiàn)季節(jié)分解后再預(yù)測,預(yù)測結(jié)果的相對誤差控制在0~2%范圍內(nèi),預(yù)測精度有了大幅度提高。
(1) 利用傳統(tǒng)的ARIMA模型對某礦明顯具有季節(jié)特征的涌水量進(jìn)行預(yù)測,預(yù)測誤差較大,在對模型進(jìn)行分解提取出趨勢—循環(huán)因子、季節(jié)指數(shù)和隨機(jī)變動(dòng)后,重新建立起預(yù)測模型,預(yù)測精度有了大幅度提升,基本實(shí)現(xiàn)無偏差預(yù)測,為煤礦防治水工作中的涌水量預(yù)測難題提供了新的方案和思路。
(2) 在對涌水量信息進(jìn)行多因素分解后預(yù)測結(jié)果的精度提升表明:在諸如突水危險(xiǎn)性評價(jià)、危險(xiǎn)系數(shù)確定等煤礦定量化作業(yè)過程中應(yīng)當(dāng)綜合考慮多因素多變量的影響。
(3) 在數(shù)據(jù)的平穩(wěn)化處理過程中,需要考慮到極端數(shù)據(jù)的影響情況,因此,在模型的后續(xù)完善工作中,可以考慮將濾波算法加入到模型中來,排除不良數(shù)據(jù)的干擾。