張志偉 尹文亭 李彥鵬
(1.江西應(yīng)用技術(shù)職業(yè)學(xué)院,江西 贛州 341000;2.吉安職業(yè)技術(shù)學(xué)院,江西 吉安 343000)
目前,國際形勢越來越嚴重,能源問題也越來越突出。煤炭作為國家的重要能源儲備,合理有效地開發(fā)利用煤炭資源具有重要的戰(zhàn)略性意義。但因早期煤炭的過度開采,引起的地表沉陷等問題也變得越來越嚴重,這就要對煤礦地表沉陷問題有足夠的重視。
影響地表變形的因素非常復(fù)雜,如煤炭的地下開采、地質(zhì)條件、地下水的分布情況等都會對地表產(chǎn)生影響,從而造成地表變形。因此,選取合理有效的預(yù)測方法是對地表進行變形預(yù)測的關(guān)鍵?,F(xiàn)階段,關(guān)于煤礦地表變形預(yù)測的模型有很多,但大多數(shù)都不是很理想,有的模型要用到較多的數(shù)據(jù),有的模型誤差比較大,有的模型預(yù)測精度不高。
基于此,本研究將基于基因表達式編程的預(yù)測模型運用到煤礦地表形變中,并對預(yù)測模型進行研究分析,取得了不錯效果。
基因表達式編程(Gene Expression Programming,GEP)是葡萄牙Ferreira博士提出的一種新算法,該算法結(jié)合了GA和GP算法的優(yōu)點,現(xiàn)階段該算法的應(yīng)用范圍非常廣[1]。目前,包括但不限于醫(yī)藥學(xué)、智能化學(xué)、預(yù)測股票、產(chǎn)量評估、災(zāi)害預(yù)測、測繪地理信息、經(jīng)濟趨勢預(yù)測等,GEP都得到了成功的運用,并取得了不錯的效果。但GEP預(yù)測研究模型還未涉及煤礦領(lǐng)域?;诖耍狙芯繉诨虮磉_式編程的預(yù)測模型在煤礦領(lǐng)域中的應(yīng)用進行研究。
基因表達式編程(GEP)是一種比較年輕且高效的新型算法,關(guān)鍵在于其創(chuàng)造性地發(fā)明了能表達任何樹形結(jié)構(gòu)的染色體[2]。
首先,對GEP算法中一系列的基本參數(shù)進行設(shè)置,包括染色體中基因的個數(shù)、基因的長度、各種遺傳算子的參數(shù)值,并通過GEP編程隨機生產(chǎn)一個代表不同個體的初始化種群[3]。然后,利用適應(yīng)度函數(shù)進行評估,判斷其是否滿足結(jié)束條件,如果滿足,輸出最優(yōu)個體。否則,對種群進行重組、移位等。最后,再對新一代種群進行適應(yīng)度評估,不斷重復(fù)上述過程,直到找到全局最優(yōu)解,即問題的最優(yōu)解為止。其流程圖如圖1所示。
圖1 GEP算法基本流程圖
對構(gòu)建一個變形監(jiān)測預(yù)測模型,其數(shù)據(jù)處理是重中之重[4],數(shù)據(jù)的主要處理流程如圖2所示。首先對變形數(shù)據(jù)進行濾波、平穩(wěn)化等數(shù)據(jù)預(yù)處理,處理過的數(shù)據(jù)也就是用于建模的數(shù)據(jù)。緊接著對其執(zhí)行GEP算法,通過設(shè)置參數(shù)對其進行暫停、繼續(xù)等控制操作,從而得到最優(yōu)個體的基因編碼方式。最后將基因編碼轉(zhuǎn)換為對應(yīng)的表達式樹,得到預(yù)測模型的函數(shù)表達式。同時,利用歷史觀測的變形監(jiān)測數(shù)據(jù)對函數(shù)表達式進行分析評價和檢驗,最后輸出結(jié)果。并與其他變形監(jiān)測預(yù)測模型進行比較分析,最后得出結(jié)論。
圖2 GEP變形預(yù)測數(shù)據(jù)流程圖
由于影響煤礦變形的因素復(fù)雜多變,同時還有高頻噪聲,必須對其進行預(yù)處理[5],通過引入了Fibonacci數(shù)列對變形監(jiān)測數(shù)據(jù)進行加權(quán)預(yù)處理。
假如j≤M,hj=Fibo(j)/totalweight,否則hj=0。
其中,totalweight=Fibo(1)+Fibo(2)+…+Fibo(M)。
則線性濾波的輸出見式(1)。
利用GEP進行預(yù)測時,M為窗口寬度w-1。
算法一:Fibonacci加權(quán)預(yù)處理規(guī)范
算法二:傳統(tǒng)的GEP滑動窗口預(yù)測法規(guī)范性
Fibonacci加權(quán)滑動窗口預(yù)測法(FWASWPM)是對上述兩種算法的結(jié)合[6],即變形監(jiān)測數(shù)據(jù)經(jīng)過算法一(Fibonacci加權(quán)預(yù)處理)的處理后,將其得到的預(yù)處理數(shù)據(jù)輸入到算法二(GEP滑動窗口預(yù)測法)中進行GEP的滑動窗口預(yù)測,便可得到一個公式f,用f來預(yù)測未來的平均值,然后將得到的結(jié)果代入到公式(1)中,即可得到預(yù)測值。
王樓煤礦位于山東省濟寧市,南北長11 km,東西寬5~13.5 km,面積約為96.08 km2,其中湖區(qū)面積為52.77 km2、陸地面積為43.31 km2。煤礦區(qū)內(nèi)公路四通八達,濟寧-魚臺公路自井田西部穿過,鄉(xiāng)村級公路連接成網(wǎng),另外在井田東北部有京福和日荷高速公路通過。礦區(qū)地理位置優(yōu)越,交通方便。
受煤礦委托,分別沿煤礦走向、傾向布設(shè)了一條和兩條觀測線,總計埋設(shè)了106個觀測點。從2012年7月2日到2013年12月12日共進行了25次變形觀測,得到原始的變形監(jiān)測數(shù)據(jù),為研究工作提供可靠的基礎(chǔ)數(shù)據(jù)。其中,傾向線一的最大沉陷值是22號點的400 mm,傾向線二的最大下沉值是24號點的369 mm,走向線三的最大下沉值12號點的407 mm。本研究選擇下沉值最大的走向線三12號點為研究對象,其他各點利用類似方法進行預(yù)測分析。其中,垂直位移用的是S2型水準儀,平面位置變形觀測采用尼康2″級830型全站儀。
2.2.1 數(shù)據(jù)處理。對數(shù)據(jù)的處理是能否建模成功的關(guān)鍵[7],本研究利用Fibonacci數(shù)列對變形監(jiān)測數(shù)據(jù)進行加權(quán)預(yù)處理。其中,用于建模的數(shù)據(jù)是觀測點變形最大的12號點,總計25期的原始觀測數(shù)據(jù)。利用前20期數(shù)據(jù)進行建模,后面5期進行模型精度檢驗,如表1所示。
表1 原始觀測數(shù)據(jù)
2.2.2 種群的初始化。模型必須有一定數(shù)量的初始化種群,種群的初始化實際上是確定GEP中的函數(shù)集合(F)和終結(jié)符集合(T)[8],一旦得到來自F和T的符號,就可隨機產(chǎn)生初始種群的染色體。即基因的頭部可用F和T中的元素,而基因的尾部則只能使用終點符號[9]。本研究選取的函數(shù)集合(F)為基本的數(shù)學(xué)函數(shù){+,-,×,/,sqrt,exp,sin,cos},設(shè)定終結(jié)符集合(T)為滑動窗口大小一致的五個數(shù)據(jù)組成,分別用來表示。確定了函數(shù)集合和終結(jié)符集合后,染色體結(jié)構(gòu)可使用函數(shù)集和終點集的符號隨機產(chǎn)生,不用其他東西來監(jiān)控結(jié)構(gòu)的完整性。由此,完成了種群初始化的工作。
2.2.3 GEP各種參數(shù)設(shè)置。在預(yù)測模型建立前,要對初始化種群進行一系列的遺傳操作[10],這就要求必須對遺傳操作的各種參數(shù)進行有效的設(shè)置,從而能更快、更精確地得到預(yù)測模型的函數(shù)表達式,建立準確的變形監(jiān)測預(yù)測模型。本研究設(shè)置的遺傳基本參數(shù)見表2。
表2 遺傳操作參數(shù)設(shè)置
2.2.4 適應(yīng)度函數(shù)。適應(yīng)度函數(shù)的選取至關(guān)重要[11],本研究選取的適應(yīng)度函數(shù)見式(2)。
式中:f為適應(yīng)度函數(shù);yj為觀測數(shù)據(jù);yj'為利用表達式得到的yj的估計值。
2.2.5 預(yù)測函數(shù)模型發(fā)現(xiàn)?;诖?,本研究利用C#語言進行編程,并對建模的前20期數(shù)據(jù)進行種群初始化,在此基礎(chǔ)上進行一系列的遺傳操作[12],然后對其進行適應(yīng)度評價,選出優(yōu)勢個體繼續(xù)進行適應(yīng)度函數(shù)值比較,直到得到最優(yōu)個體,從而得到預(yù)測模型的函數(shù)形式,然后利用最后五期的數(shù)據(jù)對模型的準確度進行檢驗、評價,得到最終的變形監(jiān)測預(yù)測模型。本研究建立的基于GEP的煤礦地表變形預(yù)測模型的窗口應(yīng)用程序如圖3所示。
圖3 預(yù)測模型窗口設(shè)計
利用建立的模型對后五期變形值的預(yù)測步驟如下[13]。先利用第十六到第二十期的數(shù)據(jù)分別代表從而預(yù)測出第二十一期的數(shù)據(jù)值,利用第十七到二十一期數(shù)據(jù)預(yù)測第二十二期數(shù)據(jù),依次類推,最后得到基于GEP的預(yù)測模型后五期的預(yù)測值如表3所示。
表3 GEP預(yù)測模型數(shù)據(jù)對比表
為了能更好地檢驗其預(yù)測的精確度、準確度,對后五期預(yù)測值的絕對誤差和相對誤差進行計算,如表4所示。
表4 GEP預(yù)測模型后五期預(yù)測值和誤差
結(jié)合表4,得到基于GEP的煤礦地表預(yù)測模型預(yù)測值和實際值的對比圖,如圖5所示。其預(yù)測值在實際值附近波動,由此能更好地對煤礦地表變形進行預(yù)測分析。
圖5 GEP預(yù)測模型變形預(yù)測對比圖
綜上所述,在基于煤礦地表變形數(shù)據(jù)有限的基礎(chǔ)上,利用GEP進行變形預(yù)測是可靠的,GEP的一個優(yōu)勢是能采用較小的種群規(guī)模去解決較為復(fù)雜的問題,且其預(yù)測的數(shù)值在實際觀測值上下浮動,具有一定的可靠性。
本研究針對煤礦地表變形數(shù)據(jù)具有高頻噪聲的特點,利用Fibonacci加權(quán)滑動窗口預(yù)測法對其進行預(yù)處理,結(jié)合GEP編程的優(yōu)點,建立基于基因表達式編程的煤礦地表預(yù)測模型,并對最后5期的數(shù)據(jù)進行預(yù)測分析,取得了較好的效果,說明預(yù)測模型具有較好的可靠性,為煤礦地表的變形預(yù)測提供一個較好的方法。