国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于非線性自回歸模型的礦井粉塵濃度預(yù)測

2021-10-26 04:52:46周旭王藝博朱毅秦思佳
關(guān)鍵詞:粉塵神經(jīng)網(wǎng)絡(luò)誤差

周旭,王藝博,朱毅,秦思佳

(1.華北理工大學 理學院,河北 唐山 063210;2.華北理工大學 以升創(chuàng)新教育基地,河北 唐山 063210)

引言

煤炭在我國能源結(jié)構(gòu)中占有著絕對重要的地位,在工業(yè)化建設(shè)初期曾占到能源結(jié)構(gòu)總量的90%。隨著近幾十年來對油田的開采,煤炭在能源結(jié)構(gòu)中的占比才有了一定程度的下降,但仍在能源結(jié)構(gòu)中占有主要地位??梢灶A(yù)見,煤炭工業(yè)在國家能源結(jié)構(gòu)以及國民基礎(chǔ)經(jīng)濟中的地位是不可代替的,具有長期性和穩(wěn)固性。隨著煤礦機械化水平的提高,礦井粉塵不斷增加。在礦井事故中,大多數(shù)事故都與礦井中的粉塵濃度有關(guān)。礦井粉塵不僅會危害地下工人的身體,而且當粉塵達到一定濃度時會引起爆炸,甚至會造成更嚴重的地下災(zāi)害[1]。因此,礦井防塵工作越來越重要,準確預(yù)測礦塵濃度對礦井安全生產(chǎn)具有重要意義。

相關(guān)文獻表明,學者們主要采用神經(jīng)網(wǎng)絡(luò)模型對粉塵濃度進行預(yù)測,如:改進的神經(jīng)網(wǎng)絡(luò)模型[2]、BP神經(jīng)網(wǎng)絡(luò)模型[3]、熵權(quán)法RBF神經(jīng)網(wǎng)絡(luò)[4]。王永斌等[5]建立的灰色-廣義回歸神經(jīng)網(wǎng)絡(luò)組合模型以及基于費舍爾得分和支持順序前向搜索算法[6]的支持向量積模型,研究該模型對塵肺病預(yù)測的準確性。上述模型雖然在傳統(tǒng)的擬合預(yù)測領(lǐng)域中表現(xiàn)出了較高的擬合度與準確性,但由于模型中存在的遺忘機制,導致其對具有時序特征數(shù)據(jù)的預(yù)測會有一定的偏差。因此,結(jié)合神經(jīng)網(wǎng)絡(luò)模型的預(yù)測能力,以及時間序列模型對時序型數(shù)據(jù)的處理能力,構(gòu)建模型對礦井粉塵濃度進行預(yù)測無疑是一種有效的預(yù)測方法。但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,在數(shù)據(jù)量較小,且樣本數(shù)據(jù)受到多方面因素影響時,很難展現(xiàn)出良好的性能。而傳統(tǒng)的時間序列模型,雖然對時間變量作為自變量的數(shù)據(jù)樣本具有良好的擬合效果,但是在進行預(yù)測時,只能做到短期的預(yù)測,且誤差急速增長。

為了解決這些問題,該項研究融合時間序列與神經(jīng)網(wǎng)絡(luò)的模型,提出一種非線性自回歸的礦井粉塵濃度預(yù)測模型,多重考慮了變量時間因素以及模型輸出結(jié)果對模型本身的影響。

1模型理論基礎(chǔ)

1.1 時間序列

時間序列的建模及預(yù)測在學術(shù)界和實際應(yīng)用領(lǐng)域極為普遍,如城市交通量、人口增長量、股市價格、國民收入、太陽黑子數(shù)等預(yù)測問題[7]。自1970年問世以來,逐漸形成了一整套時間序列識別、估計、建模、預(yù)測及控制的理論和方法。以Box-Jenkins為代表的現(xiàn)代時間序列預(yù)測方法建立在隨機過程理論基礎(chǔ)上,具有結(jié)構(gòu)簡單、建模速度快、預(yù)測精度高等優(yōu)點,并且解決了非平穩(wěn)序列時間序列的處理問題,非常適合現(xiàn)實生活中各類隨機性強的時間序列的分析和預(yù)測[7]。

一般來說,建立ARIMA模型有3個階段,分別是模型識別和定階、參數(shù)估計和模型檢驗。其中模型識別指在繪出時序圖后,判斷所需差分階數(shù),并由ACF與PACF圖判斷 與 的取值,其原始時間序列模型為:

(1)

其中L為y的滯后算子,其滿足:

(2)

模型檢驗指根據(jù)所計算得到的模型殘差值對其進行檢驗,判斷模型反應(yīng)序列變化的完整性。

1.2 神經(jīng)網(wǎng)絡(luò)理論基礎(chǔ)

神經(jīng)網(wǎng)絡(luò)法的學習和訓練過程包括正向傳播和反向傳播2個階段。在正向傳播過程中,樣本數(shù)據(jù)通過隱藏層的傳遞函數(shù)從輸入層傳遞到輸出層[8]。如果輸出層沒有得到所需的輸出,則進入反向傳播過程,沿原正向傳播路徑返回誤差信號,采用均方誤差和梯度下降法修改網(wǎng)絡(luò)連接權(quán)重,調(diào)整網(wǎng)絡(luò)實際輸出與引導學習信號之間的均方誤差值。重復(fù)此過程,直到達到指定的錯誤要求或達到最大培訓次數(shù)為止。圖1所示為神經(jīng)網(wǎng)絡(luò)模型的基本原理。

圖1 神經(jīng)網(wǎng)絡(luò)原理圖

考慮到變量與樣本在訓練過程中所受到的綜合影響因素,輸入集數(shù)據(jù)不單會受到觀測值變量的影響,還會在一定程度上受到輸出數(shù)據(jù)的影響,因此需要在輸入與輸出數(shù)據(jù)之間建立影響選用外因(外部)輸入非線性自回歸NARX模型對數(shù)據(jù)集進行處理。

2基于時間序列神經(jīng)網(wǎng)絡(luò)模型對礦井中粉塵濃度的預(yù)測

2.1 原始數(shù)據(jù)準備與處理

以某礦5424工作面粉塵濃度為原始數(shù)據(jù)來源[9],通過采集篩選時間在某日9:31~10:17之間的47組數(shù)據(jù),建立合適的時間序列神經(jīng)網(wǎng)絡(luò)模型,在模型檢驗通過后,將其用于預(yù)測10:18至10:21這4個時間點的粉塵濃度,進而驗證模型的適用性。表1所示為工作面在篩選時間內(nèi)的對應(yīng)粉塵濃度。

表1 原始數(shù)據(jù)

將表1中的時間與其所對應(yīng)的粉塵濃度導入SPSS后,將其對應(yīng)時間的變量進行初始化,得到定義出的時間變量并將其繪制成如圖2所示時序圖:

圖2 粉塵濃度時序圖

從圖2中所反映的粉塵濃度變化趨勢來看,時間因素在粉塵濃度變化的影響因素中占有極大的權(quán)重,且其濃度變化趨勢與時間變量的關(guān)系并非簡單的線性關(guān)系,因此采用神經(jīng)網(wǎng)絡(luò)模型對此變量進行預(yù)測。

2.2 時間序列神經(jīng)網(wǎng)絡(luò)模型的建立

(1)隱藏層層數(shù)的確定

隱藏層負責處理輸入特征的信息,具有一個隱含層的網(wǎng)絡(luò)可被稱之為單隱含層網(wǎng)絡(luò),具有兩個及以上隱藏層的網(wǎng)絡(luò)可被稱之為多隱含層網(wǎng)絡(luò),用于解決復(fù)雜問題。網(wǎng)絡(luò)層數(shù)增多,會提升運算的精度[10]。但模型的復(fù)雜程度也隨之提升,且過擬合風險也會變大。若為簡單問題,一般選取單隱含層網(wǎng)絡(luò),對于復(fù)雜問題一般可設(shè)置多層網(wǎng)絡(luò)??紤]到實際數(shù)據(jù)樣本量較少,不易發(fā)生過擬合的現(xiàn)象,并為了提高模型預(yù)測結(jié)果的擬合度,該項研究選擇10層網(wǎng)絡(luò)以及2個延時來構(gòu)建模型。

(2)激活函數(shù)的選擇

由于神經(jīng)網(wǎng)絡(luò)能夠不斷學習的本質(zhì)就是在接收不斷訓練誤差的反饋中,來優(yōu)化自身的模型參數(shù)。其中,當前層的誤差大小與激活函數(shù)的選擇有著密切關(guān)系[11]。由于sigmoid 函數(shù)與tanh函數(shù)的導數(shù)值均不大于1,在迭代的過程中必然會出現(xiàn)梯度消失的情況,導致訓練提前終止。而ReLU函數(shù)則可以很好地避免這一現(xiàn)象的發(fā)生,只要采用其導數(shù)值為1的神經(jīng)元進行學習,就能有效地規(guī)避梯度消失的問題,因此選用ReLU函數(shù)作為該研究模型的激活函數(shù)。

(3)訓練算法的選取

在神經(jīng)網(wǎng)絡(luò)訓練的過程中,選用Levenberg-Marquardt、貝葉斯正則化和量化共軛梯度3種算法進行訓練。對于大多數(shù)問題,推薦使用Levenberg-Marquardt,對于一些含噪聲小的問題,貝葉斯正則化雖然需要更長的時間,但能獲得更好的解。對于數(shù)據(jù)量比較大的問題,選取量化共軛梯度。因為它使用的梯度計算比其他2種算法使用的Jacobian矩陣計算更節(jié)省內(nèi)存。由于該項目所使用的數(shù)據(jù)樣本較少,不易出現(xiàn)過擬合的現(xiàn)象,同時也不會花費過多的訓練時間。因此,為了追求更高的擬合度,該研究使用的是貝葉斯正則化的訓練方式。

2.3 模型檢驗

2.3.1誤差自相關(guān)檢驗

誤差自相關(guān)是對誤差(觀測值與預(yù)測值的差值)進行自相關(guān)計算,通過觀察誤差自相關(guān)曲線可以判斷預(yù)測模型是否能夠準確預(yù)測結(jié)果的趨勢性、季節(jié)性、隨機性。誤差自相關(guān)是一個檢測性的指標,需要在預(yù)測模型構(gòu)建并計算出預(yù)測值后計算來對其進行評估。對于完美模型,自相關(guān)函數(shù)只有一個非零值,并在零滯后時出現(xiàn)。如果預(yù)測誤差中存在顯著相關(guān)關(guān)系,則需對預(yù)測結(jié)果進行改進,誤差自相關(guān)系數(shù)的計算公式如下:

(3)

圖3是該項研究模型成果所表現(xiàn)出來的誤差自相關(guān)系數(shù):

圖3 誤差自相關(guān)

由圖3所示的誤差自相關(guān)系數(shù)可以看出,除了零滯后時的1以外,其余區(qū)間的模型置信度均在置信區(qū)間內(nèi),因此模型看上去是足夠的。

2.3.2輸入-誤差互相關(guān)函數(shù)

輸入-誤差互相關(guān)函數(shù)說明誤差如何與輸入序列 相關(guān)。對于完美的預(yù)測模型,所有相關(guān)性都應(yīng)為零。如果輸入與誤差相關(guān),則應(yīng)該可以改進預(yù)測,這可以通過增加抽頭延遲線中的延遲數(shù)量來實現(xiàn)。在這種情況下,所有相關(guān)性都在零附近的置信邊界范圍內(nèi)。圖4是該項研究模型成果所表現(xiàn)出來的輸入-誤差互相關(guān)函數(shù)。

圖4 輸入-誤差互相關(guān)函數(shù)

由圖4可以看出,該項研究的模型結(jié)果中的輸入-誤差互相關(guān)函數(shù)的相關(guān)性,均在極大程度上收斂于零附近的置信邊界范圍內(nèi),因此可以證明該項研究的預(yù)測模型具有良好的預(yù)測效果。

2.3.3綜合檢驗指標分析

圖5所示為模型在迭代過程中,預(yù)測結(jié)果與真實結(jié)果間均化誤差的變化。

圖5 模型均化誤差

均化誤差是指擬合結(jié)果的總誤差值與擬合樣本數(shù)的比值,代表的是預(yù)測結(jié)果的整體誤差偏移;平穩(wěn)R方指的是模型能解釋因變量變化的百分比例,它表示的是預(yù)測模型與原數(shù)據(jù)樣本的擬合程度[12]。由圖中數(shù)據(jù)可知,所得到的預(yù)測函數(shù),其均化誤差達到了2.204 6的程度,等同于模型的誤差在10%以內(nèi),同時不論是訓練集還是測試集函數(shù)的平穩(wěn)R方均在0.9以上,神經(jīng)網(wǎng)絡(luò)模型集和采用數(shù)據(jù)集的回歸結(jié)果都在擬合曲線上,這表明該模型具有很好的擬合性。

2.4 模型預(yù)測

圖6 所示為實際粉塵濃度以及TN預(yù)測模型對粉塵濃度的預(yù)測結(jié)果。

圖6 擬合圖像

利用模型對9:31至10:17期間的粉塵濃度進行擬合后,對10:18至10:21這3個時間點的粉塵濃度進行預(yù)測,預(yù)測結(jié)果如表2所示。

表2 模型預(yù)測結(jié)果

由表2可知,建立的時間序列神經(jīng)網(wǎng)絡(luò)模型對10:18至10:21的粉塵濃度預(yù)測結(jié)果呈下降趨勢,這與所測得的實際值相符。同時,在之后的預(yù)測結(jié)果中,預(yù)測結(jié)果的誤差值波動較小,因此該模型對粉塵濃度的長期預(yù)測具有一定可行性。

3模型對比

由于該模型是基于時間序列模型和神經(jīng)網(wǎng)絡(luò)模型所衍生出來的復(fù)合模型,因此在得出模型結(jié)果時,需對傳統(tǒng)的模型預(yù)測結(jié)果進行比對分析,以確定復(fù)合模型是否具有良好的擬合性能和泛化性能[13]。圖7所示為3種不同模型與原數(shù)據(jù)的擬合圖像對比圖。

圖7 擬合圖像對比圖

其中,3個模型擬合綜合結(jié)果的評價如表3所示。

表3 3個模型擬合結(jié)果的比對

由表3中的對比結(jié)果可以看出,外因輸入非線性自回歸模型(NARX模型)無論是在誤差率還是預(yù)測函數(shù)的擬合效果上都要優(yōu)于傳統(tǒng)的2個模型。因此,相較于傳統(tǒng)的2個模型,NARX模型能夠更好地擬合樣本數(shù)據(jù)的變化。

4結(jié)論

(1)由于影響礦井中粉塵濃度的因素較多,且實際情況更為復(fù)雜,因此僅時間變量作為單變量來對粉塵濃度進行預(yù)測,雖然預(yù)測結(jié)果的置信度符合要求,但預(yù)測結(jié)果僅具有參考性。

(2)在使用普通的BP神經(jīng)網(wǎng)絡(luò)對粉塵濃度進行預(yù)測時,由于其前饋的參量只有誤差,很難反映輸出結(jié)果對輸入數(shù)據(jù)本身的影響。因此采用外因(外部)輸入非線性自回歸模型來對粉塵濃度進行預(yù)測,其預(yù)測誤差率降至3.8%。

(3)外因輸入非線性自回歸模型(NARX模型)在對礦井內(nèi)粉塵濃度的預(yù)測上,同時繼承了時間序列模型對原數(shù)據(jù)的良好擬合度,以及神經(jīng)網(wǎng)絡(luò)模型較好的預(yù)測能力,并在原有基礎(chǔ)上降低了一定預(yù)測時間內(nèi)的整體誤差,具有優(yōu)越的擬合預(yù)測效果與泛化性能。

猜你喜歡
粉塵神經(jīng)網(wǎng)絡(luò)誤差
高壓粉塵防爆電機過厚粉塵層的形成與分析
防爆電機(2021年6期)2022-01-17 02:40:28
角接觸球軸承接觸角誤差控制
哈爾濱軸承(2020年2期)2020-11-06 09:22:26
Beidou, le système de navigation par satellite compatible et interopérable
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
粉塵大戰(zhàn)
壓力容器制造誤差探究
光散射法粉塵儀在超低排放的應(yīng)用
基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
九十億分之一的“生死”誤差
山東青年(2016年2期)2016-02-28 14:25:41
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
永登县| 文成县| 瑞金市| 岑溪市| 五莲县| 南召县| 烟台市| 大丰市| 纳雍县| 郧西县| 凤台县| 南召县| 通海县| 苏尼特右旗| 华坪县| 晋江市| 大悟县| 毕节市| 蓬安县| 孝感市| 永兴县| 手游| 剑河县| 甘谷县| 松桃| 西吉县| 观塘区| 新乐市| 柳江县| 山东省| 西贡区| 蚌埠市| 独山县| 五台县| 井研县| 大名县| 琼海市| 昌江| 徐水县| 赤峰市| 永平县|