国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于邏輯回歸模型的瓦斯?jié)舛犬惓V禉z測與預警*

2020-08-05 14:17廖英雷
陜西煤炭 2020年4期
關鍵詞:瓦斯閾值工作面

廖英雷

(西安科技大學 計算機科學與技術學院,陜西 西安 710054)

0 引言

2019年上半年全國煤礦企業(yè)共發(fā)生事故67起,其中因瓦斯事故死亡人數(shù)占比42%,可見瓦斯事故是煤炭安全生產(chǎn)的最大威脅[1]。通過對瓦斯數(shù)據(jù)的監(jiān)測和異常數(shù)據(jù)的檢測來預警危險,對煤礦的安全生產(chǎn)有重大意義。煤炭的采出必然破壞巖層的原始平衡狀態(tài)而引起巖層運動,從而導致瓦斯涌出或突出,為生產(chǎn)帶來風險[2]。在煤層產(chǎn)狀不穩(wěn)定的條件下,瓦斯突出點主要分布在煤層應力較集中且應力梯度變化較大部位[3]。工作面采掘機的工作會改變煤層的應力,從而導致瓦斯突出,在通風不變的情況下,隨著時間增加瓦斯?jié)舛纫搽S之增加,會帶來瓦斯?jié)舛瘸薜娘L險。目前瓦斯傳感器主要采用頻率信號傳輸,僅能輸出單一數(shù)據(jù)信息,無法掌握更多的運行信息。當傳感器監(jiān)測值異常時,只能依靠人工推斷傳感器運行狀態(tài)[4]。

隨著國內(nèi)外學者專家對煤礦開采的瓦斯?jié)舛葦?shù)據(jù)分析,對數(shù)據(jù)的不確定性進行深入研究,發(fā)現(xiàn)井下瓦斯數(shù)據(jù)的變化深刻影響煤礦生產(chǎn)安全。周鑫[5]研究了基于分類的時間序列異常檢測方法及特征屬性降維方法,并應用于礦井瓦斯異常檢測;彭泓[6]等采用再生核算法來進行RBF神經(jīng)網(wǎng)絡的訓練,通過W12[a,b]空間插值逼近的方法,把RBF神經(jīng)網(wǎng)絡的訓練轉(zhuǎn)換為解線性方程組,從而準確地預測出了瓦斯突出;吳海波[7]等采用流回歸機器學習算法與正態(tài)統(tǒng)計分布技術相結(jié)合的方法來建立瓦斯?jié)舛攘鲾?shù)據(jù)異常檢測模型,實時判斷流數(shù)據(jù)中的異常,提高了瓦斯風險評價時效;敖培[8]等基于改進的加權歐氏距離對瓦斯?jié)舛犬惓?shù)據(jù)進行處理,分析出設備異常數(shù)據(jù)、噪聲數(shù)據(jù)和瓦斯突出孤立點數(shù)據(jù)。韓磊[9]通過建立瓦斯涌出量混沌預測數(shù)學模型,根據(jù)瓦斯?jié)舛阮A測結(jié)果及其預測區(qū)間進行預警閾值計算,并對其對應的預警等級進行劃分,完成預警信息?;诜诸惖耐咚?jié)舛犬惓V禉z測隨著監(jiān)測時間的增加數(shù)據(jù)的累計,會造成該算法的不穩(wěn)定,不能更準確的分別異常數(shù)據(jù)。而神經(jīng)網(wǎng)絡的算法有較好的識別準確率,但算法復雜,數(shù)據(jù)量較大時需要對數(shù)據(jù)進行長時間的分析;利用損失函數(shù)易于計算的線性算法做成流式回歸機器學習算法有一定的局限性;基于改進的加權歐氏距離的算法隨著新數(shù)據(jù)的增長需要重新計算歐氏距離;建立瓦斯涌出量混沌預測數(shù)學模型的方法由于參與計算的數(shù)據(jù)比較多,實時性較差。為此,使用邏輯回歸模型對時間序列瓦斯?jié)舛葦?shù)據(jù)進行檢測與分析,判斷出風險所在,降低對人工分析的依賴,為排除風險提供可靠的依據(jù)。判斷異常數(shù)據(jù),能在時間復雜度相對低的情況下較為準確的分析出異常數(shù)據(jù),且有一定的實時性。

1 瓦斯相關數(shù)據(jù)預處理

1.1 試驗數(shù)據(jù)采集

采集范圍:試驗數(shù)據(jù)來自陜北某礦的瓦斯?jié)舛葦?shù)據(jù),經(jīng)勘探該礦區(qū)煤層處于瓦斯風化帶中,瓦斯含量在0.05~6.49 mL/g·r;煤層原始瓦斯壓力為1.2~1.59 MPa;煤層瓦斯相對含量為9.32~11.73 m3/t;透氣性系數(shù)11.49 m2/MPa2·d;該區(qū)煤層含氣量高,煤層透氣性好,瓦斯壓力大[10]。采煤區(qū)在進行勘探后,會進行6~12個月的預抽采以降低煤層的瓦斯含量,當抽采達標后進行生產(chǎn)。該數(shù)據(jù)是實時監(jiān)測的采煤工作面上隅角瓦斯?jié)舛葦?shù)據(jù),數(shù)據(jù)間隔取1 min,瓦斯?jié)舛葦?shù)據(jù)范圍是0%~100%,并且在0%~5%濃度范圍內(nèi)其測量誤差小于±0.06%。采煤工作面上隅角瓦斯?jié)舛葌鞲衅鱐0分布,如圖1所示。

圖1 傳感器位置分布

采集方法:風由進風巷吹到工作面,帶走工作面的瓦斯,上隅角的傳感器對氣體進行檢測,帶瓦斯空氣隨著回風巷排到通風巷道,因此上隅角的瓦斯?jié)舛葦?shù)據(jù)能反映工作面瓦斯?jié)舛鹊淖兓?。根?jù)國家和礦區(qū)規(guī)章制度,礦區(qū)瓦斯?jié)舛葌鞲衅餮b備數(shù)量和報警濃度的規(guī)則制度見表1[11]。如圖2所示,數(shù)據(jù)組1來自該礦區(qū)的803工作面7 d的瓦斯?jié)舛葦?shù)據(jù),用作訓練數(shù)據(jù),采集間隔為1 min,其中有異常數(shù)值31個,監(jiān)測數(shù)據(jù)最大濃度2.11%,最小值為0.01%,平均值為0.253%,標準差為0.104%,大部分數(shù)據(jù)在瓦斯?jié)舛?%~1%之間進行有規(guī)律的波動。另有數(shù)據(jù)組2來自工作面采集8 h的數(shù)據(jù)作為測試數(shù)據(jù)如圖3所示,采集間隔為1 min,最大濃度為0.58%,最小濃度為0.08%,均值為0.212%,標準偏差為0.117%,數(shù)據(jù)集隨時間進行規(guī)律波動。

圖3 8 h工作面瓦斯?jié)舛入S時間變化散點圖

圖2 1周工作面瓦斯?jié)舛茸兓Ⅻc圖

表1 瓦斯?jié)舛葌鞲衅餮b備數(shù)量

數(shù)據(jù)處理的必要性:井下瓦斯?jié)舛鹊那闆r僅依據(jù)國家和礦區(qū)的規(guī)章制度來判斷是否報警還是斷電是有弊端的,當采掘工作面沒有開始工作處于檢修狀態(tài)時,采集到的瓦斯數(shù)據(jù)大部分在0.0%~0.2%之間,此時檢測到異常數(shù)據(jù)若為0.6%未超過1.0%的報警上限,監(jiān)測監(jiān)控系統(tǒng)選擇不報警是有可能帶來風險的。因此,要對采集到的瓦斯?jié)舛葦?shù)據(jù)進行即時有效的分析,規(guī)避井下瓦斯突出等風險因素。

1.2 數(shù)據(jù)的分析與預處理

缺失數(shù)據(jù)插補:煤礦的原始數(shù)據(jù)一般包含異常數(shù)據(jù)(噪聲),因此在用機器學習的辦法進行數(shù)據(jù)分析和建模前,就要對異常數(shù)據(jù)進行預處理來適應模型。異常數(shù)據(jù)包括:缺失值、異常值、不一致的值、重復數(shù)據(jù)及含有特殊符號(如#、¥、*等)的數(shù)據(jù)。本次研究瓦斯?jié)舛鹊漠惓?shù)據(jù),只需將瓦斯監(jiān)測設備的故障、通信信號被干擾等原因采集到的缺失值(如null),濃度數(shù)據(jù)為100%或者0%及含有特殊符號(如#、¥、*等)的數(shù)據(jù)進行處理,對這些數(shù)據(jù)采用插補的辦法進行處理,常用的方法見表2。

表2 常用的缺失數(shù)據(jù)插補方法

回歸模型分析:以間隔1 min采集到一周瓦斯?jié)舛葦?shù)據(jù)有9 360個,缺失值為14個,缺失值較少且瓦斯數(shù)據(jù)會隨時間變化添加新數(shù)據(jù)。當設備故障時缺失數(shù)據(jù)是連續(xù)的,對該數(shù)據(jù)用回歸方法插補進行補差,回歸方法插補根據(jù)已有數(shù)據(jù)和與其有關的其他變量數(shù)據(jù)建立擬合模型來預測是無偏估計,雖容易忽視隨機誤差,但較為適合具有線性關系的數(shù)據(jù)。瓦斯數(shù)據(jù)的P-P圖如圖4所示,點的分布接近直線y=x線進行分布且比較對稱;在如圖5所示,點分布于y=0兩側(cè)且對稱,可看出瓦斯?jié)舛葦?shù)據(jù)分布也符合Logistics回歸模型。

圖4 瓦斯?jié)舛萀ogistics P-P圖

圖5 瓦斯?jié)舛萀ogistics去趨勢P-P圖

2 邏輯回歸分析

2.1 邏輯回歸分析的作用

邏輯回歸介紹:邏輯回歸(Logistic Regression)是一種用于解決二分類(0/1分類)問題的機器學習方法,用于估計某種事物的可能性。邏輯回歸(Logistic Regression)是廣義線性模型(generalized linear model)其中一種。該模型通過假設因變量y服從伯努利分布,自變量x與因變量y存在線性關系,利用Sigmoid函數(shù)處理非線性數(shù)據(jù),從而解決二分類問題。

邏輯回歸分析的作用:當工作面的瓦斯?jié)舛葦?shù)據(jù)異常時但未達到報警濃度為1%的閾值,通過邏輯回歸模型對數(shù)據(jù)進行分析,不僅能檢測出異常數(shù)據(jù)還可提前數(shù)分鐘進行預警從而幫助礦區(qū)提前排除風險或者調(diào)整工作面刀頭速度保證安全生產(chǎn)。

2.2 邏輯回歸模型的建立

建立過程:邏輯回歸模型的建立需要以下過程,首先要建立代價函數(shù),然后通過優(yōu)化方法迭代求解出最優(yōu)模型參數(shù),最后測試驗證得到邏輯回歸模型。

建立代價函數(shù):瓦斯?jié)舛葦?shù)據(jù)集t包含t1,t2,…,tn,這些數(shù)據(jù)賦予一個權值w,帶有權值的瓦斯?jié)舛葦?shù)據(jù)wTt計算見式(1)

(1)

定義f(t)=wT·t,定義函數(shù)g(i)=Sigmiod(i)見式(2),Sigmiod函數(shù)其函數(shù)圖像如圖6所示,值域是[0,1]。

圖6 Sigmiod函數(shù)圖像

(2)

樣本數(shù)據(jù)正反類劃分:用函數(shù)g(i)映射f(t),當f(t)≥ 0.5時,表示t被分到正類,當f(t)<0.5時,表示t分到反類,f(t)的數(shù)值在[0,1]之間可看為概率。此時瓦斯?jié)舛葦?shù)據(jù)已經(jīng)能被劃分出2類,分類函數(shù)記為P(y|t),也可記為P(y|x)。定義h(x)表示預測出的樣本數(shù)據(jù)是正類的概率,則反類的概率為1-h(x),定義讓步比為正類和反類的比值,取對數(shù)計算見式(3),并用對數(shù)求解得式(4)

(3)

(4)

模型的預測函數(shù):將帶有權值的瓦斯?jié)舛葦?shù)據(jù)代入函數(shù)f(x)進行非線性求和得h(x),如圖7所示,用g(i)函數(shù)映射f(x)得到h(x),即h(x)→g(f(x)),代入瓦斯?jié)舛葦?shù)據(jù),對進行加權求和與非線性輸出得出h(x),如圖8所示。函數(shù)h(x)有Sigmiod函數(shù)的特性為模型的預測函數(shù)。

圖7 線性模型加權和

圖8 加權和非線性輸出

瓦斯?jié)舛葦?shù)據(jù)計算:瓦斯?jié)舛葦?shù)據(jù)是已經(jīng)知結(jié)果,需要尋找使得該結(jié)果出現(xiàn)的概率最大的條件,構(gòu)造函數(shù)選擇似然函數(shù),似然函數(shù)是統(tǒng)計模型函數(shù)中參數(shù)的函數(shù)。利用瓦斯?jié)舛葦?shù)據(jù)進行參數(shù)估列。建立似然函數(shù)L(w),每個樣本互相獨立,n個瓦斯?jié)舛葦?shù)據(jù)樣本出現(xiàn)的似然度為式(5)

(5)

取函數(shù)L(w)的自然對數(shù)得l(w),化簡計算見式(6),為損失函數(shù)Loss函數(shù)與f(x)的關系。

(6)

對損失函數(shù)進行最優(yōu)化,得到對應的f(x),以此找回歸因子W,對參數(shù)W求偏導數(shù)并化簡得式(7)

(7)

以上步驟得到f(x),知l(w)為損失函數(shù),l(w)求偏導數(shù),得梯度上升公式(8)。a表示每次迭代上升的幅度,利用瓦斯?jié)舛葦?shù)據(jù)與時間的數(shù)據(jù)來尋找回歸因子W逼近最合理的參數(shù)列表。

(8)

若將w=w+a×x.T×(y-h(x))定義為梯度上升公式,其隨機梯度上升為w=w+a×x[j,:].T×(y[j,:]-h(x)),是從所有的數(shù)據(jù)樣本矩陣x和y樣本中隨機選出的一個數(shù)據(jù)點來計算梯度并更新參數(shù),有新的樣本數(shù)據(jù)增加時只需要對模型進行增量式更新。

2.3 瓦斯?jié)舛葦?shù)據(jù)訓練及分析

瓦斯?jié)舛葦?shù)據(jù)訓練:瓦斯?jié)舛葦?shù)據(jù)的訓練數(shù)據(jù)集D的屬性有3個:C,T,V。瓦斯?jié)舛葦?shù)據(jù)集合為C中有數(shù)據(jù)C1、C2…,Cn;時間T以分鐘為單位;該時刻瓦斯?jié)舛葦?shù)據(jù)是否為異常值V(是異常數(shù)據(jù)為1不是為0)。通過已經(jīng)監(jiān)測出來的瓦斯?jié)舛葦?shù)據(jù)利用公式求出預測函數(shù)h(x),求得擬合預測數(shù)據(jù)h(T)。訓練數(shù)據(jù)中有異常數(shù)據(jù)n個,計算擬合預測值與實測值的相對差值di=|Ci-h(T)|,閾值Threshold按照Sigma原則取值。對比di與閾值的大小,當di大于閾值時則記該時刻瓦斯?jié)舛葦?shù)據(jù)為異常數(shù)據(jù),檢測出來的異常數(shù)據(jù)個數(shù)與n進行對比選擇合適的Sigma。

瓦斯?jié)舛葦?shù)據(jù)分析:測試集需要分析的瓦斯?jié)舛葦?shù)據(jù)集的屬性有S(測試集瓦斯?jié)舛葘崪y值)和T(時間)。利用訓練出來的回歸模型用于測試數(shù)據(jù)集,得到擬合回歸數(shù)據(jù)h(T),計算擬合預測值與實測值的相對差值dj=|Sj-h(T),將數(shù)據(jù)的相對差值dj與模型閾值Threshold進行對比,當dj≤Threshold時,該M時刻的瓦斯數(shù)據(jù)為正常數(shù)據(jù),當dj>Threshold時,此刻的瓦斯?jié)舛葦?shù)據(jù)為異常數(shù)據(jù),需要進行預警。

3 試驗與分析

3.1 閾值選取

數(shù)據(jù)統(tǒng)計:該數(shù)據(jù)來自陜北某礦的803綜采工作面的回風隅瓦斯傳感器采集間隔為1 min的7 d的瓦斯?jié)舛葦?shù)據(jù)作為訓練數(shù)據(jù)。通過分析統(tǒng)計,該監(jiān)測點最大濃度2.11%,最小值為0,平均值為0.253%,標準差為0.104%。對該瓦斯?jié)舛葦?shù)據(jù)的P-P圖如圖9所示,可以看出圖中點的分布幾乎符合y=x,則說明該數(shù)據(jù)符合正態(tài)分布。繪制瓦斯?jié)舛葦?shù)據(jù)的正態(tài)分布圖如圖10所示。

圖10 瓦斯?jié)舛日龖B(tài)分布

圖9 瓦斯?jié)舛葦?shù)據(jù)正態(tài)P-P圖

閾值確定:閾值需要根據(jù)Sigma原則進行取值,從正態(tài)分布圖來看,(μ-σ,μ+σ)中的概率為0.652 6,其中μ近似于0.3,σ近似于0.1。閾值Threshold=μ+kσ(k=1,2,3)。對訓練數(shù)據(jù)集用邏輯回歸模型進行分析,得到結(jié)果如圖11所示。其預測方程式為1/(0.166 666 666 666 666 7+4.967 385 168 684 82×0.999 959 195 617 732 7×x),閾值Threshold=μ+kσ(k=1,2,3;μ=0.3%;σ=0.1%)。當k=1時,檢測出異常數(shù)據(jù)31個;當k=2時,檢測出異常數(shù)據(jù)28個;當k=3時,檢測出17個異常數(shù)據(jù)。由于訓練集的異常數(shù)據(jù)n=31,所以k=1時,閾值設為0.4%比較適合。

圖11 訓練數(shù)據(jù)進行邏輯回歸預測

3.2 模型應用

測試結(jié)果:數(shù)據(jù)組2是在工作面連續(xù)采集8 h的瓦斯?jié)舛葦?shù)據(jù),時間間隔為1 min,作為測試集數(shù)據(jù),其中包含15個異常瓦斯?jié)舛葦?shù)據(jù)。該組數(shù)據(jù)統(tǒng)計范圍有0.84%,最大值0.92%,最小值0.08%。用經(jīng)過訓練的Logistics回歸模型對其進行分析,如圖12所示,閾值取0.4%,預測出相應的瓦斯?jié)舛葦?shù)值并根據(jù)其與實測數(shù)據(jù)的相對距離來判斷是否為異常數(shù)據(jù)。此組數(shù)據(jù)共檢測出13個異常數(shù)據(jù),準確率為0.867%。

圖12 邏輯回歸模型分析測試數(shù)據(jù)

異常數(shù)據(jù)分析:測試集數(shù)據(jù)情況特殊,在工作面進行檢修時,上隅角傳感器采集到數(shù)據(jù)中有異常數(shù)據(jù),需要預警。但采煤機沒有工作,煤層的應力結(jié)構(gòu)沒有遭到人為破壞[12],因此瓦斯?jié)舛犬惓?shù)據(jù)的產(chǎn)生是由于地殼結(jié)構(gòu)的變化導致瓦斯突出[13]。

4 結(jié)論

(1)邏輯回歸模型中的隨機梯度上升算法是一個在線學習的算法,能減少計算機資源的利用,保證系統(tǒng)的穩(wěn)定。通過邏輯回歸模型對瓦斯?jié)舛鹊漠惓V颠M行檢測,判斷此時是否有異常情況發(fā)生,識別異常數(shù)據(jù)的正確率達85%以上,能夠?qū)崿F(xiàn)提前預警。

(2)利用一部分數(shù)據(jù)對邏輯回歸模型進行分析,得到相關參數(shù),樣本數(shù)據(jù)隨著時間的累加,通過不斷檢測異常數(shù)據(jù)的過程,該模型能得到越來越多較好的參數(shù),使得模型對異常數(shù)據(jù)的檢測會越來越準確。

(3)通過試驗結(jié)論與數(shù)據(jù)分析,可以利用邏輯回歸模型基于不同閾值的情況下,建立一個分級報警的瓦斯?jié)舛犬惓V禉z測系統(tǒng),有效識別未達到閾值上限的瓦斯數(shù)據(jù)是否存在異常狀態(tài),這對優(yōu)化礦井瓦斯?jié)舛鹊臋z測與預警提供了新方法。

本文寫作過程中得到了王安虎博士、曹健博士的支持和幫助,在此深表感謝!

猜你喜歡
瓦斯閾值工作面
土石壩壩體失穩(wěn)破壞降水閾值的確定方法
經(jīng)坊煤業(yè)礦井需風量與通風能力核定研究
淺埋中厚煤層超長工作面末采礦壓規(guī)律研究
采用紅細胞沉降率和C-反應蛋白作為假體周圍感染的閾值
礦井瓦斯涌出量預測
綜采工作面過上覆煤柱技術研究
11采區(qū)永久避難硐室控制瓦斯涌出、防止瓦斯積聚和煤層自燃措施
高瓦斯礦井防治瓦斯異常涌出措施的應用
遼寧強對流天氣物理量閾值探索統(tǒng)計分析
哈瓦斯與埃及考古學
九江市| 浠水县| 九龙县| 墨竹工卡县| 尚义县| 塘沽区| 天柱县| 上高县| 大宁县| 岑溪市| 武威市| 荣成市| 景谷| 利津县| 沙坪坝区| 彰武县| 岳普湖县| 寻乌县| 宜城市| 安化县| 安庆市| 镶黄旗| 四子王旗| 定州市| 华阴市| 广水市| 云和县| 高平市| 屏山县| 台前县| 南汇区| 定日县| 潍坊市| 刚察县| 内黄县| 彩票| 新田县| 元谋县| 塔城市| 沙雅县| 新竹市|