国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量機(jī)的煤礦井水害水源自動識別方法研究

2015-05-07 03:19李繼君薛陽余桂希余桂蓮余生晨
華北科技學(xué)院學(xué)報 2015年2期
關(guān)鍵詞:化驗水源向量

李繼君,薛陽,余桂希,余桂蓮,余生晨

(1.高河能源有限公司,山西長治 047100;2.北京政法職業(yè)學(xué)院,北京 102600;3.寧夏中衛(wèi)市海原縣職業(yè)中學(xué),寧夏海原 755200;4.寧夏固原市原州第五中學(xué),寧夏固原 756000;5.華北科技學(xué)院,北京東燕郊 101601)

0 引言

山西潞安集團(tuán)所屬的各煤礦水害頻發(fā),其表現(xiàn)形式通常為突、涌、潰、淋水等。煤礦井突水會造成重大財產(chǎn)和人員傷亡,多年來對其預(yù)防和治理一直是相關(guān)領(lǐng)域生產(chǎn)者關(guān)注研究的重要課題。水文地球化學(xué)(簡稱“水化學(xué)”)探測技術(shù)主要利用地面水質(zhì)化驗的結(jié)果,一般是八個指標(biāo),有時或更多,然后根據(jù)這些指標(biāo)分析水源。它是礦井防治水工作中的一種重要手段,在礦井突水水源判別方面效果顯著,是一種快速、經(jīng)濟(jì)、實用的方法。目前一般采用以下幾種方法:(1)利用特征離子或特征離子比值法判別突水水源;(2)利用水質(zhì)分析結(jié)合同位素綜合分析方法判斷突(涌、淋、潰)水水源;(3)利用人工示蹤法判斷水源;(4)通過建立數(shù)學(xué)判別模型,判斷突水水源[1]。然而這種手工且根據(jù)單一地面水質(zhì)化驗指標(biāo)判斷水源的方法,在一些復(fù)雜地區(qū)的判斷結(jié)果與實際有較大的出入。

在實際應(yīng)用過程中,由于受各種條件的限制(例如,鉆井?dāng)?shù)量的限制),工程技術(shù)人員往往無法針對每類水源都能采集到大量的足夠樣本,有時,水源識別問題就是一個小樣本的分類識別問題。對于小樣本的分類識別問題,傳統(tǒng)的分類方法容易出現(xiàn)過學(xué)習(xí)(over fitting)現(xiàn)象,導(dǎo)致算法的推廣性差;同時,又會導(dǎo)致學(xué)習(xí)性能差,無法勝任水害水源識別這樣一個非線性很強(qiáng)的分類模式。而支持向量機(jī)(SVM)恰好能夠在學(xué)習(xí)性能和推廣能力上找到一個平衡點,從而使得其分類性能既具有較好的推廣性,又能達(dá)到較強(qiáng)的分類效果。

SVM是建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)之上的一種新型機(jī)器學(xué)習(xí)方法,它是對結(jié)構(gòu)風(fēng)險最小化原則的近似。由于SVM在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣到函數(shù)擬合等其它機(jī)器學(xué)習(xí)問題中,所以將其作為一些小樣本的分類器是一種合理的選擇。但在實際運用中,支持向量機(jī)的泛化性能取決于其核函數(shù)的類型、核函數(shù)的參數(shù)以及懲罰系數(shù)C。文獻(xiàn)[2]采用改變高斯核的方法來提高基于高斯核SVM的分類性能,但每種核函數(shù)都有其優(yōu)缺點,很難說某一個核函數(shù)在所有的問題中都是最好的,為了充分利用各種核函數(shù)的優(yōu)點,得到一個較好的分類效果,本文采用混合核函數(shù)的支持向量機(jī)。實驗結(jié)果表明,該方法具有較好的水源識別效果。

1 支持向量機(jī)方法概述

支持向量機(jī)(SVM)分類器能將非線性可分樣本經(jīng)核函數(shù)映射到一個高維空間,并在該高維空間中構(gòu)造最優(yōu)分類超平面,這個超平面不但能將兩類樣本正確分開,而且使兩類樣本點的間隔最大。其過程如下:

1)用一個合適的核函數(shù)作用于一組分別屬于兩種不同類別的N維的向量組,使其在高維空間中分散開來;

2)找出兩個類的支持向量;

3)找到最優(yōu)分類面,即得到這兩類的分類的依據(jù)。

SVM算法的輸入是一個集合:{(xi,yi)|x∈Rd,y∈{-1,+1},i=1,2,…,N}

集合中,yi是樣本xi的所屬類的標(biāo)志,d是樣本的維數(shù),N是訓(xùn)練樣本的個數(shù)。

SVM的期望輸出(最優(yōu)分類面函數(shù))設(shè)為:

其中,K(xi,x)= φ(xi)·φ(x),b*為分類的閾值,K(xi,x)是一核函數(shù)(內(nèi)積函數(shù)),函數(shù)φ:R→F,是一個從非線性輸入空間R到高維特征空間F的映射。文獻(xiàn)[3]給出了目前使用較多的四個典型的核函數(shù),它們分別是:

2)polynomial kernel多項式核 Kpoly(xi,xj)

3)radial basis function kernel(徑向基函數(shù))

4)MLPkernel KMLP 核 KMLP(xi,xj)=tanh

為了充分利用各種核函數(shù)的優(yōu)點,減少核函數(shù)類型差別對支持向量機(jī)分類性能的影響,本文采用如下混合核函數(shù)的支持向量機(jī)模型:

產(chǎn)生最優(yōu)分類面函數(shù)的過程實質(zhì)上是使兩類樣本的分類間隔最大的過程,使分類間隔最大的分類面即為最優(yōu)分類超平面,這可以通過求解下列函數(shù)的最優(yōu)化解αi來完成。因此,求解最優(yōu)超平面可以轉(zhuǎn)化為函數(shù)優(yōu)化問題如下:

式2)中C是用戶自定義的懲罰系數(shù),用來實現(xiàn)在最少錯分樣本和最大分類間隔之間的折衷[4],在不等式中φ是一映射函數(shù),ξ是一松散變量,其值是可接受的錯分樣本率。這個二次規(guī)劃問題有唯一的極小點,利用Lagrange(拉格朗日)乘子法可轉(zhuǎn)化為其對偶形式[5]:

其中,αi為每一個樣本對應(yīng)的Lagrange乘子。

最后得到最優(yōu)分類超平面函數(shù)為:

其中,sign(.·)是一符號函數(shù),b*是分類的閾值,可以通過兩類中任意一對支持向量取中值求得。

2 水源識別理論

利用數(shù)學(xué)模型對礦井水化學(xué)數(shù)據(jù)進(jìn)行處理并判別充水水源,是現(xiàn)代地球化學(xué)和計算機(jī)科學(xué)相結(jié)合的必然結(jié)果。水源識別過程的一般步驟如下:

1)根據(jù)實際情況,首先建立一個煤礦,或一個區(qū)域(例如,潞安集團(tuán)所屬煤礦區(qū))的水化學(xué)模型(或建水樣庫)。不同地區(qū)的水化學(xué)模型一般是有差別的,我國內(nèi)陸煤礦充水水源主要有砂巖水、奧灰水、太灰水、老空水。有些在淺海區(qū)下面開采的煤礦充水水源主要是海水,在水庫或湖泊下面開采的煤礦充水水源主要是水庫或湖泊水;

2)獲取水質(zhì)化驗分析的多個指標(biāo):例如,K(鉀)、Ca2+(鈣)、Mg2+(鎂)(硫酸鹽)、PH(PH值)、Fe(鐵)(亞硝酸鹽)、I(碘)和T(水溫);

3)建立數(shù)學(xué)判別模型,判斷突水水源,例如,可以應(yīng)用人工智能方法判定水的來源;

4)當(dāng)判定為奧灰承壓水,或老窯采空區(qū)積水等,即,可能會發(fā)生水害的水源,可采取預(yù)防措施;當(dāng)判定為其它水源或危害性較小的水源時,可正常采煤。

3 支持向量機(jī)(SVM)方法在煤礦水害水源識別中的應(yīng)用

用本文方法對潞安集團(tuán)所屬的高河能源有限公司的煤礦礦井水害水源進(jìn)行了分類識。其計算過程的具體步驟如下:

1)利用潞安集團(tuán)所屬煤礦區(qū)的礦井和鉆孔水樣以及在地面對其水質(zhì)化驗的指標(biāo),首先建立潞安集團(tuán)所屬煤礦區(qū)的水化學(xué)模型(或建水樣庫);高河能源有限公司煤礦區(qū)的充水水源主要分為6大類:砂巖水、奧灰水、太灰水、老空水,地面泉水和斷層氧化帶水等;

2)獲取水質(zhì)化驗分析的多個指標(biāo)(在分類識別中,稱為“特征”):K(鉀)、Ca2+(鈣)、Mg2+(鎂)(硫酸鹽)、PH(PH值)、Fe(鐵)、(亞硝酸鹽)、I(碘)、氯(CI)和T(水溫);

3)為了使有不同量綱的特征(指標(biāo))能夠進(jìn)行比較,需要將特征數(shù)據(jù)規(guī)格化,即將特征數(shù)據(jù)變換為無量綱的數(shù)據(jù),然后再判別識別,本文規(guī)格化方法是“標(biāo)準(zhǔn)差歸一化方法”,把帶單位的水質(zhì)化驗分析指標(biāo),都轉(zhuǎn)化為沒有單位的數(shù)據(jù),但不影響分類效果,歸一化后,第i個水質(zhì)化驗指標(biāo)的取值在-1~+1之間;

4)建立數(shù)學(xué)判別模型,判斷突水水源,應(yīng)用本文改進(jìn)的支持向量機(jī)(SVM)方法判定水的來源;

5)跟據(jù)上述10個特征(水質(zhì)化驗分析的指標(biāo)),把待判別的水源樣品和水化學(xué)模型(或建水樣庫)中的各類水源樣品,一同分類。如圖1所示,先粗分為兩大類,再把兩大類各自細(xì)分為2個子類,依次類推;

圖1 先粗分為兩大類,再細(xì)分為4類,依次類推

6)當(dāng)判定為奧灰承壓水、太灰水或老窯采空區(qū)積水等,即,可能會發(fā)生水害的水源,可采取預(yù)防措施;當(dāng)判定為其它水源或危害性較小的水源時,可正常采煤。

4 實驗結(jié)果與討論

本文計算程序,包括支持向量機(jī)(SVM)分類器程序,都是采用FORTRAN90和C++編寫。

1)建立水化學(xué)模型(或建水樣庫)。本文用潞安集團(tuán)所屬煤礦區(qū)的礦井和鉆孔水樣,利用在地面對其水質(zhì)化驗的指標(biāo)判斷水源。該煤礦區(qū)的充水水源主要分為6大類:砂巖水、奧灰水、太灰水、老空水,地面泉水和斷層氧化帶水等。

通過實驗發(fā)現(xiàn)當(dāng)訓(xùn)聯(lián)樣本集的兩類樣本的個數(shù)相差較大時,分類結(jié)果總是偏向樣本個數(shù)較大的類。為了避免這一現(xiàn)象,本文用相同數(shù)目的樣本訓(xùn)練分類器。6大類水源各取7個典型的代表性水源樣本,總共42個樣本,做為訓(xùn)練集(如果條件允許的話,盡可能的多取一些訓(xùn)練樣本)。

為了消弱水質(zhì)化驗中的干擾和分析誤差,本文把同一類水源的同一個水質(zhì)化驗指標(biāo)的多個化驗值,取其平均值,這樣,用平均值代替同一個水質(zhì)化驗指標(biāo),對每類形成一個平均后的代表樣本,即,指標(biāo)平均值樣本。

6大類水源各取3個典型的已知水源的代表性水源樣本,總共18個樣本,做為測試樣本集,以便測試本方法的分類識別效果。測試樣本集越多越好。

2)特征數(shù)據(jù)規(guī)格化。在地面水質(zhì)化驗的結(jié)果中,眾多化驗指標(biāo)的單位是不統(tǒng)一的,例如,離子含量單位為mg/L(毫克/升),有些離子含量單位為mol/L(模爾/升,1模爾Mg2+離子=6.02×1023個Mg2+離子),這就給通過建立數(shù)學(xué)判別模型,判斷突水水源的方法帶來很大麻煩,導(dǎo)致該方法判斷結(jié)果誤差較大。為了解決這兩個問題,本論文用“標(biāo)準(zhǔn)差歸一化”方法,把帶單位的水質(zhì)化驗分析的多個指標(biāo)(即,特征),轉(zhuǎn)化為沒有單位的數(shù)據(jù),但不影響分類效果,轉(zhuǎn)化(即,歸一化)后,第i個水質(zhì)化驗指標(biāo)的取值在-1~+1之間。

標(biāo)準(zhǔn)差歸一化方法。以Ca2+(鈣)、(鈣)離子為例,假設(shè)xi=Ca2+(鈣)離子,其觀測了30個數(shù)據(jù),這里n=30。

對于第i個水質(zhì)化驗指標(biāo)(即,測量指標(biāo))歸一化(標(biāo)準(zhǔn)化),就是將第i個測量指標(biāo)換成x'i,

這樣歸一化后,第i個測量指標(biāo)的取值在-1~+1之間。

3)用上述(1)中選出的訓(xùn)練集中的42個樣本訓(xùn)練本文研制的支持向量機(jī)(SVM),確定支持向量機(jī)(SVM)中的參數(shù);當(dāng)SVM訓(xùn)練好后,再用測試樣本集中的18個樣本,分別測試支持向量機(jī)(SVM)的分類識別效果。在測試中,如(1)所述,當(dāng)訓(xùn)練樣本集的兩類樣本的個數(shù)相差較大時,分類識別結(jié)果總是偏向樣本個數(shù)較大的類。

4)對比點。在測試對比過程中發(fā)現(xiàn):有1個測試樣本,不論用什么方法分類識別,其結(jié)果都是不正確的,后經(jīng)多方分析查證是砂巖水和奧灰水混在一起了,該測試樣本被放棄。

5)多方法對比。

②用2個指標(biāo)分類識別的效果也不高,識別水害水源正確率為48%。我們做了數(shù)據(jù)分布圖,并分析了原因,原因如下:

圖2 用2個指標(biāo)分類識別的效果

從圖2可見,在x-y座標(biāo)系中,奧灰水和砂巖水可以區(qū)分開,但是由計算機(jī)計自動分類識別就困難了。17個樣本進(jìn)行了測試,其識別水源的正確率分別為77%和71%。

表1給出了應(yīng)用本文改進(jìn)的支持向量機(jī)(SVM)分類識別該煤礦區(qū)水源的結(jié)果和其它常用方法的識別結(jié)果的比較。

表1 用本文研究的方法和其它常用方法識別水源的結(jié)果比較

表2 用本文研究的方法識別水害水源的結(jié)果和部分?jǐn)?shù)據(jù)

由表1和表2可以看出幾種不同的方法對水害水源的識別正確率是不同的。應(yīng)用本文改進(jìn)的支持向量機(jī)(SVM)方法對水源的正確識別率是最高的,從而證明本文研究的方法是有效的而且是可行的。

6)支持向量機(jī)(SVM)核函數(shù)的選用問題。每種核函數(shù)都有其優(yōu)缺點,很難說某一個核函數(shù)在所有問題中都是最好的,但可以充分利用各種核函數(shù)的優(yōu)點,得到一個較好的分類效果,本文采用混合核函數(shù)的支持向量機(jī)模型,實驗證明其有較強(qiáng)的分類能力。

在第1部分(支持向量機(jī)方法概述)中,列舉了目前常用的四個典型的核函數(shù)。根據(jù)泛函分析的有關(guān)理論,若某一變換空間中的內(nèi)積函數(shù)滿足Mercer條件,那么該函數(shù)就可以作為SVM核函數(shù)。因為polynomial kernel多項式核Kpoly(xi,xj)和 radial basis function kernel(徑向基函數(shù))總是符合Mercer條件的,所以其線性組合 λ1Kpoly(xi,xj)+ λ2KRBF(xi,xj)也滿足 Mercer 條件。盡管 MLP kernel KMLP 核 KMLP(xi,xj)=+θ)在個別情況下不滿足Mercer條件,但在本文的實驗中不但切實可行,而且提高了SVM的分類性能,因而可以加入到本文的混合核函數(shù)中。前述的對水源的識別都是建立在使用混合核函數(shù)的支持向量機(jī)(SVM)模型基礎(chǔ)之上的。

6)前提條件。使用本方法識別水源的前提條件是在識別水源前要建立一個適合待識別地區(qū)(煤礦)的水樣本訓(xùn)練集(即,建立水化學(xué)模型,或水樣庫),并指出待識別地區(qū)(煤礦)可能的水源類型。每類水源至少有一個水樣本做為訓(xùn)練樣本,訓(xùn)練樣本越多越好。

[1] 劉峰.礦井水害水源的水文地球化學(xué)探測技術(shù)[J].煤田地質(zhì)與勘探,2007,35(4):20 -23.

[2] Kotsia I,Nikolaidis N,Pitas I.Facial expression recognition in videos using a novel Multi-Class Support Vector Machines variant[C].IEEE International Conference on Acoustics,Speech and Siqnal Processing,2007,2:585-588.

[3] Sheen Nuking,Andrews G J,Evans L B.Adaptive resource allocation in multiuser OFDM systems with proportional rate constraints[J].IEEE transactions on wireless communications,2005,4(6):2726 -2737.

[4] Jiao Jang,Kwan Bok Lee.Transmit power adaptation for multiuser OFDM systems[J].IEEE K.Sell.Areas common,2003,21(2):171-178.

[5] Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer- Verlag,1995.

[6] 董書寧.對中國煤礦水害頻發(fā)的幾個關(guān)鍵科學(xué)問題的探討[J]. 煤炭學(xué)報,2010,35(1):66 -71.

[7] 周健,史秀志,王懷勇.礦井突水水源識別的距離判別分析模型[J].煤炭學(xué)報,2010,35(2):278-282.

[8] 石磊,徐樓英.基于水化學(xué)特征的聚類分析對礦井突水水源判別[J].煤炭科學(xué)技術(shù),2010(3):97-100.

猜你喜歡
化驗水源向量
保護(hù)水源
地質(zhì)化學(xué)化驗的誤差及成因分析
向量的分解
聚焦“向量與三角”創(chuàng)新題
鐵礦石化驗質(zhì)量控制對策分析
南水源頭清如許
鐵礦石粒度與化驗環(huán)節(jié)的關(guān)系探討
尋找水源
向量垂直在解析幾何中的應(yīng)用
淺談如何減小煤質(zhì)化驗設(shè)備使用中的數(shù)據(jù)偏差
浙江省| 松江区| 江油市| 旬邑县| 岳普湖县| 沧州市| 喀喇沁旗| 三台县| 长岛县| 昔阳县| 潼南县| 河北省| 蓝山县| 苏州市| 武穴市| 镇沅| 安新县| 南川市| 贵定县| 日喀则市| 通河县| 开化县| 章丘市| 潜江市| 尤溪县| 朝阳县| 峨边| 雷波县| 章丘市| 泰兴市| 出国| 常宁市| 环江| 封开县| 介休市| 分宜县| 温泉县| 连云港市| 阳西县| 成都市| 嵩明县|