孫友森,陳傳海,楊志龍,王新欣
(1.棗礦集團煤質(zhì)管理處,山東 棗莊 277000;2.山東山控信息科技有限公司,山東 濟南 250000)
計算機視覺技術(shù)是利用相機與電腦連接成的一個系統(tǒng),通過對目標的檢測、追蹤、測量和進一步預處理得到能夠代表圖像特征的信息,再對這些特征信息通過計算機算法進行識別[1-2]。在選煤行業(yè),隨著選煤廠智能化水平的提高,對各個生產(chǎn)崗位的要求也更加嚴格,同樣浮選車間的控制也要求精煤灰分盡可能穩(wěn)定[3]。前人在浮選泡沫圖像的識別問題上已經(jīng)做了大量的研究,例如,Kaartinen[4]在鋅粗選浮選槽中進行基于機器視覺的浮選控制實驗,在監(jiān)控系統(tǒng)中,使用的泡沫圖像特征主要包括泡沫顏色、泡沫坍塌率、氣泡尺寸和一些主要藥劑的添加量,基于這些泡沫圖像特征對生產(chǎn)工況進行分類。Brown[5]等設計了一個基于泡沫表面視覺特征的浮選過程控制器來控制浮選泡沬流速和液位、起泡劑添加量、通風量3個浮選操作變量。結(jié)果表明,當浮選流速能夠很好地控制時,浮選性能也能穩(wěn)定下來。中南大學的桂衛(wèi)華、楊春華等[6]根據(jù)大量的樣本和實驗,利用機器視覺技術(shù)和圖像處理技術(shù),設計了一套銅浮選泡沬圖像監(jiān)控系統(tǒng)。利用BP神經(jīng)網(wǎng)絡建立相關(guān)指標的預測模型,指導銅浮選生產(chǎn)過程。洪升[7]研究建立了選礦過程中在線監(jiān)控系統(tǒng),采用了支持向量機(SVM)的預測方法,進行浮選回收率預測,此方法顯著提高了浮選指標的預測精度和模型的泛化能力,使其具有更好的應用性??梢钥闯觯∵x車間的自動化發(fā)展是當前研究的熱點問題。
由于浮選車間工況復雜[8-9],精礦的品位常常受入料性質(zhì)、加藥量和工人操作等多方面條件的影響,應用在現(xiàn)場的識別精度并不是很高。因此,一種準確可靠的預測算法成為當前研究的重點。傳統(tǒng)的圖像識別技術(shù)更加適應于有明顯特征、背景簡單的情況[10-11],而選煤廠浮選車間工況復雜,煤泥浮選泡沫圖像特征單一,并且捕捉到的圖像由于現(xiàn)場特殊環(huán)境的干擾往往帶有較大的噪聲,這樣給浮選車間智能化的進程帶來嚴重阻礙。
將卷積神經(jīng)網(wǎng)絡(CNN)[12]和支持向量機(SVM)[13]結(jié)合,提出一種混合的煤泥浮選泡沫圖像識別算法,通過CNN自動提取圖像特征,再將提取到的特征作為SVM的輸入預測浮選實時灰分,通過調(diào)整網(wǎng)絡參數(shù)和結(jié)構(gòu),取得了不錯的分選結(jié)果。同時面對現(xiàn)場復雜的的環(huán)境,該混合算法具有較高的識別精度和較強的魯棒性(即算法對數(shù)據(jù)變化的容忍度)。
卷積神經(jīng)網(wǎng)絡(CNN)是一種包含多層的深度卷積神經(jīng)網(wǎng)絡模型,它由自動特征提取部分和全連接層組成,特征提取部分包括卷積層和池化層兩部分,通過卷積和池化2種過程的迭代從煤泥浮選泡沫圖像上提取特征信息[14]。支持向量基(SVM)將特征數(shù)據(jù)投影到特征空間中尋找最優(yōu)的分離面,根據(jù)其核函數(shù)的不同,它可以用來處理線性和非線性問題[15]。卷積神經(jīng)網(wǎng)絡的神經(jīng)元由權(quán)重和偏置項組成,每一個神經(jīng)元接受輸入并執(zhí)行卷積計算,每個神經(jīng)元接受來自前端的輸入并執(zhí)行一次點積運算,然后整個神經(jīng)網(wǎng)絡表達出一個評分函數(shù),對網(wǎng)絡的輸入到輸出進行評分[16]。在CNN中通常用一個損失函數(shù)對網(wǎng)絡中的參數(shù)進行估計,這就形成了一個將原始圖像變?yōu)樘卣飨蛄康奶卣魈崛∑鱗17]。另一部分就是全連接層,將提取到的特征向量按照前向傳播網(wǎng)絡進行分類。
混合的CNN—SVM模型是將CNN最后的全連接網(wǎng)絡層替換為SVM分類器。CNN網(wǎng)絡的最外層實際上是指每個樣本標簽所對應的可能出現(xiàn)的概率估計值,每一個概率估計值對應一個激活函數(shù),單查看隱含層的輸出對于分類結(jié)果是沒有任何意義的,它僅僅對CNN網(wǎng)絡模型本身有意義,但是這些值可以作為SVM分類器的特征輸入。圖1為CNN—SVM模型的網(wǎng)絡結(jié)構(gòu)圖。首先,將煤泥浮選泡沫圖像通過多次卷積和池化,對原始帶有輸出層的CNN進行預訓練直到收斂,然后SVM將隱含層的輸出作為特征輸入進行訓練,一旦SVM訓練合格,就會對自動提取特征的煤泥圖像做出預測?;旌系腃NN—SVM模型的優(yōu)點彌補了兩類分類器的局限性,提高了單一模型的泛化能力和模型精度。
圖1 CNN—SVM混合模型結(jié)構(gòu)
實驗采用CCD工業(yè)相機對浮選泡沫拍照,選取更加可靠LED背光源為泡沫的補光光源,這樣可以最大程度的減小浮選泡沫表面的反光現(xiàn)象。為了避免外界光源的干擾,對現(xiàn)場對采集系統(tǒng)進行遮光處理。針對浮選工況的不同,分散取樣化驗實時灰分作為圖像標簽,設置圖像大小為1024×1024像素,對每個灰分標簽連續(xù)采集30張照片,擇優(yōu)選取20張作為該標簽對應的數(shù)據(jù)集。最終取得山東某選煤廠浮選車間的30 000張浮選泡沫圖像,按照灰分區(qū)間不同將其標簽劃分為小于7、7~7.99、8~8.99、9~9.99、10~10.99、11~11.99、12~12.99、大于13共8個類別,其中20 000張作為訓練集,7 000張作為驗證集,最后3 000張作為測試集。
選煤廠浮選車間的實際環(huán)境比較特殊,因此在圖像采集、傳輸?shù)冗^程中,難免受到周圍特殊環(huán)境和磁場等的影響,經(jīng)過工業(yè)相機采集的圖像最終傳到計算機上時難免會帶有較大的噪聲和微小的失真現(xiàn)象,這樣的圖像喂入神經(jīng)網(wǎng)絡就會出現(xiàn)過擬合或者準確率較低,無法達到較好的的分類效果,為了解決這類問題必須對采集到的圖像做去燥、增強等預處理。根據(jù)實際驗證對采集到的數(shù)據(jù)集進行了高斯椒鹽去燥和圖像增強預處理,處理前后的圖像如圖2所示。
圖2 預處理浮選泡沫圖像
3.3.1 CNN特征提取
CNN被用來提取煤泥浮選泡沫圖像特征被認為是有效的,本文在全連接層之前添加一個額外的卷積層,其中包含8個神經(jīng)元的200個特征圖。最大池化層進行全零填充和歸一化操作。卷積神經(jīng)網(wǎng)絡的參數(shù)圖如表1所示。
表1 CNN模型參數(shù)設計
3.3.2 SVM分類
在SVM中首先將數(shù)據(jù)投影到特征空間中,然后確定最優(yōu)分離超平面,利用不同的核函數(shù)將線性問題轉(zhuǎn)化為非線性問題。該方法最初是為了解決兩類問題而提出的,然而現(xiàn)在這項技術(shù)已經(jīng)被用來解決多分類問題。
首先將訓練集S定義如下:
其中:yi∈{1,2,3,4,5,6,7,8}代表灰分標簽的8個類別(小于7、7~7.99、8~8.99、9~9.99、10~10.99、11~11.99、12~12.99、大于13),并且i=2500。目前有2種方法用來解決多分類問題:一種是構(gòu)件多個二分類SVM并將它們以一對一或一對多的方式聯(lián)合起來,另一種是將所有多分類數(shù)據(jù)集考慮在一個最優(yōu)化問題中用SVM分類。Hsu[18]等人通過使用不同的數(shù)據(jù)集驗證得出一對一的方法更加合適實際應用。LIBSVM[19]是一種開源的SVM分類工具,本文將使用它來做分類處理,一對一的分類方法構(gòu)建了一個k/(k-1)/2(k為分類數(shù))分類器,其中每個分類器從k個類別中挑選出的2類作為訓練數(shù)據(jù)。下式主要計算如何獲取從第i和第j個類別的訓練數(shù)據(jù):
其中αi是拉格朗日乘子,核函數(shù)K用來計算高維空間未完成分類映射的點積,C是控制最大分類誤差和最小分類誤差的一個懲罰因子。在分類決定的過程中,LIBSVM采用“max Wins”算法[20],即每個分類器對上一次的分類結(jié)果評分,來獲取最佳的分類結(jié)果。
3.3.3 實驗結(jié)果與分析
在CNN—SVM混合訓練模型中,使用SVM代替CNN最后的全連接層。為了構(gòu)造混合模型中的SVM,通過對數(shù)據(jù)集采用10倍交叉驗證的方法,采用徑向基函數(shù)來確定最佳的核參數(shù)S和懲罰因子C。各參數(shù)的范圍為C=[0.8,0.9,1.0,1.1,1.2],γ=[0.01,0.03,0.05,0.07,0.09],應用不同的組合最終選定C=1.0,γ=0.05。將這些參數(shù)代入混合模型,如圖3所示,設置樣本量大小為400,學習率為0.001,過擬合為0.75,50個訓練樣本之后模型的準確率達到了87.66%。
圖3 CNN-SVM模型識別度準確率
模型中各個灰分類別的準確率如圖4所示,從圖中可以看出,CNN—SVM模型對每個灰分類別的泡沫識別準確率都在80%以上,其中灰分小于7%和大于13%的泡沫識別精度最高,達到90%以上,這也與浮選現(xiàn)場這2種泡沫的形態(tài)差距明顯有一定關(guān)系。由于煤泥浮選泡沫圖像差異小,分別難度高,所以識別精度不如其他的特征明顯的圖像高。但在未來的應用中,隨著數(shù)據(jù)集的擴大和計算機計算能力的增強,相信可以取得不錯的分類結(jié)果。
圖4 各灰分等級的泡沫識別精度
以選煤廠煤泥浮選泡沫為分類對象,提出一種CNN—SVM混合的網(wǎng)絡模型。先對輸入網(wǎng)絡前對所有圖像做了增強去噪的預處理,該模型結(jié)合了支持向量機和神經(jīng)網(wǎng)絡的優(yōu)點,利用CNN部分對預處理后的圖像自動提取特征,之后將提取到的特征輸給SVM預測分類,最終在本次煤泥浮選泡沫分類中取得了87.66%的準確率。在未來的研究中,通過繼續(xù)增加網(wǎng)絡的深度和獲取更多的數(shù)據(jù)集有可能獲得更高的準確率。