丁毓峰,徐 鑫
(武漢理工大學 機電工程學院,湖北 武漢 430070)
森林火災具有成災面積大,火區(qū)溫度高等特點,一旦發(fā)生便難以控制,對自然環(huán)境和相關人員的生命財產(chǎn)造成嚴重破壞[1]。因此,森林火災監(jiān)測系統(tǒng)的建立具有重要意義。隨著電子與計算機技術的發(fā)展,基于圖像處理技術的森林火災監(jiān)測方法由于其監(jiān)測效率高、漏報率低的優(yōu)點,被大量應用到實際中,同時,越來越多的研究人員開始研究森林火災的圖像檢測技術,如Muhammad等[2]提出了一種基于卷積神經(jīng)網(wǎng)絡的有效方法,實現(xiàn)了對不確定監(jiān)視環(huán)境中的視頻進行火災識別。Saeed等[3]提出了基于3種深層神經(jīng)網(wǎng)絡的火災監(jiān)測模型,使用Adaboost-MLP模型和卷積神經(jīng)網(wǎng)絡對火焰進行識別。Zaman等[4]提出了基于計算機視覺的火災檢測技術,使用小波變換來判斷運動區(qū)域中是否存在火焰,同時跟蹤著火區(qū)域的增長率,以區(qū)分危險著火和受控著火。黎傳琛等[5]使用遷移學習作為特征提取器提取特征,然后進行特征融合并結合傳統(tǒng)機器學習分類器方法進行識別。曾思通等[6]利用改進的選擇性背景更新模型提取了視頻圖像中運動前景目標,然后通過分析火焰的特征,提出了一種基于層次分析法的火焰多種動態(tài)特征融合的檢測識別方法。張秀玲等[7]提出了張量對象特征提取的多線性主成分分析深度學習算法,使用多線性主成分分析算法構建學習濾波器,并將其作為深度學習網(wǎng)絡卷積層的卷積核,對張量對象的高維圖像進行特征提取,可有效識別火災圖像及干擾圖像。
筆者首先根據(jù)顏色提取森林火災目標區(qū)域,然后從形狀特征、紋理特征以及動態(tài)特征3個方面提取森林火焰及煙霧的特征,并分別整理成特征向量,并將該特征向量作為核極限學習機的輸入,為提高分類器的分類準確率,使用粒子群算法對核極限學習機參數(shù)進行尋優(yōu)。
森林火災發(fā)生時的主要特征包括火焰及煙霧,且火焰和煙霧相對于圖像中其他物體的顏色有著明顯的區(qū)別,在對圖像進行處理前,首先通過顏色檢測該圖像中是否存在目標區(qū)域可加快森林火災識別效率。相機采集的圖像是基于RGB色彩空間的,為了清楚地展示火焰RGB圖像在R、G、B 3個通道的像素值關系,將火焰圖像的RGB 3通道分離出來,分離后火焰圖像在3個通道的分量圖如圖1所示。
圖1 火焰RGB圖像各通道對比
從圖1可知,火焰圖像在R通道亮度最高,且火焰區(qū)域的輪廓較為清晰,G通道次之,在B通道亮度最低,且輪廓不清晰,故火焰圖像的RGB3通道像素值關系可表示為:
R>G>B
(1)
為更加準確地分析火災圖像中各分量分布規(guī)律,隨機選擇100張火焰圖像與100張非火焰圖像,并手動分割火焰圖像中的火焰像素點,然后分別統(tǒng)計火焰圖像中的火焰像素點和非火焰圖像的所有像素點的RGB值,統(tǒng)計結果如圖2所示。
圖2 圖像RGB分量統(tǒng)計結果
從圖2可知,火焰圖像與非火焰圖像的RGB分布差別較大,而非火焰圖像的RGB分布較為平均。因此,根據(jù)上述實驗結果,提出RGB圖像中火焰像素的判據(jù)為:
(2)
式中:RT,BT分別為R通道和B通道像素值的閾值,通過實驗分析,RT的取值范圍為[160,190],BT的取值范圍為[80,100]。
煙霧圖像在RGB圖像中并不明顯,Emmy等[8]研究了煙霧在YUV顏色空間中的分布規(guī)律,并提出了YUV顏色空間中的煙霧分割規(guī)則如式(3)所示。
(3)
其中,TU和TUV取值分別為60,40。
根據(jù)式(2)和式(3)的火焰及煙霧判據(jù)對火焰及煙霧圖像進行處理,結果如圖3所示。
圖3 火焰及煙霧圖像目標區(qū)域分割效果
經(jīng)過火焰與煙霧分割,得到的分割圖像中存在細小的孔洞或噪聲點,會影響下一步的特征提取結果,因此,根據(jù)式(4)使用核B對A圖像進行形態(tài)學處理。
選擇合適的火焰及煙霧特征,可以降低目標區(qū)域中干擾物的影響,提高森林火災識別算法的識別率,并降低誤報率。
(1)圓形度。圓形度是指目標區(qū)域輪廓與圓形相似的程度,可應用于度量物體輪廓的復雜性[9]。圓形度的計算公式為:
(5)
式中:S為目標區(qū)域的面積;L為目標區(qū)域輪廓的周長。
火焰、煙霧及干擾物的圓形度如表1所示。
(2)尖角個數(shù)。由于火焰在燃燒的過程中,存在邊緣抖動的現(xiàn)象,因此會產(chǎn)生很多小的尖角[10],因此,尖角個數(shù)也可以作為一個特征。火焰、煙霧及干擾物的尖角個數(shù)如表2所示。
表1 火焰、煙霧及干擾物的圓形度
表2 火焰、煙霧及干擾物的尖角個數(shù)
火焰和煙霧的紋理與其他干擾物有著明顯的區(qū)別,灰度共生矩陣(gray-level co-occurrence matrix,GLCM)考慮的是二階統(tǒng)計量,研究有一定關系的像素對[11],不僅反映了亮度的分布特性,也反映了像素之間的位置分布特性[12]。常用的基于GLCM計算的圖像紋理特征指標有5項,其中,P為(i,j)的像素值;G為灰度共生矩陣的階數(shù);δ,θ分別表示P的距離和方向。
(1)能量。能量體現(xiàn)了圖像灰度分布的均勻程度。能量E的計算公式為:
(6)
(2)熵。熵體現(xiàn)了圖像的紊亂程度。熵值ENT的計算公式為:
(7)
(3)逆差矩。逆差矩(inverse difference moment,IDM)反映了圖像紋理的局部變化程度。逆差矩IDM的計算公式為:
(8)
(4)慣性矩。慣性矩(inertia moment, IM)描述了圖像灰度分布的空間差異性。慣性矩IM的計算公式為:
(9)
(5)相關矩。相關矩(correlation)反映了像素灰度值之間的線性相關性。相關矩COR的計算公式為:
(10)
在森林火災發(fā)生時,火焰和煙霧是隨時間不斷擴散、不斷變化的,而背景和各種干擾物則不會有太大的變化。
(1)面積變化率。在森林火災發(fā)生早期,火焰及煙霧的面積都會隨時間逐漸變大,而各種干擾物則不會有太大變化。面積變化率ΔS的計算公式為:
(11)
式中:S(t)為當前幀森林火災目標區(qū)域的面積;S(t-1)為上一幀森林火災目標區(qū)域的面積。
(2)火焰閃頻特征。火焰的閃頻特征是最為明顯的特征之一,是火災檢測的重要依據(jù)?;鹧骈W爍頻率一般為3~25 Hz,可計算連續(xù)10幀圖像內(nèi)的火焰閃爍次數(shù)作為森林火災的閃頻特征。
(3)煙霧重心移動特征。煙霧在擴散過程中重心會隨時間緩慢移動,而與煙霧相似的干擾物大多處于靜止狀態(tài)。煙霧的重心特征計算公式為:
(12)
式中,mij為幾何矩,計算公式為:
(13)
式中:x,y為像素點位置;M,N為選取運動區(qū)域的長和寬;f(x,y)為M×N的圖像中(x,y)的像素值。
通過分別提取火焰和煙霧的形狀、紋理和動態(tài)特征,各自整理成一個特征向量,作為圖像分類算法的輸入, 特征向量的格式如式(14)所示。
(14)
式中:Ffire,Fsmoke分別為火焰及煙霧特征向量;C為圓形度;N為尖角個數(shù);ME,MENT,MIDM,MIM,MCOR分別為能量、熵、逆差矩、慣性矩、關系矩的平均差;SE,SENT,SIDM,SIM,SCOR分別為能量、熵、逆差矩、慣性矩、關系矩的標準差;ΔS為目標區(qū)域的面積變化率;SUMP為頻閃頻率;L為重心移動距離。
極限學習機(extreme learning machine, ELM)是一種快速高效的單隱層前饋神經(jīng)網(wǎng)絡[13]。與傳統(tǒng)的單隱層前饋神經(jīng)網(wǎng)絡相比,ELM有著更快的學習速度以及泛化能力[14]。
極限學習機的結構如圖4所示。
圖4 極限學習機結構
則極限學習機的數(shù)學模型可表示為:
Y=Hβ
(15)
式中:H為隱含層輸出矩陣;β為輸出權值矩陣;Y為極限學習機的輸出矩陣,其學習目的是使得訓練誤差和隱含層權范數(shù)最小,其目標函數(shù)可寫為:
(16)
式中:T為輸入樣本X對應的目標輸出,引入拉格朗日乘子,式(16)可轉(zhuǎn)換成如下目標函數(shù):
h(xi)β=yi-ξi,i=1,2,…,n
(17)
式中:ξi為訓練誤差;h(xi)為樣本xi的隱含層輸出矩陣;yi為樣本xi的輸出矩陣;C為正則化系數(shù),根據(jù)KKT理論,極限學習機的輸出結果為[15]:
(18)
當隱含層特征映射h(x)未知時,采用核函數(shù)KELM替換h(x)HT和HHT,則式(18)可寫為:
(19)
筆者選擇高斯徑向核函數(shù)作為核極限學習機的核函數(shù),其表達式為:
(20)
式中:δ為高斯徑向核函數(shù)帶寬。
粒子群優(yōu)化算法是一種群體智能的優(yōu)化算法,該算法將鳥群作為粒子群,并且每一個粒子都具有位置、速度和適應度3個屬性[16]。如在一個D維的搜索空間中,有一個包含n個粒子的種群X={x1,x2,…,xn},則粒子群算法在解空間中尋優(yōu)的迭代公式如式(21)和式(22)所示。
Vk+1=ωVk+c1r1(Pk-Xk)+c2r2(Gk-Xk)
(21)
Xk+1=Xk+Vk+1
(22)
式中:Vk為粒子第k次迭代的速度;Xk為粒子第k次迭代的位置;ω為慣性權重;c1和c2為加速度因子;r1和r2為[0,1]之間的隨機數(shù);Pk為個體最優(yōu)位置;Gk為群體最優(yōu)位置。
為保證粒子群算法收斂速度的同時,提高其全局尋優(yōu)能力,使用式(23)來動態(tài)調(diào)整ω的值。
ωk+1=ωk-Δf·e-h/T·b·fmax
(23)
式中:fmax為當前迭代次數(shù)下最大適應度值;Δf為最大適應度值與最小適應度函數(shù)的差值;T為粒子群最大迭代次數(shù);b,h為調(diào)節(jié)參數(shù)。
將火災的特征向量作為KELM(kernel extreme learning machine)的輸入,為降低不同特征量的差異造成的影響,使用式(24)對火災的不同特征值歸一化至[-1,1]。
(24)
式中:xi為火災特征向量中的第i(i=1,2,…,14)維特征量;xmax與xmin分別為該特征量的最大值與最小值。將KELM的識別率作為PSO(particle swarm optimization)算法的適應度函數(shù),可表示為:
(25)
式中:Dnum為正確分類數(shù)目;Anum為樣本總數(shù)。
筆者所設計的PSO-KELM森林火災圖像識別算法過程如圖5所示。
圖5 PSO-KELM算法流程
為驗證上述森林火災識別算法,建立了圖像數(shù)據(jù)庫。其中正負樣本集各35 000張。正樣本和負樣本的選擇如圖6所示。
圖6 正負樣本的選擇
將數(shù)據(jù)集中80%的圖像用于訓練核極限學習機,20%的圖像用于測試。訓練過程中PSO的參數(shù)如表3所示。
表3 PSO參數(shù)設置
使用改進PSO算法,核極限學習機的尋優(yōu)過程中最優(yōu)個體適應度變化如圖7所示, 最終得到的最優(yōu)個體適應度值為0.93,得到的核極限學習機參數(shù)如表4所示。
圖7 尋優(yōu)過程中最優(yōu)個體適應度變化
表4 改進PSO尋優(yōu)結果
為驗證所設計算法的性能,同時使用反向傳播神經(jīng)網(wǎng)絡(back propagation neural networks,BPNN)、支持向量機(support vector machines,SVM)算法進行對比,3種方法的識別正確率及誤報率如表5所示。
表5 3種不同方法的森林火災識別正確率及誤報率對比
對比表5中的結果發(fā)現(xiàn),相比于BPNN分類法和SVM分類法,筆者所提算法在識別率及誤報率上都有明顯的優(yōu)勢。3種方法的識別速度對比如表6所示。
表6 3種方法的識別速度對比
從表6可知,PSO-KELM方法具有較高的實時性,可以用于森林火災的實時監(jiān)測。
筆者首先根據(jù)火焰及煙霧的顏色從圖像中提取森林火災目標區(qū)域,然后提取目標區(qū)域的形狀特征、紋理特征以及動態(tài)特征,整合成特征向量,將該特征向量作為核極限學習機的輸入,為提高識別準確率,使用粒子群算法對核極限學習機的參數(shù)尋優(yōu)。實驗結果表明,該方法進行火災圖像識別具有較高的準確率,可以用于森林火災的實時監(jiān)測。