李 洋, 楊 濤
(1.西南科技大學(xué) 信息工程學(xué)院,四川 綿陽(yáng) 621000;2.特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室,四川 綿陽(yáng) 621000)
異物檢測(cè)是檢測(cè)電能表內(nèi)部是否存在焊渣殘留、松脂殘留、脫落元器件、膠沫等異物或雜物。異物自動(dòng)檢測(cè)利用聲音識(shí)別技術(shù),通過電氣控制模擬的人工搖表裝置搖晃電能表,完成聲音信號(hào)的采集、訓(xùn)練與識(shí)別。在靜音比較多的情況下,基于閾值的雙門限法有很好的性能,但實(shí)際的電能表內(nèi)異物檢測(cè)環(huán)境采集的聲音信號(hào)可能不存在靜音段或者靜音段較短,那么傳統(tǒng)的基于閾值的端點(diǎn)檢測(cè)算法將會(huì)失效。
文獻(xiàn)[1]針對(duì)公共場(chǎng)所異常聲音的特點(diǎn),提出了一種綜合短時(shí)優(yōu)化過零率和短時(shí)TEO對(duì)數(shù)能量的端點(diǎn)檢測(cè)方法,優(yōu)化的過零率避免了低信噪比下過零率易受噪聲影響的不足,但仍然會(huì)受到噪聲影響;文獻(xiàn)[2]針對(duì)基于短時(shí)能量和短時(shí)過零率在低信噪比時(shí)性能較差問題提出了一種低信噪比下基于譜熵的端點(diǎn)檢測(cè)算法,在不同的噪聲環(huán)境下具有很好的性能;文獻(xiàn)[3]提出了一種改進(jìn)的K—均值聚類算法來實(shí)現(xiàn)對(duì)光發(fā)射信號(hào)的端點(diǎn)檢測(cè),實(shí)時(shí)性較好,適合大規(guī)模生產(chǎn)程中端點(diǎn)檢測(cè);文獻(xiàn)[4]基于模糊C—均值(fuzzy C-means,FCM)、融合過零率和Lempel-Ziv復(fù)雜性等特征的語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方法,提高了語(yǔ)音識(shí)別和編碼等處理的性能。文獻(xiàn)[1]、文獻(xiàn)[2]中的方法在采集的聲音起始段存在足夠長(zhǎng)度的靜音段時(shí)性能都比較好,然而當(dāng)采集的聲音起始段不存在靜音段時(shí)性能較差甚至失效,此情況下文獻(xiàn)[3]、文獻(xiàn)[4]中基于聚類的方法更具穩(wěn)定性。
聲音信號(hào)比較有代表性的特征包括短時(shí)能量和短時(shí)過零率[5]、倒譜特征[6]、小波包能量譜[7]、小波包能量特征[8]等。小波包分析不僅能夠分析出信號(hào)的低頻信息和高頻信息,且小波包能量特征受噪聲影響較小。文獻(xiàn)[9]利用小波包能量特征向量對(duì)結(jié)構(gòu)損傷進(jìn)行識(shí)別,小波包能量特征不易受噪聲的影響,識(shí)別效果較好。
本文結(jié)合電能表內(nèi)異物聲音特點(diǎn),提出一種綜合小波包能量特征、TEO對(duì)數(shù)能量和FCM的端點(diǎn)檢測(cè)算法,比較同文獻(xiàn)[2]中端點(diǎn)檢測(cè)算法的檢測(cè)準(zhǔn)確率。
實(shí)際采集的異物聲音信號(hào),由于受諸多環(huán)境因素影響,信號(hào)的頻率和振幅特性復(fù)雜多變,采樣值也隨時(shí)間變化劇烈波動(dòng),因此采集的電能表內(nèi)異物聲音信號(hào)具有時(shí)變性,為使聲音能用傳統(tǒng)的方法進(jìn)行分析,可假定聲音信號(hào)在短時(shí)范圍(10~30 ms)內(nèi)的特性基本保持不變。由于異物聲音變化的突然性,本文選擇較大的幀長(zhǎng)(40 ms一幀)對(duì)輸入的聲音信號(hào)進(jìn)行分幀以獲取短時(shí)較為平穩(wěn)的特征描述。
本文選擇小波包能量作為特征參數(shù)。圖1是有異物的聲音信號(hào)和無異物的聲音信號(hào)經(jīng)三層小波包分解后不同節(jié)點(diǎn)的能量比,可以看出有異物的聲音信號(hào)同無異物的聲音信號(hào)的不同頻帶能量比區(qū)別明顯。
圖1 小波包分解后不同節(jié)點(diǎn)能量百分比
小波包能量特征提取步驟如下:
1)小波包變換。根據(jù)采集的電能表內(nèi)異物聲音信號(hào)特點(diǎn)、信號(hào)處理的具體要求選擇小波基函數(shù)以及分解層數(shù)m,將信號(hào)分解到互不相交的2m個(gè)頻段上。本文選擇‘db4’作為小波基函數(shù),分解層數(shù)為3。
2)小波包能量計(jì)算。根據(jù)Parseval能量積分等式,選擇小波包分解后各個(gè)頻段內(nèi)信號(hào)的平方和作為小波包能量,則任意頻段對(duì)應(yīng)的能量為
(1)
(2)
3)提取特征向量V。計(jì)算各個(gè)頻段的能量與總能量的相對(duì)比值,將其組成一個(gè)特征向量。即
V=[E1/Etotal,E2/Etotal,…,E2m/Etotal]
(3)
TEO對(duì)數(shù)能量可以表征信號(hào)的共振峰信息,且能很好地抑制背景噪聲的,從而起到信號(hào)增強(qiáng)作用。圖2為采集的聲音信號(hào)波形及對(duì)應(yīng)的TEO對(duì)數(shù)能量圖。本文使用提取的TEO對(duì)數(shù)能量對(duì)FCM聚類以后的數(shù)據(jù)作非靜音段和靜音段的判別。
圖2 實(shí)際信號(hào)波形及TEO對(duì)數(shù)能量
設(shè)聲音信號(hào)時(shí)域波形為x(n),加窗分幀處理后得到的第i幀聲音信號(hào)為xi(m),幀長(zhǎng)為N。則每一幀的能量為
(4)
在這里引入TEO對(duì)數(shù)能量,定義為式(5)
LEi=lg(1+AMPi/a)
(5)
式中a為一個(gè)常數(shù),由于有a的存在,當(dāng)a取較大值時(shí),AMPi幅值有劇烈變化時(shí)能夠得到緩和,所以,適當(dāng)選擇有助于減小突發(fā)性的干擾聲音的影響。文中選擇a=2。
FCM算法[10]本質(zhì)為運(yùn)用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法。FCM聚類算法目標(biāo)函數(shù)
(6)
(7)
在式(7)的約束下,欲求式(6)的最小值,令Jm對(duì)參數(shù)Vi和uj(xi)的偏導(dǎo)數(shù)為0,即可得到
(8)
(9)
FCM端點(diǎn)檢測(cè)算法如下:
1)設(shè)置幀長(zhǎng)和幀間重疊,加窗分幀。將采集的聲音信號(hào)分為較短的幀,每一幀可以看作平穩(wěn)信號(hào),使用短時(shí)平穩(wěn)信號(hào)的處理方法,同時(shí)為了使幀與幀之間平滑過渡,在相鄰兩幀之間設(shè)置重疊部分。
2)計(jì)算每一幀的小波包能量特征H,得到H(i),表示第i幀特征參數(shù)。
3)分別計(jì)算每一幀的對(duì)數(shù)能量LEi。
4)采用FCM對(duì)采集的異物聲音信號(hào)進(jìn)行端點(diǎn)檢測(cè),具體步驟:
a.將步驟(2)中計(jì)算得到的特征參數(shù)作為FCM的輸入?yún)?shù),使得目標(biāo)函數(shù)
(10)
(11)
(12)
b.選擇模糊系數(shù)m,m∈(1,∞),聚類數(shù)c,2≤c和ε,ε為一很小的正常數(shù),文中選擇c=2;
c.設(shè)l為迭代次數(shù),由公式Ul-1可以得到Vl,其中,UL-1為U的第l-1次迭代值,Vl為V的第l次迭代值;
d.采用式(11)、式(12)更新隸屬度矩陣Ul;
f.計(jì)算步驟e中每類的對(duì)數(shù)能量,并標(biāo)記出非靜音段和靜音段,TEO對(duì)數(shù)能量較大的是非靜音音段,TEO對(duì)數(shù)能量較小的是靜音段。
支持向量機(jī)(support vector machine,SVM)[11]是基于將數(shù)據(jù)從低維空間映射到高維空間的思想,由支持向量來決定最優(yōu)分割線,SVM首先找出對(duì)分類有較好區(qū)分能力的向量,然后構(gòu)造最大化類與類之間間隔的分類器。考慮到SVM可以較好地解決小樣本、非線性、高維數(shù)等實(shí)際問題,本實(shí)驗(yàn)異物檢測(cè)采用SVM分類器來完成。同時(shí)可檢驗(yàn)基于FCM聚類的端點(diǎn)檢測(cè)同傳統(tǒng)端點(diǎn)檢測(cè)處理數(shù)據(jù)后的分類精度。
實(shí)驗(yàn)數(shù)據(jù)來源于工廠實(shí)際采集的電能表內(nèi)異物聲音信號(hào),實(shí)驗(yàn)選用100個(gè)有異物的聲音樣本和100個(gè)無異物的聲音樣本組成樣本集。采用留出法將樣本數(shù)據(jù)集隨機(jī)劃分為兩個(gè)互斥的部分,訓(xùn)練集占樣本數(shù)據(jù)集的80 %,測(cè)試集數(shù)據(jù)占樣本數(shù)據(jù)集的20 %,分別計(jì)算不同實(shí)驗(yàn)次數(shù)下的平均識(shí)別率(即表1的識(shí)別率為相應(yīng)實(shí)驗(yàn)次數(shù)下的平均識(shí)別率)。比較采用本文提出的端點(diǎn)檢測(cè)方法下的識(shí)別率同文獻(xiàn)[2]中基于短時(shí)優(yōu)化過零率和短時(shí)TEO對(duì)數(shù)能量的端點(diǎn)檢測(cè)方法下不同試驗(yàn)次數(shù)的識(shí)別率(圖中基于能零比的識(shí)別率代表文獻(xiàn)[2]中端點(diǎn)檢測(cè)算法的識(shí)別率,基于聚類的識(shí)別率代表本文算法的識(shí)別率)。
表1 實(shí)驗(yàn)不同次數(shù)時(shí)的識(shí)別率
圖3 不同實(shí)驗(yàn)次數(shù)下兩種方法的識(shí)別率
通過比較可知,隨著實(shí)驗(yàn)次數(shù)的增加,兩種方法各自的識(shí)別率都沒有較大的變化,但采用FCM聚類的方法處理數(shù)據(jù)以后識(shí)別率明顯高于文獻(xiàn)[2]中的數(shù)據(jù)處理方法,文獻(xiàn)[2]中端點(diǎn)檢測(cè)方法雖然針對(duì)傳統(tǒng)的過零率做了優(yōu)化,但它仍然是傳統(tǒng)的基于閾值的端點(diǎn)檢測(cè)算法,避免不了需要假設(shè)聲音數(shù)據(jù)起始段為靜音段,并由該靜音段來設(shè)置閾值,當(dāng)聲音數(shù)據(jù)起始段不是靜音段時(shí)或聲音數(shù)據(jù)起始段靜音部分較短時(shí),這種檢測(cè)方法將會(huì)失去作用,而本文中的端點(diǎn)檢測(cè)算法無需假設(shè)聲音數(shù)據(jù)存在靜音段,也不需要設(shè)置閾值,在實(shí)際處理時(shí)效果更加穩(wěn)定,針對(duì)電能表內(nèi)的異物檢測(cè)準(zhǔn)確率也較高。
結(jié)合SVM比較了采用本文中的端點(diǎn)檢測(cè)方法同文獻(xiàn)[2]中端點(diǎn)檢測(cè)算法在電能表內(nèi)異物檢測(cè)中的異物識(shí)別率,其結(jié)果是明顯較優(yōu),識(shí)別率達(dá)到了95 %左右。在電能表內(nèi)異物檢測(cè)方面具有更好的表現(xiàn)。