蔣曉永, 楊 濤
(1.西南科技大學(xué) 信息工程學(xué)院,四川 綿陽 621000; 2.特殊環(huán)境機器人技術(shù)四川省重點實驗室,四川 綿陽 621000)
電能表異物檢測的目的是檢測電能表內(nèi)部是否存在焊渣殘留、松脂殘留、脫落元器件、膠沫等異物或雜物。傳統(tǒng)的人工電能表檢測是按照一定的速度和旋轉(zhuǎn)方向進(jìn)行搖表聽取聲音判斷電能表是否含有異物。檢測效率低、檢測結(jié)果不穩(wěn)定。隨著聲學(xué)檢測技術(shù)的日益成熟,通過聲音信號的采集、處理和識別能實現(xiàn)對異物的檢測。由于電能表內(nèi)部異物的種類存在不確定性且存在較大背景噪聲,增大了電能表異物檢測算法的復(fù)雜性,需要研究噪聲分離技術(shù)和基于學(xué)習(xí)的聲音識別技術(shù)以提高檢測的可靠性和準(zhǔn)確性。
文獻(xiàn)[1]提出心音信號的3種去噪方法,實驗證明經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)去噪性能更好,但EMD降噪對于數(shù)據(jù)量較大時存在速度過慢以及模態(tài)混疊等問題;文獻(xiàn)[2]針對腦電信號設(shè)計了誤差歸一化的最小均方(least mean square,LMS)自適應(yīng)濾波器,效果良好;文獻(xiàn)[3]提出語音增強中的3種去噪算法,得出了無偏歸一化自適應(yīng)去噪(unbiased normalization adaptive noise reduction,UNANR)性能較好,但收斂速度較慢。文獻(xiàn)[4]將梅爾頻率倒譜(Meier frequency cepstrum coefficient,MFCC)、差分MFCC以及短時能量3種特征用于高斯混合模型(Gaussian mixture model,GMM)的訓(xùn)練與識別,在處理不同環(huán)境的聲音信號時,需根據(jù)實驗結(jié)果確定GMM的參數(shù),所以對GMM混合階數(shù)的選擇存在局限性;文獻(xiàn)[5]提出了一種提取聲音信號MFCC系數(shù)的方法和實驗裝置,解決了用HTK提取該系數(shù)的問題,采用非線性變換和離散余弦變換,優(yōu)化了提取的MFCC系數(shù),提高了語音識別的準(zhǔn)確率。文獻(xiàn)[6]提出了一種新的MFCC改進(jìn)方法,通過對頻譜噪聲重構(gòu)使改進(jìn)后的MFCC系數(shù)具有良好的抗噪性。文獻(xiàn)[7]提出基于MFCC參數(shù)和支持向量機(support vector machine,SVM)的心音信號識別,平均識別率達(dá)到了93 %,結(jié)果優(yōu)于神經(jīng)網(wǎng)絡(luò)模型;文獻(xiàn)[8]針對家庭環(huán)境訓(xùn)練數(shù)據(jù)不易獲得的情況,采用SVM作為分類器,提取自適應(yīng)MFCC參數(shù)作為特征,分類效果優(yōu)于傳統(tǒng)的分類器。
本文針對電能表內(nèi)異物聲音的特點并結(jié)合具體的應(yīng)用背景,提出一種基于變步長LMS和SVM的電能表內(nèi)的異物聲音自動識別方法。針對SVM分類對噪聲敏感的問題,先對采集到的聲音信號進(jìn)行數(shù)字降噪。然后提取聲音信號的短時能量和改進(jìn)MFCC系數(shù)組成混合特征矩陣并進(jìn)行降維處理,并輸入SVM分類器進(jìn)行識別。
在車間采集聲音時伴隨著氣泵、車床、風(fēng)扇、電機等噪音,利用聲卡一次采集2個通道的聲音信號,一個通道放置有異物的電表,一個通道不放置電表作為參照。采用改進(jìn)的變步長LMS自適應(yīng)濾波降噪,將一個通道的信號作為輸入信號,另一個通道的信號作為期望信號。自適應(yīng)濾波器原理如圖1。
圖1 自適應(yīng)濾波器原理
其中x(n)為輸入信號,y(n)為輸出信號;v(n)為與x(n)不相關(guān)的信號,d(n)為期望信號,e(n)=d(n)-y(n),算法通過誤差e(n)的值自動調(diào)整自適應(yīng)濾波器的抽頭權(quán)向量w(n),使得下一輸出信號y(n+1)與期望信號更接近,從而使自適應(yīng)濾波器逐漸收斂。基于最速下降法的LMS算法迭代公式為
y(n)=wH(n)x(n)
(1)
e(n)=d(n)-y(n)
(2)
W(n+1)=W(n)+2ue(n)x(n)
(3)
式中u為步長因子,通常為常數(shù)值,收斂范圍為01.2 變步長LMS濾波
本文將步長同平方誤差結(jié)合,建立新步長和誤差之間的非線性關(guān)系。在一定程度上解決了收斂速度和穩(wěn)態(tài)之間的矛盾且計算量小。改進(jìn)后能夠使步長在收斂穩(wěn)時保持相對穩(wěn)定,增大了適應(yīng)性,新的步長因子為
u(n)=αu(n-1)+β(e(n))2
(4)
由式(4)可得到新的迭代公式為
W(n+1)=W(n)+2(αu(n-1)+β(e(n))2)·
e(n)x(n)
(5)
式中參數(shù)α控制步長變化函數(shù)的陡峭程度,β控制步長變化范圍。步長與誤差的關(guān)系如圖2所示。開始收斂時,需要較大的步長加快收斂速度,而收斂穩(wěn)態(tài)期需要較小的步長。在滿足算法收斂的條件下,β的取值需要盡可能大。本文中設(shè)定a=0.1,β=9。
圖2 不同參數(shù)下步長與誤差的關(guān)系
1)聲音的能量隨時間而變化,預(yù)處理后計算第i幀聲音信號xi(n)的短時能量E(i)為
(6)
2)通過Mel尺度頻率域提取出MFCC具有較好的魯棒性,能準(zhǔn)確反映聲音信號的特征。對每一幀信號進(jìn)行快速傅里葉變換,將時域波形數(shù)據(jù)轉(zhuǎn)換為頻域能量信息并得到各幀信號的頻譜。Mel濾波器的頻域響應(yīng)為Hm(k),通過濾波器后
(7)
k=0,1,…,N-1
(8)
式中 參數(shù)N為聲音信號x(n)的長度,C(k)為正交因子
計算得到MFCC參數(shù)
cos[πn(2m-1)/2M]
(9)
引入差分系數(shù)來表現(xiàn)聲音信號的動態(tài)特性。將動、靜態(tài)特征結(jié)合起來才能更全面地反映聲音信號的整體特征,能有效提高聲音信號的識別率。計算幀間差分參數(shù)
(10)
式中dt為第t個一階差分;Ct為第t個倒譜系數(shù);Q為倒譜系數(shù)的階數(shù);K為一階導(dǎo)數(shù)的時間差,可取1或2。
為了使得到的聲音特征參數(shù)能全面反映聲音信號的時、頻特征,故對聲音特征參數(shù)進(jìn)行排列和處理。短時能量和改進(jìn)MFCC系數(shù)構(gòu)成混合特征矩陣,其第1維為短時能量,第2維第15維為MFCC系數(shù)。并對數(shù)據(jù)進(jìn)行降維處理,求取混合特征矩陣最大特征值所對應(yīng)的特征向量。將高維數(shù)據(jù)投影到較低維空間,在一定程度上減少聲音特征矩陣的維度,為聲音信號識別減少計算量。
檢測電能表時不需要判別異物的具體類別,只需要判別電能表內(nèi)是否含有異物??紤]到SVM可以較好地解決小樣本、非線性、高維數(shù)等實際問題,在對聲音信號進(jìn)行降噪后提取特征識別,不僅可以解決SVM易受噪聲影響的問題,還可以解決過擬合問題。
SVM可以將低維數(shù)據(jù)映射到高維空間,由支持向量來判決最優(yōu)分割線,首先找出對分類有較好區(qū)分能力的向量,然后構(gòu)造最大化類與類之間間隔的分類器,是一種由分離超平面定義的判別分類器。為了計算這個最優(yōu)超平面,超平面定義如下
f(x)=α+βTx
(11)
式中β為權(quán)重向量,α為偏置。通過對α和β縮放,可以盡可能多的獲得最優(yōu)化超平面
|α+βTx|=1
(12)
式中x為最接近超平面的訓(xùn)練集,被稱為支持向量。使用式(13)得到點x到超平面(α,β)的距離
d=|α+βTx|/‖β‖
(13)
支持向量到超平面的距離定義為
d(s-v)=|α+βTx|/‖β‖=1/‖β‖
(14)
分類間隔為支持向量到超平面距離的2倍,即
M=2/‖β‖
(15)
對式(15)分類間隔M的最大化等價于在某些約束條件下的最小化。約束條件表達(dá)了對所有訓(xùn)練集正確分類的要求
(16)
式中yi為訓(xùn)練集的標(biāo)簽。
實驗數(shù)據(jù)來源于工廠實際采集的電能表內(nèi)異物聲音信號(異物聲音信號頻率集中在3 000~4 000 Hz),選取一段較為純凈的異物聲音,設(shè)定初始信噪比為SNR=5,疊加一定的隨機噪聲,原始信號與帶噪信號如圖3,原始信號與去噪后的信號如圖4。
圖3 原始信號與帶噪信號
圖4 原始信號與去噪后信號
2種算法都能一定程度地去除噪聲,其去噪效果如表1。
表1 2種去噪算法的比較
由表1可知,固定步長LMS算法隨著步長的減小,去噪后的信噪比先增大后減小,不同步長時的去噪效果差于變步長LMS算法,處理時間也明顯大于變步長LMS算法。
采集到聲音信號經(jīng)過預(yù)處理和特征特提,得到一組代表聲音信號特性的聲音特征系數(shù)。但數(shù)據(jù)量大不利于快速計算,在實際生產(chǎn)中不能快速判斷電能表有無異物。對數(shù)據(jù)進(jìn)行降維處理,降低混合特征矩陣維度,減少聲音信號識別的計算量。將混合特征矩陣和降維處理后的混合特征矩陣分別輸入SVM分類器中進(jìn)行識別,發(fā)現(xiàn)降維后雖然損失了一部分信息但有效提高了識別速率。具體表現(xiàn)為:信號數(shù)目分別為100,500,1000時,混合矩陣SVM識別時間分別為0.602 7,1.584 1,3.257 3 s,而降維后的SVM識別時間分別為0.203 5,0.792 1,1.293 1 s。
用本文提出的方法對電能表進(jìn)行識別,實驗采用留出法將數(shù)據(jù)集分為互斥的2部分分別作為訓(xùn)練集和測試集,經(jīng)過重復(fù)實驗1 000次得到的平均識別率在90 %左右。
本文對聲音信號的數(shù)字降噪和識別進(jìn)行了具體闡述,結(jié)合具體應(yīng)用背景提出了一種新的變步長LMS算法,將誤差和步長的關(guān)系建立了等式進(jìn)行了討論,最終得到一個適合于電能表內(nèi)異物聲音信號去噪的參數(shù),但如何對采集的兩個通道的聲音進(jìn)行對準(zhǔn)以消除干擾有待進(jìn)一步研究。提取聲音信號的短時能量和改進(jìn)MFCC系數(shù)組成混合特征矩陣,并對其進(jìn)行降維處理,然后輸入SVM分類器識別。該方法在一定程度上減小了計算量,提高了異物聲音的識別率,有很好的應(yīng)用價值。