李云紅,李小英,周靜雷,潘 楊
(西安工程大學(xué) 電子信息學(xué)院, 陜西 西安 710048)
?
·信息科學(xué)·
掩蔽效應(yīng)在揚(yáng)聲器異常音檢測中的應(yīng)用
李云紅,李小英,周靜雷,潘 楊
(西安工程大學(xué) 電子信息學(xué)院, 陜西 西安 710048)
傳統(tǒng)的揚(yáng)聲器異常音檢測方法(純音檢測)受主觀因素影響會出現(xiàn)漏檢、誤判等狀況,針對虛擬儀器的異常音檢測技術(shù)效率低、精度低、成本高等問題,提出一種基于掩蔽效應(yīng)的揚(yáng)聲器異常音檢測方法,將異常音功率譜和掩蔽閾值比較,提取掩蔽閾值曲線以上的可聞異常音,再用相關(guān)系數(shù)進(jìn)行算法有效性驗證,結(jié)果表明,(0.0,0.7]參數(shù)區(qū)間的凱撒窗使激勵和噪音的相關(guān)系數(shù)分別達(dá)到0.992 6和0.992 1,可實現(xiàn)揚(yáng)聲器異常音高效、高精度、易操作的檢測要求。
揚(yáng)聲器異常音檢測;掩蔽效應(yīng);心理聲學(xué)模型
異常音檢測對揚(yáng)聲器的品質(zhì)保障至關(guān)重要,對于剛制造出的揚(yáng)聲器,首要的工序就是純音檢測。目前,形成的一些基于聲學(xué)儀器并按照揚(yáng)聲器主要性能測試標(biāo)準(zhǔn)對其進(jìn)行基本的常規(guī)測量,包括:頻響、頻率特性、阻抗特性、有效頻率范圍、輸入電功率等揚(yáng)聲器特性參數(shù)[1-2]。還有基于一些模擬儀器的揚(yáng)聲器異常音檢測技術(shù),但其價格昂貴、檢測效率低、操作復(fù)雜不能滿足在線檢測的要求[3]。而純音檢測是完全依靠人耳進(jìn)行的音質(zhì)優(yōu)劣的判斷,這很容易受主觀因素及各種環(huán)境條件等等影響,比如:聽音員技術(shù)嫻熟程度不一、主觀感受不一等等[4]。
隨后,希爾伯特黃算法(HHT)[5]于1998年問世,韋峻峰等[6]通過希爾伯特黃變換研究異常音信號包含的異常振動模態(tài)函數(shù),進(jìn)行揚(yáng)聲器異常音判決,取得較好的效果。盧學(xué)軍等[7]通過分析揚(yáng)聲器響應(yīng)信號的時域特征,利用模式識別技術(shù)進(jìn)行了異常音檢測。黃海[8]利用Hilbert-Huang變換研究揚(yáng)聲器紙盆位移信號非線性特性。而信號分析處理方法不可避免地受到其自身局限的影響。比如:小波變換不能實現(xiàn)對信號各分量的瞬時特性的分析等[9-10]。
針對目前揚(yáng)聲器異常音檢測技術(shù)存在的不足,提出基于掩蔽效應(yīng)的揚(yáng)聲器異常音檢測方法,通過窗函數(shù),可有效改善心理聲學(xué)模型在異常音檢測中的精度,從而提高了揚(yáng)聲器異常音檢測系統(tǒng)的效率,非常適合以揚(yáng)聲器為代表的電聲器件在線檢測。
1.1 掩蔽效應(yīng)
當(dāng)人耳聽覺系統(tǒng)同時接受到兩個或多個激勵時,由于某些頻譜能量的存在掩蔽了另一些頻譜能量,即其他聲音干擾致使另一種聲音被淹沒而人耳無法聽見,這種現(xiàn)象稱為掩蔽效應(yīng),被掩蔽掉的聲音稱為被掩蔽信號,掩蔽較弱的聲音稱為掩蔽信號[11]。掩蔽效應(yīng)一般包括同時掩蔽和異時掩蔽。同時掩蔽也稱為頻域掩蔽,是被掩蔽信號和掩蔽信號同時作用產(chǎn)生的效應(yīng),屬于一種較明顯的掩蔽效應(yīng),能持續(xù)200ms。通常情況下,頻域中,一個能量較大的信號會將其附近能量較弱的信號掩蔽掉,人耳聽覺系統(tǒng)就不會感知到較弱的聲音。而且,弱音頻率離強(qiáng)音越近,越容易被掩蔽,頻率距離越遠(yuǎn),則被掩蔽的可能性越小[12]。
當(dāng)掩蔽信號和被掩蔽信號不在同一時間發(fā)生而產(chǎn)生的掩蔽效應(yīng),叫作異時掩蔽,又稱為時域掩蔽。時域掩蔽效應(yīng)分為超前掩蔽和滯后掩蔽,前者是指掩蔽效應(yīng)發(fā)生在掩蔽信號出現(xiàn)之前的時間段,后者是指掩蔽效應(yīng)發(fā)生在掩蔽信號結(jié)束后的一段時間。由人耳聽覺感音機(jī)理不難理解,到達(dá)人耳的信號需經(jīng)過聽覺系統(tǒng)的處理才能將其中攜帶的信息傳到大腦進(jìn)行分析處理,所以才會產(chǎn)生異時掩蔽效應(yīng)。
在掩蔽情況下,如果當(dāng)被掩蔽音的能量達(dá)到一定的強(qiáng)度,而剛好可以被人耳聽到,這個閾值稱為掩蔽閾值或者掩蔽門限。掩蔽門限以下的聲音將會被掩蔽掉,聲音的能量在該頻點掩蔽門限值上方的信號才能被人耳感知到。
研究中,以人耳的生理結(jié)構(gòu)和感知模式為基礎(chǔ),并結(jié)合人耳感音機(jī)理及人耳聽覺掩蔽效應(yīng)原理,將復(fù)雜抽象的人耳聽覺感音機(jī)理通過建立有效模型來模擬人耳聽覺系統(tǒng)掩蔽特征,通過該模型可以求出輸入的仿真信號的掩蔽閾值曲線,利用掩蔽效應(yīng)去除可以掩蔽掉的聲音,以下主要圍繞心理聲學(xué)模型I展開異常音檢測研究和分析。
1.2 心理聲學(xué)模型I
心理聲學(xué)模型I先將音頻信號經(jīng)FFT變換到頻域,再映射到臨界頻帶,劃分出有調(diào)和無調(diào)成份,依據(jù)所在頻率位置及強(qiáng)度大小分別計算單獨掩蔽閾值,最后與靜音掩蔽閾值結(jié)合,得到信號的全局掩蔽閾值。心理聲學(xué)模型I的仿真流程圖如圖1所示。
圖1 心理聲學(xué)模型I仿真流程框圖Fig.1 Psychoacoustics model I simulation diagram of the process
1)功率譜密度計算:首先對輸入的樣本語音信號進(jìn)行分幀處理,再對分幀后的信號進(jìn)行加窗處理,這里選用漢寧窗,然后進(jìn)行FFT變換以求取功率譜密度。圖2和圖3分別為仿真的語音信號及其功率譜歸一化到96dB聲壓級的功率譜密度。
圖2 樣本語音信號Fig.2 Samples of voice signal
圖3 樣本語音信號功率譜密度Fig.3 Sample voice signal power spectral density
2)頻譜成分劃分:有調(diào)和無調(diào)成分的掩蔽特征不同,需分別計算它們的掩蔽閾值。根據(jù)信號功率譜密度的局部最大值來確定頻譜中的有調(diào)成份,剩下的臨界頻帶頻譜值組成無調(diào)成分。仿真中求出的有調(diào)成分和無調(diào)成分結(jié)果分別如圖4和圖5所示。
圖4 有調(diào)成分抽取結(jié)果Fig.4 Tonal component extraction results
圖5 無調(diào)成分抽取結(jié)果Fig.5 Nontonal component extraction results
3)全局掩蔽閾值計算:根據(jù)心理聲學(xué)模型 I,分別計算有調(diào)和無調(diào)成分的掩蔽閾值,計算公式如公式(1)和公式(2)。
LTtm[z(j),z(I)]=Xtm[z(j)]+avtm[z(j)]+vf[z(j),z(I)]
(1)
LTnm[z(j),z(I)]=Xnm[z(j)]+avnm[z(j)]+vf[z(j),z(I)]
(2)
式中:LTtm[z(j),z(I)]表示在頻譜中的頻率I處的有調(diào)掩蔽分量的掩蔽閾值,LTnm[z(j),z(I)]表示在頻譜中的頻率I處的無調(diào)掩蔽分量的掩蔽閾值。有調(diào)和無調(diào)成分的掩蔽系數(shù)如公式(3)和公式(4)。
avtm[z(j)]=
[-1.525-0.275z(j)-4.5];
(3)
avnm[z(j)]=
[-1.525-0.175z(j)-0.5]。
(4)
z(I)表示功率譜線的臨界帶率。Xtm[z(j)]和Xnm[z(j)]分別表示有調(diào)和無調(diào)成分的聲壓級電平,vf[z(j),z(I)]是掩蔽函數(shù)。
將有調(diào)和無調(diào)成分掩蔽閾值與靜音掩蔽閾值按照公式(5)計算全局掩蔽閾值,最后得到的全局掩蔽閾值曲線如圖6所示。
LTg(i)=
(5)
圖6 全局掩蔽閾值曲線Fig.6 The global masking threshold curve
對圖2的樣本語音信號加入3個頻率分別為40Hz,200Hz,400Hz的正弦信號,用心理聲學(xué)模型求得的掩蔽結(jié)果如圖7所示。再給其加入3個頻率分別為40Hz,45Hz,400Hz正弦信號,結(jié)果如圖8所示。
圖7 不同頻率信號掩蔽效應(yīng)圖一Fig.7 Chart one of different frequency signal masking effect
圖8 不同頻率信號掩蔽效應(yīng)圖二Fig.8 Chart two of different frequency signal masking effect
對比圖7和圖8,不難發(fā)現(xiàn),同樣是給樣本語音信號中加入了3個不同頻率的信號,圖7出現(xiàn)了3個較明顯的波峰,而圖8只出現(xiàn)了兩波峰,說明第一種頻率組合下,三者之間沒有發(fā)生掩蔽,第二種情況,是40Hz將45Hz的信號掩蔽掉了,并未與400Hz的信號發(fā)生干擾現(xiàn)象。
總之,較強(qiáng)的低頻信號可以掩蔽較弱的高頻信號,而且當(dāng)信號所處的頻段距離較遠(yuǎn)時,那么信號彼此之間很難形成掩蔽。
3.1 異常音檢測流程
通過心理聲學(xué)模型可以求出信號掩蔽閾值曲線,掩蔽閾值曲線以下的異常音信號將會被掩蔽掉而不被人耳所感知,掩蔽閾值曲線以上的異常音將會被人耳聽到。由此,提出一種異常音檢測算法,具體流程如圖9所示。
圖9 異常音檢測及提取算法流程圖Fig.9 Abnormal sound detection and extraction algorithm flowchart
仿真中,選取chirp信號作為激勵信號并給其加入正弦信號后的混合信號作為異常音信號進(jìn)行算法仿真。運(yùn)用心理聲學(xué)模型,將全局掩蔽閾值曲線以上的信號的功率成分提取出,初步判為噪音,并和仿真前的噪音求取相關(guān)系數(shù)。同理,從混合信號中減去提取出的噪音信號作為去噪后的激勵信號,將其與原激勵信號求取相關(guān)系數(shù),通過兩組相關(guān)系數(shù)就可驗證該算法是否有效。
3.2 算法仿真結(jié)果
按照圖9的仿真流程,在心理聲學(xué)模型仿真中選用凱撒窗函數(shù),進(jìn)行仿真信號功率譜密度的計算,得到掩蔽閾值曲線如圖10所示。
圖10 基于凱撒窗的掩蔽閾值曲線Fig.10 The masking threshold curve based on Kaiser window
圖10是基于心理聲學(xué)模型求出的掩蔽閾值曲線,不難發(fā)現(xiàn)功率譜的最大幅值位于掩蔽閾值曲線之上,該部分不能被掩蔽掉,提取閾值曲線以上的異常音功率譜并進(jìn)行傅里葉逆變換求取其時域波形圖。并與原噪音信號進(jìn)行比較,最終得到圖11。
圖11 基于凱撒窗的異常音提取結(jié)果Fig.11 The abnormal sound extraction result based on Kaiser window
圖11為去噪后的信號及其與原激勵信號的差值信號、提出的噪音信號時域波形。
3.3 有效性驗證
由于不同窗函數(shù)頻譜特性不同,而且不同參數(shù)下的凱撒窗也具有不同的頻譜特征,運(yùn)用不同參數(shù)下的凱撒窗及其他幾種窗函數(shù)進(jìn)行仿真分析,并分別求取兩組相關(guān)系數(shù)進(jìn)行算法有效性驗證,仿真中得到的相關(guān)數(shù)據(jù)如表1所示。
表1 基于不同參數(shù)的凱撒窗求取的相關(guān)系數(shù)Tab.1 Based on the different parameters of Kaiser window to calculate the correlation coefficient
表1中,通過得到的3個區(qū)段參數(shù)下的相關(guān)系數(shù),不難發(fā)現(xiàn)其變化規(guī)律類似于一個分段的減函數(shù),a在(0.0,0.7]半開半閉區(qū)間時的相關(guān)系數(shù)為恒定值,也是最大的一組相關(guān)系數(shù),說明凱撒窗取該區(qū)間內(nèi)的參數(shù)值時,算法的去噪效果最好。
下一步,我們將按照中發(fā)〔2010〕11號文件、2011年中央1號文件和2012年2月份國務(wù)院批復(fù)的西部大開發(fā)“十二五”規(guī)劃等要求,繼續(xù)把西部地區(qū)的水利建設(shè)擺在優(yōu)先和突出重要的位置,著力圍繞解決西南地區(qū)的工程性缺水和西北地區(qū)的資源性缺水問題,以這兩個問題為重點全面推進(jìn)西部地區(qū)水利建設(shè)和水資源綜合管理。重點做好以下五個方面的工作:
以掩蔽效應(yīng)原理為基礎(chǔ),對心理聲學(xué)模型I
及掩蔽效應(yīng)進(jìn)行了仿真研究,并提出了基于掩蔽效應(yīng)的異常音檢測算法,通過在Matlab環(huán)境下仿真,運(yùn)用不同參數(shù)的凱撒窗函數(shù)進(jìn)行算法有效性驗證,得到了一組最大的相關(guān)系數(shù),其中,噪音的最大相關(guān)系數(shù)為0.992 1;激勵的最大相關(guān)系數(shù)0.992 6,不僅驗證了該算法的有效性,也說明了在(0.0,0.7]參數(shù)區(qū)間的凱撒窗,對基于心理聲學(xué)模型的揚(yáng)聲器異常音檢測最為有效,可以有效提高異常音檢測系統(tǒng)的精度。
[1] 王琳娜,景妮琴,吳國喬,等.通過揚(yáng)聲器振膜位移測試頻響曲線[J].中國測試, 2013, 39(5):31-33.
[2] 周楊.基于虛擬儀器技術(shù)的混合信號電路自動測試系統(tǒng)研究[D].長春:吉林大學(xué),2013.
[3] 馬牧.基于虛擬儀器的分布式測試系統(tǒng)的設(shè)計與實現(xiàn)[D].西安:西安電子科技大學(xué),2012.
[4] 李宏斌,徐楚林,溫周斌,等. 基于短時傅里葉變換的異常音檢測方法[J].聲學(xué)技術(shù),2014,33(2):145-149.
[5] 胡海翔. 基于Hilbert-Huang變換的情感語音特征提取研究[D].長沙:長沙理工大學(xué),2013.
[6] 韋峻峰,楊益,溫周斌,等. 一種揚(yáng)聲器異常音的時域特征檢測方法[J].振動與沖擊,2011,30(10):122-128.
[8] 黃海.揚(yáng)聲器非線性特性的Hilbert-Huang變換分析[J].浙江大學(xué)學(xué)報:工學(xué)版,2005,39(3):385-391.
[9] 汪輝.分?jǐn)?shù)階小波變換理論及其應(yīng)用研究[D].西南交通大學(xué), 2014.
[10] 張曉娜.基于Hilbert-Huang變換的局部場電位響應(yīng)調(diào)諧特性研究[D].鄭州:鄭州大學(xué),2013.
[11] 顏利君. 基于噪聲估計和掩蔽效應(yīng)的語音增強(qiáng)[D].成都:西南交通大學(xué), 2014.
[12] 張冠軍,郁梅,廖義,等. 基于立體掩蔽效應(yīng)的非對稱立體視頻編碼算法[J]. 寧波大學(xué)學(xué)報:理工版,2014,27(1):44-47.
(編 輯曹大剛)
The application of masking effect in the speaker abnormal sounds detection
LI Yun-hong, LI Xiao-ying, ZHOU Jing-lei, PAN Yang
(School of Electronics and information, Xi′an Polytechnic University, Xi′an 710048, China)
Pure sound detection is the traditional abnormal sound detection method of loudspeaker, which is affected by many subjective factors, leading to listening leakage, misjudgment.The abnormal sound detection technologies based on the virtual instrument have shortcomings of low efficiency, low precision, high cost and so on. Given all of this, based on masking effect, this paper puts forward an abnormal sound detection method of loudspeaker, which extracts the audible abnormal sound above the masking threshold value curve, by comparing the abnormal sound power spectrum with the masking threshold, and uses the correlation coefficient to carry on the algorithm validity confirmation. The results shows the Caesar window in the (0.0,0.7] parameter interval makes the correlation coefficient of the incentive and noise reach 0.992 6 and 0.992 1 respectively, which achieves the detection requirements of high performance, high precision and easy operation effectively.
the abnormal sound detection of the loudspeakers; masking effect; the psychoacoustic model I
2014-12-23
西安市科技局技術(shù)轉(zhuǎn)移促進(jìn)工程基金資助項目(CXY1431(4));國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃基金資助項目(201410709024);西安工程大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃基金資助項目(201403018);陜西高等教育教學(xué)改革研究基金資助項目(13BZ60);陜西省教育廳科研計劃基金資助項目(14JK1319);陜西省科技廳自然科學(xué)基礎(chǔ)研究計劃基金資助項目(2013JC2-15)
李云紅,女,遼寧錦州人,副教授,博士,從事紅外熱像測溫技術(shù)、圖像處理、信號與信息處理技術(shù)研究。
TB52+3;TB54
:ADOI:10.16152/j.cnki.xdxbzr.2015-02-009