王 杰,王友國,翟其清
(南京郵電大學(xué) 理學(xué)院,江蘇 南京 210046)
語音是人們在日常生活中進行交流溝通的主要媒介,因此語音傳輸就成為人與人之間信息傳輸?shù)闹匾绞?。隨著信息技術(shù)的快速發(fā)展,語音通訊技術(shù)被廣泛應(yīng)用[1-3]。然而,在語音信號傳輸?shù)倪^程中,信號不可避免地會受到來自外界和內(nèi)部噪聲的影響,這就使得獲取到的語音信號存在失真的情況。為此學(xué)者們一直致力于尋找降噪、去噪的方法來提高語音信號的傳輸效率。但有些學(xué)者發(fā)現(xiàn),噪聲能夠起到輔助信號傳輸?shù)淖饔谩N墨I[4]討論了語音信號在二元輸出的單閾值系統(tǒng)中,適當(dāng)?shù)募有栽肼暷軌蚋纳普Z音信號的傳輸,這種現(xiàn)象被稱為閾上隨機共振。
2000年,Stocks[5]研究了單閾值網(wǎng)絡(luò)系統(tǒng)中的閾上隨機共振現(xiàn)象。2015年,McDonnell等人[6]基于其在2009年提出的隨機池網(wǎng)絡(luò)模型[7],以互信息為測度研究了在加性噪聲下的具有多元輸出的閾值系統(tǒng)中的閾上隨機共振現(xiàn)象。Cheng等人[8]研究了在乘性噪聲作用下,分別以互信息和信噪比為測度的具有多元輸出閾值系統(tǒng)中的閾上隨機共振現(xiàn)象。陳楠等人[9]以互信息為測度,研究了在加性和乘性噪聲共同作用下的多閾值系統(tǒng)中的閾上隨機共振現(xiàn)象。目前,閾上隨機共振的研究已經(jīng)得到了廣泛的應(yīng)用[10-18],如參數(shù)信號的估計任務(wù)[13]、信號重構(gòu)[14]、圖像恢復(fù)[18]等。
該文在文獻[4,9]的基礎(chǔ)上,選取相關(guān)系數(shù)為測度,研究其在受到加性和乘性噪聲共同作用下的具有多元輸出閾值系統(tǒng)中的閾上隨機共振現(xiàn)象。此外還用真實語音信號作為輸入進行仿真來驗證在一定噪聲強度范圍內(nèi),語音信號在傳輸過程中能夠發(fā)生閾上隨機共振現(xiàn)象。
該文采用多閾值網(wǎng)絡(luò)模型作為語音信號傳輸系統(tǒng),它包含N個閾值單元,如圖1所示[9]。
圖1 多閾值網(wǎng)絡(luò)系統(tǒng)模型
文獻[19]通過實驗評估證明,語音信號的統(tǒng)計量類似于多元拉普拉斯。拉普拉斯在去相關(guān)域中準(zhǔn)確地描述了所有語音的邊緣分布。盡管語音成分的能量是隨時間變化的,但它們的分布形狀仍然是拉普拉斯式的。因此,用拉普拉斯分布可以很好地描述語音樣本的分布。在圖1的閾值系統(tǒng)中,輸入信號x選擇均值為0、方差為σ2的拉普拉斯信號,其概率密度函數(shù)為:
(1)
αi、βi分別為標(biāo)準(zhǔn)高斯加性噪聲和標(biāo)準(zhǔn)高斯乘性噪聲,且二者相互獨立,即:
〈αi,αj〉=0,〈βi,βj〉=0,i≠j,且〈αi,βj〉=0,
i=1,2,…,N,j=1,2,…,M
(2)
經(jīng)噪聲作用后的第i個閾值單元的輸入為:
vi=x+Dβix+Qαi
(3)
其中,D和Q分別為乘性噪聲強度和加性噪聲強度,當(dāng)D→0時,系統(tǒng)中僅受到加性噪聲作用,當(dāng)Q→0時,系統(tǒng)中僅受到乘性噪聲作用。vi的條件概率可表示為:
P(vi|x)=
(4)
該模型的每個閾值單元均有M個閾值θi,j,其中i=1,2,…,N,j=1,2,…,M。規(guī)定θi,0=-∞,θi,M+1=+∞。為了便于計算,不妨假設(shè)每個閾值單元的閾值在[0,1]上服從均勻分布,且每個閾值單元的閾值相等,即有:
θ1,j=θ2,j=…=θN,j,j=1,2,…,M
(5)
每個閾值單元的輸出為:
(6)
每個閾值單元的輸出條件概率為:
(7)
(8)
(9)
文獻[20]即為文中閾值輸出元數(shù)M=2,乘性噪聲強度D=0時的情況。
取相關(guān)系數(shù)作為語音信號傳輸?shù)臏y度[4],當(dāng)輸入信號為x,輸出信號為y時,相關(guān)系數(shù)為:
(10)
由式(1),E(x)=0,故上式化簡為:
(11)
其中,
(12)
(13)
該文取信號x的標(biāo)準(zhǔn)差σ=1。利用式(11)~式(13),在閾值分布區(qū)間為[0,1],M=4,N=4時,數(shù)值計算得到相關(guān)系數(shù)R隨著乘性噪聲強度D和加性噪聲強度Q的變化情況。觀察圖2,系統(tǒng)中發(fā)生了閾上隨機共振現(xiàn)象,即適量的噪聲可以起到輔助信號傳輸?shù)淖饔?。在一定精度下,得到的最?yōu)噪聲D=0.01,Q=0.44,在此種情況下,信號輸出效果最佳。
圖2 相關(guān)系數(shù)R隨著乘性噪聲強度D和加性噪聲強度Q的變化(閾值分布區(qū)間為[0,1],M=4,N=4)
圖3和圖4給出了在給定乘性噪聲D(加性噪聲Q)的情況下,相關(guān)系數(shù)R隨著加性噪聲Q(乘性噪聲D)的變化情況。
設(shè)置閾值區(qū)間為[0,1],閾值單元數(shù)N=4。在不同閾值單元輸出元數(shù)下,圖3(a)給出了當(dāng)乘性噪聲D=0.02,相關(guān)系數(shù)隨著加性噪聲Q的變化情況。圖3(b)給出了加性噪聲Q=0.02,相關(guān)系數(shù)隨著乘性噪聲D的變化情況,在圖3中,相關(guān)系數(shù)的初始值和峰值隨M值的增大而增加,且均發(fā)生了閾上隨機共振現(xiàn)象。隨著M的增大,閾值單元中的閾值相應(yīng)減小,閾值輸出元數(shù)對系統(tǒng)信息傳輸?shù)奶岣吣芰σ掩呌陲柡蜖顟B(tài)。
設(shè)置閾值區(qū)間為[0,1],閾值輸出元數(shù)M=4。在不同閾值單元個數(shù)下,圖4(a)給出了當(dāng)乘性噪聲D=0.02,相關(guān)系數(shù)隨著加性噪聲Q的變化情況。圖4(b)給出了加性噪聲Q=0.02,相關(guān)系數(shù)隨著乘性噪聲D的變化情況。由圖4,隨著N的增大,相關(guān)系數(shù)的值也隨之增大,且當(dāng)N≥2時均發(fā)生了明顯的閾上隨機共振現(xiàn)象。這表明,在非零噪聲情況下,增加閾值單元的個數(shù)能明顯提高系統(tǒng)中信息傳輸?shù)哪芰Α?/p>
(a)乘性噪聲D=0.02 (b)加性噪聲Q=0.02
(a)乘性噪聲D=0.02 (b)加性噪聲Q=0.02
選取了一個時長為2秒,采樣頻率為44 100 Hz的音頻文件,如圖5所示。
圖5 語音信號時域圖
該文將音頻文件作為圖1所示的多閾值系統(tǒng)的輸入信號進行仿真。對于給定的語音輸入信號x=(x1,x2,…,xl)以及系統(tǒng)輸出信號y=(y1,y2,…,yl),l是信號長度,輸入信號x和輸出信號y的平均值分別為:
(14)
輸入輸出的相關(guān)系數(shù)表達式如下:
(15)
通過仿真,圖6和圖7給出了在給定乘性噪聲D(加性噪聲Q)的情況下,相關(guān)系數(shù)R隨著加性噪聲Q(乘性噪聲D)的變化情況。
(a)乘性噪聲D=0.02 (b)加性噪聲Q=0.02
(a)乘性噪聲D=0.02 (b)加性噪聲Q=0.02
圖6中,隨著閾值輸出元數(shù)M的增大,語音信號處理效果逐漸增強,進一步增大M,閾上隨機共振功效逐漸趨于飽和。在圖7中,當(dāng)閾值單元個數(shù)N=1時,未發(fā)生閾上隨機共振現(xiàn)象;當(dāng)N≥2時,均發(fā)生了明顯的閾上隨機共振現(xiàn)象,即增加閾值單元數(shù)可以有效地改善系統(tǒng)中語言信號的傳輸。
從理論和實例兩個方面探討了利用閾上隨機共振現(xiàn)象來改善語音信號的傳輸。在多閾值系統(tǒng)中,分別討論了當(dāng)輸入信號為拉普拉斯信號和真實語音信號時,加性高斯噪聲和乘性高斯噪聲共同誘導(dǎo)的閾上隨機共振現(xiàn)象。
結(jié)果表明,閾上隨機共振功效可有效改善語音信號的傳輸效果,在最優(yōu)噪聲強度下,語音傳輸?shù)男Ч_到最佳。此外,在一定的噪聲強度下,增加閾值單元數(shù)和適當(dāng)提高閾值輸出元數(shù)均可以引發(fā)閾上隨機共振現(xiàn)象,從而提高信息傳輸?shù)男省?/p>