国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Wavelet-COH在通信語(yǔ)音質(zhì)量評(píng)估算法中的應(yīng)用研究*

2015-03-25 05:16
通信技術(shù) 2015年9期
關(guān)鍵詞:評(píng)測(cè)頻譜主觀

陳 靜

(中國(guó)人民解放軍91404部隊(duì),河北 秦皇島 066001)

Wavelet-COH在通信語(yǔ)音質(zhì)量評(píng)估算法中的應(yīng)用研究*

陳 靜

(中國(guó)人民解放軍91404部隊(duì),河北 秦皇島 066001)

將小波變換用于子帶分解,對(duì)純凈語(yǔ)音信號(hào)和受擾語(yǔ)音信號(hào)進(jìn)行特征提取,包括質(zhì)心、子帶能量和帶寬等,并進(jìn)一步與一致性函數(shù)(COH)方法相結(jié)合對(duì)語(yǔ)音客觀音質(zhì)評(píng)價(jià)方法進(jìn)行了研究,即Wavelet-COH方法。通過(guò)最小二乘多項(xiàng)式擬合模型,對(duì)Wavelet-COH方法得到的客觀評(píng)測(cè)和主觀評(píng)測(cè)結(jié)果進(jìn)行相關(guān)分析,得出相應(yīng)算法的相關(guān)系數(shù)和方差值。通過(guò)對(duì)比,表明Wavelet-COH語(yǔ)音評(píng)估方法比傳統(tǒng)的COH客觀評(píng)價(jià)方法有很大改善。

小波變換; COH; 語(yǔ)音音質(zhì)客觀評(píng)價(jià)

0 引 言

語(yǔ)音質(zhì)量評(píng)估一直是通信領(lǐng)域以及語(yǔ)音編碼領(lǐng)域的研究熱點(diǎn)。在現(xiàn)代化通信系統(tǒng)中存在各種干擾,包括不可避免的通信噪聲干擾,以及一些以阻斷通信為目的人為干擾。如何對(duì)各種干擾進(jìn)行評(píng)價(jià),給出客觀的評(píng)測(cè)指標(biāo),以及如何評(píng)價(jià)通信系統(tǒng)在這些干擾下的抗干擾能力,對(duì)完善高質(zhì)量的通信系統(tǒng),確保通信任務(wù)順利進(jìn)行起著至關(guān)重要的作用。

語(yǔ)音質(zhì)量評(píng)估可以分為主觀評(píng)價(jià)和客觀評(píng)價(jià)兩種。主觀評(píng)價(jià)的依據(jù)是ITU-TP.800(傳輸質(zhì)量的主觀評(píng)價(jià)方法),以人為主體的評(píng)價(jià)方法,利用人主觀感覺的滿意度以可懂度為原則給聽到的語(yǔ)音打分,并通過(guò)得分情況來(lái)評(píng)價(jià)端到端的語(yǔ)音質(zhì)量[1]。與主觀評(píng)價(jià)不同的另一種評(píng)價(jià)方法是客觀評(píng)價(jià),客觀評(píng)價(jià)的目的是建立一個(gè)人腦與耳朵的模型,來(lái)模擬聽眾環(huán)境,并通過(guò)這個(gè)模型來(lái)模擬聽覺的失真,計(jì)算出一個(gè)質(zhì)量指標(biāo),來(lái)衡量發(fā)送語(yǔ)音和接收語(yǔ)音之間的質(zhì)量下降程度[2]。

從語(yǔ)音質(zhì)量客觀評(píng)價(jià)性能的提高過(guò)程來(lái)看,客觀評(píng)價(jià)方法研究大致經(jīng)歷了這樣幾個(gè)階段:時(shí)域階段(如SNR等)、頻域譜分析階段(如SD、COH等)、模型參數(shù)(LPC分析)階段(如CD等)、聽覺模型階段(BSD、MBSD和PSQM等)[3]及聽覺模型與判斷模型的混合(hybrid)模型階段(如AD/MNB等)[4]。因此可以將客觀評(píng)價(jià)從使用的主要技術(shù)方法上分為基于SNR的評(píng)價(jià)方法、基于LPC技術(shù)的評(píng)價(jià)方法、基于譜距離的評(píng)價(jià)方法、基于聽覺模型的評(píng)價(jià)方法、基于判斷模型的評(píng)價(jià)方法、其它類評(píng)價(jià)方法[5]。

其中COH方法的實(shí)質(zhì)是在頻域計(jì)算純凈語(yǔ)音和受干擾語(yǔ)音的相關(guān)性的一種度量。近年來(lái)小波分析在語(yǔ)音合成與識(shí)別、圖像與信號(hào)處理等領(lǐng)域有著廣泛應(yīng)用。作為分析非平穩(wěn)時(shí)變信號(hào)的有力工具,小波變換采用多分辨率分析的思想,非均勻的劃分時(shí)頻空間,通過(guò)伸縮和平移等運(yùn)算功能對(duì)信號(hào)進(jìn)行多尺度細(xì)化分析,達(dá)到可以分析信號(hào)概貌和信號(hào)細(xì)節(jié)[6,7]的能力,克服了采用短時(shí)傅里葉變換進(jìn)行信號(hào)分析時(shí),傅里葉變換固定分辨率的弱點(diǎn)[8,9]。本文對(duì)小波變換在語(yǔ)音通信質(zhì)量客觀評(píng)價(jià)中的應(yīng)用進(jìn)行了研究,提出了一種新的評(píng)估方法——小波COH語(yǔ)音評(píng)估方法,與COH語(yǔ)音評(píng)估方法相比處理結(jié)果有一定的改善。

1 系統(tǒng)整體框架

整體通信語(yǔ)音質(zhì)量評(píng)估系統(tǒng)框架如圖1所示,其中語(yǔ)音信號(hào)在通信過(guò)程中受到一定的干擾。發(fā)送端的純凈語(yǔ)音信號(hào)和接收端的受擾語(yǔ)音信號(hào),在經(jīng)過(guò)同步環(huán)節(jié)之后,計(jì)算Wavelet-COH作為客觀評(píng)估分值,通過(guò)主客觀映射模型之后,得到主觀估計(jì)結(jié)果。

圖1 基于Wavelet-COH的通信語(yǔ)音質(zhì)量評(píng)估系統(tǒng)框架

1.1 同步環(huán)節(jié)

由于通信系統(tǒng)本身的算法延遲以及在不同天氣下短波傳輸信道的傳輸延遲,發(fā)送端和接收端信號(hào)需要同步環(huán)節(jié)確定真正語(yǔ)音的起始點(diǎn)對(duì)應(yīng)關(guān)系。這里采用在文件起始位置加入500 Hz和2 000 Hz的單頻純音交替出現(xiàn)作為同步信號(hào),對(duì)受擾語(yǔ)音信號(hào),同樣檢測(cè)語(yǔ)音頻譜峰值,作為檢測(cè)的同步點(diǎn)。

圖2給出發(fā)送端純凈語(yǔ)音信號(hào)和接收端受擾信號(hào)起始的500 Hz的同步信號(hào)的短時(shí)頻譜,可以看出,雖然受擾信號(hào)受到的各頻帶噪聲的干擾,但仍然在500 Hz處出現(xiàn)明顯的峰值。

(a)純凈語(yǔ)音信號(hào)的500 Hz的同步信號(hào)的短時(shí)頻譜

(b)受擾語(yǔ)音信號(hào)的500 Hz同步信號(hào)的短時(shí)頻譜

1.2 主客觀映射模型

給定n+1個(gè)數(shù)據(jù)點(diǎn)(ok,sk),其中ok為客觀評(píng)測(cè)的結(jié)果,而sk為主觀評(píng)測(cè)結(jié)果,k=0,…,n。其中客觀評(píng)價(jià)結(jié)果為Wavelet-COH結(jié)果,而主觀評(píng)價(jià)結(jié)果采用MOS分值進(jìn)行評(píng)價(jià)。

這里采用一個(gè)m次的多項(xiàng)式模型刻畫主客觀映射關(guān)系,如式(1)所示,其中ai為多項(xiàng)式的系數(shù),其由最小二乘法估計(jì)。

pm(o)=a0+a1×o+…+am×om,m

(1)

下面實(shí)驗(yàn)中m取值為2。

最小二乘法擬合的準(zhǔn)則是:使訓(xùn)練數(shù)據(jù)總的擬合誤差(即總殘差)達(dá)到最小。其目標(biāo)函數(shù)為:

(2)

2 Wavelet-COH

在客觀評(píng)估中,這里提出Wavelet-COH計(jì)算方法,旨在將小波變換的多尺度分析的優(yōu)點(diǎn)和傳統(tǒng)的COH評(píng)價(jià)結(jié)合。

2.1 Coherence Function (COH)

第i幀的COH函數(shù)值計(jì)算如下[10,11]:

(3)

式中,Ci為第i幀的COH函數(shù)值,i為幀序號(hào),k為線性頻域的頻率標(biāo)號(hào),Xi(k)為第i幀標(biāo)準(zhǔn)語(yǔ)音的離散頻譜,Yi(k)為 第i幀干擾語(yǔ)音的離散頻譜。

Ci取均值,既為失真語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)音的COH函數(shù)值,如下所示:

(4)

2.2 小波特征提取

小波變換具有恒Q性質(zhì)、并且可以同時(shí)兼顧時(shí)域、頻域分辨率,其實(shí)質(zhì)是短時(shí)傅立葉分析方法的發(fā)展與延拓。其優(yōu)于短時(shí)傅里葉變換在于其具有多分辨率分析的特點(diǎn)。從理想濾波器組的角度看,多分辨分析實(shí)質(zhì)上是將信號(hào)按頻帶進(jìn)行分解,在處理不同頻帶信號(hào)時(shí),其頻率分辨率不同[12]。

(5)

(6)

(7)

圖3 小波特征和頻譜特征的對(duì)比

2.3 Wavelet-COH

COH評(píng)價(jià)的標(biāo)準(zhǔn)是計(jì)算頻域內(nèi),信號(hào)頻譜之間的相關(guān)度。在公式(3)中,由于語(yǔ)音信號(hào)的頻譜是復(fù)數(shù),因此存在共軛和取模的操作,而對(duì)于每一幀的小波特征而言,每一維特征均為實(shí)數(shù),因此公式(3)可以重寫為:

(8)

3 實(shí)驗(yàn)及結(jié)果

3.1 實(shí)驗(yàn)方法

本文中應(yīng)用的數(shù)據(jù)是實(shí)際現(xiàn)場(chǎng)采集,具體采集數(shù)據(jù)的方法框圖如圖4所示。實(shí)驗(yàn)時(shí)按圖示聯(lián)接各設(shè)備。發(fā)射的標(biāo)準(zhǔn)語(yǔ)音文件為錄制的標(biāo)準(zhǔn)男女聲數(shù)碼報(bào)文,采用增加同步頭的方法使標(biāo)準(zhǔn)語(yǔ)音與受擾語(yǔ)音的同步誤差小于一定的指標(biāo)值,保證客觀評(píng)估算法中的時(shí)間同步。在實(shí)驗(yàn)中通信干擾設(shè)備發(fā)射不同程度的干擾信號(hào),在通信接收設(shè)備處錄取發(fā)射的通信信號(hào)和通信干擾信號(hào),形成了不同程度的受擾語(yǔ)音文件。本實(shí)驗(yàn)中一共得到受擾語(yǔ)音文件24個(gè)。主觀MOS評(píng)分按軍標(biāo)要求進(jìn)行實(shí)施。實(shí)驗(yàn)所使用的語(yǔ)音信號(hào)的采樣頻率為11 025 Hz,基本覆蓋了語(yǔ)音的基音與高次諧波頻率范圍(基音頻率為60 Hz~500 Hz,最高諧波頻率5 000 Hz左右)。

圖4 實(shí)驗(yàn)聯(lián)接示意圖

3.2 實(shí)驗(yàn)結(jié)果

圖5和圖6給出傳統(tǒng)的COH方法和Wavelet-COH方法對(duì)應(yīng)文件主觀和客觀評(píng)價(jià)的映射模型。其中橫軸為客觀評(píng)價(jià)結(jié)果,縱軸為主觀評(píng)價(jià)結(jié)果。紅色的散點(diǎn)為實(shí)際每個(gè)文件的主觀評(píng)價(jià)和客觀評(píng)價(jià)對(duì)應(yīng)值,而按照最小二乘法擬合出的曲線,為在根據(jù)客觀評(píng)價(jià)得到相應(yīng)主觀估計(jì)評(píng)價(jià)的映射模型。

圖5 COH算法擬合曲線

圖6 Wavelet-COH方法擬合曲線

衡量客觀評(píng)價(jià)測(cè)度和主觀評(píng)價(jià)MOS值的相符程度一般用相關(guān)系數(shù)R表示。其公式如下:

(9)

其中,s(d)和o(d)分別為文件d的主觀評(píng)測(cè)分值和客觀評(píng)測(cè)分值。R系數(shù)可以反映出主觀評(píng)測(cè)和客觀評(píng)測(cè)結(jié)果之間的線性相關(guān)度。

另一種衡量客觀評(píng)價(jià)測(cè)度和主觀評(píng)價(jià)測(cè)度之間擬合度的方法是用估計(jì)的主觀評(píng)測(cè)值代替實(shí)際主觀評(píng)測(cè)值之間的誤差的方差,即:

(10)

其中,s′=|s-so|,表示用主觀和客觀評(píng)價(jià)的映射模型代替主觀評(píng)價(jià)時(shí)帶來(lái)的誤差,so為估計(jì)的主觀評(píng)測(cè)值。

用COH方法對(duì)受擾語(yǔ)音文件進(jìn)行評(píng)價(jià),與主觀MOS值擬合后得到的相關(guān)系數(shù)R為0.82,方差σ為0.27。用Wavelet-COH方法對(duì)受擾語(yǔ)音文件進(jìn)行評(píng)價(jià),與主觀MOS值擬合后得到的相關(guān)系數(shù)R為0.90,方差σ為0.18。

3.3 結(jié)果分析

從相關(guān)系數(shù)試驗(yàn)以及方差結(jié)果來(lái)看,本文提出的Wavelet-COH方法性能優(yōu)于傳統(tǒng)的COH方法。從圖2可以看出,在本實(shí)驗(yàn)系統(tǒng)中,通信干擾帶來(lái)的噪聲分布在各個(gè)頻段,語(yǔ)音信號(hào)質(zhì)量因此受到很大干擾。傳統(tǒng)的COH方法是在頻譜系數(shù)基礎(chǔ)上進(jìn)行相關(guān)匹配,因此在這種條件下受到的影響較大。而小波系數(shù)和頻譜系數(shù)相比具有較好的頑健性,其可以在較強(qiáng)噪聲環(huán)境下較好地表現(xiàn)語(yǔ)音信號(hào),更適合在強(qiáng)噪聲干擾下的通信語(yǔ)音質(zhì)量評(píng)估。

4 結(jié)束語(yǔ)

本文提出了一種基于小波變換原理的語(yǔ)音客觀音質(zhì)評(píng)價(jià)的方法,有效將小波變換的優(yōu)點(diǎn)和COH方法結(jié)合。與主觀測(cè)量結(jié)果進(jìn)行相關(guān)分析,通過(guò)對(duì)比相關(guān)系數(shù)和方差值,在強(qiáng)干擾下得到優(yōu)于傳統(tǒng)COH方法的性能。實(shí)驗(yàn)結(jié)果表明:由于小波特征對(duì)噪聲的頑健性,將其應(yīng)用在COH客觀評(píng)價(jià)方法中時(shí),使擬合曲線有較高的相關(guān)系數(shù)和較低的方差,可以很好的提高語(yǔ)音音質(zhì)客觀評(píng)價(jià)的準(zhǔn)確性,是一種可以推廣應(yīng)用的分析方法。

[1] ITU-T Recommendation P.800, Methods for Subjective Determination of Transmission Quality[S]. Geneva: International Telecommunication Union,1996.

[2] 陳國(guó), 胡修林, 張?zhí)N玉等. 語(yǔ)音質(zhì)量客觀評(píng)價(jià)方法研究進(jìn)展[J]. 電子學(xué)報(bào), 2001, 29(4):1-5. CHEN Guo, HU Xiu-lin, ZHANG Yun-yu, et al. Research Progress of Objective Evaluation of Speech Quality[J], Acta Electronica Sinica,2001, 29(4):1-5.

[3] ITU-T Recommendation P.862, Perceptual Evaluation of Speech Quality (PESQ): An Objective Method for End-to-End Speech Quality Assessment of Narrow-Band Telephone Networks and Speech Codecs [S]. Geneva: International Telecommunication Union, 2001.

[4] 陳明義,陳里,桂衛(wèi)華. 基于MNB2算法的編解碼器客觀評(píng)估的應(yīng)用研究,電路與系統(tǒng)學(xué)報(bào),2004,9(1):126-129. CHEN Ming, CHEN Li, GUI Wei-hua. Applied Research of Objective Evaluation of Speech Codecs based on MNB2, Journal of Circuits and Systems, 2004, 9(1):126-129.

[5] 李薇,胡智奇,尚秋峰等.語(yǔ)音質(zhì)量客觀評(píng)價(jià)方法的研究[J]. 電力系統(tǒng)通信, 2009,30(198): 64-67,71. LI Wei,HU Zhi-qi,SHANG Qiu-feng,et al.Study of Objective Evaluation of Speech Quality[J]. Telecommunications for Electric Power System,2009,30(198):64-67,71.

[6] 許山川.基于小波變換的語(yǔ)音信號(hào)去噪研究[D].秦皇島:燕山大學(xué),2006. XU Shan-chuan. The Research of Speech De-Nosing based on Wavelet Transform[D].Qinhuangdao: Yanshan University, 2006.

[7] 付維勇.基于小波變換的語(yǔ)音信號(hào)處理的應(yīng)用研究[D].昆明:昆明理工大學(xué),2008. FU Wei-yong. The Research of Application on Speech Signal Processing based on Wavelet Transform[D].Kunming: Kunming University of Science and Technology,2008.

[8] 譚喬來(lái).語(yǔ)音增強(qiáng)方法研究及應(yīng)用[D].長(zhǎng)沙:湖南師范大學(xué),2008. TAN Qiao-lai. The Research on Speech Enhancement Method and Its Application[D].Changsha: Hunan Normal University,2008.

[9] 齊揚(yáng)陽(yáng),于淼,陳建忠.一種基于小波包的單通道盲源分離跳頻通信抗干擾方法[J],通信技術(shù),2014,47(12):1361-1362. QI Yang-yang, YU Miao, CHEN Jian-zhong. An Anti-Jamming Method for Frequency-Hopping Communication based on Single Channel BSS of Wavelet Packet[J]. Communications Technology, 2014,47(12):1361-1362.

[10] 張建良.基于小波變換的語(yǔ)音信號(hào)的噪聲處理研究[D].蘭州:蘭州大學(xué),2007. ZHANG Jian-liang. De-Nosing Study of Speech Signal Based on Wavelet Method[D]. Lanzhou: Lanzhou University, 2007.

[11] 張璐琳.GJB4405A-2006,語(yǔ)音通信干擾效果評(píng)定準(zhǔn)則[S].北京:總裝備部軍標(biāo)出版發(fā)行部:12-13. ZHANG Lu-lin. GJB4405A-2006, Assessment Rule of Jamming Effect for Speech Communications[S].Beijing: The General Armaments Department Military Standard Publication Distribution Department: 12-13.

[12] 陳靜,趙凌偉.基于小波變換的語(yǔ)音質(zhì)量客觀評(píng)估方法研究[J],無(wú)線電工程,2012,42(10):14-15. CHEN Jing, ZHAO Ling-wei. Study of Objective Evaluation of Communication Speech Quality based on Wavelet Transform[J]. Radio Engineering, 2012,42(10):14-15.

Application of Wavelet-COH in Communication Speech Quality Evaluation Algorithm

CHEN Jing

(Unit 91404of PLA, Qinhuangdao Hebei 066001,China)

With the application of wavelet tranform in sub-band decomposition, the characteristics of both clean and jammed speech signals are extracted,such as centroid, sub-band energy and band width. These characteristics are further combined with COH (Coherence Function), i.e. Wavelet-COH, and applied to objective evaluation of speech quality. Based on least squares polynomial fitting model, the obtained results of both objective and subjective evaluations through Wavelet-COH are analyzed, and the relationship coefficient and error variance also acquired. Comparison indicates that the Wavelet-COH speech evaluation method enjoys even more significant improvement as compared with traditional COH objective evaluation method.

wavelet transform; COH; objective evaluation of speech quality

2015-03-03;

2015-07-08 Received date:2015-03-03;Revised date:2015-07-08

TN912.3

A

1002-0802(2015)09-1032-05

10.3969/j.issn.1002-0802.2015.09.011

陳 靜(1975—),女,碩士,高級(jí)工程師。主要研究方向?yàn)橥ㄐ艑?duì)抗。

猜你喜歡
評(píng)測(cè)頻譜主觀
“美好生活”從主觀愿望到執(zhí)政理念的歷史性提升
次時(shí)代主機(jī)微軟XSX全方位評(píng)測(cè)(下)
次時(shí)代主機(jī)微軟XSX全方位評(píng)測(cè)(上)
一種用于深空探測(cè)的Chirp變換頻譜分析儀設(shè)計(jì)與實(shí)現(xiàn)
加一點(diǎn)兒主觀感受的調(diào)料
攻坡新利器,TOKEN VENTOUS評(píng)測(cè)
Canyon Ultimate CF SLX 8.0 DI2評(píng)測(cè)
人民音樂(lè)(2016年3期)2016-11-07
主觀評(píng)述構(gòu)式“很+x”認(rèn)知研究
遙感衛(wèi)星動(dòng)力學(xué)頻譜規(guī)劃