衛(wèi)國標(biāo)
摘要:語音信號是現(xiàn)代通信系統(tǒng)傳輸?shù)闹匾盘栔?,語音信號的大量使用,使得語音信號發(fā)送傳輸技術(shù)研究持續(xù)發(fā)展。因此,如何對語音信號質(zhì)量評估就成為改變廣播行業(yè)的重要課題。本項目基于保證節(jié)目語音質(zhì)量考慮量,提出采用PESQ算法模型,并設(shè)計實現(xiàn)基于PESQ算法的廣播語音技術(shù)質(zhì)量評測系統(tǒng)。
關(guān)鍵詞:PESQ;廣播語音質(zhì)量,MOS;音頻質(zhì)量評估
中圖分類號:TP37 文獻標(biāo)識碼:A 文章編號:1009-3044(2018)07-0178-02
現(xiàn)今傳媒業(yè)之間競爭日趨激烈,傳統(tǒng)媒體代表--廣播電視,面臨市場份額嚴(yán)重縮水和影響力持續(xù)下降的影響,要改變不利局面,既要改變節(jié)目形式,增加節(jié)目內(nèi)容,還要提高播出節(jié)目的語音質(zhì)量。廣播節(jié)目語音質(zhì)量,指的是經(jīng)訪談、錄音、編輯、傳輸發(fā)送后語音信息的保真度。假如播出的節(jié)目語音差,出現(xiàn)回聲、畸變、音量過低或過高等情況,就會影響宣傳效果,節(jié)目內(nèi)容再好也難獲得較高的收視收聽率。該文正是基于以上考慮,提出并設(shè)計實現(xiàn)基于PESQ算法的廣播語音技術(shù)質(zhì)量評測系統(tǒng)。
1 廣播語音質(zhì)量測評系統(tǒng)簡介
廣播語音質(zhì)量測評系統(tǒng)采用PESQ (Perceptual Evaluation of Speech Quality) 感知通話質(zhì)量評估算法,依據(jù)部分感知標(biāo)準(zhǔn)作出對語音信號的質(zhì)量的客觀評價,設(shè)計實現(xiàn)一種可量化的語音質(zhì)量評測方法,并且這些評測標(biāo)準(zhǔn)完全符合人們對語音質(zhì)量的體驗。評估系統(tǒng)接收電臺播出的語音信號,將信號進行解調(diào),利用算法進行質(zhì)量評測,獲得語音信號經(jīng)發(fā)送傳輸后的失真狀況。
語音評測系統(tǒng)將電臺傳輸來的語音信號進行A/D轉(zhuǎn)換,經(jīng)同步處理后,獲得語音失真相關(guān)數(shù)據(jù),再依據(jù)選擇的測量方法對失真語音信號展開算法分析處理,獲得相關(guān)測度差離值。最后比照先驗?zāi)0?,最終得到相對應(yīng)的MOS值。
在語音質(zhì)量評測系統(tǒng)中,通過對應(yīng)的測度算法實現(xiàn),使用設(shè)計的軟件包來完成評測。即通過PESQ算法來分析失真語音信號,實現(xiàn)得到相應(yīng)的測度差離值。在模板對應(yīng)中,一定要有相應(yīng)的先驗?zāi)0遄鳛閰⒄?。這要求在PESQ算法實現(xiàn)以后,需開展大量實踐實驗,獲得廣播通信多種情況的先驗?zāi)0?,從而可集成到相?yīng)的PESQ測度的MOS分值。
2 PESQ 算法
與PEQM標(biāo)準(zhǔn)不同,PESQ 是基于感知模型的語音質(zhì)量客觀評價標(biāo)準(zhǔn)。針對通信系統(tǒng)中出現(xiàn)的線性濾波和可時間延遲這兩個問題,PESQ做了改進,在對差值曲面的解釋中,既考慮誤差的分布,又考慮誤差的總量,同時增強了端到端語音通信質(zhì)量的可靠性評價。PESQ 算法結(jié)構(gòu)如圖2所示。
PESQ算法的設(shè)計思想是:首先電平對齊參考信號和經(jīng)過被測系統(tǒng)信號,使之符合聽覺電平要求標(biāo)準(zhǔn)。再使用輸入濾波器進行濾波。通過電平對齊和輸入濾波對兩個信號進行時間對準(zhǔn)均衡處理,實施聽覺變換,獲得系統(tǒng)中增益變化和線性濾波的均衡和補償。聽覺變換后對兩個信號間區(qū)別進行擾動處理,提取出兩個失真參數(shù),在時間和頻率上累計得出PESQ 分值,最后將該分值與主觀意見的預(yù)估值( MOS 值)進行映射 。
3 基于PESQ算法的廣播語音質(zhì)量評測系統(tǒng)設(shè)計
3.1 系統(tǒng)硬件結(jié)構(gòu)
評測系統(tǒng)硬件結(jié)構(gòu)包含支撐模塊、業(yè)務(wù)處理模塊、后臺管理模塊、信令處理模塊和語音音質(zhì)量測評系統(tǒng),能實現(xiàn)錄音、放音以及評測等功能,它的硬件結(jié)構(gòu)如圖3:
語音業(yè)務(wù)前臺主要包含語音信令處理、數(shù)據(jù)庫處理、呼叫處理等幾個部分。信令處理功能提供BICC、H.248 、SIP等呼叫協(xié)議處理功能。
語音業(yè)務(wù)后臺主要完成的是系統(tǒng)支撐功能,負(fù)責(zé)提供人機交互接口、網(wǎng)絡(luò)管理接口等,實現(xiàn)了加載程序、配置數(shù)據(jù)、管理設(shè)備和模塊間通信等功能。
數(shù)據(jù)庫處理單元完成存儲語音數(shù)據(jù)等數(shù)據(jù)庫管理功能,建立連接語音評估功能架構(gòu)的接口,最后由語音評測評系統(tǒng)對語音質(zhì)量進行評估。
3.2 系統(tǒng)整體設(shè)計
根據(jù)語音評測流程,語音質(zhì)量評測系統(tǒng)應(yīng)由語音采樣、語音傳送、音頻質(zhì)量評測、GUI界面呈現(xiàn)四個部分組成。語音質(zhì)量測評系統(tǒng)的架構(gòu)設(shè)計如圖4 所示:
3.3系統(tǒng)實現(xiàn)流程
語音質(zhì)量評測總體實現(xiàn)流程圖如圖5所示:
評測系統(tǒng)首先配置相應(yīng)測試腳本,提供指令創(chuàng)建無線鏈接,通過解碼提取音頻數(shù)據(jù),以便控制發(fā)送原樣本語音數(shù)據(jù)和采集采樣數(shù)據(jù),該批次數(shù)據(jù)采樣結(jié)束后結(jié)合 PESQ 評估算法進行語音質(zhì)量評測,得出相關(guān)MOS 分值,將評估結(jié)果以CUI界面呈現(xiàn),并可對比播放采樣語音和樣本語音。
PESQ評測系統(tǒng)通過對比樣本信號和降級信號,使樣本信號通過一個通信體系得到結(jié)果。系統(tǒng)先對樣本信號和經(jīng)過網(wǎng)絡(luò)傳輸?shù)耐嘶盘栠M行電平調(diào)整,再模擬聽筒用輸入濾波器濾波。兩個信號需校準(zhǔn)時間點,并利用聽覺變換對系統(tǒng)中增益變化和線性濾波進行均衡和補償,再結(jié)合感知模型,映射出主觀平均意見分;在干擾度計算中需識別出壞區(qū)間,這需重新對齊壞區(qū)間。總的來說,樣本信號和輸出信號的差異性越大,得出的MOS分值就越低。
4 結(jié)束語
評測系統(tǒng)采用PESQ作為測量MOS 值的基本算法,實現(xiàn)由 PESQ 算法驗證評測準(zhǔn)確性,并進行語音MOS 值評分,從相關(guān)度和殘余誤差兩個參數(shù)來看,PESQ算法改進了判定依據(jù)。結(jié)合后臺實現(xiàn)的各測試指標(biāo)的性能統(tǒng)計對比功能, 整個語音質(zhì)量評測系統(tǒng)基本實現(xiàn)了現(xiàn)在強調(diào)的 QoE(Quality Of Experience)要求。
參考文獻:
[1] GBT 16463-1996 廣播節(jié)目聲音質(zhì)量主觀評價方法和技術(shù)指標(biāo)要求[S].
[2] 安澤華.廣播節(jié)目聲音質(zhì)量的客觀測量與主觀評價[J].電聲技術(shù),2015,38(11):38-40.
[3] 荊瀅,張慧.電視節(jié)目技術(shù)質(zhì)量評測指標(biāo)體系與方法研究[J].現(xiàn)代電視技術(shù), 2013(6):19-20.
[4] 李懷暢.WMA流媒體音質(zhì)測試與分析[J]. 電聲技術(shù),2014,38(12):67-69.