強策,夏凌,卿朝進,童新(西華大學電氣與電子信息學院,成都 610039)
QIANG Ce,XIA Ling,QING Chao-jin,TONG Xin(School of Electrical Engineering and Electronic Information,Xihua University,Chengdu 610039)
緊框架算法下的語音信號壓縮感知
強策,夏凌,卿朝進,童新
(西華大學電氣與電子信息學院,成都610039)
壓縮感知(Compressed Sensing,CS),又稱壓縮采樣、壓縮傳感,是近幾年才提出的新技術[1]。CS理論的核心思想是:將一個高維的向量投影到一個低維的空間,對獲得的低維向量進行一系列的壓縮、重構、存儲或者傳輸,原來的高維信號(稀疏信號)可以通過特定的重構算法從獲得的低維向量中較為精確地恢復出來[2]。在傳統(tǒng)的壓縮感知理論中,信號在一組正交基底表示下是稀疏表示的[3]。因而在正交基確定下來后,一個信號有且只有一種分解的方法,所以很多信號達不到最稀疏的表示[4]。然而在很多應用中發(fā)現信號在正交基的表示不是稀疏的,而是在冗余字典的表示下是稀疏的。冗余字典的稀疏表示[4]可以有效改善模式識別,壓縮或去噪效果。同時也可以求解壓縮感知的問題。
緊框架[4-5]作為冗余字典里面的一種重要形式,框架構造的簡易性及使用的靈活性[6-7]。在解決大規(guī)模問題中有很重要的作用,本文利用緊框架理論,提出一種構造測量矩陣的改進方法,使得信號的表示更為稀疏,改善語音信號的CS性能。
系統(tǒng)模型如圖1和圖2所示,壓縮感知提供了一種新方法來重構原始信號.設一維的離散信號x∈RN×1,假設RN空間內的任意的信號都可以被空間內的一組規(guī)范正交基(DCT基)Ψ=[φ1,φ2,…,φN]的線性組合表示,那么x就可以用DCT基的線性組合表示[8-9]:
圖1 壓縮感知采樣流程
圖2 壓縮感知過程
(1)式表示信號x在Ψ域內的線性分解,投影系數αi= 離散信號x滿足了稀疏性的條件后,就能將信號投影到一個和變換矩陣不相關的矩陣Ф的低維空間上,得到的投影稱作觀測序列,記作y,即: Ф是M×N矩陣,y是M維的列向量,由(2)式我們可以得出觀測后的序列y維數M遠遠小于原始信號的維數N,這樣就說明信號被壓縮了,而且壓縮后的數據大小遠小于用奈奎斯特采樣方法獲得的數據[9]。將(1)式帶代入(2)式中得到: 令Δ=ФΨ,一般稱Δ為“感知矩陣”。 測量矩陣Ф每一行都是一個測量向量,α是具有K個非零元素的系數向量.壓縮感知理論認為通過對測量矩陣的不斷優(yōu)化,得到一個性能優(yōu)秀的測量矩陣,方便后期最大限度的重構原始信號[8]。 2.1語音信號在規(guī)范范正交際上的稀疏性 2.2基于緊框架算法的觀測矩陣選取 特別的,信號在稀疏基上有且只有K個非零稀疏稱為嚴格稀疏[1]。一般情況下信號不一定是嚴格稀疏的,但信號變換域系數經過排序以后以指數級衰減趨近于零時,信號可以被認為是近似稀疏表示,這在CS理論里是完全可行的。由此看來,語音信號稀疏基的選擇是語音信號壓縮重構的要過程。 語音信號在DCT域上可以被認為是近似稀疏表示。設一幀語音信號x=[x(1),x(2),…,x(N)]T,在DCT域上的系數為α=[α1,α2,…,αN]T,那么第n個DCT的系數αn為: CS理論認為,稀疏域的選取主要根據被處理的信號,由于隨機高斯矩陣與大多數固定正交基構成的矩陣不相關,隨機高斯矩陣是壓縮感知中最常用的觀測矩陣[10]。由于隨機矩陣不會切合不同信號各自具有的特性,因而會導致壓縮性能下降。本節(jié)以緊框架理論為依據,達到改善CS重構性能的目的。 一般情況下,未知大信號x∈RN×1可以表達為x=D x軇,其中D∈Rn×d(n< 對應標準的壓縮感知模型,如果信號在緊框架(冗余字典)的表達下稀疏時,我們就可以通過下面的線性系統(tǒng)來恢復信號, 其中Ф∈Rm×n(m 輸入:ΨDCT∈RN×L-DCT基M-觀測次數Iter-迭代的次數 進行初始化:設P∈RM×N的初始值P0作為高斯隨機矩陣,循環(huán)的計數變量k=0。 循環(huán): (1)首先計算矩陣Gk:Yk=PkΨDCT,Yk為測量矩陣和投影矩陣相乘得到的感知矩陣。 歸一化矩陣Yk的所有列向量后得到矩陣xk,Gk=。 (2)根據以下條件得到矩陣Gk*: (3)SVD分解:Guu=ALPHA*Gk+(1-ALPHA)*Gu,對進行SVD分解,使得矩陣的秩降為M,并將分解得到的Uk、Sk的秩也降為M。 (4)求解skqk:利用得到skqk=sk@· (5)更新P:找出Pk+1,使得誤差最小。 (6)設k=k+1,直到k=Iter,循環(huán)結束。 輸出:ΨDCT對應的緊框架矩陣P=PIter。 3.1PESQ 算法 PESQ算法是近期國際電信聯盟組織(ITU)提出的針對語音質量客觀評價的算法。PESQ算法考慮到網絡的端到端時延,并且采用了改進后的聽覺模型和認知模型新技術,對于通信時延、環(huán)境噪聲等有很好的魯棒性[11]。到目前為止,它是ITU公布的客觀語音質量評價算法中和主觀評價算法結果相關度最高的算法,在該算法下得到的MOS評分結果最貼合用戶的主觀感受。它的評分標準為:-0.5-4.5分,4.5分最好。下面是PESQ算法結構圖。 本實驗就是采用PESQ算法對重構語音進行評價。 3.2評分標準 MOS(Mean Opinion Score)值一般作為評價語音信號額主觀方法[5],本文采用ITUP.862的PESQ程序對語音信號和重構信號的對比來得到MOS分,如表1所示,打分的范圍為0(最差)~5(最好),實現主管質量的客觀評價。 圖3 PESQ算法原理 表1 五級評分標準 實驗中分別采用高斯隨機矩陣與緊框架矩陣作為觀測矩陣,對錄入的一段16kHz的語音信號進行壓縮、重構,利用OMP[12]算法對壓縮后的語音信號進行重構,比較不同觀測矩陣對壓縮重構性能的影響。在同等條件下,取語音幀長N=320個采樣點,每一幀20ms,壓縮比r分別取為0.6,0.5,0.4,0.3,0.2,0.1.實驗環(huán)境為安靜環(huán)境。從MOS評分表中可以看出,當壓縮比r≤0.5時,緊框架矩陣的重構語音質量好于高斯隨機矩陣的重構語音質量.當壓縮比r=0.6時,緊框架下的重構語音質量與高斯隨機矩陣的重構語音質量基本相同,MOS評分分別為3.289和3.261。 表2 重構語音的MOS評分 此外,引入語音質量評價客觀標準:信噪比SNR。在r一定時,SNR越大說明CS語音重構性質量越好。各壓縮比下,隨機高斯矩陣和緊框架矩陣重構語音的SNR如表3、圖4所示。 表3 重構語音的信噪比/dB 圖4 重構語音SNR 從表3、圖4都可以看出,隨著壓縮比r的增大,緊框架矩陣和隨機高斯矩陣的SNR都增大,可以比較明顯地看出緊框架的語音重構質量更好。 表4 算法運行時間比較/s 以循環(huán)一次為例,表4記錄了高斯隨機矩陣與緊框架矩陣在不同壓縮比下運行所需要的時間,不難看出隨著壓縮比增大,觀測次數M的增加,兩種矩陣算法運行時間都會增加;在同一壓縮比下,緊框架矩陣運行時間明顯比高斯矩陣運行時間長。 通過實驗結果比較,我們可以看出,緊框架作用下的測量矩陣壓縮感知相較于使用隨機測量矩陣能得到更好的重構信,緊框架矩陣算法明顯改善了語音信號的CS性能。但是,此算法運行時間比隨機觀測算法稍長,今后會在改進緊框架算法方面和語音重構算法方面繼續(xù)深入研究。 [1]石光明.壓縮感知理論及研究進展[J].電子學報,2009,37(5):1070-1081. [2]焦李成,楊淑媛,劉芳等.壓縮感知回顧與展望[J].電子學報,2011,39(7):1652-1662. [3]戴瓊海,付長軍,季向陽.壓縮感知研究[J].計算機學報,2011,2011,34(3):425-434. [4]金偉.二元小波緊框架的構造與濾波器的設計[D].哈爾濱:哈爾濱理工大學,2012:21-29. [5]黃淼,崔麗鴻.參數化的三帶小波框架中的擴充矩陣的構造[J].北京化工大學學報(自然科學版),2012,39(3):124-127. [6]張洪濤.四帶小波緊框架的構造及其應用[D].西安:陜西師范大學,2014. [7]郭訓香.框架的強分離性與緊框架的構造[J].數學學報,2015,58(4):587-592. [8]徐倩,季云云.基于最優(yōu)觀測的語音信號壓縮感知[J].南京郵電大學學報(自然科學版),2011,31(6):49-54. [9]孫林惠,楊震.基于壓縮感知的分布式語音壓縮與重構[J].信號處理,2010,26(6):824-829. [10]S.L.Zhou,L.C.Kong and N.H.Xiu,New Bounds for RIC in Compressed Sensing,[J].Oper.Res.Soc.China,2013,vol.1,pp.227-237. [11]陳臻圓.語音信號的壓縮感知研究及其在語音編碼中的應用[D].蘇州:蘇州大學,2011. [12]劉智威.基于壓縮感知的重構算法與語音壓縮研究[D].南京:南京郵電大學,2012. Speech;Compressed Sensing;Tight Frame;Observation Matrix;Gaussian Random Matrix Speech Compressed Sensing Based on Tight Frame Algorithm 1007-1423(2016)07-0031-05 10.3969/j.issn.1007-1423.2016.07.007 強策(1990-),男,山東濟寧人,在讀研究生,主要研究方向為信息與信號處理 夏凌(1963-),女,漢族,四川成都人,副教授,研究生導師,研究方向為信息與信號處理卿朝進(1979-),男,四川南充人,副教授,研究生導師,研究方向為信息與信號處理 童新(1992-),女,四川眉山人,在讀研究生,研究方向為信息與信號處理 2016-01-19 2016-02-25 QIANG Ce,XIA Ling,QING Chao-jin,TONG Xin 壓縮感知,近年來在信號處理領域取得非常多的成果。在基于壓縮感知進行語音壓縮重構時,測量矩陣在重構原始信號的過程中發(fā)揮著重要的作用.為了提高重構語音質量,從觀測矩陣著手,基于緊框架算法構造測量矩陣,并與傳統(tǒng)的高斯隨機觀測矩陣進行重構語音質量的比較。實驗結果表明,緊框架矩陣相對于傳統(tǒng)常用的高斯隨機矩陣,在語音重構過程中取得更好的效果。 語音;壓縮感知;緊框架;觀測矩陣;高斯隨機矩陣 Compressed sensing is a research hotspot making so much progress in the field of signal processing.We know that the observation matrix plays an important role in the reconstruction of original speech signal.In order to improve the quality of reconstructed speech,starts from the observation matrix,constructs observation matrix based on tight frame algorithm and compares with the traditional gaussian random observation matrix on reconstructing of original speech.The experiments’results show that the tight frame matrix,compared with the tra-ditional gaussian random matrix achieves better effect in the process of speech re-construction.2 基于緊框架的觀測矩陣的選取
3 重構語音的評價方法
4 實驗結果
5 結語
(School of Electrical Engineering and Electronic Information,Xihua University,Chengdu 610039)