浦靈敏, 胡宏梅
(蘇州健雄職業(yè)技術(shù)學院電氣工程學院,江蘇太倉215411)
基于改進匹配追蹤算法的語音信號處理研究*
浦靈敏, 胡宏梅
(蘇州健雄職業(yè)技術(shù)學院電氣工程學院,江蘇太倉215411)
針對匹配追蹤算法最匹配原子的搜索存在計算量較大、時間過長、效率不高等問題,根據(jù)粒子群算法的搜索特性,使用概率選擇方式更新全局極值,利用混沌映射改善隨機值,并將改進后的粒子群算法融入到標準匹配追蹤算法中,通過重構(gòu)語音信號,證明改進后的算法具有一定的可行性,其重構(gòu)質(zhì)量和運行速度均優(yōu)于標準匹配追蹤算法。
匹配追蹤;稀疏分解;粒子群算法;混沌映射
語音通信是人類最重要的通信方式之一,為了減少通信過程中的失真現(xiàn)象,高效率地對語音信號實現(xiàn)數(shù)字化表達,常采用壓縮編碼的方式。傳統(tǒng)信號采樣的定律是奈徹斯特采樣定律,而基于信號帶寬的奈徹斯特采樣定律是具有一定局限性的。為此,一種新的采樣定律——壓縮傳感(Compressive Sensing,CS)理論在2004被國外的學者們首次提出[1-2],該理論以信號的稀疏度作為信號采樣的基礎,只要信號滿足稀疏特性或者可壓縮特性,就能夠在采樣信號的同時實現(xiàn)數(shù)據(jù)的壓縮[3]。其中,在壓縮傳感理論中,最為著名的就是Mallat等人在1993年提出的引入了信號稀疏分解思想的匹配追蹤(Marchiing Pursuit,MP)算法[4]。
該算法主要是從過完備原子庫中選擇最貼近殘差信號的原子,通過多次迭代找出最佳匹配原子用來表示信號,直到滿足最終迭代條件。由此可以發(fā)現(xiàn),最佳匹配原子的選擇決定了重構(gòu)信號質(zhì)量的好壞。為此,不少學者提出了大量的改進方法,譬如:人工蜂群算法-MP算法[5~7],標準粒子群-MP算法[8~11],果蠅優(yōu)化-MP算法[12]等,這些算法均是利用群智能尋優(yōu)算法來搜索最佳原子,目標在于減小計算復雜度、提高收斂速度,但在解空間的遍歷性問題上還存在局部趨同性的問題。針對這一問題,本文引入改進后的粒子群算法,將其與標準MP算法相融合,完成最佳匹配原子的搜索,該算法能夠搜索匹配過程中每一步所分解的最佳原子,更好地重構(gòu)原始信號[13~15]。
1.1 稀疏分解原理
信號的稀疏表示就是在過完備原子庫上將信號進行分解,由此獲得一個簡單的信號表達方式,而這個過程又被稱為信號的稀疏分解。
定義f為待分解信號,長度為L,D={gγ},γ∈Γ,是稀疏分解信號所用的過完備原子庫,gγ為γ中所定義的原子,Γ為所有γ的集合。
MP的信號稀疏分解過程就是通過比較信號與原子庫中原子內(nèi)積大小,不斷搜索與待分解信號最匹配的原子gγi,把信號f投影在過完備原子庫的每一個原子上,由于‖gγ‖=1,f在gγ上的投影為<f,gγ>,最佳匹配的原子gγi定義為:
則信號f可表示為
又從過完備原子庫中找出與殘差信號R1f最貼近的原子,則R1f可以表示為
由此可以類推,
可以看出,任何信號f經(jīng)過分解后,均可以表示為:
其中,gγk為第k次迭代時在過完備原子庫中所搜索的最貼近殘差信號的原子,RMf為M次迭代后殘差信號。
MP算法的原理是通過多次迭代找到局部最優(yōu)的系數(shù),每一次迭代的結(jié)果是不可預知的,為了更好地搜索最佳匹配原子,逼近原始信號,提高重構(gòu)質(zhì)量,通常需要經(jīng)過相當多次迭代,才能得到相對好的搜索結(jié)果,這就浪費了很多時間成本,降低了方法的實用性。
1.2 過完備原子庫的構(gòu)成
通過分析信號f特征,可靈活選擇適合的變換基,經(jīng)過調(diào)制后構(gòu)建過完備原子庫,常用的有快速傅里葉變換基、離散余弦變換基、離散小波變換基、Curvelet基和Gabor基。通過分析語音信號的特點,選用與之具有一定相似度的Gabor原子,然后通過伸縮、平移、調(diào)制等行為對這些原子進行操作,構(gòu)造過完備原子庫,即
其中,g(t)=exp(-πt2)為高斯窗函數(shù),對每個原子的尺度、位移、頻率、相位等4個參數(shù)離散化并進行變化,可以形成龐大的原子庫。γ={s,u,v,φ}(s>0,u<L,v>0,φ<2π)為時頻參數(shù)向量,其中s為尺度、u為位移,v為頻率,φ為相位,不同的γ,產(chǎn)生不同Gabor原子。
粒子群算法(PSO)是一種群智能優(yōu)化算法,是1995年由Kennedy與Eberhart提出的。在PSO算法中,可將每個優(yōu)化問題的解看作是“粒子”。根據(jù)粒子在搜索過程中的適應性,可確定一個由被優(yōu)化的函數(shù)而決定的適應值,每個粒子的方向和距離可用其速度和位置用來確定;在每一次迭代過程中,每個粒子都可通過自身搜索得出一個解,多次比較,可確定當前迭代中的局部最優(yōu)解;在多次迭代搜索后,粒子們跟蹤當前最優(yōu)粒子找到最優(yōu)解,完成搜索過程。同時,在每一次迭代過程中,粒子通過跟蹤局部最優(yōu)解和全局最優(yōu)解來更新自己的位置和速度。具體搜索過程如下:
(1)隨機初始化,包括粒子個數(shù)、初始位置和速度;
(2)確定粒子的適應性函數(shù),計算適應值;
(3)將當前所計算的適應值和局部最優(yōu)解、全局最優(yōu)解進行分別比較,如果更好,則更新局部最優(yōu)解和全局最優(yōu)解;
(4)根據(jù)公式(7)和(8)更新粒子的速度和位置;
式中,v和x分別表示速度和位置;下標“i”和“j”分別表示粒子i和該粒子的維數(shù),w為慣性權(quán)重,大小決定了粒子的搜索能力;c1、c2為加速常數(shù),c1調(diào)節(jié)粒子飛向自身最好位置方向的步長,c2調(diào)節(jié)粒子向全局最好位置飛行的步長,通常在0~2間取值;r1、r2為兩個在(0,1)之間相互獨立的隨機數(shù)。
(5)檢查是否滿足終止條件。滿足,則停止搜索;不滿足,則返回(2),繼續(xù)執(zhí)行。
MP算法是通過不斷搜索與殘差信號匹配的最佳原子來重構(gòu)信號的,所以原子的匹配搜索很關鍵。在標準的MP算法中,過完備原子庫中遍歷尋優(yōu)時所需要的計算量比較龐大,運行時間過長,且很難搜索到最匹配的原子[16]。本文受到粒子群算法的啟發(fā),通過粒子行為對MP算法原子進行群智能搜索,為了防止標準的粒子群算法易出現(xiàn)的“趨同性”現(xiàn)象,避免其陷入局部最優(yōu),將改進后的粒子群算法融入MP算法原子的搜索中。根據(jù)本文匹配追蹤的需要,需要對4個參數(shù)進行尋優(yōu),具體執(zhí)行過程如下:
(1)初始粒子群。對信號f參數(shù)離散化γi={si,ui,vi,φi},根據(jù)式(6)計算出gγi,設為第i粒子。同時,將初始粒子作為全局最優(yōu)解和局部最優(yōu)解。
(2)將式<Rif,gγi>設為粒子群的適應值函數(shù)。
(3)將當前計算的適應值和全局最優(yōu)解進行概率比較,如果滿足式(9),則更新全局最優(yōu)解;將當前計算的適應值和局部最優(yōu)解進行大小比較,如大,則更新局部最優(yōu)解。
其中,N為粒子數(shù),ε為預設置精度。
(4)根據(jù)公式(7)和(8)更新粒子的速度和位置,式(7)中r1、r2的隨機數(shù)可采用混沌映射中的貓映射(cat map)進行設置,具體如式(10),能夠一定程度上改善rand()函數(shù)產(chǎn)生的完全隨機分布可能引起的遍歷性較差等問題。
式中,mod1表示只取其小數(shù)部分,n為正整數(shù),映射產(chǎn)生的xn與yn均在[0,1]之間。
(5)判斷MP迭代殘差閾值Rif 是否小于0.0001。滿足,則停止搜索,輸出gγ;不滿足,則返回(2),同時,根據(jù)式(4)更新Rif。
在步驟(3)中,增加粒子的全局搜索能力,采用概率選擇方式去更新全局最優(yōu)解,有效地改善了標準PSO所存在的“趨同性”,提高了粒子全局搜索最佳原子的能力。
實驗采用Matlab編程仿真實現(xiàn),主要是通過MP算法重構(gòu)語音信號。語音信號為一段40 S長的語音,其中30 s用來作為訓練語音,其余10 S用來作為測試語音,采樣點為8 000。改進后的MP算法中,ε為0.05,初始種群群體為40個,根據(jù)經(jīng)驗值,PSO算法中的參數(shù)c1、c2取值為2,慣性權(quán)重w的選取采用式(11)的方式
其中wmax為0.9,wmin為0.4,T為迭代次數(shù),Tmax為最大的迭代次數(shù)。
定義殘差[17]:e(n)=f(n)-g(n),其中,f(n)為原始語音信號,g(n)為重構(gòu)語音信號。圖1為重構(gòu)語音信號過程中隨意匹配4次信號后所產(chǎn)生的殘差結(jié)果。圖2顯示了匹配追蹤過程中語音信號的重構(gòu),重構(gòu)語音信號越來越接近原始語音信號。
圖1 語音信號匹配過程中任選4次匹配信號的殘差結(jié)果
在仿真平臺上,分別使用標準匹配追蹤(MP)算法和改進后算法對語音信號進行重構(gòu)。重構(gòu)過程中,和改進后的算法相比,標準MP算法重構(gòu)語音信號的過程較為復雜,運行時間長,重構(gòu)的結(jié)果不理想,具體建模結(jié)果如圖2,從圖中可以清晰地看出改進后算法重構(gòu)的語音信號更貼近于原始信號。而重構(gòu)語音信號質(zhì)量的主觀評價還取決于人的聽覺感知。通過人的聽覺測試語音重構(gòu)質(zhì)量,從試聽的結(jié)果中可感知出算法在重構(gòu)信號上的優(yōu)劣。結(jié)果發(fā)現(xiàn)改進后算法所重構(gòu)出來的語音信號較標準MP算法所重構(gòu)的語音聽上去更為清晰、自然,且容易理解。
圖2 標準MP算法和改進后算法重構(gòu)語音信號建模結(jié)果
針對匹配追蹤算法中最佳原子搜索耗時問題,本文引入粒子群算法,利用其智能搜索特性,針對粒子所存在的過早“趨同性”提出改進算法,提高粒子的全局最優(yōu)搜索能力,并將改進后的粒子群算法融入到標準匹配追蹤算法中,減少最佳匹配原子的搜索時間,更有利于找到貼近于原始信號的最佳匹配原子來表示信號。通過仿真分析,發(fā)現(xiàn)改進后的匹配追蹤算法節(jié)省了搜索的時間,提高了算法的效率,更好地改善了重構(gòu)信號的質(zhì)量。
[1]Candes E.Compressive Sampling[J].International Congress of Mathematicians,Madrid,Spain:European Mathematical Society,2006:1433~1452.
[2]Baraniuk R G.Compressive Sensing[J].IEEE Signal Processing Magazine,2007,24(4):118~124.
[3]張雯.壓縮傳感算法研究與音頻應用[D].天津:天津大學,2011.
[4]Mallat S G,ZHANG Z.Matching Pursuit with Time-Frequency Dictoionarier[J].IEEE Transactions on Signal Processing,1993,41(12):3397~3415.
[5]侯坤等.信號稀疏分解的人工蜂群-MP算法[J].計算機仿真,2012(11):247~250.
[6]張冬麗.人工蜂群算法的改進及相關應用研究[D].河北:燕山大學,2014.
[7]寧愛平.人工蜂群算法及其在語音識別中的應用研究[D].太原:太原理工大學,2013.
[8]高雷阜等.人工魚群算法優(yōu)化SVR的預測模型[J].統(tǒng)計與決策,2015(2):13~16.
[9]李越雷等.利用粒子群算法實現(xiàn)PPS信號的稀疏分解[J].計算機仿真,2010(2):200~203.
[10]李焱.基于函數(shù)變換的改進混沌粒子群優(yōu)化[J].計算機應用研究,2010(11):4105~4113.
[11]李霞等.基于改進FOA匹配追蹤的超聲信號處理研究[J].儀器儀表學報,2013(9):2068~2073.
[12]朱延萬等.一種改進的稀疏度自適應匹配追蹤算法[J].信號處理,2012,28(1):80~85.
[13]趙知勁等.一種基于量子粒子群的二次匹配OMP重構(gòu)算法[J].計算機工程與應用,2012,28(29):157~161.
[14]胡宏梅.若干矢量量化碼書設計算法[D].蘇州:蘇州大學,2007.
[15]劉景華等.一種啟發(fā)式的局部隨機特征選擇算法[J].計算機工程與應用,2014(5):1~7.
[16]張焱凱等.余弦距離下保護型遷移學習聚類算法[J].計算機工程與應用,2014(4):1~7.
[17]孫艷等.小波匹配追蹤的語音信號時頻建模[J].計算機工程與應用,2012,48(3):151~152.
Speech Signal Processing based on Modified Matching Pursuit Algorithm
PU Ling-min,HU Hong-mei
(School of Electrical Engineering,Suzhou Chien-shiung Institute of Technology,Taicang Jiangsu 215411,China)
Aiming at large calculation,time-consuming and low efficiency for the searching the best atomic in matching pursuit algorithm,and based on the searching characteristic of PSO(Particle Swarm Optimization),the update of globalextremum is done with probability selection method,and the random value improved by Chaos mapping.Meanwhile,the modified PSO is integrated into the standard matching pursuit algorithm.Reconstruction of speech signal indicates that the modified algorithm is of certain feasibility,and both the reconstruction quality and operation speed are superior to the standard matching pursuit algorithm.
MP(Matching Pursuit);sparse decomposition;PSO;chaos mapping
TN911
A
1009-8054(2015)12-0127-04
浦靈敏(1982—),男,碩士,講師,物聯(lián)網(wǎng)工程中心主任,主要研究方向為無線通信及物聯(lián)網(wǎng)應用技術(shù);
2015-05-12
2014江蘇省“青藍工程”資助(No.201423);2014年蘇州市智能家居無線傳感應用技術(shù)重點實驗室建設項目研究成果(No.SZSD201403)
胡宏梅(1982—),女,碩士,講師,主要研究方向為語音信號處理;■