陳 艷
(池州學(xué)院 機(jī)電工程學(xué)院,安徽 池州 247000)
盲源分離(blind signal separation, BBS)一直以來都是信號(hào)處理領(lǐng)域的一個(gè)研究熱點(diǎn)問題。盲源分離是從可觀測(cè)到的信號(hào)中分離出隱含其中的獨(dú)立源信號(hào)?!懊ぁ笔侵釜?dú)立源信號(hào)不可直接觀測(cè)到,且觀測(cè)得到信號(hào)的混合形成過程不知道。盲源分離問題的解決對(duì)混合信號(hào)的形成環(huán)境以及源目標(biāo)信號(hào)的信息的依賴比較少,因此,它應(yīng)用比較廣泛。
獨(dú)立分量分析(independent component analysis ICA)一般被用作盲源分離,它通過建立目標(biāo)函數(shù)將盲源信號(hào)分解開來,由此達(dá)到恢復(fù)信號(hào)的目的,分解得到的信號(hào)稱為數(shù)據(jù)處理中的獨(dú)立成分[1]。ICA是基于信號(hào)的高階統(tǒng)計(jì)量,研究信號(hào)之間的獨(dú)立關(guān)系[2],它在數(shù)據(jù)處理中得到更廣泛的應(yīng)用。盲源信號(hào)經(jīng)ICA進(jìn)行分離后,得到的分離信號(hào)其形態(tài)和源信號(hào)有著高度相似性,然而在幅值方面卻和源信號(hào)有著較大差異。
BP神經(jīng)網(wǎng)絡(luò)通過搜索最優(yōu)值在信號(hào)處理中得到廣泛應(yīng)用。然而,BP神經(jīng)網(wǎng)絡(luò)采用梯度下降法連續(xù)優(yōu)化權(quán)值和閾值,因而對(duì)初始權(quán)值和閾值的選擇尤為關(guān)鍵,而初始權(quán)值和閾值的選擇僅能憑經(jīng)驗(yàn),算法求解很容易收斂于局部極小值[3-4],最佳的權(quán)值分布很難得到。但搜索不依賴梯度信息的遺傳算法是一種自適應(yīng)全局搜索的算法。因此為了同時(shí)優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)閾值,一般選用遺傳算法。通常使用遺傳算法來確定BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值[4]。
將遞階遺傳算法與BP神經(jīng)網(wǎng)絡(luò)組合在一起稱為自適應(yīng)混合智能算法。這種算法既能全局搜索尋優(yōu),又能快速收斂[5]。鑒于已有的研究成果,本文將ICA技術(shù)和自適應(yīng)混合智能算法結(jié)合對(duì)信號(hào)進(jìn)行分離,實(shí)驗(yàn)表明,該算法能達(dá)到更好的分離精度。
設(shè)存在m個(gè)未知源信號(hào)的s(t)=[s1(t),s2(t),…,sn(t)]T相互獨(dú)立,通過采集系統(tǒng)獲得n個(gè)傳感器上線性疊加接收到的觀測(cè)信號(hào)x(t)=[x1(t),x2(t),…,xn(t)]T。在條件為n≥m的情況下,總存在混合矩陣A,使x=As。如果在噪聲環(huán)境下,線性混合系統(tǒng)模型為:
x=As+R
(1)
其中A是n×m維的矩陣,源信號(hào)s(t)和混合矩陣A都是未知的,x(t)混合信號(hào)是可以觀測(cè)得到的,R是n維加性高斯白噪聲,一般設(shè)m=n。
ICA算法的目的是求解矩陣B,使其滿足:
y(t)=Bx(t)
(2)
可得y(t)=Bx(t)=BAs(t),y(t)是逼近于未知源信號(hào)s(t)的最優(yōu)值,并且組成信號(hào)y(t)的各個(gè)分量盡可能相互獨(dú)立。這里采用FastICA算法[6]。
遞階遺傳算法的思想是先把神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和權(quán)值都編碼成一個(gè)個(gè)體,再對(duì)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和權(quán)值通過遺傳算法同時(shí)對(duì)其進(jìn)行訓(xùn)練優(yōu)化[7]。遞階遺傳算法的染色體由兩塊結(jié)構(gòu)構(gòu)成[8-9]:一塊是控制基因,另一塊是參數(shù)基因。通常使用二進(jìn)制數(shù)編碼控制基因,對(duì)于激活情況下的下層基因用1表示,同時(shí)非激活情況下的下層基因處于用0表示;參數(shù)基因用來表示節(jié)點(diǎn)的連接權(quán)以及閾值系數(shù),用實(shí)數(shù)編碼的方式。其中控制基因又分為層控制基因和神經(jīng)元控制基因[10](見圖1)。
圖1 網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值的編碼示意圖
遞階遺傳學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)的主要步驟:
(1)確定種群規(guī)模N,以上描述的編碼方式被用作判斷變量的編碼方式[11]。給定交叉概率pc,變異概率pm。若進(jìn)化代數(shù)t與進(jìn)化終止代數(shù)T相等,則算法終止。
(2)取t=0,以一定的方式產(chǎn)生初始種群X(0)。
(3)計(jì)算種群X(t)中個(gè)體Xi(t)的適應(yīng)值f(Xi(t)),對(duì)母體個(gè)數(shù)N的選擇依據(jù)個(gè)體的適應(yīng)值。
(4)為避免控制基因出現(xiàn)全0情況,對(duì)N個(gè)母體里面的控制基因僅使用均勻變異的方法;使用算術(shù)交叉以及高斯變異來對(duì)構(gòu)造基因做出操作,保留下最優(yōu)個(gè)體。
(5)若t=T,輸出進(jìn)行結(jié)果,否則轉(zhuǎn)步驟(3)。
自適應(yīng)混合智能算法是在遞階遺傳算法基礎(chǔ)上引入BP神經(jīng)網(wǎng)絡(luò),在遺傳算法遞階編碼的情況下,使用自適應(yīng)交叉概率和變異概率訓(xùn)練網(wǎng)絡(luò)。這種算法不僅能將遺傳算法的全局搜索最優(yōu)性保留下來,同時(shí)又能凸顯出BP算法沿最速下降方向進(jìn)行相應(yīng)局部搜索的能力,從而達(dá)到兼顧全局尋優(yōu)和快速搜索的目的[5]。
(1)染色體編碼
控制基因包括層的控制基因和神經(jīng)元的控制基因。為了較好的控制神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),一般采用二進(jìn)制數(shù)編碼的形式[11],1表示激活情況下的下層基因,同時(shí)0表示非激活情況下的下層基因。參數(shù)基因表示網(wǎng)絡(luò)的權(quán)值系數(shù)和閾值系數(shù)。若要達(dá)到網(wǎng)絡(luò)權(quán)值系數(shù)的精度以及染色體的編碼長(zhǎng)度,這里參數(shù)基因采用表示非常直觀的實(shí)數(shù)編碼的形式。種群規(guī)模的選擇對(duì)遺傳算法的性能影響具有重要意義,種群太小往往得不到滿意的結(jié)果,種群太大則導(dǎo)致網(wǎng)絡(luò)訓(xùn)練的時(shí)間過長(zhǎng)。一般種群的規(guī)模適宜取為50~150。
(2)交叉和變異
層控制的基因和神經(jīng)元控制的基因在這里采用單點(diǎn)交叉的方式。單點(diǎn)交叉首先在個(gè)體編碼串中隨機(jī)設(shè)置一個(gè)交叉點(diǎn),然后在該交叉點(diǎn)相互交換兩個(gè)配對(duì)個(gè)體的部分染色體。由于參數(shù)基因使用實(shí)數(shù)編碼,因此使用算術(shù)交叉方式對(duì)參數(shù)基因進(jìn)行操作。算術(shù)交叉方式通過兩個(gè)個(gè)體的線性組合而產(chǎn)生兩個(gè)新的個(gè)體。
交叉概率的取值既影響遺傳算法產(chǎn)生新的個(gè)體,又會(huì)影響其算法的收斂性。若交叉概率取值偏大,將對(duì)種群中的優(yōu)質(zhì)結(jié)構(gòu)造成破壞,干擾進(jìn)化運(yùn)算;若取值小到一定程度,又將使產(chǎn)生新個(gè)體的過程變得十分遲緩,通常建議的取值區(qū)間為0.4~0.99[12]。為了避免遺傳算法收斂過早,本算法中使用自適應(yīng)的交叉概率:
(3)
變異操作不僅包含對(duì)控制基因的操作而且包含了對(duì)所控制的網(wǎng)絡(luò)權(quán)重、閾值的操作。控制基因的變異操作是利用一定概率把控制基因串里面的位在“1”與“0”之間互換,變異操作將對(duì)隱層結(jié)構(gòu)造成影響,利用選擇操作保留進(jìn)化變異。
考慮到參數(shù)基因采用實(shí)數(shù)編碼,對(duì)于算法初期,種群中會(huì)出現(xiàn)少數(shù)幾個(gè)個(gè)體的適應(yīng)值相對(duì)非常小,在確定個(gè)體的遺傳數(shù)量時(shí)假使依照常用的比例進(jìn)行算子的選擇,那么這幾個(gè)相對(duì)較好的個(gè)體將在下一代群體里占據(jù)比較大的比例。當(dāng)群體的規(guī)模還比較小的時(shí)候,這樣的少數(shù)幾個(gè)個(gè)體就會(huì)組成新的種群,但是對(duì)于產(chǎn)生新個(gè)體作用較大的交叉算子就無法發(fā)揮作用了,由此為了擴(kuò)大搜索空間,只有通過均勻變異增加群體的多樣性。同時(shí)變異概率的設(shè)置影響較大,如果設(shè)得過大容易對(duì)優(yōu)質(zhì)結(jié)構(gòu)造成破壞,而設(shè)得較小將會(huì)限制變異操作產(chǎn)生新個(gè)體以及早熟現(xiàn)象的抑制,所以采用自適應(yīng)變異率pm:
(4)
(3)適應(yīng)值計(jì)算
遞階遺傳算法不僅優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并且也對(duì)神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值作出求解運(yùn)算。因此這種算法屬于一個(gè)雙目標(biāo)優(yōu)化問題,其要求網(wǎng)絡(luò)的誤差函數(shù)和復(fù)雜度函數(shù)均為最小。適應(yīng)值函數(shù)記為:
f=fe+α×fs,0<α<1
(5)
式(5)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的均方誤差用fe代表,網(wǎng)絡(luò)復(fù)雜度代表網(wǎng)絡(luò)里激活的連接權(quán)值數(shù)與網(wǎng)絡(luò)里面的全部連接權(quán)值數(shù)的比值,用fs代表。一般適應(yīng)值系數(shù)取在0.1~0.5之間,用α表示。
由于BP的最速下降特性,所有個(gè)體通過遺傳算子操作后都會(huì)朝著極值點(diǎn)靠近,也就是局部搜索。局部搜索雖然有一些點(diǎn)可能會(huì)陷入局部極值點(diǎn),但因此可以保留最優(yōu)點(diǎn)。由此下一代經(jīng)過選擇、交叉、變異算子的搜索后,會(huì)產(chǎn)生一些適應(yīng)值大的較優(yōu)點(diǎn),保留較優(yōu)點(diǎn),刪除適應(yīng)值小的局部極值點(diǎn)。
自適應(yīng)混合智能學(xué)習(xí)算法(見圖2)。
圖2 自適應(yīng)混合智能算法流程圖
基于混合智能算法建立以下優(yōu)化模型,采用三層網(wǎng)絡(luò)結(jié)構(gòu)(見圖3)。
圖3 自適應(yīng)混合智能算法的網(wǎng)絡(luò)結(jié)構(gòu)
對(duì)比傳統(tǒng)遺傳算法,自適應(yīng)混合智能算法不僅具有更快的收斂速度和更高的收斂精度,收斂過程
穩(wěn)定,而且在進(jìn)行權(quán)值訓(xùn)練時(shí),對(duì)神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)進(jìn)行優(yōu)化,學(xué)習(xí)效率較高。另外在遺傳過程中,自適應(yīng)交叉和變異概率的采用能有效加快遺傳速度,避免早熟現(xiàn)象的出現(xiàn)。
(1)讀取混合信號(hào),數(shù)據(jù)經(jīng)過去均值[13]和白化處理。
(2)采用文中ICA分離的方法分解得到分離信號(hào)y。
(3)對(duì)步驟(2)中得到的分離y信號(hào)運(yùn)用自適應(yīng)混合智能學(xué)習(xí)算法的優(yōu)化模型輸出分離精度更高的信號(hào)。
自適應(yīng)混合智能算法中種群規(guī)模選為120,種群進(jìn)化總代數(shù)為4萬代,交叉概率依據(jù)式(7)、交叉概率依據(jù)式(8)進(jìn)行自適應(yīng)調(diào)整。
圖4 源語音信號(hào)s1(t)
圖5 源語音信號(hào)s2(t)
圖6 混合語音信號(hào)x1
圖7 混合語音信號(hào)x2
圖8 ICA算法分離語音信號(hào)
圖9 ICA算法分離語音信號(hào)
圖10 自適應(yīng)混合智能優(yōu)化算法分離語音信號(hào)
圖11 自適應(yīng)混合智能優(yōu)化算法分離語音信號(hào)
通過圖6和圖7對(duì)比表明,采用ICA分離后得到的信號(hào)再經(jīng)自適應(yīng)混合智能優(yōu)化方法得到的信號(hào)主觀上觀察更加標(biāo)準(zhǔn)(見表1)??陀^實(shí)驗(yàn)數(shù)據(jù)也表明,該方法具有較好的分離精度。
表1 自適應(yīng)混合智能優(yōu)化算法分離語音信號(hào)分離信號(hào)的相關(guān)系數(shù)
自適應(yīng)混合智能算法具有更高的收斂精度,在進(jìn)行權(quán)值訓(xùn)練時(shí)學(xué)習(xí)效率較高。將ICA與自適應(yīng)混合智能算法結(jié)合,可以增強(qiáng)信號(hào)分離精度。實(shí)驗(yàn)表明本文提出方法具有可行性,與單純的ICA方法相比,具有較好的分離效果。