張平,孟品超,尹偉石
(長春理工大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,長春 130022)
反源問題是指通過遠(yuǎn)場數(shù)據(jù)識別未知點(diǎn)源的某些參數(shù),如位置和強(qiáng)度等,目前已成為醫(yī)學(xué)成像、環(huán)境污染、層析成像和天線合成等領(lǐng)域中的重要問題[1-2]。
研究單頻反源問題的一個(gè)難點(diǎn)是解的不唯一性,為此,人們通常需要對源施加額外的約束[3]。文獻(xiàn)[4]和其中的參考文獻(xiàn)給出了反源問題的穩(wěn)定性估計(jì)。目前求解單頻反源問題的方法主要有迭代法、直接采樣方法和貝葉斯方法等[5-6]。傳統(tǒng)方法在求解反演點(diǎn)源位置的問題時(shí)往往會(huì)限制點(diǎn)源之間距離[7-8]。此外,對于單頻的反源問題,在許多實(shí)際應(yīng)用中往往只能在有限孔徑情況下觀測點(diǎn)源位置[9]。
近年來,神經(jīng)網(wǎng)絡(luò)方法發(fā)展迅猛,能夠彌補(bǔ)信息的缺失,對非線性映射有著較好的逼近效果,一些學(xué)者將其用以求解反問題[10-12]。本文針對單頻聲波反源問題,構(gòu)建基于神經(jīng)網(wǎng)絡(luò)和門控思想的點(diǎn)源位置參數(shù)反演模型,利用單頻遠(yuǎn)場數(shù)據(jù),確定點(diǎn)源位置信息。
考慮在如下Helmholtz系統(tǒng)中通過遠(yuǎn)場模式u∞反演點(diǎn)源S的問題:
其中,δ表示Dirac分布,且N表示單極源的個(gè)數(shù),為正整數(shù);zj是單極源S的位置,這里,點(diǎn)源位置zj是互不相同的;λj表示單極源的強(qiáng)度,是一個(gè)標(biāo)量。反源問題是:給定單極源S的強(qiáng)度和固定頻率的遠(yuǎn)場數(shù)據(jù)u∞,確定單極源S的位置。
建立求解均勻介質(zhì)中固定頻率聲波點(diǎn)源位置反演問題的神經(jīng)網(wǎng)絡(luò)模型。首先給出以下假設(shè)和定義:
假 設(shè)1:觀測方向d=(c os(α),sin(α)),觀 測角α均勻分布于觀測孔徑(α1,α2),即:
其中,n為觀測方向個(gè)數(shù)。
因此,給定n個(gè)觀測方向,得到遠(yuǎn)場數(shù)據(jù):X=(x1,x2,...,xn)。為方便計(jì)算,將每個(gè)遠(yuǎn)場數(shù)據(jù)xt=at+i·bt改寫成xt=(at,bt)T,t=1,2,...,n。這里i表示虛數(shù)單位。
定義1:假設(shè)點(diǎn)源的位置有如下形式:
其中,M=2N表示位置參數(shù)的個(gè)數(shù)。于是,可將利用均勻介質(zhì)中固定頻率的遠(yuǎn)場數(shù)據(jù)u∞反演點(diǎn)源位置zj轉(zhuǎn)化為反演位置參數(shù)y=(y1,y2,…,yM)的問題。
定義 2:令A(yù)=(aij)為n×m維的矩陣,且B=(bij)為一個(gè)p×m矩陣,則矩陣運(yùn)算[A;B]表示矩陣拼接:
定義3:令A(yù)=(aij),B=(bij)為n×m維矩陣,則定義:
定義4:令F為激活函數(shù),A=(a1,a2,…,am)T為m維向量,則F(A)為一個(gè)m維向量:
下面利用可在時(shí)間維度上傳播信息且具有“記憶”功能的神經(jīng)網(wǎng)絡(luò),構(gòu)建位置參數(shù)反演模型,反演點(diǎn)源的位置參數(shù)y=(y1,y2,…,yM)。
構(gòu)建一個(gè)位置參數(shù)反演模型,其結(jié)構(gòu)如圖1所示,分為特征提取和參數(shù)反演兩部分。
圖1 位置參數(shù)反演模型
用st表示t時(shí)刻提取的遠(yuǎn)場特征,t=1,2,...,n,隨機(jī)初始化s0。構(gòu)造映射F:Rm×2×R2→Rm×2,對st-1和xt進(jìn)行特征提取,并將其記作st=F(st-1,xt),t=1,2,…,n。其中st=(ht,ct),ht=(h1t,h2t,…,hmt)T,ct=(c1t,c2t,…,cmt)T,ht為t時(shí)的短時(shí)遠(yuǎn)場特征,ct為t時(shí)的長期遠(yuǎn)場特征,經(jīng)過n個(gè)時(shí)間步后可得X的遠(yuǎn)場特征:C=sn。
圖2給出了映射F中變量之間的關(guān)系,為方便描述,本文令偏置為零向量,即b=(0 ,0,…,0)T。
圖2 映射F中的變量關(guān)系
其中,ft=σ(wf·[ht-1,xt])為遺忘門,決定保留多少ct-1中的信息并使其繼續(xù)傳播。類似的,輸入門it=σ(wi·[ht-1,xt]),決定zt中有多少信息保存到長期遠(yuǎn)場特征ct,輸出門ot=σ(wo·[ht-1,xt]),決定ct中有多少信息輸出到ht。tanh表示雙曲正切函數(shù),σ為Sigmoid函數(shù)。wf,wi,wo,wz∈Rm×(m+2)分別表示遺忘門、輸入門、輸出門和候選向量的權(quán)重,[ht-1,xt]∈Rm+2,ot,ft,it,zt∈Rm。
至此,模型提取了遠(yuǎn)場特征C=sn=(hn,cn),下面進(jìn)行參數(shù)反演。
與特征提取階段相似,在圖1參數(shù)反演階段,用ST=(HT,CT),表示T時(shí)的參數(shù)特征,T=1,2,…,M,其中HT∈Rm為短時(shí)參數(shù)特征,CT∈Rm為長期遠(yuǎn)場特征。初始化0=0,構(gòu)造映射L:Rm×2×R→Rm×2,將ST-1=(HT-1,CT-1)和位置參數(shù)T-1映射成,其計(jì)算過程如下:
因?yàn)镠T∈Rm,且∈R,因此本文通過一個(gè)輸出維度為1的全連接將HT反演為第T個(gè)位置參數(shù)=WDT·HT,其中WD∈Rm為與時(shí)間步T對應(yīng)的全連接權(quán)重。經(jīng)過M個(gè)時(shí)間步,可反演出全部M個(gè)位置參數(shù)。
由于每個(gè)位置參數(shù)∈R,即“連續(xù)”,因此本文使用均方誤差作為損失函數(shù)E。
定義 3:令Yj為模型的真實(shí)輸出,為模型的預(yù)測輸出,定義損失函數(shù)為:
式中,J為樣本總數(shù)。
更新模型就是更新模型中的權(quán)重和偏置,用W表示模型中的權(quán)重wo,wf,wi,wz,Wo,Wf,Wi,Wz,WD,這里隨機(jī)初始化權(quán)重W(0),然后利用Adam算法更新權(quán)重W(l),l=1,2,…,n。更新規(guī)則如下:
其中,gl為損失函數(shù)相對于權(quán)重W的梯度矩陣;ql和rl分別為gl的一階和二階有偏矩估計(jì),且q0,r0均初始化為零向量;ρ1,ρ2∈ [0,1)為矩估計(jì)的指數(shù)衰減速率;和l分別為修正的一階和二階矩估計(jì);η為學(xué)習(xí)率;δ為數(shù)值穩(wěn)定常數(shù)。本文令ρ1=0.9,ρ2=0.999,η=10-2,注意在計(jì)算ΔW(l)時(shí)需對矩陣l和l逐個(gè)元素執(zhí)行相應(yīng)運(yùn)算,即。
至此,本文構(gòu)建了反演點(diǎn)源位置參數(shù)的神經(jīng)網(wǎng)絡(luò)模型,下面進(jìn)行數(shù)值實(shí)驗(yàn)說明該模型的有效性。
通過數(shù)值例子說明位置參數(shù)反演模型能夠解決有限孔徑和點(diǎn)源之間距離較小等限制的反源問題。
對于點(diǎn)源位置表達(dá)式:
將數(shù)據(jù)集劃分為訓(xùn)練集與測試集,其中測試集中樣本數(shù)據(jù)量固定為l=100,在測試集中隨機(jī)選取測試樣本。在模型訓(xùn)練過程中進(jìn)行批量訓(xùn)練,批量大小滿足1<v<J。
表1給出了模型所用超參數(shù),這些參數(shù)是通過多次實(shí)驗(yàn)得到的。
表1 模型超參數(shù)
實(shí)驗(yàn)一:遠(yuǎn)場數(shù)據(jù)不加噪聲。
點(diǎn)源個(gè)數(shù)N=2時(shí),令n=8,10和12,遠(yuǎn)場數(shù)據(jù)無噪聲。為了比較位置反演的精度,表2列出了精確和預(yù)測的數(shù)據(jù)。反演位置參數(shù)的均方誤差如表3所示。
表2 兩個(gè)點(diǎn)源的位置反演效果
表3 參數(shù)反演的均方誤差
表2和表3說明:隨著觀測方向的增加,獲得的遠(yuǎn)場信息增多,損失函數(shù)減小,點(diǎn)源位置的反演效果提升。
點(diǎn)源個(gè)數(shù)N=3時(shí),令n=15,16和 17,遠(yuǎn)場數(shù)據(jù)無噪聲。為了比較位置反演的精度,表4列出了精確和預(yù)測的數(shù)據(jù)。反演位置參數(shù)的均方誤差如表5所示。
表4 三個(gè)點(diǎn)源的位置反演效果
表5 參數(shù)反演的均方誤差
表4和表5同樣說明:隨著觀測方向的增加,獲得的遠(yuǎn)場信息增多,損失函數(shù)減小,點(diǎn)源位置的反演效果提升。
實(shí)驗(yàn)二:遠(yuǎn)場數(shù)據(jù)加噪聲。
在實(shí)際測量中遠(yuǎn)場數(shù)據(jù)經(jīng)常含有一定的測量誤差,為說明模型在此種情形下的反演效果,本實(shí)驗(yàn)以兩個(gè)點(diǎn)源為例,取觀測點(diǎn)n=12,遠(yuǎn)場數(shù)據(jù)含不同水平的高斯噪聲ε。為了比較位置反演的精度,表6列出了精確和預(yù)測的數(shù)據(jù)。反演位置參數(shù)的均方誤差如表7所示。
表6 遠(yuǎn)場數(shù)據(jù)加噪聲的點(diǎn)源位置反演效果
表7 參數(shù)反演的均方誤差
由表6和表7可知,在使用含有乘性高斯噪聲的測量數(shù)據(jù)反演點(diǎn)源位置參數(shù)時(shí),模型可較好地反演點(diǎn)源位置參數(shù),這是因?yàn)樵摲椒ㄊ褂煤瑴y量誤差的遠(yuǎn)場數(shù)據(jù)與真實(shí)位置參數(shù)進(jìn)行訓(xùn)練,逼近了二者之間的映射,進(jìn)而降低了測量誤差對反演效果的影響,該實(shí)驗(yàn)說明模型具有一定的魯棒性。
表8 有限觀測孔徑下的點(diǎn)源位置反演效果
表9 參數(shù)反演的均方誤差
由表8和表9可知:當(dāng)觀測方向數(shù)目不變時(shí),隨著觀測孔徑的逐步縮小,觀測方向間的夾角減小,觀測到的遠(yuǎn)場數(shù)據(jù)相似度上升,導(dǎo)致從遠(yuǎn)場數(shù)據(jù)中獲得的點(diǎn)源位置信息減弱,使得位置參數(shù)的反演誤差增大,反演效果下降。
表10 參數(shù)反演的均方誤差
本文針對單頻遠(yuǎn)場信息反演點(diǎn)源位置的聲波反源問題,構(gòu)建了基于神經(jīng)網(wǎng)絡(luò)和門控思想的位置參數(shù)反演模型,反演點(diǎn)源的位置。實(shí)驗(yàn)結(jié)果表明該模型反演效果良好,在噪聲干擾下模型具有一定的魯棒性和泛化性,點(diǎn)源之間距離的大小對該模型的反演結(jié)果影響較為微弱。三維立體空間中移動(dòng)點(diǎn)源位置的反演,是更有現(xiàn)實(shí)意義的問題,而近場問題涉及到精確度與更微觀層面的問題,這將是下一步的工作。