王樂洋,陳 濤,鄒傳義,2
1. 東華理工大學(xué)測繪工程學(xué)院,江西 南昌 330013; 2. 武漢大學(xué)測繪學(xué)院,湖北 武漢 430079
在大地測量數(shù)據(jù)處理領(lǐng)域中,若觀測誤差隨觀測量的大小或物理信號的強弱而變化,則該類誤差為乘性誤差[1]。例如,現(xiàn)代觀測手段中的合成孔徑雷達(dá)SAR觀測值的隨機誤差表現(xiàn)為乘性誤差[2-3],光電測距EDM(electronic distance measurement)和全球定位系統(tǒng)GPS的觀測誤差表現(xiàn)為乘性誤差或者加乘性混合誤差[4-5]。目前,在大地測量領(lǐng)域中關(guān)于乘性誤差模型參數(shù)估計和精度評定的研究成果相對較少[6-9],且其中尚無文獻(xiàn)針對乘性誤差模型中存在的病態(tài)問題進(jìn)行研究,因此如何對病態(tài)乘性誤差模型進(jìn)行參數(shù)估計和精度評定是值得研究的問題。
病態(tài)問題廣泛存在于測繪數(shù)據(jù)處理中,模型的病態(tài)性會造成參數(shù)解的不穩(wěn)定,甚至嚴(yán)重偏離真值[10]。已有的總體最小二乘病態(tài)問題[11]、大地測量反演的病態(tài)問題[12]和控制網(wǎng)平差的病態(tài)問題[13]等都是基于加性誤差模型建立的,而對于乘性誤差模型的病態(tài)問題尚未發(fā)現(xiàn)研究成果。乘性誤差模型的最小二乘解法最早由文獻(xiàn)[6]提出,文獻(xiàn)[7]在文獻(xiàn)[6]的基礎(chǔ)上,總結(jié)了乘性誤差模型的最小二乘、加權(quán)最小二乘和偏差改正加權(quán)最小二乘方法,并推導(dǎo)了參數(shù)估計的精度評定公式。若直接采用文獻(xiàn)[7]中的3種方法處理病態(tài)乘性誤差模型,而不考慮系數(shù)矩陣的病態(tài)性,會使參數(shù)估值產(chǎn)生偏差且不穩(wěn)定。文獻(xiàn)[4]為避免系數(shù)矩陣病態(tài),將模擬點集中在數(shù)字地面模型(digital terrain model,DTM)中的峰值處,其他的點均勻分布,這僅可用來處理模擬數(shù)據(jù),無法適用于真實的觀測數(shù)據(jù)。系數(shù)矩陣病態(tài)會使得系數(shù)矩陣的列向量之間存在復(fù)共線性,進(jìn)而引起法方程條件數(shù)過大,導(dǎo)致解不穩(wěn)定[10]。目前,處理病態(tài)問題的方法主要有Tikhonov正則化法[14-16]和虛擬觀測值解法[17]等。正則化參數(shù)的確定方法,主要有廣義交叉核實法[18]、嶺跡法[19]和L曲線法[20-22]等。廣義交叉核實法難以獲得最優(yōu)解,適用性弱;嶺跡法雖然計算簡單,但有一定的主觀性;L曲線法適用性強,并且能獲得較為合理的正則化參數(shù),被廣泛用于正則化參數(shù)的選取,可以很好地用于本文算法中正則化參數(shù)的選取。
經(jīng)分析發(fā)現(xiàn),使用加權(quán)最小二乘正則化法求解病態(tài)乘性誤差模型時,參數(shù)估值是觀測值的非線性函數(shù),而觀測值的協(xié)因數(shù)陣是參數(shù)估值的非線性函數(shù),并且在逐步迭代的過程中參數(shù)的每一步估值都具有隨機性,使得最終的參數(shù)估值與觀測值為復(fù)雜的非線性關(guān)系,只能使用數(shù)值方法迭代求解,無法得到解析解。因此本文引入無需求導(dǎo)、無需獲取非線性函數(shù)具體表達(dá)式的SUT法[23-24]對病態(tài)乘性誤差模型進(jìn)行精度評定。
綜上所述,針對已有文獻(xiàn)未考慮乘性誤差模型的病態(tài)性,本文首先利用Tikhonov正則化方法導(dǎo)出病態(tài)乘性誤差模型的加權(quán)最小二乘正則化解,其次通過SUT法對病態(tài)乘性誤差模型進(jìn)行精度評定;最后通過兩個模擬數(shù)據(jù)算例和一個真實數(shù)據(jù)算例驗證本文方法的適用性及優(yōu)勢。
給定一組帶有乘性誤差的觀測值,相應(yīng)的乘性誤差模型可以表示為[7]
(1)
隨機模型為
(2)
進(jìn)一步可將式(1)改寫為如下形式
y=f(β)⊙(1+εm)
(3)
式中,⊙表示哈達(dá)瑪乘積符號。
y=(Aβ)⊙(1+εm)
(4)
式中,A=[a1,a2,…,an]T;β=[β1,β2,…,βt]T。
由式(4)可知,在乘性誤差模型中,觀測值精度與系數(shù)矩陣和參數(shù)估值的乘積有關(guān):信號Aβ越強,觀測值y的誤差越大;反之,信號Aβ越弱,誤差越小。這明顯區(qū)別于傳統(tǒng)的加性誤差模型,即觀測值y的誤差與系數(shù)矩陣和參數(shù)估值無關(guān)。目前,已有關(guān)于乘性誤差模型的研究均不考慮系數(shù)矩陣A病態(tài)[7-8],然而在大地測量實際數(shù)據(jù)處理中,系數(shù)矩陣A很容易出現(xiàn)病態(tài),此時會引起法方程條件數(shù)過大,觀測量微小的擾動將會引起參數(shù)較大的變化,導(dǎo)致解不穩(wěn)定。例如,文獻(xiàn)[25]針對SAR型噪聲的特性采用乘性誤差模型進(jìn)行影像去噪,去噪效果達(dá)到70%~93%。此時,若系數(shù)矩陣A病態(tài),會引起法方程條件數(shù)過大,導(dǎo)致解不穩(wěn)定,進(jìn)而影響影像去噪。因此需要針對病態(tài)乘性誤差模型進(jìn)行更深入的研究來豐富現(xiàn)代大地測量數(shù)據(jù)處理理論。
為了更方便地進(jìn)行公式推導(dǎo),將式(4)改寫為如下形式
y-Aβ=(Aβ)⊙εm
(5)
令
(6)
(7)
根據(jù)最小二乘準(zhǔn)則求解式(6),得
(8)
β的最小二乘估值為
(9)
根據(jù)前文中的分析可知,當(dāng)法方程N=ATA病態(tài)時,由式(9)求得的最小二乘解不可靠。因此,引入正則化因子α,構(gòu)建如下病態(tài)乘性誤差模型的正則化準(zhǔn)則
(10)
對式(10)中的β求偏導(dǎo),并令其為0,可得
(11)
將式(6)代入式(11),可得病態(tài)乘性誤差模型的加權(quán)最小二乘正則化解
(12)
進(jìn)而可以得到
(13)
在確定本文病態(tài)乘性誤差模型中的正則化參數(shù)時,由于觀測值的協(xié)因數(shù)陣為參數(shù)估值的非線性函數(shù),因此觀測值的權(quán)陣也為參數(shù)估值的非線性函數(shù),這使得正則化參數(shù)值產(chǎn)生動態(tài)變化。
根據(jù)文獻(xiàn)[8],病態(tài)乘性誤差模型的單位權(quán)方差估值可表示為
(14)
(15)
由偏差的定義[26],對式(13)兩邊取期望,可得參數(shù)估值的偏差為
(16)
(17)
病態(tài)問題中,由于產(chǎn)生了偏差項,此時的均方誤差不等于協(xié)方差不能作為一個良好的精度評判標(biāo)準(zhǔn)。雖然最小二乘估值是無偏,但已不是最優(yōu)值[7]。根據(jù)均方誤差的定義[30-31],可知均方誤差的表達(dá)式為
(18)
式中,等式右邊第1部分表示參數(shù)估值協(xié)方差的跡;第2部分表示參數(shù)估值偏差平方的跡。
式(13)的迭代公式如下所示
(19)
綜上所述,本文將病態(tài)乘性誤差模型的加權(quán)最小二乘正則化法迭代解法命名為算法1,具體步驟如下:
(1) 采用最小二乘法求得參數(shù)估值的初始值
(20)
(3) 求得正則化參數(shù)αi。
(4) 根據(jù)式(19)迭代求得病態(tài)乘性誤差模型加權(quán)最小二乘正則化迭代解。
由算法1可以看出,病態(tài)乘性誤差模型的加權(quán)最小二乘正則化迭代解法中,每一步迭代參數(shù)估值都是觀測值的函數(shù),而觀測值的協(xié)因數(shù)陣又是參數(shù)估值的函數(shù),使得最終的參數(shù)估值與觀測值為一個復(fù)雜的非線性函數(shù)。本文將這種非線性關(guān)系表示為[32-33]
(21)
式中,φ(·)表示參數(shù)估值與觀測值y之間的非線性函數(shù)。
第1步參數(shù)迭代估值可以表示為[32-33]
(22)
最終的參數(shù)估值表達(dá)式為[32-33]
(23)
式(23)表明,病態(tài)乘性誤差模型的加權(quán)最小二乘正則化法的迭代過程使得參數(shù)估值和觀測值之間的非線性關(guān)系非常復(fù)雜,且迭代的過程使參數(shù)的每一步的估值都具有隨機性。為了避免復(fù)雜的公式運算,本文在病態(tài)乘性誤差模型加權(quán)最小二乘正則化法中引入SUT采樣法,旨在獲得更精確的參數(shù)估值和精度信息。
本文將病態(tài)乘性誤差模型精度評定的SUT法命名為算法2,步驟如下:
(1) 確定采樣的先驗統(tǒng)計均值和協(xié)方差陣。本文將觀測值和對應(yīng)的協(xié)方差陣作為采樣的先驗統(tǒng)計均值E(y)和協(xié)方差陣D(y)。
(2) 基于先驗統(tǒng)計均值和協(xié)方差陣構(gòu)造采樣點集{χi}(i=0,1,2,…,2n),生成2n+1個采樣點
(24)
(4) 確定采樣點集的權(quán)
(25)
(5) 計算參數(shù)估值的均值和均方誤差陣
(26)
(27)
(6) 計算單位權(quán)方差
(28)
本文首先對病態(tài)乘性誤差模型加權(quán)最小二乘正則化迭代解法進(jìn)行改化,將病態(tài)乘性誤差模型中參數(shù)估值與觀測值表示為嵌套函數(shù)的形式,然后引入無需求導(dǎo)、無需了解非線性函數(shù)構(gòu)造的SUT法求解病態(tài)乘性誤差模型中參數(shù)估值的均值、均方誤差矩陣和單位權(quán)方差。
為了比較不同方法下參數(shù)估值和精度信息的差異,分別使用文獻(xiàn)[7]中的未考慮病態(tài)性的三種方法即最小二乘法、加權(quán)最小二乘法和偏差改正加權(quán)最小二乘法,以及本文提出算法1和算法2進(jìn)行解算。5種方案及對應(yīng)的方法見表1。
表1 5種方案及對應(yīng)的方法
為了驗證本文公式推導(dǎo)以及算法的有效性,算例1根據(jù)文獻(xiàn)[34]改編得到,通過利用GPS測量某一區(qū)域道路中心線地面點的高程,假定該區(qū)域道路中心線地面點高程真值與某一坐標(biāo)原點的距離除以100符合以下函數(shù)模型
y=10+2x+x2+x3+0.5x4
(29)
式中,y為地面點高程的真值;x為高程點與某一坐標(biāo)原點的距離除以100。
假設(shè)地面點高程真值被乘性誤差干擾,其中乘性誤差向量εm相互獨立,且服從均值為0、標(biāo)準(zhǔn)差為0.1的正態(tài)分布,即εm~(0,0.12×I31),相應(yīng)的乘性誤差模型的觀測方程為
Y(x)=y(x)⊙(1+εm)
(30)
式中,Y(x)為受乘性誤差干擾的地面高程點觀測值向量;1為元素全為1的31維列向量;εm為31維乘性誤差向量。
由式(30)得到一組地面高程點的數(shù)據(jù)模擬值見表2。為了說明高程點受乘性誤差的影響程度,本文將地面高程點受乘性誤差干擾前后的數(shù)據(jù)繪于圖1中。
表2 數(shù)據(jù)模擬值
圖1 地面高程點受乘性誤差干擾前后分布Fig.1 GPS elevation points before and after disturbed by multiplicative error
本算例選取的單位權(quán)中誤差σ0為0.3。使用表1中的5種方案計算,將參數(shù)真值、5種方案計算的參數(shù)估值、參數(shù)估值與真值的2范數(shù)及單位權(quán)中誤差估值列于表3;5種方案計算的參數(shù)估值的均方根誤差列于表4。
表3 參數(shù)估值、參數(shù)估值與真值之間的2范數(shù)和單位權(quán)中誤差
表4 參數(shù)估值的均方根誤差
圖2 正則化參數(shù)α隨迭代次數(shù)的變化Fig.2 The regularization parameter with the number of iterations
圖3 法矩陣條件數(shù)隨迭代次數(shù)的變化Fig.3 The condition number of the normal matrix with the number of iterations
由圖1可知,由于地面高程點受到乘性誤差干擾,導(dǎo)致點位產(chǎn)生了嚴(yán)重偏離。由表3中參數(shù)估值與真值的2范數(shù)可知,LS方法求得的2范數(shù)結(jié)果最大;WLS方法由于考慮了觀測值的權(quán)得到的結(jié)果優(yōu)于LS法,其2范數(shù)為6.058 4;bcWLS方法對WLS方法進(jìn)行了偏差改正,2范數(shù)較WLS方法減小了0.119 4,為5.939 0,但由于未考慮模型的病態(tài)性,仍與真值偏離較大。本文算法1和算法2求得的2范數(shù)分別為0.978 4和0.833 7,參數(shù)估值更接近真值,說明本文算法對于降低病態(tài)性有一定的效果。其中,由于算法2考慮了正則化解法逐步迭代過程中每一步的隨機性和非線性迭代的過程對參數(shù)估值的影響,求得的2范數(shù)較算法1減小了0.144 7,表明了本文使用SUT法的可行性。由表3中的單位權(quán)中誤差可知,由于文獻(xiàn)[7]中的方法未考慮模型的病態(tài)性,導(dǎo)致求得的單位權(quán)中誤差偏離真值,而本文算法考慮了這些影響,求得的單位權(quán)中誤差更接近真值,進(jìn)一步表明了本文算法的優(yōu)勢。
算例2為一個DTM模型的算例,本文主要考慮模型為病態(tài)的情況,因此模擬一個病態(tài)DTM模型。文獻(xiàn)[4]在模擬DTM模型時,為防止法矩陣病態(tài)情況出現(xiàn),在模擬的DTM模型的每個峰值周圍采樣更多點,并使峰值點之間遠(yuǎn)離,雖然可以在一定程度上降低病態(tài)性,但僅可用來處理模擬數(shù)據(jù),無法適用于真實的觀測數(shù)據(jù)。本文依據(jù)文獻(xiàn)[4]的思路,使用插值法來模擬DTM模型,插值法是模擬DTM模型的主要方法之一[35-36],本文模擬的DTM模型由下面的插值函數(shù)生成
(31)
函數(shù)fi(x,y)(i=1,2,3,4)分別為如下
f1(x,y)=exp{-((x-22)2+(y-22)2)/500}
(32)
f2(x,y)=exp{-((x-28)2+(y-28)2)/500}
(33)
f3(x,y)=exp{-((x-25)2+(y-25)2)/500}
(34)
f4(x,y)=exp{-((x-20)2+(y-20)2)/500}
(35)
模擬的DTM模型如圖4所示,相應(yīng)的乘性誤差模型的觀測方程為
(36)
式中,h(x,y)為受乘性誤差干擾的觀測值向量;1為元素全為1的1681維列向量;εm為1681維乘性誤差向量。
在本文中,假設(shè)誤差向量εm相互獨立、且服從均值為0,標(biāo)準(zhǔn)差為0.1的正態(tài)分布,即εm~(0,0.12×I1681)。為了說明DTM模型受乘性誤差的影響程度,本文將不含誤差的觀測值繪于圖4中,受乘性誤差干擾的觀測值繪于圖5中。
圖4 模擬的DTM模型Fig.4 Simulated DTM model
圖5 受乘性誤差干擾的DTM模型Fig.5 DTM model disturbed by multiplicative error
表5 參數(shù)估值、參數(shù)估值與真值之間的2范數(shù)和單位權(quán)中誤差
表6 參數(shù)估值的均方根誤差
圖6 正則化參數(shù)α隨迭代次數(shù)的變化Fig.6 The regularization parameter with the number of iterations
圖7 法矩陣條件數(shù)隨迭代次數(shù)的變化Fig.7 The condition number of the normal matrix with the number of iterations
由圖4和圖5可以發(fā)現(xiàn),盡管本文模擬的DTM模型加入的乘性誤差標(biāo)準(zhǔn)差僅為0.1,但對高程產(chǎn)生了較大的影響,此時法矩陣的條件數(shù)為5.190 5×104,嚴(yán)重病態(tài)。因此,針對病態(tài)乘性誤差模型數(shù)據(jù)處理理論需要進(jìn)行更深入的研究。
由表5可得,由于未考慮模型的病態(tài)性,文獻(xiàn)[7]中的方法求得的參數(shù)估值嚴(yán)重偏離真值,而本文算法求得的結(jié)果更接近真值,參數(shù)估值的2范數(shù)分別為0.817 7和0.770 5,比bcWLS方法小了10.031 8和10.079 0,進(jìn)一步說明本文算法對于降低病態(tài)性有一定的效果。其中,本文算法2考慮到非線性迭代的過程對參數(shù)估值的影響,求得的2范數(shù)最小,這與算例1得到的結(jié)果一致。由表5中的單位權(quán)中誤差可知,LS方法求得的單位權(quán)中誤差0.700 6,結(jié)果嚴(yán)重偏離真值;WLS方法和bcWLS方法由于考慮了觀測值的權(quán),求得的單位權(quán)中誤差比LS方法更接近真值,為0.293 0和0.294 4;本文算法考慮了病態(tài)性對單位權(quán)中誤差的影響,求得的單位權(quán)中誤差最接近真值。
為進(jìn)一步說明本文方法的可行性和適用性,算例3為一個病態(tài)數(shù)字高程模型真實數(shù)據(jù)算例。數(shù)字高程模型是一種承載地面高程信息的空間數(shù)據(jù)模型,是DTM模型的一個分支,本文主要利用SRTM(shuttle radar topography mission)提供的免費DEM數(shù)據(jù)集,通過在網(wǎng)站http:∥srtm.csi.cgiar.org/srtmdata/下載了2304個點的三維坐標(biāo)數(shù)據(jù)來說明本文算法在實際應(yīng)用中的優(yōu)勢。SRTM數(shù)據(jù)是由航天飛機雷達(dá)測量生成的LiDAR影像數(shù)據(jù)[37],且LiDAR數(shù)據(jù)的噪聲已被證明具有乘性噪聲性質(zhì)[38],因此本文含有6個未知參數(shù)的數(shù)字高程DEM乘性誤差模型如下
H(xi,yi)=F(xi,yi)⊙(1+εm)
(37)
式中,(xi,yi)表示地面點經(jīng)緯度坐標(biāo);H(xi,yi)表示該點對應(yīng)的高程,單位為米;εm表示乘性誤差向量。
F(xi,yi)的具體形式如下[7]
(38)
由于SRTM數(shù)據(jù)均是在等精度測量中獲取,因此在定權(quán)時假設(shè)未知的單位權(quán)中誤差和乘性誤差相等,即乘性誤差的權(quán)陣為單位陣。本文獲取的受乘性誤差干擾的數(shù)字高程模型如圖8所示,分別使用表1中的5種方案計算,WLS方法和bcWLS方法由于受病態(tài)性的影響,系數(shù)矩陣奇異,參數(shù)估值不收斂;LS方法、本文算法1和2方法擬合的數(shù)字高程模型如圖9、圖10和圖11所示。將3種收斂方案計算的參數(shù)估值和單位權(quán)中誤差估值列于表7,參數(shù)估值的均方根誤差列于表8。
表7 參數(shù)估值和單位權(quán)中誤差
表8 參數(shù)估值的均方根誤差
圖8 受乘性誤差干擾的數(shù)字高程模型Fig.8 Digital elevation model disturbed by multiplicative error
圖9 LS方法求得的數(shù)字高程模型Fig.9 Digital elevation model obtained by the LS method
圖10 RWLS方法求得的數(shù)字高程模型Fig.10 Digital elevation model obtained by the RWLS method
圖11 SUTRWLS方法求得的數(shù)字高程模型Fig.11 Digital elevation model obtained by the SUTRWLS method
由圖8和圖9可以發(fā)現(xiàn),LS方法求得擬合高程的結(jié)果嚴(yán)重偏離原始的數(shù)字高程模型,這是由于LS方法未考慮觀測值的權(quán)且模型為病態(tài)性所導(dǎo)致的。本文算法考慮了病態(tài)性的影響,在處理實際數(shù)據(jù)時更具優(yōu)勢,從圖10和圖11來看,求得擬合高程的結(jié)果能夠較好地擬合圖8的高程。說明現(xiàn)有文獻(xiàn)未考慮病態(tài)性的方法無法處理實際數(shù)據(jù),因此顧及模型病態(tài)性帶來的影響是十分必要的。
由表7可以看出,LS方法求得的參數(shù)估值和單位權(quán)中誤差過大,不符合實際情況,進(jìn)一步說明了LS方法無法處理實際數(shù)據(jù),本文算法在處理實際數(shù)據(jù)的優(yōu)勢。由表8也可以看出,LS方法求得參數(shù)估值的根均方誤差最大,本文算法遠(yuǎn)小于LS方法。其中,在本文算法中,由于算法2考慮了非線性迭代過程對參數(shù)估計帶來的影響,使用SUT法求得的參數(shù)估值的均方根誤差小于算法1,這也驗證了本文算法的適用性和優(yōu)勢。對比算法1和算法2在參數(shù)估值上并沒有很大差別,這可能是因為參數(shù)估值較小;而參數(shù)估值的均方根誤差卻差別很大,這是因為算法1根據(jù)誤差傳播定律求得的均方根誤差只能反映參數(shù)估值的一階精度信息,而算法2采用的SUT法為二階精度評定方法,求得參數(shù)估值的精度信息為二階精度。
為了完善乘性誤差模型數(shù)據(jù)處理理論,本文在分析已有研究的基礎(chǔ)上,將乘性誤差模型擴(kuò)展至病態(tài)乘性誤差模型,推導(dǎo)了病態(tài)乘性誤差模型參數(shù)估計的Tikhonov正則化迭代解公式??紤]到迭代過程中參數(shù)估值與觀測值之間存在復(fù)雜的非線性關(guān)系,引入SUT法對病態(tài)乘性誤差模型進(jìn)行精度評定。最后,通過算例的驗證與分析得到以下幾點結(jié)論:
(1) 本文推導(dǎo)的病態(tài)乘性誤差模型參數(shù)估計的Tikhonov正則化迭代解法可以得到比未考慮模型病態(tài)性的方法更準(zhǔn)確的參數(shù)估值,且參數(shù)估值的精度更高。
(2) 通過將加權(quán)最小二乘正則化迭代過程表示成非線性函數(shù),引入的SUT精度評定方法能夠得到更為合理的精度信息。
(3) 本文提出的方法是基于函數(shù)f(·)為β的線性函數(shù)的情況下推導(dǎo)的,若將函數(shù)f(·)擴(kuò)展至非線性函數(shù),需要進(jìn)一步研究。