翁 燁,邵德盛,2*,甘 淑,3
(1.昆明理工大學(xué) 國土資源工程學(xué)院,云南 昆明 650093;2.云南省地震局,云南 昆明 650041;3.云南省高校高原山地空間信息測繪技術(shù)應(yīng)用工程研究中心,云南 昆明 650093)
多源數(shù)據(jù)有利于信息的全面和高效,比單一數(shù)據(jù)源獲得更加精確和可靠的數(shù)據(jù)信息[1]。實際測量數(shù)據(jù)模型中,未知參數(shù)的平差值是不同觀測量的一個加權(quán)統(tǒng)計量,相同觀測條件下為等權(quán)觀測量,不同觀測條件下觀測量具有不同權(quán)重[2]。另外,多源數(shù)據(jù)的融合也會出現(xiàn)一些函數(shù)模型和隨機(jī)模型的先驗信息,如參數(shù)間往往存在固有的幾何關(guān)系,構(gòu)成函數(shù)模型約束;也可能存在某些先驗隨機(jī)信息,構(gòu)成模型等式約束[3]。病態(tài)模型的解法主要有有偏估計、無偏估計、直接解法以及智能搜索算法等。有偏估計的很多理論是基于線性回歸模型進(jìn)行研究,但是在實際問題中,觀測量與參數(shù)之間不是簡單的線性關(guān)系,可能會隨著自變量維數(shù)增加出現(xiàn)多重共線性問題。對于有偏估計的研究,Hoerl等[4-5]通過對法方程矩陣對角線上添加一個常數(shù)k得到嶺估計;Massy[6]、Hoerl等[4]提出一種新的估計方法——主成分估計,剔除存在多重共線性的因子,消除原有最小二乘估計(least squares,LS)因子中共線性問題的影響;主成分估計在于剔除系數(shù)矩陣中較小的主成分,或者選取前k個特征根之和在所有特征根總和中所占比例達(dá)到預(yù)先設(shè)定要求,實行矩陣分塊計算,相比較嶺估計而言,主成分估計的閾值更容易選取。
為了克服線性模型中出現(xiàn)的多重共線性問題,結(jié)合嶺估計和stein估計的優(yōu)點,Liu[7]提出“線性回歸中的一類新的估計”——Liu估計,引入新參數(shù)使得估計在保證參數(shù)估值穩(wěn)定性的同時還能近似無偏。基于對嶺估計的解釋,Liu估計添加修正因子,適用于參數(shù)估計值不理想進(jìn)行二次估計解;在修正因子d=1時,Liu估計退化成原始估計,與嶺估計不同的是,Liu估計為原始估計值的線性表達(dá)和拓展形式;可以采用LS估計或者嶺估計作為原始估計值,因此Liu估計優(yōu)于LS估計和嶺估計,同時Liu估計保持stein估計的特點。若以LS估計為原始估計,參數(shù)估計的偏差引入量較小,進(jìn)一步增加參數(shù)估值的可信度。雷慶祝等[8-9]利用矩陣方法,分析帶約束條件下線性模型中的參數(shù)嶺估計的強(qiáng)、弱相合性以及參數(shù)估值的均方誤差相合性,并利用線性模型中誤差方差嶺估計的標(biāo)準(zhǔn)化,得到其樣本性質(zhì);郭雙和吳平等[10-11]討論線性誤差模型中設(shè)計矩陣存在復(fù)共線性情況時的參數(shù)估計問題,基于校正LS方法提出回歸參數(shù)的Liu估計解,還分別在附加有等式約束條件和隨機(jī)約束條件時構(gòu)造了模型參數(shù)的約束Liu估計解和隨機(jī)約束Liu估計解;針對等式約束的奇異線性模型的參數(shù)估計問題,為了克服設(shè)計矩陣的復(fù)共線性,廖勛[12]提出一個新的Liu型估計解法,證明新的Liu型估計在均方誤差矩陣(mean square error matrix,MSEM)和均方誤差(mean square error,MSE)準(zhǔn)則下優(yōu)于約束LS估計;針對帶等式約束的回歸模型復(fù)共線性問題,黃文煥等[13]、黃榮臻等[14]提出一種新估計,稱為修正約束型Liu估計,在MSE準(zhǔn)則基礎(chǔ)上證明修正約束型Liu估計優(yōu)于LS估計、嶺估計、修正嶺估計和約束型Liu估計;另外,許多學(xué)者也發(fā)現(xiàn)在一定條件下結(jié)合2種估計得到新的有偏估計優(yōu)于其中任何單一估計,Baye和Parker[15]提出線性回歸模型的主成分嶺估計。
基于對主成分估計和Liu估計的優(yōu)點考慮,結(jié)合2種估計,本文給出一種新的有偏估計——主成分Liu估計。在等式先驗信息下,結(jié)合參數(shù)回歸模型理論和聯(lián)合平差方法,推導(dǎo)出加權(quán)下的主成分Liu估計解式和修正因子計算式。本文方法在同樣約束情形下優(yōu)于傳統(tǒng)的經(jīng)典最小二乘法,還可以借用最小二乘解做線性變換,進(jìn)一步提高參數(shù)估計精度,減少偏差的同時得到更加穩(wěn)定的可靠解。
等式約束G-M模型為[16-20]
(1)
式中:L∈Rn×1為觀測向量;B∈Rn×m為設(shè)計矩陣,且R(B)=m (2) (3) (4) (5) 式中:N=BTPB;NH=HN-1HT。比較式(5)可知,等式約束G-M模型參數(shù)解的方差小于最小二乘解的方差。 在線性回歸模型L+e=BX中,增加新的參數(shù)d抵抗設(shè)計矩陣存在復(fù)共線性的情況,參數(shù)的選擇優(yōu)于嶺參數(shù)的選取,同時具有壓縮估計性質(zhì),根據(jù)準(zhǔn)則式(3),增加Liu估計的估計準(zhǔn)則[7],根據(jù)Liu估計定義得出的參數(shù)估計值為[16-17] (6) 式中:0 對模型(1)進(jìn)行如下典則參數(shù)變換 (7) 式中:G為正交方陣;Z=BG,α=GTX為典則參數(shù)。令GT(BTPB)G=Λ=diag{λ1,λ2,…,λm},這里的λi(i=1,2,…,m)為BTPB的m個特征根。將BTPB的特征值按照λ1≥λ2≥…≥λm降序排列,在設(shè)計矩陣存在復(fù)共線性同時存在部分較小特征值,可采用主成分估計方法進(jìn)行參數(shù)解算;設(shè)計矩陣病態(tài)性主要來源于小奇異值近似于0而導(dǎo)致(BTPB)-1變得很大,這里的小奇異值有可能不止1個,所以觀測向量的微小擾動誤差就會導(dǎo)致參數(shù)估計的極不穩(wěn)定;而Liu估計中對病態(tài)矩陣的修正偏向統(tǒng)一性,不區(qū)分大小奇異值造成的影響。因此,結(jié)合主成分估計和Liu估計的優(yōu)勢,組成主成分Liu估計。 首先根據(jù)主成分估計原理,剔除降序排列的后m-k個小奇異值,因此主成分估計更加適用于系數(shù)矩陣特征根兩級均勻分化且極小特征值較少的平差模型,記 設(shè)置最小奇異值門限k=λk,k=1,2,…,m-1,k的取值為[20] 將式(7)轉(zhuǎn)換成式(8)的主成分典則形式 (8) 剔除掉后面m-k個自變量較小的主成分影響因素后得到L=Z1α1-e,有X=Gα,參數(shù)X的加權(quán)主成分估計為 (9) 結(jié)合主成分估計和Liu估計,定義主成分Liu估計為[21] (10) (11.a) (11.b) 式(11)中:cov[*]表示協(xié)方差;Bias[*]表示偏差。 測量平差問題研究中,要考慮實際背景為基礎(chǔ),在實際中測量通常增加約束條件進(jìn)行聯(lián)合平差,提高參數(shù)估計的有效性。利用拉格朗日乘子算法構(gòu)造出精確約束函數(shù)表達(dá)式[22] (12) 式中λ是n×1階拉格朗日乘子向量,對X、λ求偏導(dǎo)數(shù)得 (13.a) (13.b) 由式(13.a)可得 (14) 式(14)中I為m階單位矩陣。將式(14)代入式(13.b)中,得 (15) 把式(15)代入式(14)中,得到在等式約束條件下的Liu估計解為 (16) 由于等式約束條件下主成分估計為 (17) 可得加權(quán)等式約束平差模型下的主成分Liu估計為 (18) (19) (20.a) (20.b) 令t(λi,αi,p)=N1W1=g,可以得出精確約束條件下的均方誤差為 (21) 對T(d)求導(dǎo)數(shù),在滿足d=1時,T′(d)>0,因此存在d值在T′(d)令其為零得出修正因子dH為 (22) (23) (24) 根據(jù)式(18)、(19)、(22),可以得出不同方案下的參數(shù)估計及其均方誤差矩陣,如表1所示。 表1 參數(shù)估計與均方誤差矩陣 表2 添加隨機(jī)誤差后的系數(shù)矩陣和觀測向量 表3 不同算法解算的參數(shù)估值 表4 方差-協(xié)方差矩陣 表5 文獻(xiàn)[25]方差-協(xié)方差矩陣 病態(tài)矩陣有5個奇異值,分別為Λ=diag(0.029 2,0.116 5,27.431 5,140.832 5,608.474 6),根據(jù)主成分原理,選取k=3,通過Liu估計中修正因子的計算式得到修正因子為0.15[7];利用本文計算式(22)得到修正因子為0.55。 從算例可以看出,LS估計由于受到病態(tài)性影響,導(dǎo)致參數(shù)估值偏離真值,估計值與真值的差值范數(shù)為1.308 792;主成分估計和Liu估計各有優(yōu)勢,主成分估計將較小奇異值成分剔除,保留重要主成分,有利于提升參數(shù)估值的可靠性,估計值與真值的差值范數(shù)為0.813 019;狹義Liu估計作為最小二乘估計的一步線性變換,提升精度受到限制,但優(yōu)于LS估計,估計值與真值的差值范數(shù)為0.896 969;主成分Liu估計結(jié)合2種估計的優(yōu)良性質(zhì),優(yōu)于2種估計中任何單一估計,估計值與真值的差值范數(shù)為0.812 687。通過比較主成分Liu估計和等式約束混合估計的估計值與真值的差值范數(shù)可以看出,等式約束對參數(shù)估計精度影響更大,一個合理的等式約束優(yōu)于大部分模型算法,使得參數(shù)估值更具有可信度。本文方法是等式約束病態(tài)最小二乘模型的主成分Liu估計解法,而文獻(xiàn)[25]中是基于等式約束病態(tài)總體最小二乘模型的正則化解法,采用同樣的基礎(chǔ)算例數(shù)據(jù),本文方法得出參數(shù)估值的方差-協(xié)方差矩陣接近于文獻(xiàn)[25]方法得出的方差-協(xié)方差矩陣,得到的方差-協(xié)方差矩陣的跡為2.414 41×10-4,文獻(xiàn)[25]中方差-協(xié)方差矩陣的跡為1.546 50×10-4。 圖1 LS算法模擬500次均方誤差數(shù)值 圖2 不同算法模擬500次均方誤差數(shù)值 圖3 本文算法模擬500次均方誤差數(shù)值 表6 系數(shù)矩陣、觀測值以及添加誤差的觀測值 表7 不同方法參數(shù)估計結(jié)果比較 表8 參數(shù)估計值的方差-協(xié)方差陣 從算例可以看出, 受病態(tài)性影響,導(dǎo)致LS估計參數(shù)估值偏離真值,估計值與真值的差值范數(shù)為214.276 3,因此LS估計得出的參數(shù)估值已經(jīng)失真,盡量不采納。主成分估計和Liu估計各有優(yōu)勢,主成分估計將較小奇異值成分剔除,保留重要主成分,有利于提升參數(shù)估值的可靠性,算例中由于奇異值分布較分散且最大奇異值與最小奇異值相差較大,因此主成分估計受到限制,估計值與真值的差值范數(shù)為86.802 4。狹義Liu估計作為最小二乘估計的一步線性變換,提升精度受到限制,但優(yōu)于LS估計,估計值與真值的差值范數(shù)為86.694 1,針對Liu估計的一次計算精度提升不足,文獻(xiàn)[21]提供一種迭代計算的Liu估計方法。主成分Liu估計結(jié)合2種估計的優(yōu)良性質(zhì),優(yōu)于2種估計中任何單一估計,估計值與真值的差值范數(shù)為40.460 7。 主成分Liu估計和等式約束混合估計方法的估計值與真值的差值范數(shù)分別為40.460 7和32.778 6,主成分Liu估計方法優(yōu)于單一算法,但是合理的等式約束對參數(shù)估計精度影響更大,一個合理的等式約束優(yōu)于大部分模型算法,使參數(shù)估值更具可信度,若是約束條件自身存在爭議,那么對參數(shù)解只會添加更多的誤差影響因素,更加偏離真值。主成分Liu估計方法的優(yōu)點是:當(dāng)參數(shù)模型病態(tài)時,主成分Liu估計的參數(shù)估值優(yōu)于LS、主成分估計以及Liu估計,在一個合理的等式約束下提升效果更加明顯,Liu估計思想中的原始估計可以選擇LS估計、stein估計或者嶺估計;主成分Liu估計方法的缺點是:由于采用主成分思想,主成分Liu估計會丟失部分參數(shù)解的信息,降低參數(shù)解的分辨率,參數(shù)估值的精度更加依賴于主成分的選取,參數(shù)估值為有偏估計值。 多元線性平差模型之間合理的先驗等式約束信息可顯著提高解的可靠性及精確度。基于病態(tài)加權(quán)最小二乘平差模型,本文引入等式約束,通過主成分估計和Liu估計定義出一種新的有偏估計——主成分Liu估計;推導(dǎo)出等式約束病態(tài)最小二乘的主成分Liu估計的計算式、均方誤差矩陣以及方差-協(xié)方差矩陣,利用均方誤差數(shù)值最小化原理,導(dǎo)出修正因子的求解公式;最后用一個等式約束病態(tài)數(shù)值算例計算多種不同算法估計,證明本文方法估計精度更高,可進(jìn)一步應(yīng)用于等式約束的變量含誤差模型。2 等式約束G-M模型的主成分Liu估計
2.1 主成分Liu估計的構(gòu)造
2.2 等式約束G-M模型的主成分Liu估計
2.3 修正因子的確定
3 算例及分析
3.1 算例1
3.2 算例2
4 結(jié)語