趙 俊,歸慶明
1. 信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450001; 2. 信息工程大學(xué)理學(xué)院,河南 鄭州 450001
?
部分變量誤差模型的整體抗差最小二乘估計
趙俊1,歸慶明2
1. 信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450001; 2. 信息工程大學(xué)理學(xué)院,河南 鄭州 450001
Foundationsupport:TheNationalNaturalScienceFoundationofChina(Nos. 41174005; 41474009)
部分變量誤差模型(partialEIVmodel)的加權(quán)整體最小二乘(weightedtotalleast-squares,WTLS)估計不具備抵御粗差的能力。鑒于粗差可能同時出現(xiàn)在觀測值和系數(shù)矩陣中,本文在提出部分變量誤差模型WTLS估計的兩步迭代解法的基礎(chǔ)上,運(yùn)用抗差M估計的等價權(quán)方法,發(fā)展了一種整體抗差最小二乘(TRLS)估計方法,并采用一致最大功效統(tǒng)計量確定降權(quán)因子。針對WTLS估計兩步迭代解法的特點(diǎn),設(shè)計了兩個不同的降權(quán)方案:第1個方案是在估計系數(shù)矩陣元素時,不對觀測值降權(quán),僅對系數(shù)矩陣降權(quán);第2個方案是在估計系數(shù)矩陣元素時,既對系數(shù)矩陣降權(quán),同時也對觀測值降權(quán)。通過對模擬2D仿射變換和線性擬合實例進(jìn)行計算和分析,結(jié)果表明第1方案優(yōu)于第2方案,并且優(yōu)于基于殘差和驗后單位權(quán)方差的抗差估計和現(xiàn)有的變量誤差模型抗差估計。
部分變量誤差模型; 加權(quán)整體最小二乘估計;粗差;整體抗差最小二乘估計;一致最大功效統(tǒng)計量
最近幾年,作為變量誤差模型(errors-in-variables,EIV)的參數(shù)估計方法,整體最小二乘(totalleast-squares,TLS)或加權(quán)整體最小二乘(weightedTLS,WTLS)方法在大地測量領(lǐng)域獲得了廣泛關(guān)注[1-2],但大多數(shù)學(xué)者的工作主要集中于WTLS估計的算法研究[3-8]。WTLS估計是在一般的變量誤差模型中引入觀測誤差和系數(shù)矩陣誤差的方差-協(xié)方差矩陣的參數(shù)估計方法[3]。事實上,變量誤差模型中并不是所有的系數(shù)矩陣元素都是隨機(jī)的。例如,在坐標(biāo)變換中,一些元素不含誤差,可以認(rèn)為是固定的,而另外一些元素則是由觀測值所組成的,可以認(rèn)為是隨機(jī)的。顧及這一事實,通常考慮的變量誤差模型被推廣到更一般的部分變量誤差模型[9]。部分變量誤差模型的WTLS估計方法,其優(yōu)勢在于不用拉格朗日乘子且法方程未知參數(shù)的個數(shù)大大減少,因而獲得了更多關(guān)注[10-11]。但是,WTLS估計與經(jīng)典的LS估計一樣,對粗差很敏感,不具有抵御粗差影響的能力[12-17]。
如何有效地處理觀測數(shù)據(jù)中的粗差一直是測量領(lǐng)域關(guān)注和研究的熱點(diǎn)[18-19],抗差估計是一種處理粗差的有效方法,并且針對Gauss-Markov模型的抗差估計成果較多[20-26]。雖然針對變量誤差模型,文獻(xiàn)[14—17]提出了為數(shù)不多的幾個抗差估計,但這些估計均采用殘差和驗后單位權(quán)方差確定降權(quán)因子,易受粗差的影響,進(jìn)而影響其抗差功效。由于部分變量誤差模型的系數(shù)矩陣也可能含有粗差,所以經(jīng)典的抗差估計方法并不能直接應(yīng)用于部分變量誤差模型,更為有效的方法值得研究。為此,本文將在提出部分變量誤差模型WTLS估計的兩步迭代解法的基礎(chǔ)上,運(yùn)用抗差LS估計的等價權(quán)方法,提出一種整體抗差最小二乘(TRLS)估計方法,并構(gòu)建一致最大功效統(tǒng)計量確定降權(quán)因子。針對WTLS估計兩步迭代解法的特點(diǎn),設(shè)計兩個不同的降權(quán)方案:第1方案是在估計系數(shù)矩陣元素時,不對觀測值降權(quán),僅對系數(shù)矩陣降權(quán);第2方案是在估計系數(shù)矩陣元素時,既對系數(shù)矩陣降權(quán),同時也對觀測值降權(quán)。
考慮如下部分變量誤差模型[9]
(1)
(2)
下面提出部分變量誤差模型(1)的WTLS估計的兩步迭代解法。首先,將任意給定的X的初值X(0)代入式(1),得到
(3)
(4)
再令
(5)
(6)
對應(yīng)的殘差向量為
(7)
(8)
(9)
L=A*X+Δ
(10)
再次應(yīng)用LS原理[19],可得未知參數(shù)向量X的估計為
(11)
對應(yīng)的殘差向量為
(12)
最后,可得單位權(quán)方差σ2的估計為
(13)
值得指出的是,上述WTLS估計的兩步迭代解法本質(zhì)上與現(xiàn)有算法[9]等價。鑒于上述公式是在LS框架下推導(dǎo)得到的,所以經(jīng)典LS估計和抗差LS估計的相關(guān)理論和方法[21-24]都可以直接應(yīng)用于部分變量誤差模型。
(14)
和
(15)
根據(jù)基于敏感度分析的抗差估計理論[26],本文將按下列方式確定式(14)、(15)中的等價權(quán)陣
(16)
式中,ωi為降權(quán)因子,可通過Huber權(quán)函數(shù)[20]進(jìn)行確定
(17)
(18)
(19)
式中,m為給定的常數(shù)。
眾所周知,殘差和單位權(quán)方差的驗后估計易受粗差的影響[26];因此,按式(19)確定降權(quán)因子,會造成抗差功效的損失?;诿舾卸确治龅目共罟烙嬂碚摫砻鳎谝恢伦畲蠊πЫy(tǒng)計量的抗差估計優(yōu)于基于殘差或標(biāo)準(zhǔn)化殘差的抗差估計[26]。令人遺憾的是,通過現(xiàn)有的WTLS估計方法均無法構(gòu)造此一致最大功效統(tǒng)計量,為此本文利用第1節(jié)提出的WTLS估計的兩步迭代解法,構(gòu)造如下統(tǒng)計量,以將基于一致最大功效統(tǒng)計量的抗差估計拓展到部分變量誤差模型
(20)
(21)
Fig. 3 is the chip photo of the 245 GHz 2nd subharmonic receiver with on-chip antenna with each circuit block indicated in the figure.
(22)
(23)
對應(yīng)的降權(quán)因子分別為
(24)
(25)
(26)
(27)
注意到式(14)中既包含系數(shù)矩陣的權(quán),也包含觀測值的權(quán),為此提出如下兩個降權(quán)方案,以便作比較分析。
方案1,在式(14)中僅對Pe進(jìn)行降權(quán)。
綜上所述,計算TRLS估計的迭代算法設(shè)計如下:
算例1,2D仿射變換的數(shù)學(xué)模型為
(28)
假定變換參數(shù)的參考值為
(29)
而無誤差的觀測數(shù)據(jù)如表1所示。
表1 無誤差的原始觀測數(shù)據(jù)
根據(jù)MonteCarlo策略[15],將協(xié)方差矩陣為
(30)QS=0.005diag([12315427218 36])
QT=0.005diag([13611843654 52])
的隨機(jī)誤差分別加在13個點(diǎn)的無誤差的原始觀測值上,得到模擬觀測值,并且在第4個點(diǎn)的舊坐標(biāo)分量xs上加入大小為2 m的粗差。臨界值ε和m分別選為0.000 01和1.5,最大迭代次數(shù)為200,權(quán)函數(shù)取Huber權(quán)函數(shù)。為消除隨機(jī)因素的影響,隨機(jī)模擬運(yùn)行了200次。單個粗差情形下,由各方案計算得到的變換參數(shù)估值與參考值之間的歐氏距離如圖1所示,圖2則給出了單位權(quán)方差的估值。
與此同時,對上述200次模擬結(jié)果進(jìn)行了統(tǒng)計分析,其結(jié)果如表2、表3和表4所示。從表中不難看出,當(dāng)系數(shù)矩陣元素受到粗差污染時,WTLS估計扭曲得十分厲害, 其抗差性很差; 而
基于方案1的TRLS估計則較為有效地削弱了粗差對未知參數(shù)估值的影響,獲得了可靠的參數(shù)估值;但方案2并沒有達(dá)到預(yù)期的抗差效果,其穩(wěn)定性還不如WTLS估計,這說明在估計系數(shù)矩陣時,無須進(jìn)行相應(yīng)的降權(quán)。如果將TRLS估計抵御粗差的成功率定義為
(31)則兩種方案的成功率分別為100%和29.5%,這表明方案1的TRLS估計更具穩(wěn)定性和可靠性。
表2 單個粗差情形下200次模擬的變換參數(shù)估值與參考值之間的平均距離
表3 單個粗差情形下單個變換參數(shù)估值與參考值之間的絕對距離
表4 單個粗差情形下200次模擬的單位權(quán)方差估值的統(tǒng)計結(jié)果
下面考慮多個粗差的情形。為此,繼續(xù)在第4個點(diǎn)的舊坐標(biāo)分量ys上加入大小為2 m的粗差,同時在第2個點(diǎn)的新坐標(biāo)兩分量xt和yt上也都加入大小為2 m的粗差。模擬計算200次,其變換參數(shù)估值與參考值之間的歐氏距離以及單位權(quán)方差估計分別如圖3和圖4所示,而變換參數(shù)估值與參考值之間的平均距離如表5所示。不難看出,方案2的TRLS估計基本上不具有抵御粗差的能力,而方案1的TRLS估計則克服了粗差的影響,并且成功率達(dá)到100%。
表5 多個粗差情形下200次模擬的變換參數(shù)與參考值之間歐氏距離的平均距離
綜上可知,不論是單個粗差還是多個粗差,方案2的TRLS估計均不具有較強(qiáng)的抗差能力,而方案1的TRLS估計則能夠有效削弱單個或多個粗差對未知參數(shù)估值的不良影響,這說明在處理部分變量誤差模型中的粗差時,應(yīng)采用方案1的TRLS估計方法。為了顯示本文算法的優(yōu)越性,在相同模擬條件下,仍然應(yīng)用前面的相關(guān)數(shù)據(jù),將本文算法與基于殘差和驗后單位權(quán)方差確定降權(quán)因子(式(19))的抗差估計進(jìn)行比較,其計算結(jié)果如表6和表7所示。相關(guān)結(jié)果表明本文算法優(yōu)于現(xiàn)有算法。
表6 單個粗差情形下200次的模擬變換參數(shù)估值與參考值之間距離
表7 多個粗差情形下200次模擬的變換參數(shù)估值與參考值之間的距離
算例2,考慮如表8所示的實測數(shù)據(jù)[29],該數(shù)據(jù)是關(guān)于20個孩子的血液樣本中血清中卡那霉素的水平。其中一項數(shù)據(jù)是通過足跟方式獲取,而另外一項則是用導(dǎo)管的方式獲取。文獻(xiàn)[29]指出表8中的第2個觀測值含有粗差,據(jù)此本文將去掉該觀測值所得到的WTLS估值作為未知參數(shù)的參考值。在計算過程中,迭代終止的條件為相鄰迭代估值之間的距離小于0.000 01,或者是迭代次數(shù)超過200次,權(quán)函數(shù)取Huber權(quán)函數(shù)。分別采用WTLS估計、方案1和方案2的TRLS估計進(jìn)行解算,并與文獻(xiàn)[15]中的結(jié)果進(jìn)行對比,如表9所示。表10則給出了由各種方法得到的單位權(quán)方差估值。圖5表示的是不同參數(shù)估值對應(yīng)的擬合結(jié)果。
圖1 各方案計算得到的變換參數(shù)估值與參考值之間的歐氏距離(單個粗差情形)Fig.1 Euclidean distances between estimated transformation parameters by different schemes and reference values with single outlier
圖2 單位權(quán)方差的估值(單個粗差情形)Fig.2 Estimate of variance of unit weight with single outlier
圖3 各方案計算得到的變換參數(shù)估值與參考值之間的歐氏距離(多個粗差情形)Fig.3 Euclidean distance between estimated transformation parameters by different schemes and reference values with multiple outliers
圖4 200次模擬的單位權(quán)方差估值(多個粗差情形)Fig.4 Estimate of variance of unit weight for 200 simulations with multiple outliers
圖5 線性擬合圖Fig.5 Linear fitting
表8 血液樣本數(shù)據(jù)
表9 各種方法的計算結(jié)果
表10 單位權(quán)方差的估值
從表9可以看出,方案1和方案2的TRLS方法均具有一定的抵御粗差的功效,但就未知參數(shù)估值與參考值之間的歐氏距離來看,方案1明顯優(yōu)于方案2。與文獻(xiàn)[15]中的結(jié)果進(jìn)行比較發(fā)現(xiàn),本文的TRLS估值更穩(wěn)健。從表10可以看出,本文算法的計算精度高于文獻(xiàn)[15],這也有力地驗證了本文方法的有效性和優(yōu)良性。
(1) 部分變量誤差模型的WTLS估計同LS估計一樣,對粗差很敏感,即抗差性能很差。
(2) 提出了部分變量誤差模型WTLS估計的一種兩步迭代解法,該解法的計算公式均是在LS框架下推導(dǎo)得到的,具有易于理解和可操作性強(qiáng)等特點(diǎn),為構(gòu)建部分變量誤差模型的整體抗差估計奠定了基礎(chǔ)。
(3) 利用部分變量誤差模型的兩步迭代解法,構(gòu)建了與抗差LS估計相類似的TRLS解式,保持了傳統(tǒng)的數(shù)據(jù)處理方式,并構(gòu)造了一致最大功效統(tǒng)計量以確定降權(quán)因子,其中未知的單位權(quán)方差可采用具有高崩潰污染率的LMS方法進(jìn)行估計。
(4) 結(jié)合部分變量誤差模型兩步迭代解法的特點(diǎn),設(shè)計了兩個降權(quán)方案:第1個方案是在估計系數(shù)矩陣元素時,不對觀測值進(jìn)行降權(quán),僅對系數(shù)矩陣降權(quán),而第2個方案則是在估計系數(shù)矩陣元素時對觀測值和系數(shù)矩陣同時降權(quán)。
(5) 2D相似變換模擬算例的計算結(jié)果表明,單個粗差情形下兩種不同降權(quán)方案的TRLS估計均具有一定的抗差能力,但方案1的抗差功效更優(yōu)。多個粗差情形下,方案2的TRLS估計基本上不具有抗差性。因此,處理部分變量誤差模型中的粗差時,應(yīng)采用方案1的TRLS估計。線性擬合實測數(shù)據(jù)的計算結(jié)果表明本文方法優(yōu)于現(xiàn)有變量誤差模型的抗差估計方法。
(6) 需要注意的是,統(tǒng)計量(式(20)、式(21))并非嚴(yán)格意義上的一致最大功效統(tǒng)計量,因此,部分變量誤差模型的整體抗差估計及其算法值得進(jìn)一步研究。
[1]FANGX.WeightedTotalLeastSquaresSolutionsforApplicationinGeodesy[D].Hanover:LeibnizUniversityHanover, 2011.
[2]SNOWKB.TopicsinTotalLeast-squaresAdjustmentwithintheErrors-in-variablesModel:SingularCofactorMatricesandPriorInformation[D].Ohio:OhioStateUniversity, 2012.
[3]SCHAFFRINB,WIESERA.OnWeightedTotalLeast-squaresAdjustmentforLinearRegression[J].JournalofGeodesy, 2008, 82(7): 415-421.
[4]SHENYunzhong,LIBofeng,CHENYi.AnIterativeSolutionofWeightedTotalLeast-squaresAdjustment[J].JournalofGeodesy, 2011, 85(4): 229-238.
[5]MAHBOUBV.OnWeightedTotalLeast-squaresforGeodeticTransformations[J].JournalofGeodesy, 2012, 86(5): 359-367.
[6]AMIRI-SIMKOOEIAR,JAZAERIS.WeightedTotalLeastSquaresFormulatedbyStandardLeastSquaresTheory[J].JournalofGeodeticScience, 2012, 2(2): 113-124.
[7]FANGXing.WeightedTotalLeastSquares:NecessaryandSufficientConditions,FixedandRandomParameters[J].JournalofGeodesy, 2013, 87(8): 733-749.
[8]JAZAERIS,AMIRI-SIMKOOEIAR,SHARIFIMA.IterativeAlgorithmforWeightedTotalLeastSquaresAdjustment[J].SurveyReview, 2014, 46(334): 19-27.
[9]XUPeiliang,LIUJingnan,SHIChuang.TotalLeastSquaresAdjustmentinPartialErrors-in-variablesModels:AlgorithmandStatisticalAnalysis[J].JournalofGeodesy, 2012, 86(8): 661-675.
[10]SHIYun,XUPeiliang,LIUJingnan,etal.AlternativeFormulaeforParameterEstimationinPartialErrors-in-variablesModels[J].JournalofGeodesy, 2015, 89(1): 13-16.
[11]ZENGWenxian,LIUJingnan,YAOYibin.OnPartialErrors-in-variablesModelswithInequalityConstraintsofParametersandVariables[J].JournalofGeodesy, 2015, 89(2): 111-119.
[12]SCHAFFRINB,UZUNS.Errors-in-variablesforMobileMappingAlgorithmsinthePresenceofOutliers[J].ArchivesofPhotogrammetry,CartographyandRemoteSensing, 2011, 22: 377-387.
[13]SCHAFFRINB,UZUNS.OntheReliabilityofErrors-in-variablesModels[J].ActaetCommentationesUniversitatisTartuensisDeMathematica, 2012, 16(1): 69-81.
[14]陳義, 陸玨. 以三維坐標(biāo)轉(zhuǎn)換為例解算穩(wěn)健總體最小二乘方法[J]. 測繪學(xué)報, 2012, 41(5): 715-722.CHENGYi,LUJue.Performing3DSimilarityTransformationbyRobustTotalLeastSquares[J].ActaGeodaeticaetCartographicaSinica, 2012, 41(5): 715-722.
[15]MAHBOUBV,AMIRI-SIMKOOEIAR,SHARIFIMA.IterativelyReweightedTotalLeastSquares:ARobustEstimationinErrors-in-variablesModels[J].SurveyReview, 2013, 45(329): 92-99.
[16]LUJ,CHENY,LIBF,FANGX.RobustTotalLeastSquareswithReweightingIterationforThree-dimensionalSimilarityTransformation[J].SurveyReview, 2014, 46(334): 28-36.
[17]TAOYQ,GAOJX,YAOYF.TLSAlgorithmforGPSHeightFittingBasedonRobustEstimation[J].SurveyReview, 2014, 46(336): 184-188.
[18]ROUSSEEUWPJ,LEROYAM.RobustRegressionandOutlierDetection[M].NewYork:JohnWiley&Sons, 1987.
[19]KOCHKR.ParameterEstimationandHypothesisTestinginLinearModels[M]. 2nded.NewYork:Springer, 1999.
[20]HUBERPJ.RobustStatistics[M].NewYork:JohnWiley&Sons, 1981.
[21]周江文. 經(jīng)典誤差理論與抗差估計[J]. 測繪學(xué)報, 1989, 18(2): 115-120.
ZHOUJiangwen.ClassicalTheoryofErrorsandRobustEstimation[J].ActaGeodaeticaetCartographicaSinica, 1989, 18(2): 115-120.
[22]YANGY,SONGL,XUT.RobustEstimatorforCorrelatedObservationsBasedonBifactorEquivalentWeights[J].JournalofGeodesy, 2002, 76(6-7): 353-358.
[23]YANGY.RobustEstimationforDependentObservations[J].ManuscriptaGeodaetica, 1994, 19(1): 10-17.
[24]YANGY.RobustEstimationofGeodeticDatumTransformation[J].JournalofGeodesy, 1999, 73(5): 268-274.
[25]XUPeiliang.Sign-constrainedRobustLeastSquares,SubjectiveBreakdownPointandtheEffectofWeightsofObservationsonRobustness[J].JournalofGeodesy, 2005, 79(1-3): 146-159.
[26]GUOJianfeng,OUJikun,WANGHaitao.RobustEstimationforCorrelatedObservations:TwoLocalSensitivity-BasedDownweightingStrategies[J].JournalofGeodesy, 2010, 84(4): 243-250.
[27]黃維彬. 近代平差理論及其應(yīng)用[M]. 北京: 解放軍出版社, 1992.HUANGWeibin.TheoryandApplicationsofModernAdjustment[M].Beijing:PLAPublishingHouse, 1992.
[28]郭建鋒, 趙俊. 粗差探測與識別統(tǒng)計檢驗量的比較分析[J]. 測繪學(xué)報, 2012, 41(1): 14-18.GUOJianfeng,ZHAOJun.ComparativeAnalysisofStatisticalTestsUsedforDetectionandIdentificationofOutliers[J].ActaGeodaeticaetCartographicaSinica, 2012, 41(1): 14-18.
[29]KELLYG.TheInfluenceFunctionintheErrorsinVariablesProblem[J].TheAnnalsofStatistics, 1984, 12(1): 87-100.
(責(zé)任編輯:叢樹平)
收稿日期: 2015-07-16
修回日期: 2015-12-26
第一作者簡介: 趙俊(1987—),男,博士生,研究方向為測量數(shù)據(jù)處理。
Firstauthor:ZHAOJun(1987—),male,PhDcandidate,majorsinsurveyingdataprocessing.
E-mail:zhaojun4368@163.com
LUOZhicai
TotalRobustifiedLeastSquaresEstimationinPartialErrors-in-variablesModel
ZHAOJun1,GUIQingming2
1.InstituteofGeospatialInformation,InformationEngineeringUniversity,Zhengzhou450001,China; 2.InstituteofScience,InformationEngineeringUniversity,Zhengzhou450001,China
Theweightedtotalleast-squares(WTLS)estimateforthepartialerrors-in-variables(EIV)modelisverysusceptibletooutliers.BecausetheobservationsandcoefficientmatrixinthepartialEIVmodelmaybecontaminatedwithoutlierssimultaneously,atotalrobustifiedleastsquares(TRLS)estimationforthepartialEIVmodelisproposedbycombiningatwo-stepiteratedalgorithmoftheWTLSestimatewiththeequivalentweightmethodofrobustM-estimation.Andtheuniformlymostpowerfulteststatisticsareconstructedtodeterminethedown-weightingfactors.Forthecharacteristicsofthetwo-stepiteratedmethod,twodifferentdown-weightingschemesarepresented.Inthefirstschemedown-weightingisonlyimplementedforthecoefficientmatrixandnotfortheobservationswhensomeelementsofthecoefficientmatrixareestimated,andthesecondschemeiscontrary.Asimulatedtwo-dimensionalaffinetransformationandalinearfittingwithrealdataareanalyzed.TheresultsshowthattheTRLSwiththefirstschemeissuperiortoonewiththesecondscheme,anditoutperformstheexistingrobustmethodswithresidualandposteriorestimateofvarianceofunitweightandexistingrobustmethodsforthegeneralEIVmodel.
partialEIVmodel;weightedtotalleast-squares;outlier;TRLS;uniformlymostpowerfulteststatistics
2015-04-27
2016-03-01
吳懌昊(1987—),男,博士生,研究方向為物理大地測量學(xué)。Firstauthor:WUYihao(1987—),male,PhDcandidate,majorsinphysicalgeodesy.
E-mail:whuwyh@126.com
羅志才
E-mail:zhcluo@sgg.whu.edu.cn
ZHAOJun,GUIQingming.TotalRobustifiedLeastSquaresEstimationinPartialErrors-in-variablesModel[J].ActaGeodaeticaetCartographicaSinica,2016,45(5):552-559.DOI:10.11947/j.AGCS.2016.20150374.
P207
A
1001-1595(2016)05-0552-08
國家自然科學(xué)基金(41174005;41474009)
引文格式:趙俊,歸慶明.部分變量誤差模型的整體抗差最小二乘估計[J].測繪學(xué)報,2016,45(5):552-559.DOI:10.11947/j.AGCS.2016.20150374.