□ 別必鑫 魏世麗 余 哲
直接觀測值回歸與間接觀測值回歸方法的比較研究
□別必鑫1魏世麗2余哲3
(1.武漢市洪山區(qū)房管局測繪隊,湖北武漢430070;2.陽泉市測繪處,山西陽泉 045000;3.太原理工大學測繪科學與技術(shù)系,山西太原030024)
在測量平差數(shù)據(jù)處理過程中,常涉及非線性函數(shù)模型。本文就可線性化的一元非線性回歸模型進行研究,探討了處理可線性化一元非線性回歸模型的一種新方法—直接觀測值回歸方法。并以指數(shù)函數(shù)、冪函數(shù)和正態(tài)分布函數(shù)為例,逐一討論了它們的間接觀測值回歸和直接觀測值回歸的線性化形式以及回歸系數(shù)解的具體表達式。算例結(jié)果表明,本文提出的直接觀測值回歸方法比傳統(tǒng)的間接觀測值回歸方法更為實用和有效。
直接觀測值回歸;間接觀測值回歸;方法比較
回歸分析是研究自然界變量之間存在的非確定性的相互依賴和制約關(guān)系,并把這種關(guān)系用數(shù)學表達式表達出來的一種方法,其目的是利用這些數(shù)學表達式以及對這些表達式的精確估計,對未知變量作出預測或檢驗其變化,為決策服務[1]。按照自變量和因變量之間的關(guān)系類型,回歸分析可以分為線性回歸分析和非線性回歸分析。非線性回歸分析作為社會科學定量研究方法中最基本的一種數(shù)據(jù)分析技術(shù),在測繪學、計量學、地理學等諸多領域得到了廣泛應用。在常用的非線性回歸模型中,大部分可以通過適當?shù)臄?shù)學變換轉(zhuǎn)換成線性回歸模型來進行參數(shù)估計,稱這類模型為可線性化模型。有些非線性模型則無法通過數(shù)學變換的方式轉(zhuǎn)換成線性模型,稱這類模型為不可線性化模型。
可線性化的一元非線性回歸模型的基本處理思路是通過數(shù)學變換將非線性模型轉(zhuǎn)換成線性模型,然后用最小二乘法(LS法)計算回歸系數(shù)[2]。將非線性模型轉(zhuǎn)換成線性模型有兩種回歸方法:一種是經(jīng)過線性化后,以間接觀測值,即直接觀測值的函數(shù)作為因變量,這是傳統(tǒng)的方法,稱其為間接觀測值回歸;另一種是經(jīng)過線性化后,以直接觀測值作為因變量,這是本文將要討論的方法,稱其為直接觀測值回歸。
間接觀測值回歸是將一元非線性回歸轉(zhuǎn)換為一元線性回歸的常用方法,其所得到的改正數(shù)是觀測值函數(shù)的改正數(shù),而直接觀測值回歸得到的改正數(shù)是觀測值的改正數(shù)。
以指數(shù)函數(shù)、冪函數(shù)和正態(tài)分布函數(shù)為例,來說明直接觀測值回歸和間接觀測值回歸的計算。
2.1指數(shù)函數(shù)
函數(shù)模型為
回歸方程為
間接觀測值回歸的線性化形式為
式中,vi是因變量Inyi的殘差。
直接觀測值回歸的線性化形式為
式中, vi是yi的殘差。
第一項用泰勒展開,得
用LS法得到回歸系數(shù)和的解:
2.2冪函數(shù)
函數(shù)模型為
回歸方程為
間接觀測值回歸的線性化形式為
式中,vi是因變量Inyi的殘差。
直接觀測值回歸的線性化形式為
第一項用泰勒展開,得
2.3正態(tài)分布函數(shù)
函數(shù)模型為
回歸方程為
間接觀測值回歸的線性化形式為
式中,vi是因變量Inyi的殘差。
直接觀測值回歸的線性化形式為
式中,vi是因變量yi
的殘差。
第一項用泰勒展開,得
以指數(shù)函數(shù)為例,對其直接觀測值回歸和間接觀測值回歸的算例結(jié)果進行比較與討論。
理論回歸系數(shù):a=12.5,b=0.5。
用三組不同大小的自變量XA、XB和XC分別計算三組因變量的真值YA、YB和YC。三組因變量YA、YB和YC的區(qū)別在于,因變量YA之間的數(shù)值差異較小,因變量YB之間的數(shù)值差異適中,因變量YC之間的數(shù)值差異較大。模擬一組觀測值的真誤差Δ,進而用YA、YB和YC分別加真誤差Δ得到模擬觀測值LA、LB和LC,分別見表1、表2和表3。分別用間接觀測值回歸和直接觀測值回歸對每一組模擬觀測值進行計算,模擬觀測值之間數(shù)值差異較小的計算結(jié)果見表1,模擬觀測值之間數(shù)值差異適中的計算結(jié)果見表2,模擬觀測值之間數(shù)值差異較大的計算結(jié)果見表3。殘余真誤差和殘余真誤差均方誤差的計算方法見參考文獻[3]。
表1 指數(shù)函數(shù)觀測值之間數(shù)值差異小時兩種方法的比較
表2 指數(shù)函數(shù)觀測值之間數(shù)值差異中時兩種方法的比較
表3 指數(shù)函數(shù)觀測值之間數(shù)值差異大時兩種方法的比較
續(xù)表
對于觀測值之間數(shù)值差異較小的情形(表1),間接觀測值回歸的殘余真誤差均方誤差為0.32,直接觀測值回歸的殘余真誤差均方誤差為0.30,兩者的回歸結(jié)果差異不顯著。對于觀測值之間數(shù)值差異適中的情形(表2),間接觀測值回歸的殘余真誤差均方誤差為0.33,直接觀測值回歸的殘余真誤差均方誤差為0.28,兩者的回歸結(jié)果具有一定的差異。對于觀測值之間數(shù)值差異較大的情形(表3),間接觀測值回歸的殘余真誤差均方誤差為0.52,直接觀測值回歸的殘余真誤差均方誤差為0.17,兩者的回歸結(jié)果差異十分顯著。
另,對于冪函數(shù)和正態(tài)分布函數(shù),也都具有類似的結(jié)論。
因此,直接觀測值回歸的結(jié)果優(yōu)于間接觀測值回歸的結(jié)果,特別是當觀測值之間數(shù)值差異較大時。
本文討論了一元非線性回歸的直接觀測值回歸方法。對于可線性化的一元非線性回歸模型,傳統(tǒng)的處理方法是采用間接觀測值回歸,即以直接觀測值的函數(shù)作為因變量;而本文探討的直接觀測值回歸是以直接觀測值作為因變量。直接觀測值回歸和間接觀測值回歸具有相同形式的函數(shù)模型和回歸方程,然而它們的線性化方式不同,線性化方式的差異導致了這兩種回歸方法結(jié)果間的差異。算例結(jié)果表明,當觀測值之間的數(shù)值差異較小時,間接觀測值回歸的結(jié)果近似于直接觀測值回歸的結(jié)果;當觀測值之間的數(shù)值差異較大時,間接觀測值回歸的結(jié)果和直接觀測值回歸的結(jié)果有很顯著的差異,且直接觀測值回歸的結(jié)果優(yōu)于間接觀測值回歸的結(jié)果。無論觀測值之間的數(shù)值差異是小還是大,直接觀測值回歸都有更好的回歸結(jié)果。因此,本文探討的直接觀測值回歸方法比傳統(tǒng)的間接觀測值回歸方法更實用有效。研究結(jié)果可為可線性化的非線性回歸模型進行線性化處理時有效地選取回歸方法提供借鑒和參考,同時對于提高一元非線性回歸模型系數(shù)的質(zhì)量具有一定的實際應用價值。
【1】葛永慧.再生權(quán)最小二乘法穩(wěn)健估計[M].北京:科學出版社,2015.
【2】別必鑫,魏世麗.一元非線性回歸方程系數(shù)的通解[J].經(jīng)緯天地,2014,(6):55-59.
【3】Ge,Y.;Yuan,Y.;Jia,N.More efficient methods among commonly used robust estimation methods for GPS coordinate transformation[J].Survey Review,2013,45(330):229-234.
O241.7
A
2095-7319(2015)06-0051-05
別必鑫(1963-),男,高級工程師,武漢市洪山區(qū)房管局測繪隊,畢業(yè)于武漢大學測繪學院,主要從事工程測量工作和房產(chǎn)測繪工作。