朱曉東, 魯鐵定, 陳西江
(東華理工大學測繪工程學院,江西撫州 344000)
正交多項式曲線擬合
朱曉東, 魯鐵定, 陳西江
(東華理工大學測繪工程學院,江西撫州 344000)
介紹最小二乘法擬合曲線的原理并且找出這種擬合方法的不足,針對這種不足提出另外一種新的擬合方法正交多項式擬合。這種方法能彌補最小二乘擬合中的x擬合y和y擬合x出現(xiàn)的曲線不一樣的現(xiàn)象。這種方法經(jīng)過數(shù)據(jù)實驗精度比最小二乘法擬合更高,而且這種方法中的多項式系數(shù) a可以根據(jù)自己的精度需要來自主選擇迭代的次數(shù),使得結果更加精確。
最小二乘擬合;正交多項式;隨機誤差;殘差
在曲線擬合中一般都是以 x或 y為因變量,以y或 x為自變量應用最小二乘法來處理。但是用這種方法來處理有一個前提,自變量和因變量兩者中必須有一個量是沒有誤差的精確值。在工程測量中所得的測量數(shù)據(jù)是不可能絕對準確、沒有誤差的,顯然與這種情況不符,自變量的誤差常常被忽略。當自變量的誤差較大時,在曲線擬合中就應該加以考慮。筆者利用MATLAB設計正交最小二乘法擬合的程序來驗證,運用間接平差原理來詳細推導了相關模型和公式 (魯鐵定等,2009)。實例計算結果顯示正交最小二乘法擬合曲線的效果優(yōu)于普通最小二乘擬合法。
在科研計算和統(tǒng)計研究中,往往要從大量的實驗數(shù)據(jù) (xi,yi)(i=0,1,…,m)中尋找其函數(shù)關系y=f(x)的近似表達式 y=P(x)。但由于實驗數(shù)據(jù)存在誤差,所以只能用連續(xù)的曲線近似地描述平面或空間中的離散點組所表示的坐標之間的函數(shù)關系,其目的是根據(jù)實驗建立因變量與自變量之間有效的經(jīng)驗函數(shù)關系。它包括擬合曲線模型的選取及擬合標準兩個方面的問題。給定一系列的測點 (xi,yi),要求在給定的函數(shù)類φ中尋求一個最佳的函數(shù),近似代替函數(shù)擬合函數(shù) y=f(x),ri=yiφ(xi)為 i點的擬合殘差 (陳基偉,2007)。擬合的最終目標是使得擬合的曲線最大限度逼近,并且使得擬合后的曲線與實際點的擬合殘差總體上盡可能小,這種方法稱為最小二乘法擬合曲線 (文世鵬,2005;張可村,2003),這里不再詳細介紹。但是用這種方法來擬合的曲線經(jīng)過實際數(shù)據(jù)驗證發(fā)現(xiàn)用 x擬合 y和用 y擬合 x兩個曲線相差很大并且精度也相差很多,出現(xiàn)這種情況的原因是因為擬合時這兩種方法都是按照 x或者 y方向來處理的 (圖 1),只是保證了在這一個方向上殘差最小,并沒有保證是該點到曲線的正交距離最小。因此需用另外一種方法來擬合 ——正交多項式擬合 (潘國榮等,2008)。
圖 1 x擬合 y和 y擬合 x的曲線圖Fig.1 The curve of x fitting y and y fitting x
在實際測量工作中所測得的一系列坐標點 x,y必然都存在隨機誤差,如果只用普通的多項式最小二乘法來擬合顯然就有較大誤差了。對于給定的點組,假設 xi,yi的隨機誤差分別為σi,γi,考慮到自變量的誤差,擬合的函數(shù)模型可以表示為
其實殘差 ri是到過曲線某點切線的垂直距離,擬合的準則為所有坐標點到擬合曲線的正交距離平方和最小。因此這種擬合方法稱為正交距離回歸 (丁克良,2010)(圖 2),又稱正交多項式最小二乘擬合法。擬合曲線的觀測方程可以表示為
圖 2 點到曲線的正交距離Fig.2 Po int to the curve of the o rthogona l distance
根據(jù)測量平差原理的間接平差方法對上述誤差方程進行求解得
本算例的目的在于比較驗證筆者介紹的這種方法來擬合曲線與普通最小二乘法擬合曲線的精度。
表 1 離散點的坐標Tab.1 The coo rdina te s of discre te po ints
由表 1中給出的數(shù)據(jù)分別用兩種方法進行擬合并且比較兩種擬合方法的精度,使用的兩種方法都是擬合二次曲線。
表 2 普通最小二乘擬合與正交多項式最小二乘擬合Tab.2 O rdina ry lea st squa re s and o rthogonal lea st squa re s po lynom ia l fittin
表 2中普通最小二乘擬合與正交多項式最小二乘擬合的擬合結果和精度顯示:
(1)本算例共取了十個點,分別采用普通最小二乘法和正交最小二乘擬合選取兩次的多項式模型來擬合曲線,分別計算出多項式的系數(shù)和中誤差來比較。普通最小二乘法是使擬合的曲線在 x方向上的殘差的平方和最小。但從兩種擬合方式的多項式系數(shù)來看,兩者的擬合參數(shù)有明顯的差別,就精度而言,正交最小二乘法綜合考慮了自變量和因變量的誤差 (劉海香,2004)。
(2)這兩種結果顯示后者的精度更高一些。但是擬合一個曲線并不是次數(shù)越高越好,因為次數(shù)越高曲線的振蕩性特別大,因此在實際的操作中要根據(jù)所選的次數(shù)和所得曲線的中誤差σ0來比較選擇一種最合適的。
(3)在正交多項式擬合中,從式子中可以看出多項式系數(shù)可以任意給出,賦予一定的值,在計算過程中可以得到多項式系數(shù)的改正數(shù)。因此還可以采用多次迭代的方式來求得方程的系數(shù)αk。
從上述的實例分析可以看出,正交多項式最小二乘擬合的精度優(yōu)于普通最小二乘擬合,因此在曲線擬合中這種方法更有適用性。
(1)在實際工作中觀測量的誤差很小可以忽略時,還是應該采用普通最小二乘法來擬合曲線,這種方法簡單實用計算量比較小,因而應用比較廣泛。
(2)在正交多項式最小二乘擬合中可以看出這種方法顧及了自變量和因變量的誤差,從理論上來講這種方法擬合的曲線更合理。但是這種方法在具體計算中怎樣批量的導入數(shù)據(jù)并且計算出結果來還需要編一個程序來計算。
陳基偉.2007.工程測量中一類參數(shù)曲線的擬合[J].大地測量與地球動力學,27(1):100-103.
丁克良.2010.整體最小二乘法直線擬合[J].遼寧工程技術大學學報:自然科學版,29(1):44-47.
劉海香.2004.平面上散亂數(shù)據(jù)點的二次曲線擬合[J].計算機輔助設計與圖形學學報,6(11):1594-1598.
魯鐵定,周世健,朱煜峰,等.2009.間接平差與矩陣 QR分解[J].東華理工大學報:自然科學版,32(2):381-384.
潘國榮,陳曉龍.2008.空間圓形物體數(shù)據(jù)擬合新方法[J].大地測量與地球動力學,28(2):92-94.
文世鵬,張明.2005.應用數(shù)值分析[M].北京:石油工業(yè)出版社.
武漢大學測繪學院測量平差學科組.2006.誤差理論與測量平差基礎[M].武漢:武漢大學出版社.
張可村,趙英良.2003.數(shù)值計算的算法與分析[M].北京:科學出版社.
Orthogonal Polynom ial Curve Fitting
ZHU Xiao-dong, LU Tie-ding, CHEN Xi-jiang
(Faculty of Geomatics,East China Institute of Technology,Fuzhou,JX 344000,China)
This paper introduces principle of least-squares fitting curve and finds their shortages.In view of these shortages,putting in a new least squares fitting of orthogonal polynomial.Thisway can compensate a phenomenon that the consequence is different in least-squares fitting curve while x fitting y or y fitting x.This degree of precision ismore higher than least-squares fitting curve,and this method of polynomial coefficients according to their accuracy can independently choose the iteration times,make more accurate results.
least-squares fitting orthogonal polynomial random error residual
O241
:A
:1674-3504(2010)04-398-03
10.3969/j.issn.1674-3504.2010.04.017
2010-06-25
東華理工大學研究生創(chuàng)新項目“基于 3S技術在水土流失評價中的應用——以撫州為例”(DYCA10007)
朱曉東 (1987—),男,碩士生,大地測量學與測量工程專業(yè),研究方向:數(shù)據(jù)處理理論。