祝鵬 范龍軍
摘 要:本文詳細(xì)闡述SVM在GPS高程擬合的應(yīng)用和原理,介紹SVM方法參數(shù)選取的意義和重要性,結(jié)合MATLAB在不同樣本的情況下,對三種參數(shù)尋優(yōu)方法進(jìn)行對比試驗(yàn)。結(jié)果表明,PSO算法比其他兩種算法更穩(wěn)定,擬合精度也更高。
關(guān)鍵詞:SVM;參數(shù)尋優(yōu);MATLAB軟件;GPS高程擬合;PSO算法
中圖分類號:P228.4 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-5168(2017)06-0026-02
Research on Parameters Selection of GPS Height Fitting based on SVM
Zhu Peng1 Fan Longjun2
(1.Henan Like Pipeline Detection Technology Co., Ltd.,Zhengzhou Henan 450000;
2.Beijing Zhongjiao Construction Engineering Tendering Co., Ltd. (Henan Branch),Zhengzhou Henan 450000)
Abstract: This paper introduced the theory of SVM and SVM in the application of GPS height fitting, and introduced the significance and the importance of selecting parameters of SVM method. By using of MATLAB software, the three parameters optimization methods were compared and tested in the case of different samples, The results show that the PSO algorithm is more stable than the other two algorithms, it has better fitting accuracy.
Keywords: SVM;Parameter optimization;MATLAB software;GPS height fitting;PSO algorithm
目前,GPS測量技術(shù)已經(jīng)成為測量工作的重要技術(shù)之一。GPS測量是以WGS-84參考橢球面為基準(zhǔn),獲取高精度的三維坐標(biāo)。目前,我國廣泛采用的是正常高,所以需要將GPS測量獲得的大地高([H])轉(zhuǎn)化為正常高([Hr]),其轉(zhuǎn)化公式是[ξ=H-Hr],[ξ]是高程異常[1]。計(jì)算高程異常通??梢允褂脙煞N方法:一是直接法;二是擬合法。直接法是使用高精度、高密度的重力數(shù)據(jù),再結(jié)合高分辨率的地形數(shù)據(jù),使用嚴(yán)謹(jǐn)?shù)挠?jì)算方法,獲取高精度的高程異常值的方法。擬合法就是利用數(shù)學(xué)方法對現(xiàn)有控制點(diǎn)的高程異常數(shù)據(jù)進(jìn)行擬合,進(jìn)而求得待定點(diǎn)的正常高,精度較低,可以滿足低等級的工程水準(zhǔn)測量需求[2]。
目前,GPS高程擬合的方法有曲面擬合法、多面函數(shù)擬合法、BP神經(jīng)網(wǎng)絡(luò)擬合法等[3-4]。SVM(支持向量機(jī))的出現(xiàn)給GPS高程擬合帶來新的路徑和方法;SVM學(xué)習(xí)問題可以表示為凸優(yōu)化問題,因此可以利用已知的有效算法發(fā)現(xiàn)目標(biāo)函數(shù)的全局最小值。而其他分類方法(如人工神經(jīng)網(wǎng)絡(luò))獲得的大都是局部最優(yōu)解,原因就是其原理是基于一種貪心學(xué)習(xí)的方案去搜索假設(shè)空間。在樣本數(shù)據(jù)不大的情況下,SVM依然能夠進(jìn)行回歸預(yù)測,在沒有大量控制點(diǎn)數(shù)據(jù)和水準(zhǔn)數(shù)據(jù)的情況下,也能獲得較高精度的高程擬合結(jié)果。SVM的預(yù)測結(jié)果精度受參數(shù)優(yōu)化選取影響較大,目前還沒有統(tǒng)一公認(rèn)的最好方法,還需要進(jìn)一步的研究實(shí)驗(yàn)。
1 支持向量機(jī)理論和參數(shù)選取
對于線性回歸,支持向量機(jī)函數(shù)擬合首先考慮用線性回歸函數(shù)[f(x)=ω·x+b]擬合[(xi,yi),i=1,2,…,n],[xi∈Rn]為輸入量,[yi∈R]為輸出量,即需要求解[ω]和b。
支持向量機(jī)采用[ε]-不靈敏度函數(shù),即假設(shè)所有訓(xùn)練數(shù)據(jù)在精度[ε]下用線性函數(shù)擬合。
[yi-f(xi)ε+ξif(xi)-yiε+ξ?iξi,ξ?i0 i=1,2,…,n] (1)
式(1)中,[ξi,ξ?i]是松弛因子,當(dāng)劃分有誤差時(shí),[ξ],[ξ?i]都大于0,誤差不存在取0。此時(shí),該問題轉(zhuǎn)化為求優(yōu)化目標(biāo)函數(shù)最小化問題。
[R(ω,ξ,ξ?)=12ω×ω+Ci=1n(ξi+ξ?i)] (2)
式(2)中第一項(xiàng)使擬合函數(shù)更為平坦,從而提高泛化能力;第二項(xiàng)為減小誤差;懲罰參數(shù)C表示對超出誤差[ε]的樣本的懲罰程度。為解這個(gè)凸二次優(yōu)化問題,引入Lagrange函數(shù):
[L=12ω×ω+Ci=1n(ξi+ξ?i)-i=1nαiξi+ε-yi+f(xi) -i=1nα?iξ?i+ε-yi+f(xi)-i=1n(ξiγi+ξ?iγ?i)](3)
式(3)中,[α],[α?i0],[γi],[γ?i0],為Lagrange乘數(shù),[i=1,2,…,n]。求函數(shù)L對[ω],b,[ξi],[ξ?i]的最小化,對[αi],[α?i],[γi],[γ?i]的最大化,最終解得的線性擬合函數(shù)為:
[f(x)=ω×x+b=i=1n(αi-α?i)xi×x+b] (4)
首先將輸入量x通過映射[Φ:Rn→H]映射到高維特征空間H中用函數(shù)[f(x)=ω×Φ(x)+b]擬合數(shù)據(jù)[xi,yi,i=1,2,…,n],引入核函數(shù)[K(xi,yj)=Φ(xi)×Φ(xj)],可求的非線性擬合函數(shù)的表示式為:
[f(x)=ω×Φ(x)+b=i=1n(αi-α?i)K(x,yi)+b] (5)
2 實(shí)例分析
本次試驗(yàn)共采用20個(gè)水準(zhǔn)高程點(diǎn)分為三個(gè)方案(方案A、B、C),試驗(yàn)MATLAB R2010b編制模型程序。方案A是點(diǎn)6、14、17、19作為預(yù)測點(diǎn),其余點(diǎn)作為訓(xùn)練點(diǎn);方案B是點(diǎn)6、8、10、15、17、20作為預(yù)測點(diǎn),其余點(diǎn)作為訓(xùn)練點(diǎn);方案C是點(diǎn)3、6、8、10、14、15、17、20作為預(yù)測點(diǎn),其余點(diǎn)作為訓(xùn)練點(diǎn)。試驗(yàn)所采用的GPS/水準(zhǔn)數(shù)據(jù)來自文獻(xiàn)[4]。試驗(yàn)采用的GPS高程/水準(zhǔn)點(diǎn)位分布如圖1所示。
試驗(yàn)首先將原始數(shù)據(jù)規(guī)整到[0,1]范圍內(nèi),做歸一化處理。使用訓(xùn)練點(diǎn)的數(shù)據(jù)建立訓(xùn)練模型,然后分別使用三種參數(shù)的尋優(yōu)方法尋找模型最優(yōu)參數(shù),將最優(yōu)參數(shù)帶入模型預(yù)測擬合點(diǎn)的高程異常。擬合精度評定分別使用內(nèi)、外符合精度作為精度評價(jià)指標(biāo),其計(jì)算公式如式(6)所示,V是已知點(diǎn)的高程異常和擬合值之差,n是樣本數(shù)。
[σ=±VV/(n-1)] (6)
PSO算法對比其他兩種算法顯示出了良好的穩(wěn)定性,使用該算法預(yù)測得到的結(jié)果外符合精度和內(nèi)符合精度都比較高。即使訓(xùn)練樣本數(shù)量不同時(shí),使用PSO選優(yōu)算法也比其他兩種算法的回歸預(yù)測精度要高;同時(shí)使用SVM進(jìn)行高程異常擬合時(shí),增加訓(xùn)練樣本數(shù)量得到的預(yù)測精度并不一定高。訓(xùn)練樣本數(shù)量所占樣本總量的比例過大或者過小都會造成擬合結(jié)果較差,這也驗(yàn)證了SVM不需要過多的支持向量,就能取得較高的精度。
3 結(jié)語
本文介紹了SVM非線性回歸模型的原理及幾種模型參數(shù)尋優(yōu)算法。SVM理論為GPS高程擬合提供了一種新途徑,而且在樣本數(shù)量較小的情況下,也能取得較好的預(yù)測結(jié)果。MATLAB R2010b在編程、模型參數(shù)尋優(yōu)方面具有方便、快捷的優(yōu)勢,相對人為盲目選取模型參數(shù)極大地提高了效率。結(jié)合本文的算例可以的出以下結(jié)論:
①PSO尋優(yōu)算法具有良好的穩(wěn)定性,能夠取得較好的預(yù)測結(jié)果且能夠應(yīng)用在GPS高程擬合中。
②在選擇樣本進(jìn)行建立訓(xùn)練模型時(shí),應(yīng)考慮訓(xùn)練樣本占總樣本的比例,比例過大或過小都會影響擬合精度。對于訓(xùn)練樣本選取的最優(yōu)比例還有待進(jìn)一步的研究、探索。
參考文獻(xiàn):
[1]黃聲享,郭英起,易慶林.GPS在工程測量中的應(yīng)用[M].北京:測繪出版社,2007.
[2]張書畢,張秋昭,楊化超.利用Von Karman模型的Kriging插值用于GPS高程擬合[J].測繪科學(xué),2010(5):167-168,172.
[3]馬騰,王耀強(qiáng),花向紅.遺傳神經(jīng)網(wǎng)絡(luò)在GPS高程轉(zhuǎn)換中的應(yīng)用[J].測繪信息與工程,2008(3):9-10.
[4]魏好,鄧喀中,劉弟林,等.基于SVM的GPS高程擬合模型研究[J].礦山測量,2011(6):21-24.