霍麗娟 徐靜 黃西 韓文甫
摘 要:
武器裝備的費(fèi)用是影響裝備發(fā)展的首要問(wèn)題。在裝備壽命周期的各個(gè)階段,開展裝備費(fèi)用的預(yù)測(cè)研究,對(duì)于促進(jìn)裝備可靠性和維修性的提高,加強(qiáng)裝備使用和維修的科學(xué)管理有著十分重要的意義。
關(guān)鍵詞:
SVR;武器裝備;費(fèi)用
中圖分類號(hào):
F23
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):16723198(2014)23011301
傳統(tǒng)的費(fèi)用預(yù)測(cè)方法有類比估算法、專家判斷估算法、參數(shù)估算法和工程估算法等。類比估算法和專家判斷估算法以經(jīng)驗(yàn)和主觀評(píng)價(jià)為基礎(chǔ),增加了方法的不確定性。參數(shù)估算法最大的問(wèn)題是需要相當(dāng)容量的歷史數(shù)據(jù),其精度取決于樣本數(shù)量的大小。工程估算法預(yù)測(cè)過(guò)程復(fù)雜、繁瑣、費(fèi)時(shí)。
由于樣本限制,裝備費(fèi)用預(yù)測(cè)問(wèn)題是小樣本學(xué)習(xí)問(wèn)題。支持向量機(jī)(Support Vector Machine, SVM)是由統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展起來(lái)的一種新型學(xué)習(xí)機(jī)器,它以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理為理論基礎(chǔ),具有逼近復(fù)雜非線性系統(tǒng)、較強(qiáng)的學(xué)習(xí)泛化能力和良好的分類性能,同時(shí)所需要樣本數(shù)量少、建模方便、計(jì)算簡(jiǎn)單、學(xué)習(xí)訓(xùn)練時(shí)間短、泛化能力強(qiáng)。SVM最初是用來(lái)解決模式識(shí)別問(wèn)題,隨著 Vapnik 的ε不敏感損失函數(shù)的引入, SVM已經(jīng)擴(kuò)展到解決非線性回歸問(wèn)題。
1 支持向量機(jī)回歸模型
支持向量機(jī)回歸(SVR)的基本思想是:基于Mercer核展開定理,通過(guò)非線性映射,把樣本空間映射到一個(gè)高維特征空間,在這個(gè)空間中構(gòu)造最優(yōu)決策函數(shù)。在構(gòu)造最優(yōu)決策函數(shù)時(shí)應(yīng)用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,并利用原空間的核函數(shù)取代高維特征空間中的點(diǎn)積運(yùn)算,把尋找最優(yōu)線性回歸超平面的算法歸結(jié)為求解一個(gè)凸約束條件下的一個(gè)凸規(guī)劃問(wèn)題。
對(duì)線性規(guī)劃,設(shè)訓(xùn)練樣本集(xi,yi),i=1,2,…,n具有ε相似性,即yi-f(xi)≤ε,i=1,2,…,n。該最優(yōu)問(wèn)題可作如下描述:
minf=12wTw+C∑ni=1(ξi+ξ*i)(1)
s.t.wxi+bi-yi≤ε+ξ*i
-wxi-bi+yi≤ε+ξi
ξi,ξ*i≥0
其中C為懲罰因子,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的折中;ξi,ξ*i為松弛因子,ε為損失函數(shù),采用ε不敏感 (insensitive)損失函數(shù),用于控制回歸逼近誤差和泛化能力。
在求解上式時(shí),一般采用對(duì)偶理論,把它轉(zhuǎn)化成二次規(guī)劃問(wèn)題。建立拉格朗日方程:
L(w,ξi,ξ*i)=12wTw+C∑ni=1(ξi+ξ*i)-∑ni=1αi(ε+ξ*i-wxi-bi+yi)-∑ni=1αi(ε+ξ*i+wxi+bi-yi)-∑ni=1(ηiξi+ηiξ*i) ?αi,αi,ηi,ηi≥0,i=1,2,…,n(2)
在極值處,上式對(duì)w,b,ξi,ξ*i求偏導(dǎo)為零,得:
w = ∑ni = 1(αi -α*i )xi
∑ni = 1(αi -α*i ) = 0
C-αi -ηi ?= 0
C-α*i♂-η*i♂ = 0
化簡(jiǎn)后, 可得原約束表達(dá)式的對(duì)偶式:
min12∑ni,j = 1(α*i -αi )(α*j -αj )xTi xj -∑ni = 1α*i (yi -ε)-αi (yi ?+ ε)(3)
St.∑ni = 1(αi -α*i ) = 0,\\quadαi ,α*i ∈0,C
對(duì)于非線性問(wèn)題,將原數(shù)據(jù)集通過(guò)一非線性映射,映射到一高維特征空間,在高維特征空間中進(jìn)行線性回歸,則此時(shí)約束表達(dá)式為:
min12∑ni,j = 1(α*i -αi )(α*j -αj )Φ T(xi )Φ (xj )-∑ni = 1α*i (yi -ε)-αi (yi ?+ ε)(4)
St.∑ni = 1(αi -α*i ) = 0,\\quadαi ,α*i ∈0,C
定義K(xi,xj)=(Φ(xi)·Φ(xj))=ΦT(xj)Φ(xi)為核函數(shù)。
根據(jù)Karush-Kuhn-Tucker定理,可求得αi ,α*i ,b,最終可得SVM回歸函數(shù)為:
f(x) = ∑ni = 1(αi -α*i )K(xi ,x) + b(5)
2 支持向量機(jī)預(yù)測(cè)裝備費(fèi)用的方法和步驟
基于支持向量機(jī)回歸的裝備費(fèi)用預(yù)測(cè)的方法和步驟如下:
(1)確定樣本量。
武器裝備的費(fèi)用受多方面因素的影響,如果只從單獨(dú)的一個(gè)方面對(duì)武器裝備費(fèi)用進(jìn)行考察評(píng)估,就不可能對(duì)裝備費(fèi)用有正確的反映。一般選取對(duì)費(fèi)用較為敏感的若干個(gè)主要物理與性能參數(shù)(如質(zhì)量、體積、射程、探測(cè)距離、平均故障間隔時(shí)間等)。對(duì)于單一費(fèi)用的預(yù)測(cè),其樣本量可以選擇前階段該項(xiàng)費(fèi)用作為樣本量。
(2)數(shù)據(jù)的預(yù)處理。
支持向量機(jī)沒有對(duì)數(shù)據(jù)量綱的要求,這就可能造成兩個(gè)數(shù)量級(jí)相差很大的數(shù)據(jù)一起作為訓(xùn)練樣本,造成模型訓(xùn)練費(fèi)時(shí),誤差較大。因此對(duì)訓(xùn)練樣本要進(jìn)行數(shù)據(jù)的縮放處理。一般歸一化采用下式實(shí)現(xiàn):
xM=2(x-xmin)xmax-xmin-1(6)
式中,xM表示歸一化后的數(shù)據(jù),xmax,xmin是原始變量x的最大和最小值。
(3)選擇核函數(shù),進(jìn)行學(xué)習(xí)訓(xùn)練。
常用的核函數(shù)有線性核函數(shù),多項(xiàng)式核函數(shù),徑向基核函數(shù),高斯核函數(shù)。支持向量機(jī)回歸常用的核函數(shù)是徑向基核函數(shù),表示為:
K(xi,xj)=exp{-|xi-xj|2σ2}(7)
選擇參數(shù)C,ε以及核函數(shù)中σ2的合理取值,一般按經(jīng)驗(yàn)選取,以所確定的模型的擬合精度作為標(biāo)準(zhǔn)。
(4)確定模型,用于預(yù)測(cè)。
將新的參數(shù)數(shù)據(jù)輸入到模型中進(jìn)行預(yù)測(cè)。