謝 力 楊懷寧 尹相平 孫玉華
1海軍工程大學(xué)裝備經(jīng)濟(jì)管理系,湖北武漢430033 2海軍裝備部裝備采購中心,北京100071 3海軍裝備部裝備招標(biāo)中心,北京100071 4中國人民解放軍92493部隊(duì),遼寧葫蘆島125001
艦船裝備維修費(fèi)是保障艦船裝備持續(xù)良好運(yùn)行、發(fā)揮戰(zhàn)斗力的關(guān)鍵所在。實(shí)現(xiàn)艦船裝備維修費(fèi)科學(xué)準(zhǔn)確的預(yù)測,對提高海軍裝備經(jīng)費(fèi)的使用效益,進(jìn)而提高海軍裝備的戰(zhàn)斗力具有重要意義。但由于艦船裝備的維修活動(dòng)受內(nèi)部和外部各種復(fù)雜因素的影響,如艦船造價(jià)、使用強(qiáng)度、維修技術(shù)、物價(jià)變化、維修制度等,再加上我國相關(guān)數(shù)據(jù)的收集工作起步較晚[1-2],單一預(yù)測模型難以準(zhǔn)確反映其變化規(guī)律。在實(shí)際應(yīng)用中,費(fèi)用分析人員一般根據(jù)不同來源的資料構(gòu)建多種預(yù)測模型,對艦船裝備維修費(fèi)進(jìn)行組合預(yù)測[3-4],以提高預(yù)測的適應(yīng)性和穩(wěn)定性。
Granger和 Wei等[5-6]在回歸框架中對多種組合方法進(jìn)行了討論,證明帶有常數(shù)項(xiàng)且不受約束(限制權(quán)重為非負(fù)且權(quán)重和為1)的回歸組合模型更具優(yōu)勢。但由于艦船裝備維修費(fèi)預(yù)測是典型的小樣本問題,因此多種預(yù)測方法都可對其進(jìn)行預(yù)測。運(yùn)用基于回歸的組合預(yù)測模型對其進(jìn)行研究時(shí),容易出現(xiàn)預(yù)測模型比用于組合預(yù)測的樣本數(shù)量多,導(dǎo)致回歸系數(shù)無法估計(jì)的情況。同時(shí),Timmerman[7]發(fā)現(xiàn)在單項(xiàng)預(yù)測數(shù)量過多時(shí),增加模型的代價(jià)(增加參數(shù)估計(jì)誤差)與相應(yīng)的收益(精度的提高)不匹配,故主張從組合中剔除那些只增加少量信息的預(yù)測模型以解決該問題。但是根據(jù)Granger和 Aiolfi等[8-9]的研究顯示,對單一預(yù)測模型的修剪一般不存在一個(gè)普適的最優(yōu)數(shù)量,且Aiolfi等[10]還發(fā)現(xiàn),先前最好的模型在后來會變得最差,先前最差的模型在后來會變得較好。因此,通過剔除部分模型的方法并不能很好地解決該問題。并且,單項(xiàng)預(yù)測方法之間通常容易出現(xiàn)信息重疊的現(xiàn)象,即基于回歸組合預(yù)測模型中的多重共線性問題,也將影響組合預(yù)測模型的性能。
主成分分析(Principal Component Analysis,PCA)[11]通過Karhunen-Loève變換,產(chǎn)生一組稱為主成分的新變量,所有主成分互相獨(dú)立,其間不存在冗余,并通過保留前面含信息量最大的幾個(gè)主成分來實(shí)現(xiàn)降維。本文嘗試在建立基于回歸的艦船裝備維修費(fèi)組合預(yù)測模型之前,先采用主成分分析對單項(xiàng)預(yù)測模型進(jìn)行降維處理,以解決預(yù)測模型多于用于組合預(yù)測的樣本數(shù)量以及單項(xiàng)預(yù)測模型之間的線性相關(guān)問題,并結(jié)合實(shí)際問題進(jìn)行應(yīng)用分析。
主成分分析由英國生物統(tǒng)計(jì)學(xué)家Pearson[12]于1901年在對非隨機(jī)變量進(jìn)行討論時(shí)引入,隨后數(shù)學(xué)家Hotelling[13]將其推廣至隨機(jī)變量。該方法將原來指標(biāo)的信息重新組合成了一組相互獨(dú)立的少數(shù)幾個(gè)綜合指標(biāo),這些綜合指標(biāo)可以盡可能保留原有指標(biāo)所含有的信息,且各指標(biāo)所含信息互不重疊。
設(shè)有m個(gè)指標(biāo)組成的m維隨機(jī)向量Y=(y1,y2,…,ym)′,作指標(biāo)的線性組合:
為便于討論,主成分分析將問題限制在單位圓中進(jìn)行,即方程組(1)中的系數(shù)uij滿足。根據(jù)信息理論的觀點(diǎn),一個(gè)系統(tǒng)所包含的信息量體現(xiàn)為其不確定性的大小。在統(tǒng)計(jì)分析中,一組數(shù)據(jù)的方差可以反映其不確定性,故數(shù)據(jù)中所含的信息量可通過其方差大小來度量。在方程組(1)中,Z1是 y1,y2,…,ym線性組合中方差最大的,因而含有最大的信息量,稱為第一主成分。為保證各指標(biāo)所含信息互不重疊,Z1,Z2,…,Zm互不相關(guān),依次類推得到各主成分。
根據(jù)不同的數(shù)據(jù)特征和分析的需要,目前在傳統(tǒng)PCA的基礎(chǔ)上還產(chǎn)生了非線性PCA[14]、概率PCA[15]和核 PCA[16]等多種主成分分析方法。
設(shè) yt1,yt2,…,ytm是t時(shí)刻分別來自m個(gè)不同艦船裝備維修費(fèi)預(yù)測模型的擬合結(jié)果,艦船裝備維修費(fèi)實(shí)際值為 yt(t=1,2,…,n),則基于回歸的艦船裝備維修費(fèi)組合預(yù)測模型可以表示為:
式中,ytc表示組合預(yù)測;w0為常數(shù)項(xiàng);wi(i=1,2,…,m)為相應(yīng)單項(xiàng)預(yù)測方法的權(quán)系數(shù);εt為隨機(jī)擾動(dòng)。
在我國裝備發(fā)展采用“多研制、少生產(chǎn)”策略的背景下,同型號艦船都是小批量甚至單件生產(chǎn),艦船裝備維修費(fèi)預(yù)測可參考的裝備較少。再加上我國艦船裝備修理實(shí)際發(fā)生費(fèi)用數(shù)據(jù)長期統(tǒng)計(jì)不規(guī)范、裝備修理部門或工廠的信息封閉等原因,導(dǎo)致艦船裝備維修費(fèi)預(yù)測時(shí)可利用的樣本量小。因此,在采用式(2)構(gòu)建艦船裝備維修費(fèi)組合預(yù)測模型時(shí),經(jīng)常會出現(xiàn)預(yù)測模型的數(shù)量比用于組合預(yù)測的樣本數(shù)量多的情況,直接導(dǎo)致回歸系數(shù)無法確定。針對這一問題,下面將采用主成分分析對單項(xiàng)預(yù)測模型進(jìn)行降維處理,以滿足方程(2)求解的需要。
設(shè)各預(yù)測方法擬合值組成的矩陣為:
由于艦船裝備維修費(fèi)各預(yù)測方法的擬合值并不存在量綱或數(shù)量級的差異,因此不需要對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,可以直接進(jìn)行主成分分析,具體計(jì)算步驟如下。
步驟1:計(jì)算擬合值Y的相關(guān)系數(shù)矩陣 R=(rij)mm,其中rij是第i種預(yù)測方法與第 j種預(yù)測方法的相關(guān)系數(shù)。
步驟2:計(jì)算相關(guān)矩陣 R的特征值 λ1≥λ2≥…≥λm>0 ,及其相應(yīng)的特征向量 u1,u2,…,um。其中 ui=(ui1,ui2,…,uim)(i=1,2,…,m),從而得到m 個(gè)主成分 Z1,Z2,…,Zm。
步驟3:根據(jù)上面得到的m個(gè)主成分,對第一主成分Z1作線性回歸:
將不同時(shí)刻 t=1,2,…,n的 y和 Z1的值代入方程(5),求回歸系數(shù) α0和 α1,進(jìn)行顯著性檢驗(yàn),并計(jì)算回歸方程的AIC(Akaike's Information Criterion)值[17],記為 AIC1。
步驟4:在方程(5)中增加主成分 Z2,并分別建立線性回歸模型:
求解回歸系數(shù),進(jìn)行顯著性檢驗(yàn),并計(jì)算回歸方程的AIC值,記為 AIC2。如果 AIC2>AIC1,則表示方程(5)為最佳組合預(yù)測模型,可以用其對艦船裝備維修費(fèi)進(jìn)行預(yù)測;如果 AIC2<AIC1且回歸方程統(tǒng)計(jì)上顯著,則在回歸方程中繼續(xù)逐個(gè)增加主成分,直到后一個(gè)統(tǒng)計(jì)上顯著的回歸方程的AIC大于前一個(gè)統(tǒng)計(jì)上顯著的回歸方程的AIC,否則,將所有主成分加入其中。最后,使用得到的最佳組合預(yù)測模型對艦船裝備維修費(fèi)進(jìn)行預(yù)測。
以文獻(xiàn)[18]中某單位艦船裝備維修費(fèi)的后7組數(shù)據(jù)為樣本,另外增加幾種預(yù)測模型的預(yù)測結(jié)果作為本文提出方法例證分析的基礎(chǔ)。其中,以前面6組數(shù)據(jù)為校準(zhǔn)樣本,第7組數(shù)據(jù)為檢驗(yàn)樣本。艦船裝備維修費(fèi)及各單項(xiàng)預(yù)測模型預(yù)測數(shù)據(jù)樣本如表1所示(單位為萬元)。
表1 某單位艦船裝備維修費(fèi)及其預(yù)測Tab.1 Ship equipm entm aintenance cost and its budget
在表1中,因?yàn)橛糜诮M合預(yù)測的樣本僅6個(gè),而用于組合的預(yù)測模型有7個(gè),顯然直接采用基于回歸的組合預(yù)測無法求解,所以下面將采用本文給出的方法進(jìn)行例證分析。
1)取前6組數(shù)據(jù),計(jì)算各預(yù)測方法之間的相關(guān)系數(shù),結(jié)果如表2所示。
從表2中可看出,各單項(xiàng)預(yù)測方法數(shù)據(jù)之間的相關(guān)系數(shù)都在0.97以上,即各單項(xiàng)預(yù)測方法之間高度線性相關(guān)。這在預(yù)期之中,因?yàn)楦鞣N預(yù)測方法的擬合值都與艦船裝備維修費(fèi)實(shí)際值高度線性相關(guān),因此它們之間自然也高度線性相關(guān),即各單項(xiàng)預(yù)測方法存在多重相關(guān)性。
表2 各單項(xiàng)預(yù)測方法之間的相關(guān)系數(shù)Tab.2 Correlation coefficients between individual forecastm ethods
2)根據(jù)前6組數(shù)據(jù),運(yùn)用Matlab 7.1中的princomp()函數(shù)計(jì)算各預(yù)測方法的主成分系數(shù)和新坐標(biāo)下各主成分的值,分別如表3和表4所示。
表3 主成分系數(shù)Tab.3 Principal com ponen t coefficien ts
表4 新坐標(biāo)下各主成分的值Tab.4 Principal com ponent values in new coord inate
從表4中可以看出,在新坐標(biāo)下,最后2個(gè)主成分不包含任何信息,原數(shù)據(jù)維數(shù)得到降低。
3)運(yùn)用Eviews6根據(jù)式(5)建立回歸模型為:
將第2個(gè)主成分加入回歸方程,再次計(jì)算回歸模型,得到 AIC2≈7.891>7.780,即帶有一個(gè)主成分的回歸模型即為最佳組合預(yù)測模型。
4)將第7組數(shù)據(jù)中各方法的預(yù)測值轉(zhuǎn)化為主成分值,并將第一主成分值(計(jì)算過程見表5)代入上面的回歸方程:
同時(shí),還采用算術(shù)平均法、誤差平方和倒數(shù)法、均方誤差倒數(shù)法、簡單加權(quán)平均法等常用組合預(yù)測[19-21]對本例進(jìn)行了計(jì)算,結(jié)果如表6所示。
可見,通過本文提出的組合預(yù)測模型選擇方法能有效改善組合預(yù)測的性能。
1)在建立基于回歸的組合預(yù)測模型前,采用主成分分析對單項(xiàng)預(yù)測模型進(jìn)行降維處理,可以有效解決預(yù)測模型多于用于組合預(yù)測的樣本數(shù)量的問題。
2)主成分分析可以有效解決艦船裝備維修費(fèi)組合預(yù)測模型中的共線性問題。
表5 檢驗(yàn)樣本新坐標(biāo)下第一主成分的值過程Tab.5 Calcu lating p rocess of the first p rincipal com ponent values of testing sam p le in new coordinate
表6 各組合模型預(yù)測值與預(yù)測誤差比較Tab.6 Com parison of the forecast value and forecasterror am ong various com bination m odels
3)由于各種預(yù)測方法的擬合值都與實(shí)際值高度線性相關(guān),因而艦船裝備維修費(fèi)各單項(xiàng)預(yù)測方法之間也高度線性相關(guān)。
4)采用AIC確定主成分的數(shù)量客觀可行,可為在主成分分析中引入各種信息準(zhǔn)則提供參考。
5)實(shí)例表明,基于主成分分析的艦船裝備維修費(fèi)組合預(yù)測模型具有良好的預(yù)測精度,且明顯優(yōu)于常用的組合預(yù)測模型。
此外,盡管本文給出的方法實(shí)現(xiàn)簡單、應(yīng)用方便,但由于PCA是以線性假設(shè)為前提,當(dāng)各單項(xiàng)預(yù)測方法之間出現(xiàn)復(fù)雜的非線性關(guān)系時(shí),本文的方法不能準(zhǔn)確描述其關(guān)系,從而約束了本文方法的有效性。此時(shí),必須結(jié)合非線性降維方法來建模組合預(yù)測模型。
[1]XIE L,WEIR X,JIANG T J,et al.Generalized PLS regression forecast modeling of warship equipment maintenance cost[C]//16th International Conference on Management Science and Engineering.Washington:IEEE Press,2009:607-612.
[2]謝力,魏汝祥,于偉宗.艦船裝備維修費(fèi)預(yù)測方法評價(jià)準(zhǔn)則體系研究[J].中國艦船研究,2011,6(2):98-102.
XIE L,WEIR X,YU W Z.Evaluation criteria system of forecasting methods for maintenance cost of ship equipment[J].Chinese Journal of Ship Research,2011,6(2):98-102.
[3]謝力,魏汝祥,訾書宇,等.基于包容性檢驗(yàn)的艦船裝備維修費(fèi)組合預(yù)測[J].系統(tǒng)工程與電子技術(shù),2010,32(12):2599-2602.
XIE L,WEIR X,ZISY,etal.Combined forecasting of ship equipmentmaintenance cost based on encompassing tests[J].Systems Engineering and Electronics,2010,32(12):2599-2602.
[4]WEIR X,XIE L,YIN X P,etal.Combined forecasting of ship equipmentmaintenance costwith AHP and odds-matrixmethod[C]//The Proceedingsof2010 Conference on System Sciences,Management Sciences and System Dynamics.China, Beijing:Publishing House of Electronics Industry,2010(4):115-122.
[5]GRANGER C W J,RAMANATHAN R.Improved methodsof combining forecasts[J].Journalof Forecasting,1984,3(2):197-204.
[6]WEIXQ.Regression-based forecastcombinationmethods[J].Romanian Journal of Economic Forecasting,2009,10(4):5-18.
[7]TIMMERMAN A.Forecast combinations[M]//ELLIOTTG,GRANGER CW J,TIMMERMAN A.Handbook of Economic Forecasting.North-Holland:Elsevier,2006:135-196.
[8]GRANGER CW J,JEON Y.Thick modeling[J].Economic Modeling,2004,21(2):323-343.
[9]AIOLFIM,F(xiàn)AVERO C A.Model uncertainty,thick modeling and the predictability of stock returns[J].Journalof Forecasting,2005,24(4):233-254.
[10]AIOLFIM,TIMMERMANN A.Persistence in forecasting performance and conditional combination strategies[J].Journal of Econometrics,2006,135(1/2):31-53.
[11]CAMACHO J,PIC J,F(xiàn)ERRER A.Data understanding with PCA:structural and variance information plots[J].Chemometrics and Intelligent Laboratory Systems,2010,100(1):48-56.
[12]PEARSON K.On lines and planes of closest fit to systems of points in space[J].Philosophical Magazine,1901,2(11):559-572.
[13] HOTELLING H.Analysis of a complex of statistical variables into principal components[J].Journal of Educational Psychology,1933,24(6):417-441.
[14]馬麗艷,李宏偉.一種基于非線性PCA的卷積混合盲源分離算法[J].電子學(xué)報(bào),2008,36(5):1009-1012.
MA L Y,LIH W.An algorithm based on nonlinear PCA for blind separation of convolutivemixtures[J].Acta Electronica Sinica,2008,36(5):1009-1012.
[15]宋懷波,路長厚,邱化冬.基于概率PCA模型的壓印字符集本征維數(shù)確定方法[J].光電子激光,2010,21(5):754-757.
SONG H B,LU CH,QIU H D.Determine the intrinsic dimension of protuberant characters based on probabilistic PCAmodelingmethod[J].Journalof Optoelectronics.Laser,2010,21(5):754-757.
[16]王洪斌,肖金壯,王洪瑞.數(shù)控系統(tǒng)連接相關(guān)故障的核PCA監(jiān)測方法[J].制造技術(shù)與機(jī)床,2009,59(7):94-97.
WANG H B,XIAO J Z,WANG H R.Monitoring method on connection dependent faults in numerical control system using kernel PCA[J].Manufacturing Technology and Machine Tool,2009,59(7):94-97.
[17]KOLASSA S.Combining exponential smoothing forecasts using Akaike weights[J].International Journal of Forecasting,2011,27(2):238-251.
[18]訾書宇,魏汝祥,周萍.基于RBF神經(jīng)網(wǎng)絡(luò)的艦船維修費(fèi)預(yù)測[J].中國水運(yùn)(學(xué)術(shù)版),2007,2(5):164-165.
ZISY,WEIR X,ZHOU P.Ship maintenance cost forecasting based on RBF neural network[J].China Water Transport,2007,2(5):164-165.
[19]ANDRAW IS R R,ATIYA A F,EI-SHISHINY H.Forecast combinations of computational intelligence and linearmodels for the NN5 time series forecasting competition[J].International Journal of Forecasting,2011,27(3):672-688.
[20]ANDRAWIS R R,ATIYA A F,EI-SHISHINY H.Combination of long term and short term forecasts,with application to tourism demand forecasting[J].International Journal of Forecasting,2011,27(3):870-886.
[21]DIKSC G H,VRUGT JA.Comparison of point forecastaccuracy ofmodelaveragingmethods in hydrologic applications[J].Stochastic Environmental Research and Risk Assessment,2010,24(6):809-820.