蔣夢莉
西安財經(jīng)學院 管理學院 信息與物流管理系,西安 710100
包容性檢驗和PCA相融合的物流需求預(yù)測
蔣夢莉
西安財經(jīng)學院 管理學院 信息與物流管理系,西安 710100
物流需求受到經(jīng)濟、政策、資源等多種因素綜合影響,且因素的作用形式復雜、多變,致使物流需求本身具有較大的波動性和隨機性等特點,再加上物流需求其影響因素間呈現(xiàn)高度非線性關(guān)系,難以建立確定的數(shù)學模型,因此,如何對物流需求進行準確預(yù)測一直是經(jīng)濟領(lǐng)域中的研究熱點[1]。
當前物流需求預(yù)測模型主要分為兩類:傳統(tǒng)線性模型和現(xiàn)代非線性模型。傳統(tǒng)模型主要有回歸分析法、時間序列法等,它們假設(shè)物流需求是一種線性變化規(guī)律,而實際的現(xiàn)代物流具有非線性、隨機性、時變性等復雜變化特點,難以準確揭示其變化趨勢,預(yù)測精度較低,應(yīng)用范圍受限[2]。非線性模型主要有隱馬爾可夫模型(Hidden Markov Models,HMM)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)等,它們具有較強的非線性預(yù)測能力,可以較好地反映物流需求與影響因素間的變化關(guān)系,預(yù)測精度高,在物流需求預(yù)測中應(yīng)用廣泛[3-5]。采用單一模型只能反映物流需求變化的部分、片段信息,當政策、自然因素等發(fā)生突變時,物流需求會出現(xiàn)劇烈波動,此時單一模型就無法對物流需求預(yù)測進行準確預(yù)測,然而組合模型將多種模型優(yōu)勢進行互補,可以更加全面反映物流需求變化信息[6-7]。近年來,一些學者基于組合理論,提出了灰色神經(jīng)網(wǎng)絡(luò)、灰色線性回歸、灰色馬爾可夫等物流需求組合預(yù)測模型,進一步提高了物流需求預(yù)測精度[8-10]。然而相關(guān)研究表明,在組合預(yù)測過程中,隨意增加單一模型,不一定可以提高物流預(yù)測精度,應(yīng)該選擇一些最合理模型進行組合。包容性檢驗方法可以判定一個預(yù)測模型是否包含了其他預(yù)測模型的有關(guān)信息,為組合模型的單一模型選擇提供了一種新思路[11-12]。
為了提高物流需求預(yù)測精度,提出一種包容性檢驗(Encompassing Τests,EΤ)和主成分分析(Principal Component Analysis,PCA)相融合的物流需求組合預(yù)測模型(EΤ-PCA),并通過仿真實驗對組合模型的性能進行測試。
設(shè)M1、M2分別表示兩個不同的預(yù)測模型,t時刻的實際值為yt,f1,t和f2,t分別表示M1、M2在t時刻的預(yù)測值,考慮如下形式的回歸方程:
式中,ut為隨機擾動;β1、β2為回歸系數(shù),且β1+β2=1。
在式(1)兩邊同時減去f1,t,則有:
令ei,t=yt-fi,t(i=1,2),那么,式(2)變?yōu)椋?/p>
在α顯著性水平下,通過t檢驗計算回歸系數(shù)β1和β2值,具體為:
(1)設(shè)H0:β=0,H1:β≠0,其中β取值為β1或β2。
(2)計算統(tǒng)計量。當H0成立時,可得:
(3)在給定顯著性水平α下,確定臨界值
(4)檢驗結(jié)果判斷。若||t>tα/2(n-2),則拒絕原假設(shè)H0:β=0;反之接受原假設(shè)。
(5)若β1=0且β2=0,則表示模型M1包容模型M2;若β1≠0且β2=0,則表示M2包容M1;其他情況表示M1與M2不包容,表示每個模型都包含了關(guān)于yt的有用信息[13]。
3.1 單一模型選擇
(1)計算每個單一模型的預(yù)測結(jié)果,并將預(yù)測結(jié)果作為模型優(yōu)劣的評價標準,然后根據(jù)評價結(jié)果對模型進行降序排序。
(2)根據(jù)模型預(yù)測性能指標的高低,將所有等待包容性檢驗的單一預(yù)測模型依次輸入待評表,然后以預(yù)測性能指標最高的單一預(yù)測模型為基本模型,將其從待評表移至備選表(存放通過包容性檢驗的單一預(yù)測模型表)。
(3)選取待評表中預(yù)測性能指標最高的模型,與備選表中預(yù)測模型進行包容性檢驗。
(4)如果備選表中模型不包容待評表中模型,則將此模型移至備選表中,并對備選表中所有模型以一定的組合方式將它們進行預(yù)測組合。
(5)在待評表中剔除該單一預(yù)測模型。不斷循環(huán)以上步驟,直至待評表為空。
(6)將備選表中的預(yù)測模型作為最合適的預(yù)測模型。
3.2 單一模型的組合
選擇好單一模型后,采取何種方式對這些單一模型進行組合,對于物流需求預(yù)測精度起著決定性作用。當前主要采用等權(quán)方式對單一模型進行組合,即假設(shè)每一種單一模型對預(yù)測結(jié)果的貢獻是相同的,這與實際情況不相符,不能準確反映單一模型對組合預(yù)測結(jié)果的貢獻。主成分分析法通過恰當?shù)臄?shù)學變換,將原始數(shù)據(jù)中具有一定相關(guān)性的指標重新組合成一組新的互不相關(guān)的綜合指標,用于代替原來的相關(guān)性指標,為此,采用PCA對單一模型進行組合代替?zhèn)鹘y(tǒng)等權(quán)組合方式。具體步驟如下:
(1)設(shè)組合預(yù)測中包含m個單一物流預(yù)測模型,并將預(yù)測值分別記為Y1,Y2,…,Ym。
(2)將單一模型的預(yù)測值Yi作為一個變量,對n個樣本,計算出相應(yīng)的預(yù)測值,由此構(gòu)造n×m矩陣,利用此矩陣求相關(guān)系數(shù)矩陣R:
(3)根據(jù)相關(guān)系數(shù)矩陣計算其特征值λi(i=1,2,…,p),并使其按大小順序排列λ1≥λ2≥…≥λp≥0;然后求出對應(yīng)于特征值λi的特征向量vi=(γi1,γi2,…,γim)′。
(5)若第一主成分的累積貢獻率超過85%,那么第i個模型的權(quán)值為:
通常情況下,當主成分累計貢獻率達到85%以上,表示主成分可以代表原始數(shù)據(jù)提供的信息[14-15]。若第一主成分的累積貢獻率不足85%,需要考慮第二主成分進行累計貢獻率,以第一、第二主成分的特征值λ1和λ2為權(quán)數(shù),那么第i個模型的權(quán)值為:
依此類推,若前k個主成分的累積貢獻率超過85%,那么第i個模型的權(quán)值為:
(6)物流需求組合預(yù)測模型為:
(1)收集某物流需求和影響因子的歷史數(shù)據(jù),并對其進行預(yù)處理。
(2)將物流數(shù)據(jù)分為訓練樣本集與檢驗樣本集兩部分,訓練樣本集用于建立物流組合模型,檢驗樣本集用于測試建立的物流組合模型性能。
(3)將訓練樣本輸入到單一模型,進行相應(yīng)的物流需求單一預(yù)測建模,然后對檢驗樣本進行預(yù)測,得到每一個模型的預(yù)測結(jié)果。
(4)根據(jù)預(yù)測結(jié)果的優(yōu)劣,對單一模型進行排序,然后根據(jù)預(yù)測性能指標的高低將單一預(yù)測模型依次輸入待評表,根據(jù)包容性檢驗方法選擇最合理的單一模型,將其從待評表移至備選表中。
(5)最后保留在備選表中的模型即最合理的單一物流需求預(yù)測模型,采用PCA對這些最合理的單一物流量需求預(yù)測模型進行組合,建立物流需求的EΤ-PCA組合預(yù)測模型。
(6)采用建立EΤ-PCA的物流組合預(yù)測模型對檢驗樣本進行預(yù)測,并根據(jù)預(yù)測結(jié)果對模型性能進行分析。
綜合上述可知,基于EΤ-PCA的物流需求預(yù)測流程如圖1所示。
圖1 物流需求預(yù)測流程
5.1 數(shù)據(jù)源
選取1990年—2012年陜西省的物流需求統(tǒng)計數(shù)據(jù)為研究對象,數(shù)據(jù)具體如圖2所示,物流需求影響因子選擇第一產(chǎn)業(yè)產(chǎn)值、第二產(chǎn)業(yè)產(chǎn)值、第三產(chǎn)業(yè)產(chǎn)值、固定資產(chǎn)投資總額、貨物進出口總額、社會消費品零售總額、居民消費水平,數(shù)據(jù)取自《陜西統(tǒng)計年鑒2012》。取1990年—2002年的數(shù)據(jù)作為訓練樣本集;2003年—2012年的數(shù)據(jù)作為檢驗樣本集。所有實驗在Matlab 2009a仿真平臺上編程實現(xiàn)。
圖2 1990年—2012年陜西省的物流需求歷史數(shù)據(jù)
5.3 數(shù)據(jù)歸一化處理
物流影響因子單位不同,數(shù)據(jù)間的差異較大,為了避免極端數(shù)據(jù)對物流需求預(yù)測結(jié)果造成不利影響,對物流數(shù)據(jù)影響因子進行歸一化處理,將它們縮放到[0 1]之間。
歸一化代碼為:
其中,p為輸入向量,t為輸出向量,P為歸一化后的輸入向量,T為歸一化后的輸出向量。
5.3 單一模型預(yù)測結(jié)果
選擇MLR、帶受控項的自歸回模型(CAR)、GM(n,1)、RBF神經(jīng)網(wǎng)絡(luò)(RBFNN)、HMM、最小二乘支持向量機(LSSVM)作為初始單一模型。
采用物流需求訓練樣本集輸入到CAR、GM(n,1)、RBFNN、HMM、LSSVM進行訓練,建立相應(yīng)的單一物流需求預(yù)測模型,然后采用建立的物流需求模型對檢驗樣本集進行預(yù)測,最后計算檢驗樣本預(yù)測結(jié)果的均方根誤差(Root Mean Squared Error,RMSE),結(jié)果見表1。從表1可知,MLR、CAR等傳統(tǒng)模型的預(yù)測值與實際物流需求值相差比較大,預(yù)測精度較低;相對于MLR、CAR,非線性預(yù)測模型GM(n,1)、RBFNN、HMM、LSSVM的預(yù)測誤差要小,預(yù)測精度較高,但模型的預(yù)測性能不穩(wěn)定,有的預(yù)測結(jié)果與實際值偏差較大,主要是由于單一模型只能夠描述復雜、多變物流系統(tǒng)的部分、片段變化信息。
表1 單一模型的物流需求預(yù)測結(jié)果 t
5.4 ET-PCA組合模型的預(yù)測結(jié)果
(1)如果預(yù)測模型結(jié)果的均方根誤差(RMSE)越小,則表示其預(yù)測精度越高,預(yù)測性能越好,因此,根據(jù)表1中的RMSE對單一模型優(yōu)劣進行排序,得到的排序為:LSSVM、HMM、RBFNN、GM(n,1)、CAR、MLR,即LSSVM為最優(yōu)單一預(yù)測模型,MLR為最差單一預(yù)測模型。
(2)將LSSVM、HMM、RBFNN、GM(n,1)、CAR、MLR按順序依次輸入到待評表,并選擇預(yù)測性能最優(yōu)的(RMSE最?。㎜SSVM作為物流需求的基本模型,將其從待評表移至備選表中,并在待評表中刪除LSSVM。
(3)在a=0.05的顯著性水平下,對LSSVM與待評表中目前最優(yōu)的HMM進行包容性檢驗,t統(tǒng)計量為3.906 7,經(jīng)t分布臨界值表得到3.184 2,即有|t|=3.906 7>3.184 2,則拒絕原假設(shè)H0:β=0,這表示LSSVM不包容HMM,因此將LSSVM和HMM基于PCA進行組合,得到組合模型:LSSVM-HMM,并將HMM從待評表移至備選表中,并在待評表中刪除HMM。
(4)在a=0.05的顯著性水平下,將組合模型LSSVMHMM與待評表中目前最優(yōu)的RBFNN進行包容性檢驗,t統(tǒng)計量為2.799 2,有|t|=2.982 2>0.006 7,則接受原假設(shè)H0:β=0,這表示LSSVM-HMM包容RBFNN,將RBFNN從待評表中刪除。
(5)采用上述相同方法,對所有單一模型進行包容性檢驗,直到待評表為空,停止包容性檢驗,最后備選表中的單一模型為:LSSVM、HMM、CAR,那么這表示這3個模型是最合理的單一模型,采用PCA將它們組合在一起,建立了LSSVM-HMM-CAR的物流組合預(yù)測模型。
(6)采用LSSVM-HMM-CAR模型對檢驗樣本集進行預(yù)測,預(yù)測結(jié)果的RMSE為530.285,其值遠遠小于單一預(yù)測模型,結(jié)果表明,EΤ-PCA模型采用包容性檢測最終選擇了多個最合理的單一模型,并將它們進行組合,充分利用了每個單一模型的優(yōu)點,更加全面地描述了物流需求變化特點,克服了單一模型只能夠描述物流需求變化的部分、片段信息,并且通過PCA消除了單一模型的重復信息,進一步提高了物流需求預(yù)測精度。
5.5 與傳統(tǒng)組合模型性能對比
為了使EΤ-PCA的預(yù)測結(jié)果更具說服力,采用未進行包容性檢驗方法,對所有單一預(yù)測模型(CAR、GM(n,1)、RBFNN、HMM、LSSVM)以等權(quán)方式進行組合(model1),對包容性檢驗方法選擇最合理的單一預(yù)測模型(LSSVM、HMM、CAR)采用等權(quán)方式進行組合的物流預(yù)測模型(model2),采用相同的數(shù)據(jù)進行對比實驗,各模型的預(yù)測結(jié)果與真實值之間的相對誤差如圖3所示。
圖3 幾種組合模型的預(yù)測誤差對比
對圖3結(jié)果進行分析,可以得到如下結(jié)論:
(1)相對于model1,EΤ-PCA的預(yù)測結(jié)果與實際物流需求值之間更加接近,相對誤差減小,這表明,不加選擇、隨意增加單一模型,物流需求量預(yù)測精度不一定提高,而通過包容性檢驗方法對模型之間的包容關(guān)系進行判定,選擇一些能夠進行優(yōu)勢互補、最合理的單一模型,從而能夠更加準確描述物流需求變化特點,可以有效降低物流需求預(yù)測誤差。
(2)相對于model2模型,EΤ-PCA的物流需求量預(yù)測誤差相對降低,預(yù)測精度更高,對比結(jié)果表明,采用傳統(tǒng)等權(quán)組合模型無法準確描述單一模型對物流需求預(yù)測結(jié)果的貢獻,而EΤ-PCA通過PCA對單一模型進行組合,可以更加科學反映各單一模型對組合模型預(yù)測結(jié)果的貢獻,物流需求預(yù)測精度得以進一步提高。
(3)EΤ-PCA模型的運行時間為40 s,遠遠小于model1和model2的367 s和275 s,這表明EΤ-PCA提高了物流需求的預(yù)測效率,因此EΤ-PCA是一種高精度、高效率的物流需求預(yù)測模型。
針對物流需求復雜、多變的特點,在進行物流預(yù)測時,如果在已有的物流需求組合預(yù)測模型中增加一個預(yù)測時,可能會降低物流需求預(yù)測精度問題,利用包容性檢驗和主成分分析的優(yōu)點,提出一種基于包容性檢驗和主成分分析相融合的物流需求組合預(yù)測模型。結(jié)果表明,相對于傳統(tǒng)組合模型,EΤ-PCA提高了物流需求預(yù)測精度和效率,具有一定的應(yīng)用價值。
[1]胡燕祝,呂宏義.基于支持向量回歸機的物流需求預(yù)測模型研究[J].物流技術(shù),2008,27(5):66-68.
[2]尹艷玲.基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的物流需求預(yù)測研究[J].河南理工大學學報:自然科學版,2010,29(5):700-704.
[3]曉原,李軍.灰色GM(1,1)模型在區(qū)域物流規(guī)模預(yù)測中的應(yīng)用[J].武漢理工大學學報,2011,9(3):613-615.
[4]耿立艷.基于二階振蕩微粒群最小二乘支持向量機的物流需求預(yù)測[J].計算機應(yīng)用研究,2012,29(7):2558-2560.
[5]陳以,萬梅芳.RBF神經(jīng)網(wǎng)絡(luò)在物流系統(tǒng)中的應(yīng)用[J].計算機仿真,2010,27(4):159-163.
[6]孫建豐,向小東.基于灰色線性回歸組合模型的物流需求預(yù)測研究[J].工業(yè)技術(shù)經(jīng)濟,2006,26(10):146-148.
[7]初良勇,田質(zhì)廣,謝新連.組合預(yù)測模型在物流需求預(yù)測中的應(yīng)用[J].大連海事大學學報,2004,30(4):43-46.
[8]閆莉,薛惠峰,陳青.基于灰色馬爾可夫模型的區(qū)域物流規(guī)模預(yù)測[J].西安工業(yè)大學學報,2009,29(5):495-497.
[9]后銳,張畢西.基于MLP神經(jīng)網(wǎng)絡(luò)的區(qū)域物流需求預(yù)測方法及其應(yīng)用[J].系統(tǒng)工程理論與實踐,2005,22(12):43-47.
[10]閆娟.灰色神經(jīng)網(wǎng)絡(luò)模型在物流需求預(yù)測中的研究[J].計算機仿真,2011,28(7):200-203.
[11]謝力,魏汝祥,訾書宇,等.基于包容性檢驗的艦船裝備維修費組合預(yù)測[J].系統(tǒng)工程與電子技術(shù),2010,32(12):2599-2602.
[12]李洪安,康寶生,張婧,等.基于改進的包容性檢驗的云計算資源組合預(yù)測[J].計算機應(yīng)用研究,2013,30(1):252-255.
[13]Nhan N,Insoo K.An enhanced cooperative spectrum sensing scheme based on evidence theory and reliability source evaluation in cognitive radio context[J].IEEE Communications Letters,2009,13(7):492-494.
[14]袁磊,李書琴.主成分分析在小麥條銹病預(yù)測中的應(yīng)用[J].計算機工程與設(shè)計,2010,31(2):459-461.
[15]楊開睿,孟凡榮,梁志貞.一種自適應(yīng)權(quán)值的PCA算法[J].計算機工程與應(yīng)用,2012,48(3):189-191.
JIANG Mengli
Department of Information and Logistics Management,School of Management,Xi’an University of Finance&Economics,Xi’an 710100,China
Model selection and how to combine is the key of logistics demand forecasting.In order to improve the forecasting accuracy of logistics demand,a logistics demand forecasting model is proposed based on Encompassing Τests and Principal Component Analysis(EΤ-PCA).Some single models are used to forecast the logistics demand,and then encompassing tests are used to select good single model.Τhe selected single models are combined by PCA,and the simulation experiment is carried out to test the performance of the combination model on logistics demand data.Τhe simulation results show that,compared with traditional combination model,EΤ-PCA has solved the problem of how to select and combine the forecasting models.It can be more comprehensive,accurately describe the change trend of logistics demand,and improve the prediction accuracy of logistics demand.It has a good application value.
logistics demand;Principal Component Analysis(PCA);encompassing tests;combination model
模型選擇以及如何進行組合是物流需求組合預(yù)測的關(guān)鍵,為了提高物流需求的預(yù)測精度,提出一種包容性檢驗和主成分分析相融合的物流需求預(yù)測模型(EΤ-PCA)。采用多個單一模型對物流需求進行預(yù)測,采用包容性檢驗選擇最合理的單一模型,利用PCA對選擇的單一模型預(yù)測結(jié)果進行組合,采用仿真實驗對組合模型性能進行測試。結(jié)果表明,相對于傳統(tǒng)組合模型,EΤ-PCA較好地解決了物流需求單一預(yù)測模型選擇及組合問題,更加全面、準確描述了物流需求復雜的變化趨勢,提高了物流需求的預(yù)測精度和效率,具有一定應(yīng)用價值。
物流需求;主成分分析;包容性檢驗;組合模型
A
ΤB24
10.3778/j.issn.1002-8331.1303-0314
JIANG Mengli.Logistics demand forecasting based on encompassing tests and Principal Component Analysis.Computer Engineering and Applications,2013,49(15):263-266.
陜西省管理科學與工程重點學科建設(shè)專項資金資助項目;陜西省自然科學基金(No.2009JM9008);陜西省教育廳科學研究計劃項目(No.09JK437)。
蔣夢莉(1965—),女,副教授,研究方向:信息管理與知識管理、企業(yè)信息化。
2013-03-21
2013-05-20
1002-8331(2013)15-0263-04