■何金婷,陳星艷,2,3,4,陶 濤,2,3,4,戴向東,2,3,4,黃艷麗,4,歐陽(yáng)周洲,4,呂 宙,4,詹秀麗,4
對(duì)于家具企業(yè)而言,批量化的大規(guī)模定制不僅能夠滿(mǎn)足客戶(hù)的個(gè)性化需求,同時(shí)也能夠高效地利用供應(yīng)鏈產(chǎn)能,成為企業(yè)一種不可或缺的選擇。在實(shí)現(xiàn)集約化定制生產(chǎn)的前提下,企業(yè)可以運(yùn)用大數(shù)據(jù)預(yù)測(cè)技術(shù),對(duì)訂單需求進(jìn)行精準(zhǔn)分析,從而實(shí)現(xiàn)具備前瞻性的生產(chǎn)資源規(guī)劃。但是當(dāng)前研究家具訂單需求量預(yù)測(cè)的文獻(xiàn)很少,且多數(shù)企業(yè)對(duì)未來(lái)訂單量預(yù)測(cè)的方法是根據(jù)國(guó)家經(jīng)濟(jì)增長(zhǎng)目標(biāo)進(jìn)行預(yù)測(cè),這種預(yù)測(cè)方法單一且預(yù)測(cè)精準(zhǔn)度不高,對(duì)未來(lái)的生產(chǎn)資源規(guī)劃不能起到很好的指導(dǎo)作用。因此當(dāng)前家具企業(yè)為應(yīng)對(duì)生產(chǎn)資源規(guī)劃問(wèn)題,亟需引入訂單需求預(yù)測(cè)模型來(lái)幫助企業(yè)實(shí)現(xiàn)生產(chǎn)資源有效合理的預(yù)分配。
目前主要應(yīng)用的預(yù)測(cè)模型有BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、GM(1,1)灰色預(yù)測(cè)模型、ARIMA時(shí)間序列預(yù)測(cè)模型、SARIMA時(shí)間序列預(yù)測(cè)模型等。其中BP神經(jīng)網(wǎng)絡(luò)由于具有較強(qiáng)的自學(xué)習(xí)自適應(yīng)能力和非線(xiàn)性映射能力,在函數(shù)逼近、非線(xiàn)性回歸方面有著較為廣泛的應(yīng)用;灰色預(yù)測(cè)模型中當(dāng)樣本數(shù)據(jù)不符合指數(shù)分布時(shí),預(yù)測(cè)效果會(huì)產(chǎn)生較大偏差;時(shí)間序列預(yù)測(cè)方法中SARIMA較ARIMA預(yù)測(cè)模型在數(shù)據(jù)特征提取、消除數(shù)據(jù)周期性和季節(jié)性方面更具有優(yōu)勢(shì)。綜上所述,各種預(yù)測(cè)模型的建模機(jī)理和反應(yīng)數(shù)據(jù)信息都具有局限性,單一的模型難以準(zhǔn)確地提取出數(shù)據(jù)中內(nèi)在的信息與特征,預(yù)測(cè)結(jié)果往往不太理想,因此大量學(xué)者在預(yù)測(cè)時(shí)常采用組合模型[1-6],其優(yōu)點(diǎn)在于對(duì)于優(yōu)勢(shì)互補(bǔ)的單一模型進(jìn)行組合,可以減少預(yù)測(cè)結(jié)果產(chǎn)生的誤差,提升預(yù)測(cè)精度。
基于此,本研究針對(duì)家具訂單量數(shù)據(jù)具有顯著季節(jié)性特征選用SARIMA模型進(jìn)行預(yù)測(cè),針對(duì)家具訂單量數(shù)據(jù)具有波動(dòng)性和趨勢(shì)性的非線(xiàn)性特征選用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),進(jìn)而提出SARIMA-BP組合模型預(yù)測(cè)方法。這種方法將SARIMA可消除數(shù)據(jù)周期性和季節(jié)性的優(yōu)勢(shì)以及神經(jīng)網(wǎng)絡(luò)較強(qiáng)的自學(xué)習(xí)自適應(yīng)能力和非線(xiàn)性映射能力的優(yōu)勢(shì)進(jìn)行了融合。利用BP神經(jīng)網(wǎng)絡(luò)較強(qiáng)的自學(xué)習(xí)能力實(shí)現(xiàn)SARIMA非線(xiàn)性動(dòng)態(tài)變化的自適應(yīng)調(diào)節(jié),借助神經(jīng)網(wǎng)絡(luò)非線(xiàn)性函數(shù)逼近和收斂?jī)?yōu)勢(shì),確保預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性[7]。
SARIMA(Seasonal Auto-Regressive Integrated Moving Average),又稱(chēng)季節(jié)性差分自回歸移動(dòng)平均模型[8],是一種具有周期性特征的時(shí)間序列數(shù)據(jù)模型。其模型表達(dá)式為:
其中,(p,d,q)為三個(gè)非季節(jié)參數(shù),p、d、q分別為非季節(jié)性自回歸項(xiàng)、非季節(jié)性差分次數(shù)、非季節(jié)性移動(dòng)平均項(xiàng);(P,D,Q,s)為四個(gè)季節(jié)參數(shù),P、D、Q分別為季節(jié)性自回歸項(xiàng)、季節(jié)性差分次數(shù)、季節(jié)性移動(dòng)平均項(xiàng),s表示季節(jié)性周期長(zhǎng)度[9]。SARIMA表達(dá)式為:
其中,φ (B)表示自回歸量,γ(Bs)表示季節(jié)回歸量,(1-B)d為d階差分,(1-Bs)D為D階季節(jié)差分,yt表示時(shí)間序列,θ(B)表示移動(dòng)量,δ(Bs)表示季節(jié)移動(dòng)量,εt為正態(tài)分布N(0,σ2)白噪聲。
SARIMA建模步驟為:(1)觀察時(shí)間序列的周期,確定周期的長(zhǎng)度s;(2)原始數(shù)據(jù)的平穩(wěn)性由ADF單位根檢驗(yàn)(Augmented Dickey-Fuller)來(lái)判定,若原始數(shù)據(jù)不符合平穩(wěn)性條件,則需經(jīng)過(guò)差分變換,將非平穩(wěn)性數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)性數(shù)據(jù),以確定差分次數(shù)d和季節(jié)差分次數(shù)D的值;(3)根據(jù)自相關(guān)和偏自相關(guān)分析確定p、q、P、Q的可能取值;(4)將選定的p、d、q和P、D、Q的可能值代入SARIMA模型,根據(jù)AIC最小值和Q檢驗(yàn)來(lái)選取最優(yōu)模型;(5)用建立的SARIMA模型進(jìn)行預(yù)測(cè)。
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法是基于誤差反向傳播的算法,該算法基本思想是利用梯度下降法使實(shí)際輸出值和期望輸出值的誤差最小。BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為三層網(wǎng)絡(luò)結(jié)構(gòu),由輸入層、隱藏層及輸出層構(gòu)成[10-11],包括信號(hào)正向傳播和誤差反向傳播兩個(gè)過(guò)程。正向傳播時(shí),輸入信號(hào)通過(guò)隱含層進(jìn)行非線(xiàn)性變化到輸出層,輸出層的輸出值與預(yù)期的輸出值進(jìn)行誤差計(jì)算,當(dāng)誤差值過(guò)大,則會(huì)進(jìn)行誤差反向傳播。誤差將向輸入層反向傳播,各層神經(jīng)元權(quán)重按梯度下降法進(jìn)行調(diào)整,通過(guò)不斷迭代實(shí)現(xiàn)誤差信號(hào)的最小化[12-13]。本文BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖1所示,由于歷史家具訂單量數(shù)據(jù)具有顯著的季節(jié)周期性,因此在后續(xù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)中額外將季節(jié)標(biāo)簽作為輸入,輔助BP神經(jīng)網(wǎng)絡(luò)更快地捕捉到輸入數(shù)據(jù)的季節(jié)性[14],因此輸入層為6層預(yù)測(cè)因素,輸出層為家具訂單需求量數(shù)據(jù)。
■圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
神經(jīng)網(wǎng)絡(luò)中,隱含層確定公式為:
式中,m為隱含層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),l為輸出節(jié)點(diǎn)數(shù),α取1~10;
由于輸入層各影響因素的單位不同,數(shù)據(jù)集具有不同的取值范圍,在計(jì)算時(shí)可能會(huì)出現(xiàn)神經(jīng)網(wǎng)絡(luò)無(wú)法收斂的情況,因此需要運(yùn)用MATLAB中mapminmax apply函數(shù)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)統(tǒng)一限定在一定的范圍內(nèi),本文中數(shù)據(jù)限定范圍為[0,1]。并將所得的預(yù)測(cè)結(jié)果進(jìn)行反歸一化mapminmax reverse處理。歸一化計(jì)算公式為:
式中,x*i為歸一化之后的數(shù)據(jù),xi為歸一化之前的數(shù)據(jù),xmin、xmax分別為原始數(shù)據(jù)的最小值和最大值。
反歸一化的計(jì)算公式為:
式中,yi為反歸一化后的數(shù)據(jù),y*為反歸一化前的數(shù)據(jù),ymin、ymax分別為實(shí)際訂單數(shù)據(jù)的最小值和最大值。
SARIMA模型具有良好的線(xiàn)性擬合能力,BP神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的自學(xué)習(xí)能力和任意非線(xiàn)性函數(shù)逼近能力,兩者對(duì)于家具訂單量數(shù)據(jù)有著不同的擬合和處理能力[15]。但實(shí)際上有多種影響家具訂單需求量的因素,且訂單量數(shù)據(jù)中存在著較復(fù)雜的內(nèi)在關(guān)系,單一的模型難以準(zhǔn)確地提取出數(shù)據(jù)中內(nèi)在的信息與特征,導(dǎo)致對(duì)家具訂單量的預(yù)測(cè)精度不高,因此建立SARIMA-BP組合模型以提高預(yù)測(cè)精度,該模型如圖2所示。
■圖2 SARIMA-BP組合模型
本研究所構(gòu)建的組合模型方法為:先利用SARIMA模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)得到預(yù)測(cè)結(jié)果1及誤差值,然后將預(yù)測(cè)結(jié)果1、誤差值、原始影響因素及季節(jié)標(biāo)簽序列一起作為輸入變量,訂單數(shù)據(jù)實(shí)際值作為BP神經(jīng)網(wǎng)絡(luò)的輸出,進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,根據(jù)代碼中設(shè)置的最大訓(xùn)練次數(shù)和最大誤差不斷調(diào)整BP神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù),得到最終的預(yù)測(cè)結(jié)果。
本文數(shù)據(jù)主要來(lái)源于國(guó)家統(tǒng)計(jì)局官方網(wǎng)站及A企業(yè)2013年—2021年的家具訂單量數(shù)據(jù),訂單量時(shí)間序列變化趨勢(shì)如圖3所示。
■圖3 2013—2021年A企業(yè)家具訂單量變化趨勢(shì)(單位:?jiǎn)危?/p>
通過(guò)文獻(xiàn)分析及調(diào)查[16-23],確定影響家具需求的主要驅(qū)動(dòng)變量為:①中國(guó)人均GDP。②城鎮(zhèn)化率。城鎮(zhèn)化率表示全國(guó)城鎮(zhèn)常住人口占全國(guó)總?cè)丝诘谋壤?,城?zhèn)居民相較于農(nóng)村居民具有更高的消費(fèi)能力和消費(fèi)意愿,因此對(duì)家具產(chǎn)品的需求也更為顯著,隨著中國(guó)城鎮(zhèn)化水平的提高以及城鎮(zhèn)居民人數(shù)的增加,對(duì)家具類(lèi)產(chǎn)品的需求也隨之增長(zhǎng),因此城鎮(zhèn)化率也是家具需求量的影響因素之一;③產(chǎn)業(yè)結(jié)構(gòu)(第二產(chǎn)業(yè)增加值/GDP)。家具生產(chǎn)制造屬于消費(fèi)品制造業(yè),處于第二產(chǎn)業(yè),通過(guò)產(chǎn)業(yè)結(jié)構(gòu)的變動(dòng),能夠有效推進(jìn)勞動(dòng)力在生產(chǎn)企業(yè)之間的流轉(zhuǎn),進(jìn)而影響家具的發(fā)展;④人均可支配收入。消費(fèi)者的購(gòu)買(mǎi)能力取決于消費(fèi)者的收入水平,人均可支配收入提高,隨之消費(fèi)者的購(gòu)買(mǎi)力也逐漸提高,對(duì)于家具市場(chǎng)需求的數(shù)量也發(fā)生著變化;⑤商品房銷(xiāo)售面積。國(guó)內(nèi)家具行業(yè)和房地產(chǎn)行業(yè)有較高相關(guān)性,新房銷(xiāo)售與房屋竣工對(duì)于家具企業(yè)的訂單量有一定的影響。
從產(chǎn)業(yè)鏈的角度出發(fā),家具產(chǎn)品的需求往往會(huì)產(chǎn)生并滯后于房屋銷(xiāo)售[24],一定程度上隨著房地產(chǎn)的銷(xiāo)售而產(chǎn)生波動(dòng)。根據(jù)相關(guān)統(tǒng)計(jì)研究,家具銷(xiāo)售比商品房銷(xiāo)售滯后約11到12個(gè)月[25](例如2017年第一季的商品房銷(xiāo)售將在2018年第一季度對(duì)家具需求達(dá)到最大釋放)。因此,本文在研究影響A企業(yè)家具訂單需求量因素時(shí),驅(qū)動(dòng)變量商品房銷(xiāo)售面積采用相對(duì)應(yīng)前一年的季度數(shù)據(jù)(例如影響2018年第一季度的家具訂單量的因素為2017年第一季度的商品房銷(xiāo)售面積)[26-27]。驅(qū)動(dòng)變量原始數(shù)據(jù)如表1所示。
表1 影響因素原始數(shù)據(jù)(2013-2021年)
為進(jìn)一步驗(yàn)證上述所選驅(qū)動(dòng)變量的可行性,利用SPASS軟件中的灰色關(guān)聯(lián)分析法對(duì)上述選取的驅(qū)動(dòng)變量與9年的訂單量數(shù)據(jù)進(jìn)行關(guān)聯(lián)程度計(jì)算[28-29]。計(jì)算結(jié)果如表2所示,驅(qū)動(dòng)變量關(guān)聯(lián)度按大小排序?yàn)椋荷唐贩夸N(xiāo)售面積、中國(guó)人均GDP、人均可支配收入、城鎮(zhèn)化率、產(chǎn)業(yè)結(jié)構(gòu)占比,關(guān)聯(lián)度均大于0.5,通過(guò)可行性檢驗(yàn)即驅(qū)動(dòng)變量選取合理[30]。
表2 訂單量需求驅(qū)動(dòng)變量灰色關(guān)聯(lián)度
使用SPASS分析軟件構(gòu)建SARIMA模型,首先由初始序列圖3可以看出,原始數(shù)據(jù)有一定的趨勢(shì)和季節(jié)效應(yīng)且季節(jié)周期長(zhǎng)度s為4;其次判斷原始數(shù)據(jù)平穩(wěn)性,由ADF檢驗(yàn)結(jié)果(表3)可知原始家具需求量數(shù)據(jù)為非平穩(wěn)數(shù)據(jù),在一階差分-一階季節(jié)差分變換下,P值<0.05,t值小于三個(gè)置信區(qū)間的臨界值,原始數(shù)據(jù)變?yōu)槠椒€(wěn)性數(shù)據(jù),因此確定差分次數(shù)d為1,季節(jié)差分次數(shù)D為1。
表3 ADF檢驗(yàn)表
根據(jù)一階差分—一階季節(jié)差分后的自相關(guān)和偏自相關(guān)性結(jié)果進(jìn)行分析,獲取可能的p、q、P、Q值,通過(guò)AIC準(zhǔn)則求出各模型的AIC值如表4所示,以AIC最小值原則選取最優(yōu)SARIMA模型為SARIMA(0,1,0)(0,1,0,4)。對(duì)該模型的殘差序列進(jìn)行檢驗(yàn),其p值遠(yuǎn)大于0.05,因此該殘差序列為白噪聲序列,SARIMA(0,1,0)(0,1,0,4)模型合理,可用來(lái)做預(yù)測(cè)。用該模型對(duì)2013年到2021年的A企業(yè)家具訂單量進(jìn)行預(yù)測(cè)并與真實(shí)值進(jìn)行擬合,擬合結(jié)果如圖4所示。SARIMA的預(yù)測(cè)結(jié)果準(zhǔn)確率為76.88%。
表4 SARIMA備選模型及AIC值
■圖4 SARIMA模型預(yù)測(cè)擬合圖
使用MATLAB軟件構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,共有36組數(shù)據(jù),選取前24組數(shù)據(jù)為訓(xùn)練集,剩余12組數(shù)據(jù)為測(cè)試集,數(shù)據(jù)的區(qū)間要求為[0,1],因此在BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建中對(duì)驅(qū)動(dòng)變量數(shù)據(jù)及原始家具訂單需求量數(shù)據(jù)進(jìn)行歸一化處理。在代碼中設(shè)置迭代次數(shù)、學(xué)習(xí)速率及最大殘差分別為30000、0.1、0.001,在不斷的迭代中確定最佳隱含層節(jié)點(diǎn)為10,建立6-10-1的BP神經(jīng)網(wǎng)絡(luò)模型。將季節(jié)標(biāo)簽序列、中國(guó)人均GDP、城鎮(zhèn)化率、產(chǎn)業(yè)結(jié)構(gòu)、人均可支配收入、商品房銷(xiāo)售面積作為輸入,訂單量作為輸出,進(jìn)行模型訓(xùn)練,輸出測(cè)試集的實(shí)際值與預(yù)測(cè)結(jié)果的擬合圖,如圖5所示,預(yù)測(cè)準(zhǔn)確率為83.29%。
■圖5 BP神經(jīng)網(wǎng)絡(luò)擬合圖
■圖6 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)際值的相對(duì)誤差
將2.2中SARIMA模型的預(yù)測(cè)結(jié)果、誤差值以及表1中的影響因素原始數(shù)據(jù)一起作為神經(jīng)網(wǎng)絡(luò)的輸入變量進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練。共有36組數(shù)據(jù),選取前24組數(shù)據(jù)為訓(xùn)練集,剩余12組數(shù)據(jù)為測(cè)試集,數(shù)據(jù)的區(qū)間要求為[0,1],因此在BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建中對(duì)驅(qū)動(dòng)變量數(shù)據(jù)及原始家具訂單需求量數(shù)據(jù)進(jìn)行歸一化處理。設(shè)置迭代次數(shù)、學(xué)習(xí)速率及最大殘差分別為30000、0.1、0.001,在不斷的迭代中確定最佳隱含層節(jié)點(diǎn)為6,建立8-6-1的BP神經(jīng)網(wǎng)絡(luò)模型。將SARIMA模型的預(yù)測(cè)值、SARIMA預(yù)測(cè)誤差值、季節(jié)標(biāo)簽序列、中國(guó)人均GDP、城鎮(zhèn)化率、產(chǎn)業(yè)結(jié)構(gòu)、人均可支配收入、商品房銷(xiāo)售面積作為輸入,訂單量作為輸出,進(jìn)行模型訓(xùn)練,輸出測(cè)試集的實(shí)際值與預(yù)測(cè)結(jié)果的擬合圖,如圖7所示。預(yù)測(cè)結(jié)果準(zhǔn)確率為94.92%。
■圖7 組合模型擬合圖
■圖8 組合模型預(yù)測(cè)值與實(shí)際值的相對(duì)誤差
以SARIMA模型、BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和SARIMA-BP組合模型為基礎(chǔ),對(duì)A企業(yè)家具訂單需求量的進(jìn)行預(yù)測(cè),并計(jì)算出各相對(duì)誤差。三種模型誤差對(duì)比結(jié)果如圖9所示,與單一預(yù)測(cè)模型相比,組合模型的相對(duì)誤差更小且具有更高的預(yù)測(cè)精準(zhǔn)度。
■圖9 三種模型相對(duì)誤差對(duì)比圖
本文通過(guò)文獻(xiàn)分析及調(diào)查選取了影響家具訂單需求量的5個(gè)驅(qū)動(dòng)變量,并對(duì)變量的合理性進(jìn)行了判斷,驗(yàn)證了所選取的驅(qū)動(dòng)變量與家具訂單需求量均具有較高關(guān)聯(lián)性;針對(duì)家具訂單需求量數(shù)據(jù)具有影響因素多樣性、非線(xiàn)性和線(xiàn)性規(guī)律的特點(diǎn),并且依據(jù)SARIMA模型、BP神經(jīng)網(wǎng)絡(luò)模型各自的預(yù)測(cè)優(yōu)勢(shì),建立SARIMA-BP組合預(yù)測(cè)模型,應(yīng)用該方法對(duì)家具訂單量數(shù)據(jù)進(jìn)行建模及預(yù)測(cè),結(jié)果表明SARIMA-BP組合預(yù)測(cè)方法的預(yù)測(cè)精度較兩種單一模型預(yù)測(cè)精度更高,得到的預(yù)測(cè)準(zhǔn)確率比SARIMA提高了約18%,比BP神經(jīng)網(wǎng)絡(luò)提高了約10%,這表明本文的預(yù)測(cè)方法在家具訂單需求量預(yù)測(cè)中具有一定可行性。