曹秋雯,王 凱,王子杰
(鄭州大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 鄭州 450001)
工業(yè)經(jīng)濟(jì)對(duì)國(guó)民經(jīng)濟(jì)發(fā)展的重要作用不可替代。工業(yè)是全面建成小康社會(huì)和建設(shè)現(xiàn)代化強(qiáng)國(guó)的基礎(chǔ)支撐;是推動(dòng)經(jīng)濟(jì)持續(xù)健康發(fā)展的重要力量;是國(guó)際貿(mào)易與投資的關(guān)鍵支撐;是新技術(shù)與新模式創(chuàng)新的重要載體;是帶動(dòng)落后地區(qū)經(jīng)濟(jì)發(fā)展的重要?jiǎng)恿?。預(yù)測(cè)工業(yè)增加值可以幫助政府和企業(yè)提前制定策略以應(yīng)對(duì)未來(lái)經(jīng)濟(jì)變化。
現(xiàn)如今,越來(lái)越多的學(xué)者利用各種模型對(duì)工業(yè)經(jīng)濟(jì)進(jìn)行預(yù)測(cè),例如吾彥軍、邱斌、王占峰、嚴(yán)慶江探究了大數(shù)據(jù)技術(shù)在工業(yè)經(jīng)濟(jì)統(tǒng)計(jì)與預(yù)測(cè)中的應(yīng)用[1];朱云英論述了統(tǒng)計(jì)指標(biāo)和景氣指數(shù)對(duì)工業(yè)經(jīng)濟(jì)預(yù)測(cè)的意義,其中企業(yè)景氣指數(shù)對(duì)工業(yè)經(jīng)濟(jì)預(yù)測(cè)在建立模型預(yù)測(cè)工業(yè)增加值時(shí)具有信息可靠、前瞻性強(qiáng)、預(yù)測(cè)性強(qiáng)的特點(diǎn),同時(shí)也說(shuō)明了工業(yè)統(tǒng)計(jì)指標(biāo)對(duì)于工業(yè)經(jīng)濟(jì)預(yù)測(cè)的重要性[2]。本文在先前學(xué)者論述的基礎(chǔ)上創(chuàng)新性的從建立模型所需要選取的指標(biāo)的角度來(lái)說(shuō)明不同指標(biāo)建立的BP神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)同一地區(qū)的工業(yè)增加值的準(zhǔn)確性不同,相同指標(biāo)建立的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)不同地區(qū)工業(yè)增加值的準(zhǔn)確性不同;進(jìn)而得出結(jié)論:預(yù)測(cè)不同地區(qū)的工業(yè)增加值時(shí),不能用相同的指標(biāo)建立的模型進(jìn)行預(yù)測(cè)。
根據(jù)統(tǒng)計(jì)局?jǐn)?shù)據(jù),河南省2020年的生產(chǎn)總值產(chǎn)業(yè)結(jié)構(gòu)為:第一產(chǎn)業(yè)占比9.4%,第二產(chǎn)業(yè)占比41.6%,第三產(chǎn)業(yè)占比48.7%;黑龍江省2020年的生產(chǎn)總值產(chǎn)業(yè)結(jié)構(gòu)為:第一產(chǎn)業(yè)占比25.1%,第二產(chǎn)業(yè)占比25.4%,第三產(chǎn)業(yè)占比49.5%;海南省2020年的生產(chǎn)總值產(chǎn)業(yè)結(jié)構(gòu)為:第一產(chǎn)業(yè)占比20.5%,第二產(chǎn)業(yè)占比19.1%,第三產(chǎn)業(yè)占比60.4%[3]。河南省,黑龍江省和海南省的產(chǎn)業(yè)結(jié)構(gòu)顯著不同,為了說(shuō)明選用相同的指標(biāo)建立模型分別預(yù)測(cè)不同省份的工業(yè)增加值的準(zhǔn)確性不同,選擇這三個(gè)省份來(lái)進(jìn)行建模分析。
在預(yù)測(cè)工業(yè)增加值時(shí),首先需要選取適當(dāng)?shù)闹笜?biāo)。對(duì)影響工業(yè)增加值的指標(biāo)進(jìn)行分析,將影響工業(yè)增加值的指標(biāo)分為自然因素指標(biāo)和社會(huì)因素指標(biāo)。自然因素主要指自然災(zāi)害、溫度、氣候等。大的自然災(zāi)害如火山噴發(fā)、地震等必然會(huì)對(duì)工業(yè)產(chǎn)生負(fù)影響,溫度和氣候的變化一定程度上會(huì)影響工業(yè)的投入成本。但是這些因素對(duì)工業(yè)增加值的影響是短期的,且這些指標(biāo)難以量化,在預(yù)測(cè)工業(yè)增加值的具體數(shù)據(jù)的時(shí)候就會(huì)造成困難,因此在選擇預(yù)測(cè)工業(yè)增加值的指標(biāo)時(shí)不考慮自然因素。
影響工業(yè)增加值的社會(huì)因素有勞動(dòng)力人口總數(shù),規(guī)模以上企業(yè)個(gè)數(shù)、GDP、社會(huì)用電量,居民消費(fèi)價(jià)格指數(shù)、稅收、利潤(rùn)、社會(huì)用水量等。為了獲取數(shù)據(jù)的方便,選擇國(guó)家統(tǒng)計(jì)局或者地方統(tǒng)計(jì)局中已統(tǒng)計(jì)的指標(biāo)。由于國(guó)家政策的改變,規(guī)模以上工業(yè)企業(yè)虧損企業(yè)單位數(shù),規(guī)模以上工業(yè)企業(yè)主營(yíng)業(yè)務(wù)收入,規(guī)模以上工業(yè)企業(yè)主營(yíng)業(yè)成本,規(guī)模以上工業(yè)企業(yè)利息支出,規(guī)模以上工業(yè)企業(yè)營(yíng)業(yè)利潤(rùn)等指標(biāo)的數(shù)據(jù)在2018年之后不被國(guó)家統(tǒng)計(jì)局公布;而營(yíng)業(yè)收入,營(yíng)業(yè)成本,營(yíng)業(yè)利潤(rùn)等指標(biāo)在2018年之前沒(méi)有被國(guó)家統(tǒng)計(jì)局公布;因此為了方便建模,選擇2019—2021年的數(shù)據(jù)進(jìn)行建模分析。在預(yù)測(cè)工業(yè)增加值時(shí),首先要對(duì)選擇的指標(biāo)進(jìn)行相關(guān)性分析,對(duì)于相關(guān)系數(shù)r;當(dāng)>0.95時(shí),顯著性相關(guān);當(dāng)>=0.8時(shí),高度相關(guān);當(dāng)0.5≤<0.8;中度相關(guān);當(dāng)0.3≤<0.5時(shí),低度相關(guān);當(dāng)<0.3時(shí),弱相關(guān)[4]。當(dāng)相關(guān)系數(shù)大于0.5時(shí)認(rèn)為兩組數(shù)據(jù)之間的相關(guān)性較大。將統(tǒng)計(jì)局中各省份的指標(biāo)與相應(yīng)的工業(yè)增加值做相關(guān)性分析,指標(biāo)與各省份工業(yè)增加值的相關(guān)系數(shù)如下頁(yè)表1所示。
表1 指標(biāo)與各省份工業(yè)增加值的相關(guān)系數(shù)[5]
使用BP神經(jīng)網(wǎng)絡(luò)模型,將2019年1月—2021年5月的數(shù)據(jù)作為訓(xùn)練集,2021年6—11月的數(shù)據(jù)作為測(cè)試集,以固定資產(chǎn)投資、發(fā)電量累計(jì)增長(zhǎng)、社會(huì)消費(fèi)品零售總額、規(guī)模以上綜合能源消耗量和房地產(chǎn)累計(jì)投資增長(zhǎng)五個(gè)指標(biāo)的數(shù)據(jù)建立BP神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)河南省、黑龍江省和海南省的工業(yè)增加值;再以固定資產(chǎn)投資,營(yíng)業(yè)收入累計(jì)增長(zhǎng),房地產(chǎn)投資累計(jì)增長(zhǎng),社會(huì)消費(fèi)品零售總額,規(guī)模以上綜合能源消耗量這五個(gè)指標(biāo)建立BP神經(jīng)網(wǎng)絡(luò)模型二對(duì)黑龍江省工業(yè)增加值進(jìn)行預(yù)測(cè),以發(fā)電量累計(jì)增長(zhǎng)、社會(huì)消費(fèi)品零售總額、營(yíng)業(yè)收入累計(jì)增長(zhǎng)、營(yíng)業(yè)利潤(rùn)累計(jì)增長(zhǎng)和虧損企業(yè)虧損額累計(jì)增長(zhǎng)這五個(gè)指標(biāo)建立BP神經(jīng)網(wǎng)絡(luò)三對(duì)海南省的工業(yè)增加值進(jìn)行預(yù)測(cè)。結(jié)果顯示:模型一可以很好地預(yù)測(cè)河南省的工業(yè)增加值,預(yù)測(cè)黑龍江省的工業(yè)增加值時(shí)誤差較大,預(yù)測(cè)海南省的工業(yè)增加值時(shí)誤差特別大,無(wú)法顯示預(yù)測(cè)結(jié)果;模型二預(yù)測(cè)黑龍江省的工業(yè)增加值的誤差小于用模型一預(yù)測(cè)時(shí)的誤差;模型三可與預(yù)測(cè)出海南省的工業(yè)增加值。
以工業(yè)增加值累計(jì)增長(zhǎng)值作為觀測(cè)指標(biāo),以固定資產(chǎn)投資、發(fā)電量累計(jì)增長(zhǎng)、社會(huì)消費(fèi)品零售總額、規(guī)模以上綜合能源消耗量、房地產(chǎn)累計(jì)投資增長(zhǎng)、營(yíng)業(yè)收入累計(jì)增長(zhǎng),營(yíng)業(yè)利潤(rùn)累計(jì)增長(zhǎng)和虧損企業(yè)虧損額累計(jì)增長(zhǎng)作為建模指標(biāo);數(shù)據(jù)來(lái)源于國(guó)家統(tǒng)計(jì)局網(wǎng)站與地方統(tǒng)計(jì)局網(wǎng)站。各指標(biāo)的累計(jì)增長(zhǎng)值可以從統(tǒng)計(jì)局中得到,但是缺失一月份的數(shù)據(jù),因而需要對(duì)數(shù)據(jù)進(jìn)行處理;具體處理方法為:以當(dāng)年2月—12月數(shù)據(jù)的平均值作為該指標(biāo)的一月份數(shù)據(jù),2021年為2月—11月數(shù)據(jù)的平均值作為一月份的數(shù)據(jù)。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)寫(xiě)為ANNs)是模擬人的形象思維建立起來(lái)的。神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)分為三層,即輸入層、隱藏層、輸出層。在BP神經(jīng)網(wǎng)絡(luò)提出之前很長(zhǎng)一段時(shí)間里沒(méi)有找到隱藏層的連接權(quán)值調(diào)整問(wèn)題的有效算法,BP神經(jīng)網(wǎng)絡(luò)的提出解決了這一問(wèn)題[6]。
BP神經(jīng)網(wǎng)絡(luò)屬于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),是一種求解權(quán)重w的算法。通常分為兩步[7]:FP:信號(hào)正向傳遞(FP)求損失;BP:損失反向回傳(BP)。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)過(guò)程主要由信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成。原始數(shù)據(jù)從輸入層輸入,經(jīng)隱藏層處理以后,傳向輸出層。如果輸出層的實(shí)際輸出和期望輸出不符合,就進(jìn)入誤差的反向傳播階段。誤差反向傳播是將輸出誤差以某種形式通過(guò)隱層向輸入層反向傳播,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),這個(gè)誤差信號(hào)就作為修正個(gè)單元權(quán)值的依據(jù)。直到輸出的誤差滿足一定條件或者迭代次數(shù)達(dá)到一定次數(shù)便停止迭代。BP神經(jīng)網(wǎng)絡(luò)的層與層之間為全連接,同一層之間沒(méi)有連接,其結(jié)構(gòu)模型如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型
輸入向量為x=(x1,x2,…,xn),其中圖中x0為隱藏神經(jīng)元引入閾值設(shè)置的;隱層輸出向量為y=(y1,y2,…,yn),其中圖中y0為輸出神經(jīng)元引入閾值設(shè)置的;最終輸出向量為o=(o1,o2,…,ol),W1,…,Wk,…,Wl為隱藏層到輸出層的權(quán)值。即輸出層的輸入是隱層的輸出,隱層的輸入是輸入層的輸出。
BP神經(jīng)網(wǎng)絡(luò)輸入和輸出層的節(jié)點(diǎn)數(shù)是固定的,不論是回歸還是分類任務(wù),選擇合適的層數(shù)以及隱藏層節(jié)點(diǎn)數(shù),在很大程度上都會(huì)影響神經(jīng)網(wǎng)絡(luò)的性能。在建立模型時(shí)設(shè)定的參數(shù)為:輸入層節(jié)點(diǎn)數(shù)為5;輸出層節(jié)點(diǎn)數(shù)為1;隱藏層節(jié)點(diǎn)數(shù)為7;最大訓(xùn)練次數(shù)為20 000;學(xué)習(xí)效率為0.001。
選取Sigmoid函數(shù)作為激活函數(shù),交叉熵代價(jià)函數(shù)(Cross-Entropycost function)作為損失(代價(jià))函數(shù)。將2019年1月—2021年5月的數(shù)據(jù)作為訓(xùn)練集,2021年6月—11月的數(shù)據(jù)作為測(cè)試集,建立BP神經(jīng)網(wǎng)絡(luò)模型。
基于固定資產(chǎn)投資,發(fā)電量累計(jì)增長(zhǎng)值,房地產(chǎn)投資累計(jì)增長(zhǎng),社會(huì)消費(fèi)品零售總額,規(guī)模以上綜合能源消耗量這五個(gè)標(biāo)建立模型一對(duì)工業(yè)增加值進(jìn)行預(yù)測(cè)。各省份的絕對(duì)誤差如下頁(yè)表2所示。
表2 模型一預(yù)測(cè)各省份的工業(yè)增加值時(shí)的絕對(duì)值
用模型一與模型二預(yù)測(cè)黑龍江省的工業(yè)增加值的絕對(duì)誤差,用模型一與模型三預(yù)測(cè)海南省的工業(yè)增加值的絕對(duì)誤差如表3所示。
表3 黑龍江省和海南省分別兩次建模的絕對(duì)誤差
本文通過(guò)建立BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)各省份的工業(yè)增加值;橫向?qū)Ρ饶P鸵环謩e預(yù)測(cè)河南省、黑龍江省和海南省的工業(yè)增加值的絕對(duì)誤差,可以得出結(jié)論:同一模型在預(yù)測(cè)不同地區(qū)的工業(yè)增加值時(shí),準(zhǔn)確性不同??v向?qū)Ρ饶P鸵活A(yù)測(cè)黑龍江省的工業(yè)增加值的絕對(duì)誤差與模型二預(yù)測(cè)黑龍江省的工業(yè)增加值的絕對(duì)誤差;模型一預(yù)測(cè)海南省的工業(yè)增加值的絕對(duì)誤差與模型三預(yù)測(cè)海南省的工業(yè)增加值的絕對(duì)誤差,得出結(jié)論:與工業(yè)增加值的相關(guān)性越大的指標(biāo)建立的模型,對(duì)工業(yè)增加值的預(yù)測(cè)效果越好。
在當(dāng)今信息化時(shí)代大背景下,預(yù)測(cè)未來(lái)經(jīng)濟(jì)發(fā)展,提前做好應(yīng)對(duì)措施是所有國(guó)家,企業(yè)保證自身經(jīng)濟(jì)平穩(wěn)發(fā)展的必要舉措。本文淺顯地論述了在預(yù)測(cè)工業(yè)經(jīng)濟(jì)時(shí)不同地區(qū)要建立不同的模型,以防止用同一個(gè)模型預(yù)測(cè)不同地區(qū)的工業(yè)經(jīng)濟(jì)時(shí)產(chǎn)生遠(yuǎn)偏離實(shí)際的結(jié)果,導(dǎo)致管理人員做出錯(cuò)誤的決策。