張 寧,盛 武
(安徽理工大學 經(jīng)濟與管理學院,安徽 淮南 232001)
隨著我國經(jīng)濟進入新常態(tài),如何更有效推動全國及各地區(qū)經(jīng)濟發(fā)展、實現(xiàn)經(jīng)濟“提速換擋”已成為社會關(guān)注的主要問題之一。安徽省作為我國臨江近海的內(nèi)陸省份,提高安徽省經(jīng)濟發(fā)展水平,可有效推動我國中西部地區(qū)經(jīng)濟向著更加良好態(tài)勢發(fā)展。因此,本文以安徽省為研究對象,構(gòu)建經(jīng)濟發(fā)展水平指標體系,利用貝葉斯網(wǎng)絡(luò)對影響安徽省經(jīng)濟發(fā)展的各因素進行分析,找出影響經(jīng)濟發(fā)展水平的關(guān)鍵因素,從而更精準識別安徽省整體經(jīng)濟發(fā)展現(xiàn)狀。
目前,國內(nèi)已有眾多學者以安徽省經(jīng)濟為主題展開一系列研究討論。胡艷、張桅基于改進柯布——道格拉斯生產(chǎn)函數(shù)對安徽省人力資本對經(jīng)濟增長貢獻率進行了測度[1];夏永久、朱喜鋼等利用ESDA方法,從時間、空間兩個角度對安徽省經(jīng)濟格局演變規(guī)律進行了研究[2];羅念基于熵值法測度了安徽省土地生態(tài)安全與經(jīng)濟發(fā)展水平協(xié)調(diào)度[3];尹合伶針對如何創(chuàng)新安徽省經(jīng)濟發(fā)展方式展開了討論[4];馬芒、吳石英等通過構(gòu)建VEC模型從多維度對安徽省人力資本和經(jīng)濟發(fā)展方式進行了測量[5];李久林、儲金龍等基于引力模型測量了安徽省各縣間的經(jīng)濟聯(lián)系強度[6]。
綜合國內(nèi)學術(shù)界現(xiàn)有研究成果發(fā)現(xiàn),國內(nèi)學者對安徽省經(jīng)濟發(fā)展水平的研究在方法、內(nèi)容等方面呈現(xiàn)多元化,研究成果對安徽省經(jīng)濟發(fā)展具有一定的促進作用,但大多數(shù)研究都以衡量單一要素對經(jīng)濟發(fā)展的貢獻率或影響程度為主,基于經(jīng)濟發(fā)展內(nèi)在因素、從多方面找出影響安徽省經(jīng)濟發(fā)展水平關(guān)鍵因素的文獻研究較少。貝葉斯網(wǎng)絡(luò)作為表達和分析不確定性事件的有效方法,不僅可有效識別各變量間復雜的邏輯關(guān)系和相互影響程度,而且可借助反向推理找出影響目標變量的關(guān)鍵因素,因此在故障診斷、模型推理等方面具有廣泛的應用。目前,貝葉斯網(wǎng)絡(luò)在犯罪學、醫(yī)學等領(lǐng)域的研究已取得較大突破,但將貝葉斯網(wǎng)絡(luò)與經(jīng)濟學領(lǐng)域相結(jié)合的研究相對較為稀少?;诖?本文選取與安徽省經(jīng)濟發(fā)展水平相關(guān)的內(nèi)在因素,借助SPSS21.0對各變量進行相關(guān)性分析,在此基礎(chǔ)上,利用貝葉斯網(wǎng)絡(luò)工具GeNie構(gòu)建安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型,對影響安徽省經(jīng)濟發(fā)展水平的各因素進行綜合分析。
以《安徽省統(tǒng)計年鑒》和《國家統(tǒng)計年鑒》中的面板數(shù)據(jù)為數(shù)據(jù)源,選取2004-2017年間的與安徽省經(jīng)濟發(fā)展相關(guān)的指標變量,對安徽省經(jīng)濟發(fā)展情況作整體分析評價。
目前國內(nèi)關(guān)于經(jīng)濟發(fā)展水平的測度方法主要有單一指標評價法和綜合指標評價法,但尚未形成統(tǒng)一的評價指標體系[7]。由于影響區(qū)域經(jīng)濟發(fā)展水平的因素更復雜多樣,本文在選取安徽省經(jīng)濟發(fā)展水平評價指標過程中,在遵循評價指標選取的科學性、有效性、可操作性等基本原則基礎(chǔ)上,綜合考慮客觀事實及學術(shù)界現(xiàn)有研究成果[8-11],最終選取以下14個變量作為研究要素,具體情況如表1所示。
表1 評價指標選取
貝葉斯網(wǎng)絡(luò)作為目前用于推理分析隨機變量不確定性問題的一種有效且實用性最強的機器學習方法[12-13],融合了圖形化語言與概率論兩方面的內(nèi)容。它主要通過有向無環(huán)圖(DAG)將變量間復雜的關(guān)系以可視化方式呈現(xiàn)出來,并以條件概率和后驗概率的形式支持用戶進行雙向推理。DAG作為貝葉斯網(wǎng)絡(luò)的核心內(nèi)容,由節(jié)點和有向弧兩部分構(gòu)成。其中,節(jié)點代表要研究的變量,有向弧代表變量間的因果關(guān)系,由父節(jié)點指向子節(jié)點。
貝葉斯網(wǎng)絡(luò)以貝葉斯公式為數(shù)學原理,通過聯(lián)合概率分布對網(wǎng)絡(luò)中全體節(jié)點的關(guān)聯(lián)程度進行了定義。對于事件A,設(shè)影響其發(fā)生的所有事件集合為V=(V1,V2…Vn),則相關(guān)的貝葉斯公式為:
(1)
其中,P(Vi|A)為后驗概率,P(Vi)為先驗概率,P(A|Vi)為事件Vi發(fā)生條件下事件A發(fā)生的概率,即條件概率。
對于已經(jīng)確定的貝葉斯網(wǎng)絡(luò)模型而言,其節(jié)點的聯(lián)合概率分布可表示為:
(2)
其中,Vpa(Vi)表示節(jié)點Vi的所有父節(jié)點。
構(gòu)建貝葉斯網(wǎng)絡(luò)主要包含以下幾個基本環(huán)節(jié):
圖1 貝葉斯網(wǎng)絡(luò)構(gòu)建流程
在構(gòu)建完整的貝葉斯網(wǎng)絡(luò)模型結(jié)構(gòu)基礎(chǔ)上,利用參數(shù)學習可以通過學習樣本特征進而對模型中各節(jié)點狀態(tài)進行預測。目前,關(guān)于貝葉斯網(wǎng)絡(luò)參數(shù)學習的算法主要有最大似然估計法、貝葉斯估計法、期望最大(EM)算法[14]。由于本文在獲取樣本數(shù)據(jù)的過程中,存在部分數(shù)據(jù)缺失的情況,因此擬采用可以處理樣本缺失數(shù)據(jù)的參數(shù)學習算法,即EM算法進行貝葉斯網(wǎng)絡(luò)參數(shù)學習。EM算法的求解過程主要分為以下兩個步驟[15]:
(1)E(期望)步:依據(jù)觀測到的變量和當前參數(shù)值計算全部訓練樣本的概率分布期望:
Q(θi|θi-1)=E[logP(Y|θi)|θi-1,D]
(1)
其中,D為樣本數(shù)據(jù)集,P=(Y|θ)為相關(guān)參數(shù)的條件概率分布。
(2)M(最大化)步:求當E步的概率分布期望最大時θi的取值,即:
(2)
將得到的θi值重新代入公式(1),反復進行迭代,從而求得最優(yōu)解。
對獲取的樣本數(shù)據(jù)進行相關(guān)性分析,可提取與經(jīng)濟發(fā)展相關(guān)的關(guān)鍵特征,降低數(shù)據(jù)維度,簡化模型結(jié)構(gòu),提高貝葉斯網(wǎng)絡(luò)模型預測精度。皮爾遜相關(guān)系數(shù)和t檢驗作為檢測數(shù)值型變量相關(guān)性顯著水平的有效方法,可清晰呈現(xiàn)各變量間的相關(guān)程度,為貝葉斯網(wǎng)絡(luò)模型的構(gòu)建提供客觀依據(jù)。利用統(tǒng)計分析軟件SPSS21.0對選取的變量進行相關(guān)性分析,結(jié)果如表2所示。
表2 Pearson相關(guān)性檢驗
**在0.01水平上顯著相關(guān)*在 0.05 水平上顯著相關(guān)
從表2可看出,在選取的指標變量中,與變量G1(GDP總量)相關(guān)性較強的變量有G2(固定資產(chǎn)投資總額)、G4(社會消費品零售總額)、G5(進出口總額)、G6(第二產(chǎn)業(yè)占GDP比重)、G7(第三產(chǎn)業(yè)占GDP比重)、G11(人均GDP)、G13(全社會勞動生產(chǎn)率),其中變量G6(第二產(chǎn)業(yè)占GDP比重)、G7(第三產(chǎn)業(yè)占GDP比重)、G11(人均GDP)與安徽省經(jīng)濟發(fā)展水平完全相關(guān)。同理,在表2中也可以找出其它變量間的相關(guān)強度。
將獲取的樣本數(shù)據(jù)導入貝葉斯網(wǎng)絡(luò)軟件GeNie中,選取結(jié)構(gòu)學習功能,構(gòu)建初始貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型。在此基礎(chǔ)上,結(jié)合變量相關(guān)性分析結(jié)果和客觀事實對模型結(jié)構(gòu)進行調(diào)整、修正,最終構(gòu)建了如圖2所示的安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型。
圖2 安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型
小樣本數(shù)據(jù)的局限性往往會導致模型精確度降低,為驗證網(wǎng)絡(luò)模型有效性,GeNie軟件提供了模型驗證方法——交叉驗證(Cross-Validation)。目前,常用的交叉驗證方法有Leave-one-out Cross Validation(LOO-CV),K-Fold Cross Validation(K-Fold-CV)等。其中,LOO-CV驗證方法作為K-Fold-CV的特殊情況,適用于小樣本數(shù)據(jù),因此本文選用LOO-CV作為網(wǎng)絡(luò)模型的交叉驗證方法。在生成的網(wǎng)絡(luò)結(jié)構(gòu)模型基礎(chǔ)上,選取工具欄中的“Validate”按鈕,驗證方法選擇“Leave one out”,對模型中各節(jié)點及整體的預測精度進行計算,結(jié)果如表3所示。
表3 模型交叉驗證
從表中可看出,大多數(shù)節(jié)點預測的精度在0.8以上,整體預測精度為0.809,說明該模型具有較高的預測水平,可以用于因素分析與評價。
后驗概率分析是貝葉斯網(wǎng)絡(luò)推理中涉及最多的問題,利用后驗概率一方面可在已知原因前提下推斷出結(jié)果發(fā)生概率,另一方面也可在已知結(jié)果狀態(tài)情況下,找出導致結(jié)果發(fā)生的最可能原因[16]。在獲得父節(jié)點先驗概率和子節(jié)點條件概率基礎(chǔ)上,通過設(shè)定證據(jù)節(jié)點,計算各節(jié)點發(fā)生的后驗概率,以此對變量進行逆向推理,找出導致目標事件發(fā)生的關(guān)鍵因素,有助于更加精準地對事件態(tài)勢進行評估、預測。
在本環(huán)節(jié)中,首先借助GeNie軟件,將連續(xù)變量離散化,然后將目標節(jié)點“G1”設(shè)定為證據(jù)節(jié)點(即已知安徽省經(jīng)濟發(fā)展水平較高時),得出各節(jié)點的后驗概率,結(jié)果如圖3所示。
圖3 安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)節(jié)點后驗概率分布
從圖3中各節(jié)點的后驗概率值可知,在已知安徽省經(jīng)濟發(fā)展水平較高情況下,安徽省“固定資產(chǎn)投資總額較高(G2)”發(fā)生的可能性最大,概率高達93%;其次是“財政收入(G3)”和“社會消費品零售總額(G4)”,概率均為81%;此外,從圖中還可發(fā)現(xiàn),同等條件下,節(jié)點“全社會勞動生產(chǎn)率(G13)水平”較高的概率為79 %。
在貝葉斯網(wǎng)絡(luò)模型中,當父節(jié)點的先驗概率發(fā)生變化時,子節(jié)點的后驗概率隨之發(fā)生變化[17]。敏感性分析將由父節(jié)點發(fā)生變化而引起的子節(jié)點參數(shù)變化程度進行量化,從而識別出貝葉斯網(wǎng)絡(luò)模型中的關(guān)鍵因素。利用GeNie敏感性分析功能,對安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型中各節(jié)點的敏感程度進行分析,結(jié)果如圖4所示。其中,節(jié)點顏色深度與敏感性強度成正比。
圖4 安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)敏感性分析
從圖中可看出,整個模型中,節(jié)點的敏感強度可分為4個等級,高敏感度:節(jié)點G1(GDP總量);較高敏感度:節(jié)點G11(人均GDP)、G4(社會消費品零售總額)、G14(工業(yè)總資產(chǎn)貢獻率);中度敏感:節(jié)點G2(固定資產(chǎn)投資總額)、G3(財政收入)、G13(全社會勞動生產(chǎn)率);較低敏感度:節(jié)點G3(財政總收入占GDP比重)、G10(GDP增長指數(shù))、G12(單位工業(yè)增加值能耗)等。綜合分析發(fā)現(xiàn),在安徽省經(jīng)濟發(fā)展過程中,社會消費品零售總額、工業(yè)總資產(chǎn)貢獻率是影響安徽省經(jīng)濟發(fā)展水平的關(guān)鍵因素。
對安徽省經(jīng)濟發(fā)展水平和各變量的發(fā)展水平進行綜合分析評價,有助于整體把握安徽省經(jīng)濟發(fā)展水平,為進一步制定切實可行的經(jīng)濟發(fā)展制度提供理論依據(jù)。在構(gòu)建完整的安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型基礎(chǔ)上,利用獲取的樣本數(shù)據(jù)和貝葉斯網(wǎng)絡(luò)參數(shù)學習,得出安徽省目前整體的經(jīng)濟發(fā)展水平,如圖5所示。
圖5 安徽省經(jīng)濟發(fā)展水平綜合評價
從圖5可明顯看出,GDP總量(G1)為“high”的概率僅為36%,人均GDP(G11)取值“high”的概率為33%,說明目前安徽省經(jīng)濟整體發(fā)展尚處于較低水平。從圖中還可以看出近年來安徽省工業(yè)總資產(chǎn)貢獻率始終保持中等水平,處于較好的發(fā)展狀態(tài)。此外,圖中還可明顯看出與安徽省經(jīng)濟發(fā)展水平相關(guān)的其它指標發(fā)展情況。
本文以安徽省為研究對象,選取與經(jīng)濟發(fā)展水平相關(guān)的變量,結(jié)合相關(guān)性分析,利用貝葉斯工具GeNie構(gòu)建安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型。通過對模型分析推理,得出以下結(jié)論:
1.分析模型中各節(jié)點的后驗概率發(fā)現(xiàn),在已知安徽省經(jīng)濟發(fā)展水平較高情況下,“固定資產(chǎn)投資總額”處于較高水平的可能性最大,概率為93%;其次是“財政收入”和“社會消費品零售總額”,概率均為81%。
2.分析模型中各節(jié)點的敏感性發(fā)現(xiàn),在構(gòu)建的安徽省經(jīng)濟發(fā)展貝葉斯網(wǎng)絡(luò)模型結(jié)構(gòu)中,節(jié)點的敏感性強度大致可劃分為4個等級,其中社會消費品零售總額、工業(yè)總資產(chǎn)貢獻率的敏感度相對較高,是影響安徽省經(jīng)濟發(fā)展的關(guān)鍵因素。此外,對安徽省經(jīng)濟發(fā)展水平進行綜合評價發(fā)現(xiàn),安徽省工業(yè)總資產(chǎn)貢獻率處于較好發(fā)展狀態(tài),但經(jīng)濟發(fā)展尚處于較低水平。
為提高安徽省經(jīng)濟發(fā)展水平,安徽省各級政府及相關(guān)部門要在平衡各影響因素發(fā)展狀態(tài)的基礎(chǔ)上,著重關(guān)注影響經(jīng)濟發(fā)展水平的幾個關(guān)鍵因素。首先,加大固定資產(chǎn)投資總額,為推動安徽省經(jīng)濟發(fā)展奠定堅實的物質(zhì)基礎(chǔ);其次,將提高社會消費品零售總額和工業(yè)總資產(chǎn)貢獻率作為重點關(guān)注對象,不斷優(yōu)化安徽省消費結(jié)構(gòu),擴大實物消費規(guī)模,不斷創(chuàng)新消費模式,在注重實物消費的同時兼顧服務消費,從根本上提高安徽省社會消費品零售總額;最后,繼續(xù)保持安徽省現(xiàn)有的發(fā)展優(yōu)勢,多角度、全方位地提高安徽省經(jīng)濟發(fā)展水平,推動安徽省經(jīng)濟向著更加穩(wěn)定、可持續(xù)方向發(fā)展。