王 碩, 彭 虹
(福建農(nóng)林大學(xué) 金山學(xué)院,福建 福州 350002)
隨著人工智能與大數(shù)據(jù)時代的到來,經(jīng)濟學(xué)與大數(shù)據(jù)的結(jié)合為經(jīng)濟學(xué)的研究提供了新的發(fā)展方向[1]。探索性數(shù)據(jù)分析(Explorative Date Analysis,EDA)更為經(jīng)濟學(xué)領(lǐng)域帶來了新的、更為科學(xué)的研究分析方式。在傳統(tǒng)的科學(xué)看來,數(shù)據(jù)是需要徹底“凈化”和“集成”,計算的目的是找出“精準(zhǔn)答案”,而其背后的哲學(xué)是“不接受數(shù)據(jù)的復(fù)雜性”。然而,大數(shù)據(jù)中更加強調(diào)的是數(shù)據(jù)的異構(gòu)性、動態(tài)性和跨域等復(fù)雜性,其中包括彈性計算、魯棒性、虛擬化和快速響應(yīng)等不同種手段。圖靈獎獲得者Jim提出了科學(xué)研究的第四范式,即數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)(Date-intensive Scientific Discovery)?!皵?shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式”的主要特點是科學(xué)研究人員只需要從大數(shù)據(jù)中查找和挖掘所需要的信息和知識,無需直接面對所研究的物理對象。從“基于知識解決問題”到“基于數(shù)據(jù)解決問題”,重視“相關(guān)性”的分析,而不僅僅是因果分析[2]。
亞當(dāng)·斯密的經(jīng)濟學(xué)理論是以個量分析為主,根據(jù)對單個消費者、廠商和生產(chǎn)要素所有者的分析來進行經(jīng)濟學(xué)理論和經(jīng)濟現(xiàn)象的研究和分析。凱恩斯主義經(jīng)濟學(xué)則側(cè)重于分析總量變量,根據(jù)他所建立的涉及總量變量的理論,主張從國家層面干預(yù)經(jīng)濟生活[3]。傳統(tǒng)的經(jīng)濟學(xué)研究都以經(jīng)濟現(xiàn)象的理論研究為主[4],即大多以“基于知識解決問題”的研究方式,輔助以少量、個體、單一性、非動態(tài)性、非異構(gòu)性的數(shù)據(jù)來解決已發(fā)生的經(jīng)濟現(xiàn)象,缺乏對經(jīng)濟學(xué)理論和經(jīng)濟現(xiàn)象形成和發(fā)生的獨創(chuàng)性、預(yù)見性、科學(xué)性和普適性的研究。國內(nèi)學(xué)者基于大數(shù)據(jù)分析的相關(guān)研究從2012年開始。覃雄派等[5]以MapReduce為代表的非關(guān)系數(shù)據(jù)管理技術(shù)陣營,從關(guān)系數(shù)據(jù)管理技術(shù)所積累的寶貴財富中挖掘可以借鑒的技術(shù)和方法,面向大數(shù)據(jù)的深度分析需求,分析了RDBMS與MapReduce的競爭與共生。喻國明[6]以2009~2012年百度搜索詞數(shù)據(jù)庫為研究對象,運用大數(shù)據(jù)的價值挖掘與分析技術(shù),對“社會暖度”“社會幸福感”以及“社會壓力”等中國社會的輿情指數(shù)進行測度并提出了社會管理和協(xié)調(diào)的重要啟示。楊虎等[7]構(gòu)建了基于大數(shù)據(jù)分析的互聯(lián)網(wǎng)金融風(fēng)險預(yù)警系統(tǒng),并提出了互聯(lián)網(wǎng)企業(yè)風(fēng)險管理的依據(jù)和措施。崔媛[8]基于農(nóng)業(yè)氣候?qū)r(nóng)作物的影響,利用大數(shù)據(jù)分析了C-D-A模型的可行度并提出了各種天氣條件下保障與提高農(nóng)作物產(chǎn)量的理論依據(jù)。
從現(xiàn)有研究可以看出,如何科學(xué)有效的利用好經(jīng)濟數(shù)據(jù)去研究動態(tài)的、多維的、復(fù)雜的經(jīng)濟學(xué)理論和經(jīng)濟現(xiàn)象成為現(xiàn)代經(jīng)濟學(xué)研究的新課題,現(xiàn)有研究已經(jīng)將大數(shù)據(jù)分析方法運用于宏微觀經(jīng)濟、自然環(huán)境分析中,但以全球經(jīng)濟為分析對象,結(jié)合大數(shù)據(jù)分析方法進行實證,并進行經(jīng)濟預(yù)測的研究較為缺乏。本文針對多維相關(guān)性數(shù)據(jù)條件下的全球GDP總量排名前30國GDP未來發(fā)展相關(guān)性變量的研究,對30國GDP未來發(fā)展給出了趨勢變化情況和相關(guān)性分析,進一步豐富大數(shù)據(jù)研究中的理論和實踐內(nèi)容。
研究以2017年為例,選取了全球GDP排名前30位的國家為研究對象,數(shù)據(jù)來源于世界銀行網(wǎng)站。數(shù)據(jù)顯示,2017年美國和中國GDP總量均在10萬億美元以上,其中美國GDP總量已經(jīng)接近20萬億美元(表1)。
由表1可以看出,全球GDP排名前30國GDP總量占全球GDP總量的比值為85.81%。前30國GDP總量占比已經(jīng)達到全球GDP總量的85%。采用前30國作為研究對象,在得出2018~2022年前30國GDP總量及發(fā)展趨勢的同時,可以實現(xiàn)從局部對未來全球GDP總量及經(jīng)濟發(fā)展情況的有效預(yù)測。
表1 全球GDP排名前30國及其GDP總量
數(shù)據(jù)來源:根據(jù)世界銀行網(wǎng)站數(shù)據(jù)整理所得。
全球共233個國家和地區(qū),其中國家有197個,地區(qū)有36個。由于影響國家GDP總量的因素較多,其中涵蓋政治、經(jīng)濟、人文、地理等各個方面,因此難以實現(xiàn)對所有影響因素進行全部歸類,進而進行所有變量的相關(guān)性分析。為了對前30國GDP總量進行精確的預(yù)測,并基于現(xiàn)有數(shù)據(jù)的可獲得性以及考慮盡可能不造成數(shù)據(jù)混亂及相關(guān)性數(shù)據(jù)的不可降維性,從影響經(jīng)濟發(fā)展的角度挑選可能對各國GDP產(chǎn)生影響的因素:其中主要因素是國家財政收入、實際利用外資額、廣義貨幣供應(yīng)量、財政支出總量、固定資產(chǎn)投資總額[9]、不同國家的人口量、勞動力參與率、居民消費價格指數(shù)、國民生產(chǎn)總值、能源總量、對外貿(mào)易總量[10]、稅收收入、匯率、外債、實體經(jīng)濟虛擬經(jīng)濟占國家GDP總量比重等[11]。
研究采用python軟件在世界銀行網(wǎng)站中收集到相關(guān)性變量數(shù)據(jù),對于影響前30國GDP相關(guān)性數(shù)據(jù)進行探索性數(shù)據(jù)分析(Explorative Date Analysis,EDA)。然后對相關(guān)性數(shù)據(jù)進行歸納整理,迅速獲取我們所需要的相關(guān)性指標(biāo)量。
層次聚類法是最常見的一種聚類方法,在數(shù)據(jù)挖掘和基因表達分析領(lǐng)域經(jīng)常使用。使用該方法無須事先了解數(shù)據(jù)總共分為幾類,例如,數(shù)據(jù)沒有按照預(yù)先設(shè)定的類別數(shù)進行劃分。相反,結(jié)果由一個層次或一組嵌套分區(qū)構(gòu)成?;谀P偷木垲惪蚣馨ㄈ齻€主要的部分:
首先,利用基于模型的聚合聚類分割對EM算法進行初始化;其次,通過EM算法對參數(shù)進行最大似然估計;第三,根據(jù)貝葉斯因子的BIC逼近,選擇模型和類別數(shù)。
模型將分類似然函數(shù)作為目標(biāo)函數(shù)。分類似然函數(shù)公式如下:
其中γi是第i個觀測點的分類標(biāo)記,如果xi屬于第k個成分,則γi=k。在混合模型當(dāng)中,每個分量包含的觀測點數(shù)n呈多項式分布,其概率參數(shù)為π1,π2,……,πc。
基于模型的聚合聚類方法是對分類似然函數(shù)最大化的過程。起始狀態(tài)時每個點為一個單一的類,算法執(zhí)行時每一步驟將分類似然函數(shù)增長最快的兩類合并。這一過程重復(fù)執(zhí)行直至所有觀測點合并為一組。
根據(jù)python所收集的數(shù)據(jù),為了對大量動態(tài)的、多維的、異構(gòu)性數(shù)據(jù)進行有效降維[12],將前30國劃分為不同大類的經(jīng)濟體,進行合理科學(xué)的歸納分析;運用SPSS進行聚類分析,采取層次聚類對數(shù)據(jù)情況進行分類匯總(圖1)。
圖1 聚類分析30國聚類結(jié)果圖
由圖1可知,全球GDP排名前30國被劃分為5類,分別為美國、中國、日本、印度各為一類,其余國家為一類。通過層次聚類得出具有類似特征值的國家,用以對不同國家進行科學(xué)系統(tǒng)劃分,為運用BP神經(jīng)網(wǎng)絡(luò)多隱含層變量法對前30國進行精準(zhǔn)預(yù)測做鋪墊。
根據(jù)生物體大腦的原理開發(fā)的人工神經(jīng)網(wǎng)絡(luò)可以定義為一憑借眾多簡易的并行工作處理單位合并而成的復(fù)雜系統(tǒng),它的工作原理由網(wǎng)絡(luò)的結(jié)構(gòu)、關(guān)聯(lián)的程度和眾多單位的應(yīng)對問題時的策略選擇決定,和非線性動力學(xué)系統(tǒng)相似,與人類思維十分相近。BP(Back Propagation)網(wǎng)絡(luò)為目前被普遍使用的人工神經(jīng)網(wǎng)絡(luò)模型的代表,其實質(zhì)為一種按誤差逆?zhèn)鞑ニ惴üぷ鞯亩鄬忧梆伨W(wǎng)絡(luò)??紤]到BP神經(jīng)網(wǎng)絡(luò)可以對非線性模型進行預(yù)測的特性,因此在本文中采取了BP神經(jīng)網(wǎng)絡(luò)對全球前30國GDP總量進行預(yù)測與分析。
BP神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣泛的神經(jīng)元網(wǎng)絡(luò)模型之一,其學(xué)習(xí)過程中由信號的正向傳播與誤差的逆向傳播兩個過程組成。正向傳播時,模式作用于輸入層,經(jīng)隱含層處理后,傳入誤差的逆向傳播階段,將輸出誤差按某種子形式,通過隱層向輸入層逐層返回,并“分攤”給各層的所有單元,從而獲得各層單元的參考誤差或稱誤差信號,以作為修改各單元權(quán)值的依據(jù)。權(quán)值不斷修改的過程,也就是網(wǎng)絡(luò)學(xué)習(xí)過程。此過程一直進行到網(wǎng)絡(luò)輸出的誤差逐漸減少到可接受的程度或達到設(shè)定的學(xué)習(xí)次數(shù)為止。BP網(wǎng)絡(luò)模型包括其輸入輸出模型,作用函數(shù)模型,誤差計算模型和自學(xué)習(xí)模型。BP網(wǎng)絡(luò)由輸入層,輸出層以及一個或多個隱層節(jié)點互連而成的一種多層網(wǎng),這種結(jié)構(gòu)使多層前饋網(wǎng)絡(luò)可在輸入和輸出間建立合適的線性或非線性關(guān)系,又不致使網(wǎng)絡(luò)輸出限制在-1和1之間[13]。
根據(jù)聚類分析所劃分的5種不同經(jīng)濟體類型,運用BP神經(jīng)網(wǎng)絡(luò)將技術(shù)與產(chǎn)業(yè)革新、勞動投入[14]、國家財政收入、實際利用外資額、廣義貨幣供應(yīng)量、財政支出總量、固定資產(chǎn)投資總額、不同國家的人口量、勞動力參與率、居民消費價格指數(shù)、國民生產(chǎn)總值、能源總量、對外貿(mào)易總量、稅收收入、匯率、外債、實體經(jīng)濟虛擬經(jīng)濟占國家GDP總量比重等多變量因素;結(jié)合各個國家1987~2017年GDP總量數(shù)據(jù)帶入BP神經(jīng)網(wǎng)絡(luò)中。
如圖2所示,美國GDP總量一直保持較高的增長態(tài)勢,但在2020年之后GDP總量增長逐漸趨緩,這是由于美國的經(jīng)濟體量較大,經(jīng)濟較為發(fā)達,市場結(jié)構(gòu)較為健全,很難再找到新的經(jīng)濟增長爆發(fā)點,同時不斷升級的貿(mào)易摩擦帶來的風(fēng)險也是阻礙美國經(jīng)濟增長的重要方面(表2)。
圖2 美國GDP總量神經(jīng)網(wǎng)絡(luò)預(yù)測圖
表2 美國GDP總量預(yù)測結(jié)果
中國GDP總量隨著中國經(jīng)濟增長前景繼續(xù)表現(xiàn)強勁,為中國加快推進經(jīng)濟改革提供新的發(fā)展契機。供給側(cè)結(jié)構(gòu)性改革和貿(mào)易摩擦雖然給中國經(jīng)濟在2018~2020年期間帶來經(jīng)濟陣痛,但是在2020之后隨著技術(shù)與產(chǎn)業(yè)革新的逐步完成,中國經(jīng)濟又呈現(xiàn)階梯式爆炸性增長(圖3,表3)。
圖3 中國GDP總量神經(jīng)網(wǎng)絡(luò)預(yù)測圖
表3 中國GDP預(yù)測結(jié)果
日本在上世紀(jì)90年代后出現(xiàn)經(jīng)濟停滯,雖然在2009年前后出現(xiàn)經(jīng)濟較快增長,但又很快出現(xiàn)下滑。其主要原因是日本經(jīng)濟一直面臨著經(jīng)濟增長放緩、工資增長緩慢、生產(chǎn)率增長乏力、人口老齡化等問題的影響,如果未來上述問題仍不能得到效解決并出臺相關(guān)解決政策,未來日本經(jīng)濟增長仍然不容樂觀(圖4,表4)。
圖4 日本GDP總量神經(jīng)網(wǎng)絡(luò)預(yù)測圖
表4 日本GDP總量預(yù)測結(jié)果
印度經(jīng)濟在2018年后迎來了較快發(fā)展,主要是由于人口紅利所造成的。印度的發(fā)展模式重消費而非投資、重內(nèi)需而非出口、重服務(wù)業(yè)而非制造業(yè)、重高新技術(shù)產(chǎn)業(yè)而非勞動密集技術(shù)含量低的工業(yè),這種方式使印度經(jīng)濟對全球經(jīng)濟不景氣沖擊的抵抗力較強,表現(xiàn)出比較強的韌勁和經(jīng)濟平穩(wěn)增長的長周期性。印度經(jīng)濟在2020年后又呈現(xiàn)出新的較快經(jīng)濟增長(圖5,表5)。
圖5 印度GDP總量神經(jīng)網(wǎng)絡(luò)預(yù)測圖
表5 印度GDP預(yù)測結(jié)果
剩余國家2018~2022年間GDP總量預(yù)測值呈現(xiàn)鋸齒形變化趨勢,這是由于全球經(jīng)濟發(fā)展的不確定性因素較多,平均增速放緩,經(jīng)濟下行壓力大。據(jù)彭博社經(jīng)濟部稱,2018年全球經(jīng)濟增速急劇放緩,擴張速度降至2008年全球金融危機以來的最低水平(圖6,表6)。
圖6 剩余國家GDP總量神經(jīng)網(wǎng)絡(luò)預(yù)測圖
表6 剩余國家GDP預(yù)測結(jié)果
研究將上述實證數(shù)據(jù)進行分類加總,則全球30國的GDP總量預(yù)測結(jié)果見下表9所示。根據(jù)預(yù)測結(jié)果,2018年全球30國GDP總量增長速度為7.79%,2019年將放緩至4.27%;2020年全球30國GDP總量出現(xiàn)下降,下降速度為2.40%,2021年下降速度為2.46%;2022年又出現(xiàn)增長,增長速度為3.92%。全球經(jīng)濟增速放緩,經(jīng)濟的不穩(wěn)定和不確定性使得30國的經(jīng)濟發(fā)展一直維持在一個較為低迷的發(fā)展?fàn)顟B(tài)(表7)。
表7 全球三十國GDP總量預(yù)測結(jié)果
2018~2022年全球前30國經(jīng)濟增長整體而言較為緩慢,雖然在變化中也有增長趨勢,但經(jīng)濟增長的動力仍明顯不足,其中有部分國家甚至出現(xiàn)經(jīng)濟停滯和經(jīng)濟倒退的情況。其主要原因可能是是前30國經(jīng)濟受制于一系列深層次結(jié)構(gòu)性困境,難以走向復(fù)蘇和增長。從分析可以看出,中、美、印3國仍舊是2018~2022年前30國經(jīng)濟增長的主要動力。從整體來看,在未來的一段時間,前30國經(jīng)濟由于又受到逆全球化升溫、貿(mào)易保護主義抬頭等新的不確定性因素影響,其國家經(jīng)濟發(fā)展將與全球經(jīng)濟發(fā)展保持較為相似的變化趨勢,即將維持低增長和弱復(fù)蘇態(tài)勢,短期內(nèi)不穩(wěn)定性、不確定性增加。
首先應(yīng)加強全球?qū)用娴慕?jīng)濟治理與經(jīng)濟改革,推動全球經(jīng)濟一體化,更合理地解決全球資源的利用問題。第二,健全更具約束力的貿(mào)易規(guī)則,減少各國貿(mào)易摩擦。第三,穩(wěn)步深化金融政策改革,加強金融監(jiān)管。第四,加大對經(jīng)濟困難國家的政策性投資及援助力度,充分促進不發(fā)達國家經(jīng)濟增長,以此帶動發(fā)達國家、發(fā)展中國家的經(jīng)濟增長。
各國政府應(yīng)首先加大對固定資產(chǎn)的投資,大力支持新興產(chǎn)業(yè)的發(fā)展。第二,就業(yè)是民生之本,應(yīng)有效促進就業(yè)。第三,積極實施出口優(yōu)惠的稅后政策,鼓勵企業(yè)出口,減少相關(guān)產(chǎn)業(yè)的貿(mào)易保護,促進市場的自由競爭。第四,注意優(yōu)化財政支出結(jié)構(gòu),減少直接的財政干預(yù)經(jīng)濟的方式。第五,為市場松綁,充分發(fā)揮市場在資源配置方面的主導(dǎo)作用,充分挖掘市場潛力。第六,規(guī)范合理政府支出,提高政府支出效率。第七,進一步深化供給側(cè)結(jié)構(gòu)性改革,改變市場供求關(guān)系。第九,加強對實體經(jīng)濟的政策性傾斜力度,以實體經(jīng)濟帶動國家經(jīng)濟發(fā)展。