国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時(shí)代的經(jīng)濟(jì)學(xué)思考:數(shù)據(jù)驅(qū)動(dòng)范式

2017-11-28 11:52姚天駒
商情 2017年38期
關(guān)鍵詞:經(jīng)濟(jì)學(xué)大數(shù)據(jù)

姚天駒

[摘要]經(jīng)濟(jì)學(xué)研究采用的主要模式是模型驅(qū)動(dòng)范式,推動(dòng)著經(jīng)濟(jì)學(xué)的發(fā)展。但是21世紀(jì)以來,數(shù)據(jù)量爆炸式增長,模型驅(qū)動(dòng)范式難以滿足經(jīng)濟(jì)學(xué)發(fā)展的需要,數(shù)據(jù)驅(qū)動(dòng)范式應(yīng)運(yùn)而生,且具有十分強(qiáng)大的優(yōu)勢,將主導(dǎo)未來的經(jīng)濟(jì)學(xué)發(fā)展。

[關(guān)鍵詞]大數(shù)據(jù);經(jīng)濟(jì)學(xué);數(shù)據(jù)驅(qū)動(dòng)范式

隨著科學(xué)技術(shù)的發(fā)展的進(jìn)步,科學(xué)研究中的數(shù)據(jù)在數(shù)量和種類上都在不斷激增,幾乎每個(gè)領(lǐng)域都在經(jīng)歷數(shù)據(jù)爆炸。對于經(jīng)濟(jì)學(xué)研究來說,研究者也應(yīng)當(dāng)改變傳統(tǒng)研究范式,對數(shù)據(jù)驅(qū)動(dòng)范式進(jìn)行研究以適應(yīng)大數(shù)據(jù)時(shí)代的快速發(fā)展。

一、大數(shù)據(jù)時(shí)代的來臨

20世紀(jì)80年代初期,大數(shù)據(jù)登上歷史的舞臺,阿爾文·托夫勒稱之為“第三次浪潮的華彩樂章”。隨著科學(xué)技術(shù)的不斷進(jìn)步、數(shù)據(jù)的重要性提高,大數(shù)據(jù)時(shí)代終于來臨。進(jìn)入90年代中期,信息產(chǎn)業(yè)界和學(xué)術(shù)界開始進(jìn)行大數(shù)據(jù)的研究,大量有價(jià)值的成果涌現(xiàn)出來。直至進(jìn)入21世紀(jì),到達(dá)了數(shù)據(jù)大爆炸時(shí)代,2011年全球數(shù)據(jù)量高達(dá)1.82ZB(1ZB=2B),2012年全球紙質(zhì)印刷材料僅承載不到200PB(1PB=2B)的數(shù)據(jù)量,2013年僅一天的數(shù)據(jù)量就需要1.88億張DVD光盤才能容納。隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)爆炸式增長使得各國將大數(shù)據(jù)上升到國家級戰(zhàn)略研究。我國對大數(shù)據(jù)技術(shù)發(fā)展時(shí)間較晚,直到2012年學(xué)術(shù)各界才開始了研究熱潮??傮w來說,大數(shù)據(jù)具有六大特征:(1)數(shù)據(jù)量巨大,大數(shù)據(jù)計(jì)量單位已變成ZB(2)和EB(2)。(2)價(jià)值巨大。大數(shù)據(jù)經(jīng)過精確分析后具有廣泛的應(yīng)用范圍。(3)數(shù)據(jù)類型多樣,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)等。(4)處理速度快。發(fā)揮大數(shù)據(jù)的最大應(yīng)用價(jià)值需要將實(shí)時(shí)大量的大數(shù)據(jù)精確快速的進(jìn)行分析。(5)流通靈活,大數(shù)據(jù)靈活的交易方式將會成為交易量最大的商品。(6)準(zhǔn)確性,由于大數(shù)據(jù)的巨大樣本量,經(jīng)過分析處理得到的結(jié)果具有較高的真實(shí)性和準(zhǔn)確性。大數(shù)據(jù)時(shí)代的來臨,給經(jīng)濟(jì)學(xué)研究帶來了思考和挑戰(zhàn),經(jīng)濟(jì)學(xué)研究范式也發(fā)生了改變。

二、數(shù)據(jù)驅(qū)動(dòng)范式的興起

(一)數(shù)據(jù)驅(qū)動(dòng)范式的優(yōu)勢

首先是研究范式由“樣本-總體”轉(zhuǎn)變?yōu)椤皹颖?總體”。在經(jīng)濟(jì)學(xué)統(tǒng)計(jì)研究領(lǐng)域,使用樣本推斷總體是一個(gè)重要的原則。以往的模型驅(qū)動(dòng)范式采樣的隨機(jī)性難以實(shí)現(xiàn),不能進(jìn)行奇異值分析也不適合考察子類別情況。而大數(shù)據(jù)背景下的數(shù)據(jù)驅(qū)動(dòng)研究范式能夠避免這些問題,在數(shù)據(jù)采集、處理和分析技術(shù)上都有巨大的進(jìn)步,樣本即總體,可直接對數(shù)據(jù)進(jìn)行分析,不需要考慮抽樣方法和模型設(shè)計(jì)的缺陷。其次是不需要研究假定。數(shù)據(jù)驅(qū)動(dòng)范式研究不需要假定數(shù)據(jù)必須符合正態(tài)分布等,也不需要假定因變量和自變量之間的關(guān)系。從數(shù)據(jù)原本出發(fā),直接尋找數(shù)據(jù)之間的關(guān)系并發(fā)現(xiàn)其中的規(guī)律,加以總結(jié)形成研究結(jié)論。模型驅(qū)動(dòng)研究流程為“假設(shè)一驗(yàn)證”,而數(shù)據(jù)驅(qū)動(dòng)研究流程則是“發(fā)現(xiàn)一總結(jié)”。最后是檢驗(yàn)方法科學(xué),數(shù)據(jù)驅(qū)動(dòng)研究采用交叉驗(yàn)證方法,將數(shù)據(jù)分為兩類,訓(xùn)練集用來建模,測試集用來檢驗(yàn),實(shí)質(zhì)上就是利用數(shù)據(jù)本身進(jìn)行檢驗(yàn),結(jié)果的科學(xué)性和準(zhǔn)確性得到大大提高。

(二)數(shù)據(jù)驅(qū)動(dòng)范式與模型驅(qū)動(dòng)范式的經(jīng)濟(jì)學(xué)研究案例分析

在宏觀經(jīng)濟(jì)分析中,經(jīng)濟(jì)增長的“三駕馬車”包括投資、消費(fèi)和凈出口,通過從《中國統(tǒng)計(jì)年鑒》中獲取相關(guān)數(shù)據(jù),這些數(shù)據(jù)形成經(jīng)濟(jì)增長數(shù)據(jù)集。以前人構(gòu)建的中國經(jīng)濟(jì)增長問題研究模型為例,首先對經(jīng)濟(jì)增長數(shù)據(jù)集利用數(shù)據(jù)驅(qū)動(dòng)范式進(jìn)行隨機(jī)森林模擬。隨機(jī)森林算法主要是生成相互獨(dú)立分布的多個(gè)隨機(jī)向量θ1,θ2…,θk,以訓(xùn)練集為基礎(chǔ),建立樹h(x,θi),其中i=1,2…,k。通過這個(gè)過程的多次重復(fù)生成多個(gè)彼此獨(dú)立的樹,由這些樹來決定最終結(jié)果。這種算法的誤差在于樹的分類精度,還有樹之間的相關(guān)性和強(qiáng)度,樹的分類精度越大、相關(guān)性越小、強(qiáng)度越大,則結(jié)果誤差越小,反之誤差則大。隨機(jī)森林算法還能度量變量的重要性,從研究結(jié)果看,以均方誤差的平均遞減排序依次為投資、消費(fèi)和凈出口,這個(gè)順序同樣代表了變量的重要性,這與我國目前宏觀經(jīng)濟(jì)的運(yùn)行趨勢一致。

為檢驗(yàn)數(shù)據(jù)驅(qū)動(dòng)范式隨機(jī)森林算法的準(zhǔn)確性,采用模型驅(qū)動(dòng)范式多元線性回歸模擬對上述經(jīng)濟(jì)增長數(shù)據(jù)集進(jìn)行分析,用GDP、CON、INV和NEX代表國內(nèi)生產(chǎn)總值、消費(fèi)、投資和凈出口的增長率,建立多元線性回歸模型如下:

從該模型的假設(shè)檢驗(yàn)來看,擬合效果較好。各個(gè)自變量的參數(shù)估計(jì)假設(shè)檢驗(yàn)顯著水平均在0.01或者0.1,F(xiàn)檢驗(yàn)也通過了顯著水平0.01的檢驗(yàn),決定系數(shù)R2也超過了0.9。從自變量的系數(shù)能夠看出,消費(fèi)(CON)是我國經(jīng)濟(jì)增長的重要支撐力量,但我國宏觀經(jīng)濟(jì)政策是以投資為導(dǎo)向的,這與實(shí)際不符,說明了這個(gè)多元線性回歸模型的分析結(jié)果有可能是不準(zhǔn)確的,需要進(jìn)行檢驗(yàn)。模型最重要的應(yīng)用是進(jìn)行預(yù)測,而預(yù)測的準(zhǔn)確性需要使用交叉檢驗(yàn)進(jìn)行評價(jià)。而交叉檢驗(yàn)應(yīng)用原數(shù)據(jù)進(jìn)行評價(jià)比假設(shè)檢驗(yàn)更科學(xué),在上述案例中,隨機(jī)森林算法的模擬效果比多元線性回歸模型要好的多,經(jīng)過4折交叉檢驗(yàn),隨機(jī)森林算法的測試集平均標(biāo)準(zhǔn)化均方誤差為0.253,預(yù)測精度非常高,而多元線性回歸模型測試集的平均NMSE則為4.378,結(jié)果還不及均值預(yù)測。因此結(jié)論是通過了T檢驗(yàn)和F檢驗(yàn)的多元線性回歸模型仍然對于中國經(jīng)濟(jì)增長的分析是不準(zhǔn)確的,還是需要由隨機(jī)森林算法來進(jìn)行分析。

三、科技創(chuàng)新數(shù)據(jù)集的隨機(jī)森林模擬

隨機(jī)森林模擬算法能夠有效克服多元線性回歸模型的不足,提升數(shù)據(jù)的驅(qū)動(dòng)能力,對推動(dòng)經(jīng)濟(jì)學(xué)的變革,具有重要作用。在對科技創(chuàng)新數(shù)據(jù)集進(jìn)行隨機(jī)模擬的過程中發(fā)現(xiàn),制度因素是影響科技創(chuàng)新數(shù)據(jù)集驅(qū)動(dòng)力的關(guān)鍵。人力資源和物力資源也是影響科技創(chuàng)新數(shù)據(jù)集的重要因素,固定物力對科技創(chuàng)新數(shù)據(jù)集的作用最不明顯。研究結(jié)果表明,回歸模型的驅(qū)動(dòng)范式和隨機(jī)森林模擬算法的驅(qū)動(dòng)范式各不相同。單純從模型的角度來說,包括多元線性回歸模型和嶺回歸模型在內(nèi)的回歸模型,能夠更加直觀明了的顯現(xiàn)出科技創(chuàng)新數(shù)據(jù)集的驅(qū)動(dòng)力,同時(shí),嶺回歸模型的驅(qū)動(dòng)要大于多元線性回歸模型的驅(qū)動(dòng)力,能夠更為準(zhǔn)確的揭示科技創(chuàng)新數(shù)據(jù)集各變量之間的關(guān)系。原因是由多重共線對多元線性方程具有一定影響。而隨機(jī)森林模擬算法未能建立統(tǒng)一的模型,對科技創(chuàng)新數(shù)據(jù)集驅(qū)動(dòng)力的評價(jià)采用最優(yōu)化算法,參照各個(gè)變量間的相互關(guān)系,獲得測算結(jié)果。從對數(shù)據(jù)的要求來說,科技創(chuàng)新數(shù)據(jù)集與經(jīng)濟(jì)增長數(shù)據(jù)集具有相似性,在科技增長數(shù)據(jù)集中,多元線性回歸模型的假設(shè)數(shù)量過多。以至于無法滿足所有的假設(shè)。同時(shí),由于多元線性回歸模型受多重共線性的影響較大,不利于數(shù)據(jù)的擬合,因此,不得不依靠嶺回歸模型克服多元線性回歸模型的弊端,但通過建立嶺回歸模型的方式,設(shè)定懲罰系數(shù),也會在一定程度上降低模型測定的準(zhǔn)確性。通過采用隨機(jī)森林模擬算法,不需要對數(shù)據(jù)進(jìn)行假設(shè),大大減低了應(yīng)用條件的限制,提升了算法的適應(yīng)性。從預(yù)測的準(zhǔn)確性來看,多元線性回歸算法、嶺回歸算法和隨機(jī)森林模擬算法的準(zhǔn)確性都很高,其中一多元線性回歸算法的準(zhǔn)確率最高。原因是多元線性回歸模型的決定系數(shù)高于其它兩種算法。如果僅僅是為了實(shí)現(xiàn)對數(shù)據(jù)的預(yù)測,則可以忽略多重共線性,選擇多元線性回歸模型?;诖耍P者認(rèn)為,應(yīng)根據(jù)數(shù)據(jù)集的使用目的選擇科學(xué)合理的算法。例如,在研究各變量之間的關(guān)系時(shí),可采用嶺回歸算法和隨機(jī)森林算法對數(shù)據(jù)進(jìn)行擬合并求得結(jié)果。如果僅僅是為了實(shí)現(xiàn)對數(shù)據(jù)的預(yù)測,那么則應(yīng)排除多重共線性對多元回歸模型的影響,采用多元回歸模型對數(shù)據(jù)進(jìn)行預(yù)測。通過以上研究發(fā)現(xiàn),利用多元回歸模型對數(shù)據(jù)進(jìn)行預(yù)測,準(zhǔn)確率較高,嶺回歸模型能夠克服多元線性回歸模型的弊端,隨機(jī)森林算法在數(shù)據(jù)集的擬合上較為穩(wěn)健。因此,應(yīng)結(jié)合實(shí)際情況,對三種方法進(jìn)行合理運(yùn)用。

四、結(jié)語

模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩種范式之間的關(guān)系類似于牛頓力學(xué)、相對論和量子力學(xué)的關(guān)系,模型驅(qū)動(dòng)范式在數(shù)據(jù)信息不發(fā)達(dá)的時(shí)代為經(jīng)濟(jì)學(xué)的研究做出了不可忽視的貢獻(xiàn),而現(xiàn)今在大數(shù)據(jù)爆炸式增長的時(shí)代,數(shù)據(jù)驅(qū)動(dòng)范式利用模式驅(qū)動(dòng)范式的研究理論和成果發(fā)展迅速,二者共同推動(dòng)經(jīng)濟(jì)思想和理論的進(jìn)步。endprint

猜你喜歡
經(jīng)濟(jì)學(xué)大數(shù)據(jù)
基于微信公眾號的西方經(jīng)濟(jì)學(xué)教學(xué)研究
國民經(jīng)濟(jì)運(yùn)行向好基本走出疫情影響
經(jīng)濟(jì)運(yùn)行預(yù)期穩(wěn)定
經(jīng)濟(jì)增長總體平穩(wěn) 經(jīng)濟(jì)運(yùn)行預(yù)期穩(wěn)定
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
雷人的經(jīng)濟(jì)學(xué)原理
讀書
柳林县| 辉南县| 栖霞市| 呼伦贝尔市| 新沂市| 葵青区| 邹平县| 同仁县| 麻城市| 汉阴县| 怀安县| 双辽市| 上高县| 北流市| 察雅县| 伊宁县| 铁力市| 旌德县| 德化县| 确山县| 南京市| 明水县| 巴马| 濮阳县| 德化县| 凤山市| 新兴县| 平阴县| 密云县| 琼海市| 博爱县| 罗城| 青田县| 凯里市| 澎湖县| 南漳县| 若尔盖县| 阿克陶县| 辽阳市| 五台县| 巴林右旗|