郭寬厚
經(jīng)濟(jì)分析工作引入大數(shù)據(jù)的意義和作用
大數(shù)據(jù)時(shí)代的到來,對(duì)傳統(tǒng)經(jīng)濟(jì)分析工作提出了機(jī)遇和挑戰(zhàn)。在經(jīng)濟(jì)分析工作中引入大數(shù)據(jù),可以解決傳統(tǒng)經(jīng)濟(jì)分析工作中所遇到的局限,并為經(jīng)濟(jì)分析打開另一片廣闊的空間。
一是隨著信息量的極大拓展和處理信息能力的極大提高,經(jīng)濟(jì)分析可以從樣本統(tǒng)計(jì)時(shí)代走向總體普查時(shí)代。這一點(diǎn)對(duì)經(jīng)濟(jì)分析意義重大,因?yàn)槲覀兺ǔjP(guān)注的經(jīng)濟(jì)是比較宏觀的,如果能將對(duì)整體宏觀經(jīng)濟(jì)變量的分析建立在盡可能多地關(guān)于經(jīng)濟(jì)主體行為的信息的基礎(chǔ)上,無疑將會(huì)極大地提高經(jīng)濟(jì)分析的準(zhǔn)確性和可信度。
二是大數(shù)據(jù)時(shí)代的信息傳播速度有了明顯的提高。大數(shù)據(jù)經(jīng)濟(jì)模型可以充分利用數(shù)據(jù)的實(shí)時(shí)性,提高分析預(yù)測(cè)的時(shí)效性,為經(jīng)濟(jì)預(yù)警和政策制定提供快速的資料和依據(jù)。同時(shí),通過多元的數(shù)據(jù),特別是非統(tǒng)計(jì)數(shù)據(jù),可以進(jìn)行碰撞模擬計(jì)算,從而較早地對(duì)經(jīng)濟(jì)形勢(shì)進(jìn)行感知。
三是大數(shù)據(jù)分析技術(shù)具有大規(guī)模并行處理的優(yōu)點(diǎn)。適合非結(jié)構(gòu)化數(shù)據(jù)的處理,為經(jīng)濟(jì)分析提供了更加方便高效的數(shù)據(jù)采集及處理平臺(tái),借鑒數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、模式識(shí)別等技術(shù),可以豐富分析方法,提高分析準(zhǔn)確度。同時(shí),經(jīng)典計(jì)量模型以因果檢驗(yàn)為核心,而大數(shù)據(jù)分析則更重視相關(guān)性發(fā)掘。在復(fù)雜的經(jīng)濟(jì)系統(tǒng)中,當(dāng)因果關(guān)系難以準(zhǔn)確檢驗(yàn)時(shí),我們可以充分利用相關(guān)關(guān)系解決經(jīng)濟(jì)分析問題。
經(jīng)濟(jì)分析大數(shù)據(jù)體系的建立
嚴(yán)格的經(jīng)濟(jì)理論和預(yù)測(cè)判斷均需要以詳實(shí)合理的數(shù)據(jù)做支撐。進(jìn)行經(jīng)濟(jì)大數(shù)據(jù)分析,對(duì)經(jīng)濟(jì)進(jìn)行綜合分析和評(píng)價(jià),前提條件是必須圍繞整個(gè)經(jīng)濟(jì)活動(dòng)建立一個(gè)多元的數(shù)據(jù)體系。從數(shù)據(jù)來源看,經(jīng)濟(jì)數(shù)據(jù)分為三個(gè)層次:
一是經(jīng)政府統(tǒng)計(jì)途徑獲取的原始抽樣和調(diào)查數(shù)據(jù)。依據(jù)《中華人民共和國統(tǒng)計(jì)法》,政府建立了以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體,綜合運(yùn)用全面調(diào)查、重點(diǎn)調(diào)查,并充分運(yùn)用行政記錄等資料的統(tǒng)計(jì)調(diào)查體系,為經(jīng)濟(jì)核算提供了有力的制度保障和豐富的基礎(chǔ)數(shù)據(jù)。
二是經(jīng)統(tǒng)計(jì)分析后的統(tǒng)計(jì)指標(biāo)數(shù)據(jù),也就是政府統(tǒng)計(jì)部門定期發(fā)布的統(tǒng)計(jì)月報(bào)和統(tǒng)計(jì)年鑒數(shù)據(jù)。一般情況下,最容易接觸和獲取到的數(shù)據(jù)是統(tǒng)計(jì)指標(biāo)數(shù)據(jù),這也是獲得國家和國際認(rèn)可的數(shù)據(jù)。
三是通過其它途徑獲取的拓展經(jīng)濟(jì)數(shù)據(jù)。拓展數(shù)據(jù)主要針對(duì)行業(yè)協(xié)會(huì)、商會(huì)掌握的生產(chǎn)環(huán)節(jié)的行業(yè)數(shù)據(jù)、行業(yè)發(fā)展報(bào)告,以及電商等市場主體產(chǎn)生的數(shù)據(jù)。
以上三類數(shù)據(jù)共同構(gòu)成了經(jīng)濟(jì)分析大數(shù)據(jù)體系,原始抽樣和調(diào)查數(shù)據(jù)粒度最細(xì),統(tǒng)計(jì)指標(biāo)數(shù)據(jù)綜合性最強(qiáng)最直觀,拓展數(shù)據(jù)范圍最廣最實(shí)時(shí),最符合大數(shù)據(jù)特征。三類數(shù)據(jù)之間可以互為補(bǔ)充、互相驗(yàn)證。
大數(shù)據(jù)技術(shù)在經(jīng)濟(jì)分析中的應(yīng)用
以上介紹了大數(shù)據(jù)分析的重要作用,并構(gòu)建了基礎(chǔ)的數(shù)據(jù)體系,在此基礎(chǔ)上可以具體開展如下應(yīng)用:
一是在非數(shù)量經(jīng)濟(jì)信息的收集整理方面的應(yīng)用。非數(shù)量經(jīng)濟(jì)信息主要指文本、圖片、視頻等信息。從這些素材中挖掘出結(jié)構(gòu)化、數(shù)量化的信息,這是一個(gè)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的艱巨任務(wù),同時(shí)也是人理解信息或機(jī)器理解信息的過程。例如,假設(shè)從互聯(lián)網(wǎng)抓取到100萬條帖子,需要從這些文本數(shù)據(jù)中挖掘出大眾對(duì)經(jīng)濟(jì)的信心指數(shù),如可分類為樂觀、中性、悲觀三類。那么最關(guān)鍵的就是要將100萬條帖子轉(zhuǎn)換為100萬個(gè)或樂觀、或中性、或悲觀的信息,也就是復(fù)雜信息簡單化。這個(gè)過程就是先對(duì)文本進(jìn)行特征抽取,然后在特征抽取信息的基礎(chǔ)上建立分類器,最后達(dá)到對(duì)所有文本數(shù)據(jù)的分類。簡言之,數(shù)據(jù)挖掘就是大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)調(diào)查,從紛繁復(fù)雜的非數(shù)量信息中挖掘出結(jié)構(gòu)化數(shù)據(jù)。
二是大數(shù)據(jù)在經(jīng)濟(jì)計(jì)量分析中的應(yīng)用。經(jīng)濟(jì)計(jì)量分析是研究經(jīng)濟(jì)的定量方法,要求的輸入數(shù)據(jù)都是結(jié)構(gòu)化、數(shù)字型數(shù)據(jù)。大數(shù)據(jù)技術(shù)在此除了可以解決前述的非數(shù)量信息的采集,并轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的問題外,還可以對(duì)計(jì)量模型的建立、參數(shù)估計(jì)、模型應(yīng)用及驗(yàn)證方面給予輔助作用。由于經(jīng)濟(jì)現(xiàn)象的復(fù)雜性,經(jīng)濟(jì)計(jì)量模型變量的完整選擇通常是不可能的,參數(shù)設(shè)置和方法估計(jì)也很多依靠經(jīng)驗(yàn),導(dǎo)致模型計(jì)算結(jié)果有時(shí)會(huì)造成很大偏差。因此,首先可以利用大數(shù)據(jù)相關(guān)性分析,去除次要變量,為主要變量選取提供依據(jù)。其次,利用大數(shù)據(jù)快速高效處理數(shù)據(jù)的優(yōu)勢(shì),對(duì)大量的模型進(jìn)行快速計(jì)算,從而為設(shè)置合適參數(shù)、選擇正確估計(jì)方法提供快速的驗(yàn)證、修正依據(jù)。
三是機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。大數(shù)據(jù)正在推動(dòng)數(shù)據(jù)分析向機(jī)器學(xué)習(xí)的方向發(fā)展,經(jīng)濟(jì)數(shù)據(jù)分析中應(yīng)用機(jī)器學(xué)習(xí)技術(shù)勢(shì)在必行。簡言之,機(jī)器學(xué)習(xí)就是讓計(jì)算機(jī)經(jīng)過訓(xùn)練,在輸入變量和輸出變量間建立起某種最佳的匹配關(guān)系,所謂訓(xùn)練是指把輸入和輸出信息都已知的樣本輸入計(jì)算機(jī),然后根據(jù)一定的算法由計(jì)算機(jī)生成由輸入變量預(yù)測(cè)輸出變量的方法。機(jī)器能夠伴隨計(jì)算、運(yùn)行次數(shù)的增多,通過學(xué)習(xí)逐步自我提高和改善,使挖掘和處理更為準(zhǔn)確。通常的分析模型是人工建立的,通過機(jī)器學(xué)習(xí)可以實(shí)現(xiàn)建模自動(dòng)化,是經(jīng)濟(jì)分析的新領(lǐng)域。目前技術(shù)還達(dá)不到,但相信隨著機(jī)器學(xué)習(xí)算法的進(jìn)步,這個(gè)目標(biāo)是完全可以達(dá)到的。
對(duì)策建議
為有效應(yīng)對(duì)大數(shù)據(jù)對(duì)經(jīng)濟(jì)分析工作提出的機(jī)遇和挑戰(zhàn),提升內(nèi)蒙古各組織的經(jīng)濟(jì)分析水平,使分析成果在政府決策、企業(yè)經(jīng)營、大眾消費(fèi)等方面發(fā)揮更大作用,政府、智庫、企業(yè)之間應(yīng)相互協(xié)作,各盡所能,積極參與,營造良好氛圍。
一是建立政府、智庫、企業(yè)等組織之間的相互協(xié)作機(jī)制。強(qiáng)化政府引導(dǎo)作用,發(fā)揮政府匯聚多方資源、整合經(jīng)濟(jì)數(shù)據(jù)的優(yōu)勢(shì),加大政府?dāng)?shù)據(jù)開放共享力度,突出智庫部門的需求和應(yīng)用導(dǎo)向,充分激發(fā)企業(yè)參與熱情和在大數(shù)據(jù)技術(shù)創(chuàng)新和成果轉(zhuǎn)化中的活力。
二是建立經(jīng)濟(jì)大數(shù)據(jù)采集匯聚應(yīng)用機(jī)制。注重頂層設(shè)計(jì),建立健全相關(guān)法規(guī)和標(biāo)準(zhǔn)體系,完善相關(guān)制度,形成數(shù)據(jù)采集、整理、應(yīng)用、反哺的良性循環(huán)機(jī)制。強(qiáng)化創(chuàng)新能力,提高創(chuàng)新層次,推動(dòng)業(yè)態(tài)創(chuàng)新、模式創(chuàng)新。加強(qiáng)行業(yè)自律,完善行業(yè)監(jiān)管,促進(jìn)數(shù)據(jù)資源有序流動(dòng)與規(guī)范利用。
三是盡快建設(shè)內(nèi)蒙古宏觀經(jīng)濟(jì)大數(shù)據(jù)平臺(tái)。按照經(jīng)濟(jì)大數(shù)據(jù)體系采集多元化數(shù)據(jù)資源,建設(shè)經(jīng)濟(jì)運(yùn)行調(diào)查、宏觀經(jīng)濟(jì)統(tǒng)計(jì)分析、經(jīng)濟(jì)指標(biāo)趨勢(shì)走向等專題數(shù)據(jù)庫,建立全區(qū)層面的基于大數(shù)據(jù)的宏觀決策系統(tǒng),提供自助式、專題式、交互式智能按需分析技術(shù),提供數(shù)據(jù)態(tài)勢(shì)分析、預(yù)測(cè)研判分析、可視化展示等方法,實(shí)現(xiàn)對(duì)重大經(jīng)濟(jì)和社會(huì)問題的主題分析、景氣預(yù)警、實(shí)時(shí)監(jiān)測(cè)、精準(zhǔn)評(píng)估和預(yù)測(cè)模擬。
四是提升各相關(guān)組織的大數(shù)據(jù)分析應(yīng)用水平。加強(qiáng)政府、科研、智庫、企業(yè)、高校等組織中數(shù)據(jù)分析人員的交流培養(yǎng),提高經(jīng)濟(jì)領(lǐng)域大數(shù)據(jù)分析技術(shù)的創(chuàng)新應(yīng)用,建立普遍適用的動(dòng)態(tài)算法和模型,對(duì)研判準(zhǔn)確、實(shí)時(shí)有效的成果進(jìn)行獎(jiǎng)勵(lì)激勵(lì)。
(作者單位:內(nèi)蒙古自治區(qū)發(fā)展研究中心)
責(zé)任編輯:康偉