王善英
摘要:伴隨信息技術(shù)不斷發(fā)展,大數(shù)據(jù)時代全面來臨,為經(jīng)濟(jì)普查工作提供了更多的應(yīng)用工具和方法,進(jìn)一步的促使了經(jīng)濟(jì)普查工作能效的全面提升。一方面隨著經(jīng)濟(jì)總量提升,龐大的數(shù)據(jù)對經(jīng)濟(jì)普查工作帶來了前所未有的巨大挑戰(zhàn),另一方面大數(shù)據(jù)的應(yīng)用對經(jīng)濟(jì)普查又提供了龐大動力。本文就針對大數(shù)據(jù)在經(jīng)濟(jì)普查中的應(yīng)用展開研究與探討。
關(guān)鍵詞:大數(shù)據(jù) 經(jīng)濟(jì)普查 應(yīng)用
引言:
近些年來,隨著經(jīng)濟(jì)總量不斷提升和經(jīng)濟(jì)結(jié)構(gòu)的不斷優(yōu)化,經(jīng)濟(jì)普查顯得尤其重要。經(jīng)濟(jì)普查能夠?qū)ξ覈?jīng)濟(jì)結(jié)果、特征以及變化進(jìn)行實時記錄,為各種政策的有效制定提供依據(jù)。隨著我國進(jìn)入大數(shù)據(jù)時代,經(jīng)濟(jì)普查面臨著艱巨的挑戰(zhàn),我們需要對數(shù)據(jù)挖掘方法和工具展開研究,讓經(jīng)濟(jì)普查能夠高效、準(zhǔn)確推進(jìn)。如何使經(jīng)濟(jì)普查工作與“大數(shù)據(jù)”有機(jī)的融合,推進(jìn)經(jīng)濟(jì)普查大數(shù)據(jù)化的革新,改進(jìn)經(jīng)濟(jì)普查方式、促進(jìn)經(jīng)濟(jì)普查手段變革、拓展統(tǒng)計數(shù)據(jù)采集渠道,優(yōu)化統(tǒng)計服務(wù)方式,促進(jìn)經(jīng)濟(jì)普查工作更加科學(xué)、規(guī)范、系統(tǒng)具有重大的現(xiàn)實意義。
一、從統(tǒng)計學(xué)角度對大數(shù)據(jù)的理解
信息社會中的數(shù)據(jù)越來越重要,大數(shù)據(jù)的發(fā)展為經(jīng)濟(jì)普查提供了先進(jìn)的方法和手段。從統(tǒng)計學(xué)角度理解大數(shù)據(jù)有以下幾個維度。
第一,大數(shù)據(jù)是利用各種統(tǒng)計軟件自動生成,屬于非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。而統(tǒng)計數(shù)據(jù)主要是通過常規(guī)統(tǒng)計報表收集的統(tǒng)計數(shù)據(jù),或是從普查對象中搜集得到的普查數(shù)據(jù),如人口普查、農(nóng)業(yè)普查、經(jīng)濟(jì)普查,這些數(shù)據(jù)大多為結(jié)構(gòu)性化數(shù)據(jù)。
第二,大數(shù)據(jù)是從所有混雜數(shù)據(jù)中關(guān)注普遍意義的相關(guān)性關(guān)系,發(fā)現(xiàn)事物潛在規(guī)律,從海量數(shù)據(jù)中挖掘含有特殊關(guān)系的信息。
第三,大數(shù)據(jù)與傳統(tǒng)統(tǒng)計數(shù)據(jù)的區(qū)別在于大數(shù)據(jù)是采用現(xiàn)代信息技術(shù)和架構(gòu)高速處理手段,收集對自己有用有價值的數(shù)據(jù),輸入到統(tǒng)計分析模型或統(tǒng)計調(diào)查相關(guān)系統(tǒng)中,直接導(dǎo)向我們想要的結(jié)果,直接服務(wù)于統(tǒng)計調(diào)查各項工作。
二、經(jīng)濟(jì)普查結(jié)合大數(shù)據(jù)技術(shù)的意義
在大數(shù)據(jù)時代背景下,經(jīng)濟(jì)普查方式發(fā)生了較大的變化,數(shù)據(jù)的來源發(fā)生了較大的變化。傳統(tǒng)經(jīng)濟(jì)普查數(shù)據(jù)來源主要是依靠普查獲取,而普查則存在費力費時,數(shù)據(jù)更新慢,結(jié)果存在滯后性等特點,影響了經(jīng)濟(jì)普查工作的開展。而在大數(shù)據(jù)技術(shù)下,統(tǒng)計數(shù)據(jù)的方式發(fā)生了較大的變化,依靠信息技術(shù)、云計算技術(shù)進(jìn)行數(shù)據(jù)采集,不僅增加了數(shù)據(jù)采集的準(zhǔn)確性,而且增強(qiáng)了對數(shù)據(jù)有效處理的能力。大數(shù)據(jù)技術(shù)下,經(jīng)濟(jì)普查數(shù)據(jù)主要來源于兩大方面。一是網(wǎng)絡(luò)平臺數(shù)據(jù)。政府依靠互聯(lián)網(wǎng)平臺,可以快速有效地獲取大量信息,站在制高點進(jìn)行宏觀調(diào)控,為社會管理提供大量有效的數(shù)據(jù)信息[1],為經(jīng)濟(jì)決策提供有效的數(shù)據(jù)信息。另一方面,通過遙感技術(shù)獲得準(zhǔn)確的數(shù)據(jù)。衛(wèi)星遙感技術(shù)作為一種現(xiàn)代化測量手段,主要以全球定位系統(tǒng)與信息系統(tǒng)為基礎(chǔ),可以根據(jù)調(diào)查對象,對不同的衛(wèi)星遙感信息進(jìn)行加載,再經(jīng)過計算機(jī)處理,得到需要的全部數(shù)據(jù),保證經(jīng)濟(jì)普查工作的順利開展。
三、合理選擇數(shù)據(jù)挖掘技術(shù)
大數(shù)據(jù)時代開展經(jīng)濟(jì)普查數(shù)據(jù)分析,應(yīng)當(dāng)在把握經(jīng)濟(jì)普查工作整體要求的基礎(chǔ)上,從構(gòu)建相應(yīng)的分析體系、選擇科學(xué)的經(jīng)濟(jì)普查數(shù)據(jù)挖掘技術(shù)或方法及加強(qiáng)經(jīng)濟(jì)普查數(shù)據(jù)科學(xué)系統(tǒng)管理等方面進(jìn)行全面考慮,才能更好地將大數(shù)據(jù)技術(shù)和經(jīng)濟(jì)普查數(shù)據(jù)分析工作有效融合起來,提高整體分析成效[2]。
目前在經(jīng)濟(jì)普查數(shù)據(jù)分析方面有很多比較常用的現(xiàn)代化分析方法,在開展具體應(yīng)用過程中需要考慮現(xiàn)實需要,有針對性地選擇具體的挖掘技術(shù),才能提高分析效率。目前比較常用的數(shù)據(jù)挖掘技術(shù)主要有以下幾種。
一是 SAS 統(tǒng)計分析技術(shù)。SAS 分析軟件主要是借助相關(guān)的軟件模組,可以實現(xiàn)數(shù)據(jù)的訪問、管理、顯示、分析四個方面的服務(wù),并且還可以進(jìn)行服務(wù)和功能拓展,通過形成相關(guān)的統(tǒng)計函數(shù)等,根據(jù)用戶需求進(jìn)行深度統(tǒng)計分析,并通過直觀的形式展現(xiàn),便于數(shù)據(jù)分析人員進(jìn)行深度理解和應(yīng)用研究。
二是 SQL Server 2000 Analysis Services 軟件。該技術(shù)是一種基礎(chǔ)的數(shù)據(jù)庫及數(shù)據(jù)分析軟件,可以提供電子數(shù)據(jù)倉庫,從而更好地實現(xiàn)數(shù)據(jù)的快速整合和分析,同時還具有良好的業(yè)務(wù)拓展性,使用比較方便,設(shè)計功能比較強(qiáng)大,性能良好,為用戶應(yīng)用提供了很大便利。
三是 Intelligent Miner 技術(shù)。該技術(shù)是多種統(tǒng)計與挖掘算法的有效融合,既可以對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,還可以對半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,在發(fā)現(xiàn)關(guān)聯(lián)、自動生成典型數(shù)據(jù)集、發(fā)現(xiàn)序列規(guī)律、可視化呈現(xiàn)等方面都有強(qiáng)大的功能,這樣可以實現(xiàn)從數(shù)據(jù)采集到轉(zhuǎn)換、挖掘及深度處理等方面的一體化應(yīng)用。
四是決策樹技術(shù)。決策樹主要是通過借助決策點、狀態(tài)點、結(jié)果點三個體系讓使用者對事件發(fā)生概率進(jìn)行掌握,進(jìn)而以此為基礎(chǔ)進(jìn)行決策參考的一種數(shù)據(jù)分析模式。
五是 Clementine 數(shù)據(jù)挖掘平臺。該技術(shù)主要是通過構(gòu)建具有一定預(yù)測能力的模型,進(jìn)而改進(jìn)具體決策方法和過程,提高數(shù)據(jù)整體挖掘能力。
四、大數(shù)據(jù)在經(jīng)濟(jì)普查工作中的機(jī)遇與挑戰(zhàn)
大數(shù)據(jù)很大程度上使得傳統(tǒng)的經(jīng)濟(jì)普查時空單位得以擴(kuò)大,能夠為經(jīng)濟(jì)普查工作提供可靠的數(shù)據(jù)資料。采用新的技術(shù)手段完成數(shù)據(jù)的收集與深度挖掘過程,這個過程可以很大程度上減少統(tǒng)計調(diào)查的負(fù)荷,尤其是減少了對應(yīng)表格填寫和數(shù)據(jù)整理的中間過程,很大程度上強(qiáng)化了經(jīng)濟(jì)普查工作效率。大數(shù)據(jù)的運用過程中需要強(qiáng)大的軟件與硬件設(shè)備作為支撐,以此來提升海量數(shù)據(jù)的挖掘與分析能力,并采用合理的工具和高效的方法,將這些數(shù)據(jù)信息完全的轉(zhuǎn)換為具有高價值的統(tǒng)計數(shù)據(jù)信息,保證在其中能夠發(fā)掘出更具有價值的信息,從而進(jìn)一步的提高大數(shù)據(jù)時代下的數(shù)據(jù)信息的有效利用率。
參考文獻(xiàn):
[1]劉從容,劉顯鋒,李江濱.大數(shù)據(jù)時代政府統(tǒng)計方法創(chuàng)新研究[J].統(tǒng)計與咨詢 ,2018(2):17-20.
[2]朱建平,章貴軍,劉曉葳.大數(shù)據(jù)時代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計研究,2014(2):10- 19.