蔡真
摘要:2012年我國(guó)的統(tǒng)計(jì)工作會(huì)議中對(duì)“大數(shù)據(jù)時(shí)代”進(jìn)行了解讀,會(huì)議中指出“大數(shù)據(jù)時(shí)代”為我國(guó)的統(tǒng)計(jì)數(shù)據(jù)的生產(chǎn)方式帶來(lái)了挑戰(zhàn)。大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的大量增加使之成為統(tǒng)計(jì)工作的基礎(chǔ)性資源。大數(shù)據(jù)的有效管理和充分利用成為了我國(guó)統(tǒng)計(jì)工作發(fā)展的關(guān)鍵。本文筆者通過(guò)大數(shù)據(jù)背景對(duì)我國(guó)的經(jīng)濟(jì)和政府的相關(guān)統(tǒng)計(jì)工作的影響進(jìn)行論述,闡述了大數(shù)據(jù)背景下的統(tǒng)計(jì)發(fā)展的意見(jiàn)。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì);統(tǒng)計(jì)工作
中圖分類號(hào):C81 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2016)009-0000-01
前言
伴隨著我國(guó)經(jīng)濟(jì)水平的提高,計(jì)算機(jī)、網(wǎng)絡(luò)信息技術(shù)的不斷發(fā)展和高速普及。大數(shù)據(jù)時(shí)代的到來(lái),給世界的各個(gè)行業(yè)的統(tǒng)計(jì)工作帶來(lái)了挑戰(zhàn)。大數(shù)據(jù)時(shí)代的海量數(shù)據(jù)不僅數(shù)據(jù)類型和來(lái)源形式都區(qū)別于傳統(tǒng)統(tǒng)計(jì)工作中的數(shù)據(jù)類型和形式,而且其數(shù)據(jù)的新型模式也給世界的各行業(yè)的統(tǒng)計(jì)工作帶來(lái)了發(fā)展的機(jī)會(huì)。由此,本文筆者針對(duì)大數(shù)據(jù)時(shí)代對(duì)我國(guó)的統(tǒng)計(jì)工作帶來(lái)的影響,提出了相應(yīng)的意見(jiàn),并作出如下論述:
一、大數(shù)據(jù)的含義和特征
(一)大數(shù)據(jù)的含義
最早的IT行業(yè)的相關(guān)數(shù)據(jù)庫(kù)領(lǐng)域提出了有關(guān)大數(shù)據(jù)的相關(guān)概念,其認(rèn)為大數(shù)據(jù)是指其數(shù)據(jù)量的額度很大以及數(shù)據(jù)的來(lái)源形式和結(jié)構(gòu)都是多樣化的,其處理方式需要新型模式的處理系統(tǒng),才能使整個(gè)海量多樣化的數(shù)據(jù)信息資產(chǎn)具有強(qiáng)大的決策力和洞察力。從傳統(tǒng)的數(shù)據(jù)的分類來(lái)看,“大數(shù)據(jù)”是指大量的數(shù)據(jù)信息無(wú)法應(yīng)用傳統(tǒng)的工具和流程進(jìn)行處理和分析。到目前為止,還沒(méi)有權(quán)威的機(jī)構(gòu)對(duì)大數(shù)據(jù)進(jìn)行科學(xué)規(guī)范的定義,但是大數(shù)據(jù)時(shí)代的到來(lái)對(duì)社會(huì)的各個(gè)行業(yè)的統(tǒng)計(jì)工作和流程產(chǎn)生了強(qiáng)烈的沖擊。
(二)大數(shù)據(jù)的特征
1.數(shù)據(jù)的巨大容量
數(shù)據(jù)的級(jí)別發(fā)生跨級(jí),由TB級(jí)別直接升級(jí)到PB級(jí)別。大數(shù)據(jù)的海量的額度是傳統(tǒng)的統(tǒng)計(jì)容量不可比擬的。據(jù)相關(guān)的數(shù)據(jù)顯示,近幾年,世界的整體信息量的儲(chǔ)存的速度要快于世界經(jīng)濟(jì)的發(fā)展速度。計(jì)算機(jī)的信息數(shù)據(jù)的處理速度則快于世界的經(jīng)濟(jì)發(fā)展速度。
2.數(shù)據(jù)的多樣類型
數(shù)據(jù)的來(lái)源形式和數(shù)據(jù)結(jié)構(gòu)類型都具有多樣性。互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,網(wǎng)絡(luò)的普遍應(yīng)用,使網(wǎng)絡(luò)視頻和圖片等數(shù)據(jù)信息每天以高速的存儲(chǔ)速度進(jìn)行儲(chǔ)存,但是用戶無(wú)法全面有效應(yīng)用這些數(shù)據(jù)。
3.數(shù)據(jù)的價(jià)值的密度低
海量的數(shù)據(jù)其內(nèi)容量巨大,但其應(yīng)用的價(jià)值并不是全部的數(shù)據(jù)內(nèi)容,而是其中的一小部分,例如:公交車的車內(nèi)錄像,每天都進(jìn)行著了大量的信息記載,但是,車內(nèi)出現(xiàn)打鬧現(xiàn)象。其車內(nèi)錄像的相關(guān)視頻所提供的有價(jià)值的信息就是大量的視頻數(shù)據(jù)中的僅一兩秒與打鬧信息相關(guān)的數(shù)據(jù)內(nèi)容。
4.數(shù)據(jù)的處理速度快
大數(shù)據(jù)時(shí)代的數(shù)據(jù)處理挖掘技術(shù)與傳統(tǒng)的區(qū)別很大,其數(shù)據(jù)的來(lái)源和承載方式是不同的,例如:電腦、手機(jī)、互聯(lián)網(wǎng)等,這些載體的處理模式和方式與傳統(tǒng)的方式有很大程度的不同[1]。
二、大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)工作的影響
(一)大數(shù)據(jù)時(shí)代對(duì)經(jīng)濟(jì)統(tǒng)計(jì)的影響
首先,大數(shù)據(jù)時(shí)代的到來(lái),改變了數(shù)據(jù)的收集方式。傳統(tǒng)的數(shù)據(jù)收集方法是進(jìn)行普查、問(wèn)卷調(diào)查和抽樣調(diào)查等。面對(duì)當(dāng)今海量的數(shù)據(jù)形勢(shì),傳統(tǒng)的數(shù)據(jù)收集方法已經(jīng)無(wú)法滿足客戶對(duì)數(shù)據(jù)的收集速度和數(shù)量的要求。這就促使了數(shù)據(jù)的收集和處理方式的轉(zhuǎn)變。使數(shù)據(jù)的處理模式能夠適應(yīng)當(dāng)前的海量的數(shù)據(jù)形勢(shì)。其次,數(shù)據(jù)的分析模式發(fā)生了改變。傳統(tǒng)的數(shù)據(jù)在收集之后,進(jìn)行隨機(jī)的抽樣分析。大數(shù)據(jù)時(shí)代的來(lái)臨,抽樣的分析模式已經(jīng)無(wú)法適應(yīng)時(shí)代對(duì)數(shù)據(jù)的準(zhǔn)確性的要求。海量數(shù)據(jù)進(jìn)行分析的系統(tǒng)模式逐漸形成了全數(shù)據(jù)的分析模式,使其準(zhǔn)確性和時(shí)效性得到了很大的提高。最后,數(shù)據(jù)之間的因果關(guān)系淡化。傳統(tǒng)的少量數(shù)據(jù)中存在著明顯的因果關(guān)系,而大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)之間的因果關(guān)系淡化,需要用戶在進(jìn)行數(shù)據(jù)的分析時(shí)關(guān)注數(shù)據(jù)的相關(guān)的信息關(guān)系,從而實(shí)現(xiàn)數(shù)據(jù)的價(jià)值化[2]。
(二)大數(shù)據(jù)時(shí)代對(duì)政府統(tǒng)計(jì)的影響
1.擴(kuò)大了居民消費(fèi)價(jià)格調(diào)查統(tǒng)計(jì)的范圍
我國(guó)傳統(tǒng)的居民消費(fèi)價(jià)格(CPI)的調(diào)查主要進(jìn)行的是實(shí)體店,例如:超市、購(gòu)物中心等服務(wù)消費(fèi)場(chǎng)所的消費(fèi)價(jià)格的調(diào)查。由于,近幾年,網(wǎng)上購(gòu)物和電子商務(wù)的相繼產(chǎn)生和發(fā)展,居民的消費(fèi)渠道增多,使其市場(chǎng)價(jià)格的統(tǒng)計(jì)范圍擴(kuò)大。仍以傳統(tǒng)的統(tǒng)計(jì)模式則無(wú)法滿足當(dāng)前的發(fā)展形勢(shì)需要。傳統(tǒng)的CPI的統(tǒng)計(jì)數(shù)據(jù)具有一定的滯后性,采取新形式的大數(shù)據(jù)的技術(shù)能夠提高CPI統(tǒng)計(jì)數(shù)據(jù)的時(shí)效性和質(zhì)量。
2.改變了傳統(tǒng)的人口統(tǒng)計(jì)模式
我國(guó)的人口量一直居世界首位,傳統(tǒng)的人口普查是通過(guò)入戶調(diào)查、填寫(xiě)問(wèn)卷等形式進(jìn)行相關(guān)數(shù)據(jù)的儲(chǔ)存。近幾年,人口流動(dòng)的速度較大,其傳統(tǒng)的統(tǒng)計(jì)模式已經(jīng)無(wú)法滿足當(dāng)今社會(huì)人口流速快的要求。利用大數(shù)據(jù)統(tǒng)計(jì)模式,能夠高效的進(jìn)行全國(guó)的人口統(tǒng)計(jì)。
三、大數(shù)據(jù)背景下的統(tǒng)計(jì)發(fā)展的對(duì)策
(一)建立大數(shù)據(jù)統(tǒng)計(jì)科學(xué)的機(jī)構(gòu)體系
統(tǒng)計(jì)的相關(guān)部門依據(jù)互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,建立大數(shù)據(jù)在收集、整理和分析這三個(gè)步驟相對(duì)應(yīng)的科學(xué)系統(tǒng)的機(jī)構(gòu)體系。數(shù)據(jù)的收集要以建立大數(shù)據(jù)多樣結(jié)構(gòu)化的信息積累為基礎(chǔ),對(duì)數(shù)據(jù)內(nèi)容和數(shù)據(jù)間的關(guān)聯(lián)性和匹配性進(jìn)行整合和分析。使統(tǒng)計(jì)工作在大數(shù)據(jù)時(shí)代的背景下能夠更加的具有客觀性和權(quán)威性。
(二)建立統(tǒng)計(jì)信息資源的分享平臺(tái)
互聯(lián)網(wǎng)電子信息技術(shù)的高速發(fā)展,海量的信息數(shù)據(jù)在互聯(lián)網(wǎng)平臺(tái)進(jìn)行分享。但是,企業(yè)和政府之間的數(shù)據(jù)信息是沒(méi)有分享平臺(tái)的。大數(shù)據(jù)時(shí)代的到來(lái),要全方位的打破傳統(tǒng)的信息隔離狀態(tài),實(shí)現(xiàn)大數(shù)據(jù)時(shí)代的數(shù)據(jù)價(jià)值。政府機(jī)構(gòu)需要構(gòu)建可以進(jìn)行海量數(shù)據(jù)分享、存儲(chǔ)的安全平臺(tái),使全國(guó)跨地區(qū)和跨層級(jí)都可以在這個(gè)大數(shù)據(jù)的統(tǒng)計(jì)信息交流平臺(tái)進(jìn)行信息的傳送和整理,實(shí)現(xiàn)大數(shù)據(jù)時(shí)代海量數(shù)據(jù)的應(yīng)用性[3]。
四、結(jié)論
隨著全球互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)時(shí)代的悄然而至。為我國(guó)的統(tǒng)計(jì)工作的發(fā)展帶來(lái)了機(jī)遇和挑戰(zhàn)。我國(guó)要利用高速發(fā)展的電子信息技術(shù),構(gòu)建大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)數(shù)據(jù)信息的科學(xué)體系,促進(jìn)我國(guó)統(tǒng)計(jì)工作的高速發(fā)展。本文筆者希望通過(guò)對(duì)大數(shù)據(jù)背景下統(tǒng)計(jì)發(fā)展的相關(guān)內(nèi)容的論述,能為統(tǒng)計(jì)工作者提供借鑒。
參考文獻(xiàn):
[1]程開(kāi)明,莊燕杰.大數(shù)據(jù)背景下的統(tǒng)計(jì)——第十七次全國(guó)統(tǒng)計(jì)科學(xué)討論會(huì)綜述[J].統(tǒng)計(jì)研究,2014,08(01):106-112.
[2]李士猛,步倩.大數(shù)據(jù)背景下的統(tǒng)計(jì)探究[J].商場(chǎng)現(xiàn)代化,2014, 11(19):213.
[3]許琴.淺談大數(shù)據(jù)背景下的統(tǒng)計(jì)信息化建設(shè)策略[J].商場(chǎng)現(xiàn)代化,2015,09(11):287.