李偉
摘要:隨著多媒體技術(shù)的發(fā)展,網(wǎng)絡(luò)信息也漸漸豐富起來(lái),大數(shù)據(jù)因其數(shù)據(jù)信息規(guī)模較大、結(jié)構(gòu)復(fù)雜,受到各個(gè)國(guó)家廣泛的關(guān)注。并且大數(shù)據(jù)與統(tǒng)計(jì)工作之間存在多方面的聯(lián)系大數(shù)據(jù)時(shí)代的出現(xiàn)給統(tǒng)計(jì)新思維也提出很多要求。本文就大數(shù)據(jù)與統(tǒng)計(jì)新思維方式的進(jìn)行分析,深入探討統(tǒng)計(jì)思維的變化及創(chuàng)新大數(shù)據(jù)的收集方式,以期提升大數(shù)據(jù)分析數(shù)據(jù)的效率。
關(guān)鍵詞:大數(shù)據(jù) 統(tǒng)計(jì)新數(shù)據(jù) 分析
隨著信息時(shí)代的發(fā)展,大數(shù)據(jù)發(fā)展的速度變得越來(lái)越快,漸漸改變著公眾通過(guò)統(tǒng)計(jì)知識(shí)去探索世界的方法。在以往的統(tǒng)計(jì)學(xué)分析中,所使用的數(shù)據(jù)一般都是樣本數(shù)據(jù),即現(xiàn)在的大數(shù)據(jù)。大數(shù)據(jù)的數(shù)據(jù)規(guī)模非常廣泛,數(shù)據(jù)的類(lèi)型非常多,并且更新的速度較快。大數(shù)據(jù)與樣本數(shù)據(jù)相比,其數(shù)據(jù)量較廣,因此,有利于研究人員從多方面統(tǒng)計(jì)及分析數(shù)據(jù)。在統(tǒng)計(jì)學(xué)分析中,研究者所研究的對(duì)象沒(méi)有更改,但數(shù)據(jù)的來(lái)源卻有了相應(yīng)的變化,比以往的更加完善,相關(guān)的統(tǒng)計(jì)思維方式也有很大的變化。
一、統(tǒng)計(jì)思維的變化
(一)認(rèn)識(shí)數(shù)據(jù)思維
首先,從數(shù)據(jù)來(lái)源方面看,以往的樣本數(shù)據(jù)是根據(jù)某種方式來(lái)進(jìn)行收集,但大數(shù)據(jù)主要是來(lái)源于網(wǎng)絡(luò),數(shù)據(jù)庫(kù)內(nèi)的信息可被記錄下來(lái),不帶有目的性。因此,對(duì)于大數(shù)據(jù)的來(lái)源難以追溯。其次,大部分的樣本數(shù)據(jù)的類(lèi)型都屬于結(jié)構(gòu)型,而大數(shù)據(jù)的類(lèi)型屬于半結(jié)構(gòu)、非結(jié)構(gòu)及異構(gòu)型。最后,以往的樣本數(shù)據(jù)可依靠相關(guān)的理論基礎(chǔ),對(duì)一些結(jié)構(gòu)型的數(shù)據(jù)實(shí)施量化處理,但大數(shù)據(jù)的數(shù)據(jù)類(lèi)型較為復(fù)雜,量化的方式也需要有所更改。
(二)收集數(shù)據(jù)的思維要變化
收集與統(tǒng)計(jì)數(shù)據(jù)的思維是確定數(shù)據(jù)統(tǒng)計(jì)分析的目的,之后再根據(jù)所需的數(shù)據(jù)進(jìn)行收集,因此,要仔細(xì)分析相應(yīng)的調(diào)查方案,嚴(yán)格按照規(guī)定來(lái)執(zhí)行各個(gè)流程。
(三)分析數(shù)據(jù)的思維
第一,以往的統(tǒng)計(jì)思維分析,主要是根據(jù)“定性--定量--再定性”的過(guò)程進(jìn)行,定性的目的是為了確定進(jìn)行定量分析的方向,根據(jù)相關(guān)經(jīng)驗(yàn)來(lái)判斷,這在數(shù)據(jù)缺失及運(yùn)算受限的情況之下顯得非常重要。目前主要是依靠數(shù)據(jù)的分析來(lái)做判斷,因此,主要要找到定量回應(yīng),這對(duì)于儲(chǔ)存能力、分析技術(shù)的速度不斷提升的今天,探測(cè)定量回應(yīng)的工作,主要是在定量回應(yīng)當(dāng)中來(lái)尋找真實(shí)及重要的數(shù)量管理,進(jìn)而得出可作為數(shù)據(jù)判斷或者是決策的結(jié)論。
第二,以往的統(tǒng)計(jì)思維實(shí)證分析,要先按照數(shù)據(jù)研究的目的,做出相應(yīng)的假設(shè),然后再通過(guò)收集和分析數(shù)據(jù),驗(yàn)證該項(xiàng)假設(shè)是否成立,分析的思路主要是按照“假設(shè)--驗(yàn)證”的過(guò)程來(lái)進(jìn)行,但是這種形式的驗(yàn)證經(jīng)常會(huì)受到假設(shè)條件的限制,造成很多指標(biāo)選擇不當(dāng)或者是缺失數(shù)據(jù),最后沒(méi)能得出結(jié)論。第三,以往的統(tǒng)計(jì)思維推斷分析,根據(jù)分布理論,以一定概率作為保障,按照樣本數(shù)據(jù)的特征來(lái)推斷出總體的特征,邏輯關(guān)系為“分布理論--概率保證--總體推斷”,而推斷評(píng)判的標(biāo)準(zhǔn)和樣本沒(méi)有關(guān)系,但是推斷結(jié)果正確與否直接取決定于基本樣本的好壞。
二、積極應(yīng)對(duì)大數(shù)據(jù)
(一)改變對(duì)不確定性的認(rèn)識(shí)
統(tǒng)計(jì)學(xué)出現(xiàn)的目的主要是研究與認(rèn)識(shí)事物發(fā)生的不確定性,因?yàn)椴还苁亲匀贿€是社會(huì)的經(jīng)濟(jì)現(xiàn)象,隨時(shí)都會(huì)由于個(gè)體間的差異而造成不確定性,想要研究與分析不確定性,就要先收集大量的數(shù)據(jù)信息,在只可以實(shí)行抽樣檢測(cè)的情況之下,不確定性主要表現(xiàn)在獲取樣本、推斷總體以及建設(shè)模型等方面。對(duì)大數(shù)據(jù)依然存在相應(yīng)的個(gè)體差異,而區(qū)別就只在于其包含了所有的個(gè)體,并不是隨機(jī)獲取的樣本。
(二)融合統(tǒng)計(jì)技術(shù)與云計(jì)算技術(shù)
盡管當(dāng)前收集與分析數(shù)據(jù)信息的統(tǒng)計(jì)技術(shù)已逐漸成熟,但在面對(duì)規(guī)模較大的大數(shù)據(jù),也存在一定的困難,這對(duì)數(shù)據(jù)信息的計(jì)算能力來(lái)說(shuō)是一個(gè)挑戰(zhàn)。因此,需要充分使用現(xiàn)代化的信息技術(shù),并借助相應(yīng)的云計(jì)算技術(shù),把其與統(tǒng)計(jì)技術(shù)相互融合,來(lái)處理相關(guān)的數(shù)據(jù)。并且大數(shù)據(jù)的數(shù)據(jù)量較大,形式復(fù)雜多樣,必須要現(xiàn)從數(shù)據(jù)本身切入,并結(jié)合大數(shù)據(jù)的相關(guān)特點(diǎn),仔細(xì)查看數(shù)據(jù)的變化情況,不斷創(chuàng)新大數(shù)據(jù)的梳理及分類(lèi)的方法,只有不斷創(chuàng)新技術(shù)才可以適應(yīng)當(dāng)前大數(shù)據(jù)對(duì)技術(shù)的需求。
(三)創(chuàng)新樣本采樣的方式
對(duì)于小數(shù)據(jù)時(shí)代而言,主要是按照研究的目的進(jìn)行數(shù)據(jù)采樣,屬于收集數(shù)據(jù)的一種方式。雖然數(shù)據(jù)樣本在總體樣本中只占據(jù)較小的部分,但按照采樣的科學(xué)理論,科學(xué)的進(jìn)行采樣可保證數(shù)據(jù)信息的可靠性。系統(tǒng)采樣的信息量有一定的限制,難以滿(mǎn)足信息化社會(huì)發(fā)展的需求,但從目前的成本與效率方面來(lái)考慮,以往的數(shù)據(jù)采樣調(diào)查方式依然被廣泛應(yīng)用。
(四)因果關(guān)系和相關(guān)關(guān)系
因果關(guān)系通常都來(lái)源于經(jīng)驗(yàn),但隨著大數(shù)據(jù)時(shí)代的到來(lái),就直接推翻了這一論斷。在大數(shù)據(jù)時(shí)代環(huán)境之下,并不需要了解其發(fā)展的原因,它的主要核心是建立在相關(guān)關(guān)系之上,進(jìn)而可以科學(xué)地預(yù)測(cè)未來(lái)事物的發(fā)展方向。但分析事物發(fā)生的因果關(guān)系,一直都是人們探索未知世界的一個(gè)使命。即在大數(shù)據(jù)時(shí)代下,人們只是了解事物發(fā)展的因果關(guān)系遠(yuǎn)遠(yuǎn)不夠,還應(yīng)充分了解事物間存在的相關(guān)關(guān)系,只有知道因果關(guān)系,才可以有效地使用相關(guān)關(guān)系,進(jìn)而協(xié)助研究人員作出科學(xué)的決策。
三、結(jié)束語(yǔ)
總而言之,隨著大數(shù)據(jù)時(shí)代的發(fā)展,對(duì)各個(gè)領(lǐng)域的發(fā)展都帶來(lái)了很大的影響在大數(shù)據(jù)特征的影響之下,統(tǒng)計(jì)學(xué)分析也漸漸轉(zhuǎn)變了單一的思維,而是以一種全新的態(tài)度來(lái)分析大數(shù)據(jù)所帶來(lái)的便利,使用新思維來(lái)認(rèn)識(shí)、分析及處理大數(shù)據(jù)中出現(xiàn)的問(wèn)題,并不斷轉(zhuǎn)變大數(shù)據(jù)統(tǒng)計(jì)學(xué)的分析方式,充分利用大數(shù)據(jù)的優(yōu)勢(shì),進(jìn)而為決策人員提供一些有效及可靠的決策選擇。
參考文獻(xiàn):
[1]柴世琿.試論大數(shù)據(jù)統(tǒng)計(jì)的新思維[J].中國(guó)高新技術(shù)企業(yè),2015,15
[2]喬紅.現(xiàn)代統(tǒng)計(jì)中新思維、新方法的應(yīng)用[J].現(xiàn)代商業(yè),2015,36
[3]劉軍華.大數(shù)據(jù)視野下統(tǒng)計(jì)數(shù)據(jù)質(zhì)量演變的信息回歸、分布與趨勢(shì)[J].統(tǒng)計(jì)與信息論壇,2015,149