吳文遠
摘要:本文分析了大數(shù)據(jù)的概念和大數(shù)據(jù)時代的特征,對大數(shù)據(jù)時代的數(shù)據(jù)分析理念進行了探討。筆者認為大數(shù)據(jù)時代數(shù)據(jù)分析需要結合統(tǒng)計學思想,創(chuàng)新數(shù)據(jù)分析理念,完善數(shù)據(jù)分析程序和方法,使其發(fā)揮出超越傳統(tǒng)統(tǒng)計分析不可比擬的優(yōu)勢。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;理念
互聯(lián)網(wǎng)信息技術已經(jīng)發(fā)展得相對成熟,并已經(jīng)漸漸深入到社會生活的各個領域之中,新時期人們已經(jīng)感受到數(shù)據(jù)信息的重要性和在生活之中的重要意義,可以說社會生活的方方面面都離不開信息技術的支持和支撐。與此同時,數(shù)據(jù)分析方法和數(shù)據(jù)運行方法都在不斷地更新和提升的過程中,大量數(shù)據(jù)已經(jīng)具備了較為先進和即時的處理方式。事實上,當前階段對海量數(shù)據(jù)中蘊含的知識實現(xiàn)深入分析已經(jīng)是比較現(xiàn)實的事情。大數(shù)據(jù)時代一方面影響著熱門的日常生活,另一方面則對自然科學和人文科學的創(chuàng)新與發(fā)展具有很強的推動作用。大數(shù)據(jù)分析在今后的社會發(fā)展中只會應用越來越廣泛,數(shù)據(jù)分析技術也會日益完善和改進。本文從大數(shù)據(jù)時代數(shù)據(jù)分析理念進行闡述,為數(shù)據(jù)分析穩(wěn)定發(fā)展帶來更為廣闊的機會。
一、大數(shù)據(jù)和大數(shù)據(jù)時代的基本概述
(一)大數(shù)據(jù)的概述
大數(shù)據(jù)概念成型于上世紀八十年代,最早是由美國學者提出的?,F(xiàn)今大數(shù)據(jù)的概念可以總結為:在信息技術和社會發(fā)展進程影響,數(shù)據(jù)信息量異常龐大的現(xiàn)狀,還囊括超越傳統(tǒng)數(shù)據(jù)處理方法的、能夠對海量信息數(shù)據(jù)有效處理的一種信息處理技術。信息化環(huán)境給大數(shù)據(jù)技術的應用提供了更為廣闊的平臺,這種廣闊性體現(xiàn)在其影響著社會生活的方方面面,在社會生產(chǎn)活動中產(chǎn)生至關重要的影響。大數(shù)據(jù)的本質不在于海量的數(shù)據(jù)信息資源,而在于對這些數(shù)據(jù)信息價值的哇局和處理,也就是說大數(shù)據(jù)最重要的意義在于推動相關產(chǎn)業(yè)的發(fā)展和進步。大數(shù)據(jù)的特征可以概括如下:第一,數(shù)據(jù)信息量極其龐大,并且具有越來越龐大的趨勢,數(shù)據(jù)非結構化特性明顯,并且已經(jīng)在大數(shù)據(jù)之中占據(jù)八成規(guī)模;第二,數(shù)據(jù)信息的形式和種類呈現(xiàn)出多樣化趨勢;第三,數(shù)據(jù)信息具有較高的價值密度和較大的商業(yè)價值;第四,信息處理速度非???。
(二)大數(shù)據(jù)時代的概述
大數(shù)據(jù)時代建立在大量數(shù)據(jù)信息的基礎上,是一種新型信息時代,大數(shù)據(jù)建立在物聯(lián)網(wǎng)技術、互聯(lián)網(wǎng)技術和預期相關的信息技術的基礎之上,最終形成處理分析大量數(shù)據(jù)、提升數(shù)據(jù)價值的綜合處理系統(tǒng)。大數(shù)據(jù)時代最根本的目的提升數(shù)據(jù)分析效率和數(shù)據(jù)應用價值,從而促進眾多領域和行業(yè)的變革,使得各個產(chǎn)業(yè)都獲得新的發(fā)展機遇,使得人們未來生活都發(fā)生天翻地覆的變革。
二、大數(shù)據(jù)時代下數(shù)據(jù)分析理念辨析
(一)與統(tǒng)計學理論相結合
如果僅僅依靠傳統(tǒng)的統(tǒng)計抽樣技術對大數(shù)據(jù)進行處理和分析,那么其知識密度將無法展示,數(shù)據(jù)分析也無法獲得準確的結果。筆者認為大數(shù)據(jù)分析要和統(tǒng)計學理論、統(tǒng)計學思維方式結合在一起,同時打破傳統(tǒng)統(tǒng)計分析對樣本的依賴,使得統(tǒng)計學工具能夠對所有的數(shù)據(jù)進行統(tǒng)計分析,使得研究數(shù)據(jù)能夠發(fā)揮出更高的研究價值和應用價值。大數(shù)據(jù)能夠對種類多樣的、形式混亂的數(shù)據(jù)進行分析,對數(shù)據(jù)形式的準確性要求較低,其可以利用統(tǒng)計學分析工具對數(shù)據(jù)變化的情況進行分析,使得相關的決策具有更高的參考價值。大數(shù)據(jù)對數(shù)據(jù)精度的要求也不高,其秉承的理念和原則是:具有誤差的數(shù)據(jù)更具有規(guī)律發(fā)現(xiàn)價值,便于對分析整體進行了解,能夠讓較為復雜的數(shù)據(jù)體現(xiàn)出更加真實的狀況。
(二)數(shù)據(jù)分析理念的應用
大數(shù)據(jù)時代下的數(shù)據(jù)分析是對大量數(shù)據(jù)進行歸類、統(tǒng)計和歸納、總結的過程,它可以將具有價值的信息提煉出來,數(shù)據(jù)分析提供了將處理后的數(shù)據(jù)和未經(jīng)處理的數(shù)據(jù)進行比較的機會。大數(shù)據(jù)是運用統(tǒng)計學思維進行統(tǒng)計分析,這和傳統(tǒng)抽樣分析挖掘出的信息和價值有著本質的區(qū)別。所以大數(shù)據(jù)在繼承統(tǒng)計學思維的基礎上摒棄了傳統(tǒng)統(tǒng)計分析的逼單,其數(shù)據(jù)收集和處理的方式可以通過更為廣泛的渠道開展。對于大部分大數(shù)據(jù)來說,數(shù)據(jù)分析是其蘊含的有效價值得以體現(xiàn)的重要環(huán)節(jié)。所以數(shù)據(jù)的積累和數(shù)據(jù)處理過程的細化是至關重要的。大數(shù)據(jù)下的數(shù)據(jù)具有較高的流動性,在時間的推移下積累的數(shù)據(jù)將會越來越多,數(shù)據(jù)的精簡和再生也具有重要的意義,這樣有價值的數(shù)據(jù)能夠得到增值,具有高度關聯(lián)的數(shù)據(jù)結合在一起,便于發(fā)現(xiàn)問題和解決問題。
(三)數(shù)據(jù)分析程序的完善和改進
新的時期對大數(shù)據(jù)的應用程度提出了更高的要求,傳統(tǒng)數(shù)據(jù)處理通過數(shù)據(jù)分析去解釋現(xiàn)象、預測發(fā)展趨勢,大數(shù)據(jù)的實際分析之中則通過變革統(tǒng)計思想和統(tǒng)計研究方法進行數(shù)據(jù)關系描述,力求通過多種方式進行數(shù)據(jù)分析,在大數(shù)據(jù)分析的過程中要根據(jù)數(shù)據(jù)實際情況進行數(shù)據(jù)處理,確保數(shù)據(jù)分析結果較高的精確度。大數(shù)據(jù)對傳統(tǒng)統(tǒng)計質量管理環(huán)節(jié)進行轉變,通過創(chuàng)建簡單的數(shù)據(jù)分析模型來在數(shù)據(jù)分析中發(fā)揮更大的作用。大數(shù)據(jù)時代帶來的數(shù)據(jù)量越來越大,其中潛藏的價值也會越來越大。鑒于大數(shù)據(jù)和各行各業(yè)的融合愈加深入,改善數(shù)據(jù)分析程序具有至關重要的意義,同時對數(shù)據(jù)處理能力提出了更高的要求。
三、結語
大數(shù)據(jù)的廣泛應用已經(jīng)勢在必行,在海量數(shù)據(jù)中擁有的信息量決定了對社會各行各業(yè)預測的準確性。目前我們面臨著這樣的一種形勢:大數(shù)據(jù)處理過程會隨著數(shù)據(jù)的積累而不斷增加難度,數(shù)據(jù)的不斷積累也會影響數(shù)據(jù)的處理效率。信息化時代下,數(shù)據(jù)處理技術將會不斷更新和發(fā)展,統(tǒng)計工具也會不斷改進越升級,人們處理大數(shù)據(jù)的能力將會更加完善,挖掘出的數(shù)據(jù)信息將會更加具有實用價值,大數(shù)據(jù)在提升決策準確性上具有更大的支持力量。
總而言之,大數(shù)據(jù)集合了非結構化的海量數(shù)據(jù),數(shù)據(jù)知識量激增,數(shù)據(jù)管理工作難度大幅度提升,大數(shù)據(jù)時代下數(shù)據(jù)庫技術在不斷優(yōu)化、知識挖掘能力不斷提升,人們在挖掘大數(shù)據(jù)內(nèi)部信息的過程中積累了更加優(yōu)秀的能力,使得決策具有更高的科學性和合理性。
參考文獻:
[1]王惠.大數(shù)據(jù)時代下數(shù)據(jù)分析理念研究[J].中國市場,2015,22:74-85.
[2]陳俊茹.大數(shù)據(jù)時代下通信技術與數(shù)據(jù)分析理念的辨析[J].通訊世界,2015,19:16.
[3]張海健.大數(shù)據(jù)時代下數(shù)據(jù)分析理念探究[J].文理導航(中旬),2016,08:74.