作者簡介:張偉(1987.09-),男,漢,山東,中國人民大學,研究方向:數據分析。
摘 要:文章通過闡述大數據及其目的,分析大數據與統計學的對比,對大數據對統計學的挑戰(zhàn)與機遇展開探討研究,旨在為相關人員基于大數據及其目的、大數據與統計學的對比的大數據對統計學的挑戰(zhàn)和機遇研究適用提供一些思路。
關鍵詞:大數據;統計學;挑戰(zhàn);機遇;營銷
引言
國際數據公司的相關研究指出,2011年全球數據生產量達1.8ZB,且全球信息總量每隔兩年增長一倍[1]。在大數據時代下,對于統計學發(fā)展而言,挑戰(zhàn)與機遇并存,挑戰(zhàn)指的是現階段傳統統計學相關方法難以適用大數據,機遇指的是基于統計學,大數據展開數據處理、分析,促使大數據具備可視化特性。由此可見,研究大數據對統計學的挑戰(zhàn)和機遇有著十分重要的現實意義。
1.大數據及其目的
現階段,關于大數據仍舊沒有一個十分明確的界定,大數據起初是源自于技術領域。在信息量不斷擴大的情況下,使得常規(guī)電腦原有存儲空間已不能對新處理數據進行承載,新興數據處理技術得以產生,好比雅虎的Hadoop平臺、谷歌的MapReduce等。此類技術能夠對僵化層次結構、一致性予以消除,促進數據無需通過常規(guī)數據庫表格進行排列,極大程度地提升了人們可處理的數據量[1]。
2.大數據與統計學的對比
2.1樣本統計與全樣本統計的區(qū)別
樣本統計屬于統計學不可或缺的依賴,樣本指的是結合相應的概率自總體中隨機篩選并視作總體代表的集合內容,值得一提的是隨機抽樣是需要成本的,包括社會關系、資金成本或者時間成本等?;跇颖緮盗刻嵘邢耷疤嵯?,樣本估計誤差會隨著總體數量增多而增大,這亦是樣本統計無法避免的不足。大數據時代下,龐大的數據信息應運而生,數據信息發(fā)展表現出總體即是樣本的態(tài)勢,該屬性很好的消除了樣本統計這一不足。大數據時代下的全樣本統計,通常情況下可對完全總體進行覆蓋,然而受大部分數據屬于半結構、半結構數據影響,使得概率論應用遭受一定的制約[2]。鑒于此,將全樣本統計應用到統計學中,應當就總體數據展開相應的歸納、篩選,即好比在樣本統計中展開數據預處理。
2.2預測分析與非預測分析的區(qū)別
統計學的創(chuàng)立,是為了對變量相互相關關系展開分析,因此獲取數據是發(fā)生于變量確定之后的,數據分析價值是能夠被預測的。相較于統計學的預測分析,龐大數據將互聯網、傳感器作為載體,存在于分析需求之前,因此構建于大數據上的分析多為非預測性分析。在統計學中,出現大數據無法有效應用局面,這是由于不具備非預測分析所需的龐大數據,龐大數據產生與數據中心、存儲系統存在緊密的聯系,并非短期產生。也就是說,統計學中大數據的應用發(fā)展,說明了非預測分析正逐步取代傳統統計學預測分析,數據多次利用正逐步取代傳統數據一次性利用的。
3.大數據對統計學的挑戰(zhàn)與機遇
3.1數據生產、處理與應用的轉變
相關統計部門經開展嚴格的統計設計工作,獲得相關的統計數據,數據的預處理分別有數據清洗、非全面數據填補以及數據矯正等。大數據時代下的統計手段尚不十分明確,自大數據流環(huán)境而言,要不斷探索新型抽樣方法,并確保抽樣方法的實時、連貫及可行性。除去傳統的統計分析方法,還應當開發(fā)大數據動態(tài)分析、數據流算法等[3]。
3.2大數據時代對市場營銷的機遇
3.2.1大數據營銷的特點與價值
大數據營銷的特點:I.數據采集多平臺化特點,即大數據時代下,大數據的數據大多來源于不同的領域、不同的渠道。II.時效性特點,隨著信息技術的急速發(fā)展,互聯網用戶消費、購物行為方式往往會瞬間出現轉變。國際先進大數據營銷企業(yè)AdTime基于此大數據營銷特點,采取了時間營銷措施,即采取相應的技術方式全面獲悉用戶所需,于第一時間對用戶當下的需求進行回應,以使用戶在下決心購買的最佳時間及時看到對應的產品廣告。III.個性化特點,在大數據時代下,廣告商傳統媒體導向的營銷理念逐步由受眾導向取代,現如今,廣告商可應用大數據了解用戶的地理方位,需求內容等信息,達到對用戶個性化營銷的目的。
大數據營銷的價值:I.升級營銷與用戶的匹配度,大數據營銷不僅可提供給企業(yè)了解用戶有效的途徑,還能夠于網絡環(huán)境下,選取相關技術方法達到對用戶精確定位的目的,從而開展好營銷工作,升級營銷與用戶的匹配度。II.改善用戶體驗,大數據營銷促使企業(yè)真正意義上認識到用戶及其所使用企業(yè)產品情況,以給予用戶最人性化的提醒。
3.2.2大數據營銷的應用
(1)與消費者建立緊密關系
現如今,我國一些企業(yè)營銷行為仍舊處于個性化定位信息、創(chuàng)意設計階段,而無法對不同消費者展開個性化的營銷活動。大數據時代下,經采用相關數據分析技術方法,基于對消費群體喜好、傳媒接觸習慣等展開有效的分析,達到特定營銷活動明確開展的目的,實現企業(yè)精心開展的營銷活動精準的輻射至目標消費群體處,與消費者建立緊密關系,極大的改善營銷效率、質量[4]。
(2)掌握競爭對手數據
企業(yè)通過對競爭對手數據的有效掌握,獲悉競爭對手發(fā)展狀況,基于此幫助企業(yè)制定科學合理的產品價格,提升企業(yè)產品市場競爭優(yōu)勢。與此同時,企業(yè)務必要全面實施以事實為前提的決策手段,廣泛地應用數據分析方式對企業(yè)每一個發(fā)展運營步驟進行優(yōu)化,經對企業(yè)一系列數據的充分優(yōu)化、對接,促使業(yè)務環(huán)節(jié)中潛在的價值得以被有效挖掘,降低生產成本,知己知彼,促使企業(yè)在日趨白熱化的市場競爭中占據有利位置。
(3)挖掘企業(yè)內部數據
“市場未動,數據先行”儼然轉變?yōu)閲H上企業(yè)有效運營發(fā)展的一致認識,為了提升企業(yè)管理效率,要求企業(yè)要充分挖掘企業(yè)內部數據,并展開有效的整合、分析,以為企業(yè)相關人員做決策提供有利的參考依據,提升決策準確性,促進企業(yè)可持續(xù)發(fā)展。
3.2.4 企業(yè)的應用案例——以亞馬遜為例
在應用大數據開展市場營銷方面,美國亞馬遜公司一直處于領先地位。亞馬遜研發(fā)出“用戶未下單,先發(fā)貨”功能,即結合用戶的購物需求數據信息,分析用戶想要購買的產品,達到用戶未下單,提前發(fā)貨的目的。此外,亞馬遜通過對用戶檢索信息的分析,評估流感的傳播,但這僅僅為海量檢索數據中的一項用途,相同的數據能夠應用于預測大選結果、預測某類產品市場行情等等,極大地降低了統計成本[5]。
3.3大數據時代對市場營銷的挑戰(zhàn)
3.3.1信息收集
大數據并非就是對數據信息展開盲目的收集,即便收集了再多的數據,倘若這些數據并非是市場營銷所需要的,如此便會導致前期收集來的數據信息,變成一堆“數據垃圾”。鑒于此,為了避免這一情況發(fā)生,務必要充分分析業(yè)務需求,再對自身存在價值的數據展開收集、歸納,如此方可實現大數據的有效收集應用。
3.3.2經驗與數據
數據采集完畢后,面對參差不齊的數據,還應當做好數據評估工作,評估對何種目標受眾開展市場營銷工作。鑒于此,要求采取科學合理的手段,將這些參差不齊的數據整合成可被市場營銷實踐應用的,經結合過去的經驗,與采集數據進行有機融合,實現對目標受眾的有效分析確定。
3.3.3分析與優(yōu)化
數據分析,一方面是實現數據優(yōu)化,一方面是進行決策層面上的調整、轉變。此環(huán)節(jié)對于專業(yè)人才的需求提出了嚴苛的挑戰(zhàn)。數據分析、數據優(yōu)化對于專業(yè)人才的知識框架要求大不相同,這要求相關企業(yè)不僅要培養(yǎng)專業(yè)的數據分析人才,還要打造數據優(yōu)化人才隊伍。
3.4大數據營銷的未來發(fā)展趨勢
信息技術不斷發(fā)展,單一媒體導向的“消費者碎片化”儼然無法達到企業(yè)對于數據多樣性的需求。大數據時代下,媒體的跨界融合實現對“碎片化”受眾的充分聚合。在科學技術技術不斷進步的背景下,跨媒介、跨平臺、跨終端的多途徑將不斷被開拓,將使龐大的數據信息獲取多維度的整合,并且在多樣化網絡環(huán)境下,消費者主觀信息與客觀數據有機融合,構筑全面用戶數據庫環(huán)節(jié),將成為未來大數據營銷發(fā)展的必然趨勢[6]。
4.結束語
總而言之,大數據為傳統統計學帶來了嚴峻的考驗,也為傳統統計學有效發(fā)展創(chuàng)造了良好的契機。在大數據時代發(fā)展潮流中,我們應當充分的認識到大數據對于傳統統計學而言,是補充而不是更替,構建于樣本統計、預測分析內容上的傳統統計學,仍舊于社會統計、經濟分析中占據著主導位置。大數據時代下,為了實現企業(yè)市場營銷的有效開展,相關人員務必要不斷專研研究、總結經驗,全面分析大數據與統計學的對比,充分認識大數據對統計學的挑戰(zhàn)和機遇,“與消費者建立緊密關系”、“掌握競爭對手數據”、“挖掘企業(yè)內部數據”等,積極促進企業(yè)市場營銷的科學合理化。
(作者單位:中國人民大學)
參考文獻:
[1] He Y,Geng Z.Active learning of causal networks with intervention experiments and optimal designs[J].J Machine Learning Research,2009,(09):2523-2547.
[2] 游士兵,張 佩,姚雪梅.大數據對統計學的挑戰(zhàn)和機遇[J].珞珈管理評論,2013,(02):165-171.
[3] Deng K,Geng Z,Lin J.Association Pattern Discovery via Theme Dictionary Models[J].To appear in J Royal Statist Soc B,2013,(2):162-163.
[4] 邱 東.大數據時代對統計學的挑戰(zhàn)[J].統計研究,2014,31(01):16-22.
[5] B.Zhu,L.Xu,D.Faries,et al.PMH83 Comparison of Total Health Care Costs Between Remitters and Non-Remitters for Schizophrenia Patients from a Prospective Longitudinal,Observational Study in the Presence of Missing Data[J].Value in Health,2012,15(4):162-163.
[6] 耿 直.大數據時代統計學面臨的機遇與挑戰(zhàn)[J].統計研究,2014,31(01):5-9.