王靜寧 底慧萍
【摘要】隨著信息技術(shù)的快速發(fā)展,海量的數(shù)據(jù)已經(jīng)成為企業(yè)資源的另一種財富形式。大數(shù)據(jù)技術(shù)迅速的進入到社會的各行各業(yè),從而影響著人們的學習、工作、生活以及社會的發(fā)展。大數(shù)據(jù)技術(shù)的應(yīng)用范圍越來越廣,從產(chǎn)品的設(shè)計生產(chǎn)到市場營銷的策劃,從產(chǎn)品市場銷量預(yù)測到企業(yè)決策支持,從產(chǎn)品生產(chǎn)效率提升到企業(yè)內(nèi)部運營管理。本文主要闡述了大數(shù)據(jù)技術(shù)背景下,我們面對海量數(shù)據(jù)應(yīng)具有的大數(shù)據(jù)思維模式。
【關(guān)鍵詞】大數(shù)據(jù);思維模式;分析
前言:近年來,信息技術(shù)展現(xiàn)出前所未有的發(fā)展速度,以互聯(lián)網(wǎng)+、物聯(lián)網(wǎng)等為代表的新技術(shù)應(yīng)運而生,促使手機、平板電腦、PC等各式各樣的信息傳感器隨處可見,由此虛擬網(wǎng)絡(luò)得到快速發(fā)展,使得現(xiàn)實世界快速被虛擬化,數(shù)據(jù)的來源及其數(shù)量正以冪指數(shù)速度增長。“大數(shù)據(jù)”一詞撲面而來,許多IT人熱衷于大數(shù)據(jù)技術(shù)但又存在思維方面的困惑。究其原因,一是對于沒有從事大數(shù)據(jù)行業(yè)的人來說,認識只停留在表象;二是在工作和生活環(huán)境中真正能參與實踐大數(shù)據(jù)的案例實在太少了,所以人們難以做到具有大數(shù)據(jù)的思維理念。
1. 大數(shù)據(jù)概述
大數(shù)據(jù)本身是一個抽象的概念。業(yè)界將大數(shù)據(jù)的特征歸納為4個“V”,分別是:第一個“V”(Volume),數(shù)據(jù)量巨大,大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二個“V”(Variety),數(shù)據(jù)類型繁多,比如,網(wǎng)絡(luò)日志、視頻、圖片、點擊率、郵件、即時消息等;第三個“V”(Value),數(shù)據(jù)價值密度低,商業(yè)價值高,現(xiàn)在許多專家已經(jīng)將大數(shù)據(jù)等同于黃金和石油;第四個“V”(Velocity),數(shù)據(jù)的產(chǎn)生、處理和分析的速度快。
2. 大數(shù)據(jù)的產(chǎn)生與作用
大數(shù)據(jù)是信息通信技術(shù)發(fā)展至今,按照自身技術(shù)發(fā)展邏輯,通過信息感知和采集終端為我們采集了海量的數(shù)據(jù)。我們要為多樣化的大數(shù)據(jù)提供存儲和運算平臺。通過不同來源的數(shù)據(jù)管理、處理、分析與優(yōu)化,將結(jié)果反饋到應(yīng)用中。比如,在商業(yè)領(lǐng)域,大數(shù)據(jù)可以為商家制定精確而有效的營銷策略,幫助商家為消費者提供更加及時和個性化的服務(wù);在醫(yī)療領(lǐng)域,大數(shù)據(jù)可以提高醫(yī)生診斷的準確性和藥物使用的有效性;在公共事業(yè)領(lǐng)域,大數(shù)據(jù)在促進經(jīng)濟發(fā)展、維護社會穩(wěn)定等方面起到了重要作用。
3. 大數(shù)據(jù)思維模式分析
在大數(shù)據(jù)時代已經(jīng)到來的時候要用大數(shù)據(jù)思維去發(fā)掘大數(shù)據(jù)的潛在價值,本文將從以下幾個方面分析大數(shù)據(jù)思維模式:
3.1 從計算科學范式到數(shù)據(jù)密集型科學發(fā)現(xiàn)范式
近年來,人類采集數(shù)據(jù)量的爆炸性增長,傳統(tǒng)的計算科學范式已經(jīng)越來越無力駕馭海量的科研數(shù)據(jù)了。例如歐洲的大型粒子對撞機,天文領(lǐng)域的Pan-STARRS望遠鏡每天產(chǎn)生的數(shù)據(jù)多達幾千萬億(PB)。很明顯,這些數(shù)據(jù)已經(jīng)突破了傳統(tǒng)的計算科學范式的處理極限,無法被科學家有效利用。這時我們將使用數(shù)據(jù)密集型科學發(fā)現(xiàn)范式來解決這一問題。它的主要特點是研究人員只需要從大數(shù)據(jù)中查找和挖掘所需要的信息,無須直接面對所研究的對象。例如,在大數(shù)據(jù)時代,天文學家的主要研究任務(wù)從海量數(shù)據(jù)庫中發(fā)現(xiàn)所需的物體或現(xiàn)象的照片,而不再需要親自去太空進行拍照。
3.2 從企業(yè)的數(shù)據(jù)資源到企業(yè)數(shù)據(jù)資產(chǎn)
在大數(shù)據(jù)時代,對企業(yè)來說,數(shù)據(jù)不僅僅是“資源”,更是企業(yè)的“資產(chǎn)”。當然只有能夠利用數(shù)據(jù)、組合數(shù)據(jù)、轉(zhuǎn)化數(shù)據(jù)的企業(yè)才能將手中的數(shù)據(jù)資源轉(zhuǎn)化為數(shù)據(jù)資產(chǎn)。目前,作為企業(yè)數(shù)據(jù)資產(chǎn)先行者的知名IT企業(yè),如蘋果、谷歌、IBM、阿里、騰訊、百度等,無不想盡一切方法,挖掘多種形態(tài)的設(shè)備及軟件功能,從而收集各種類型的海量數(shù)據(jù),提取有價值的信息,來發(fā)揮大數(shù)據(jù)的商業(yè)價值。
3.3 從統(tǒng)計學到數(shù)據(jù)科學
在傳統(tǒng)科學中,數(shù)據(jù)分析主要以數(shù)學和統(tǒng)計學為直接理論依據(jù)。但是,大數(shù)據(jù)的處理不能依賴傳統(tǒng)科學的處理方式。我們需要四個方面的思維改變:①以前我們通常把隨機采樣看成是理所應(yīng)當?shù)姆椒ǎ钦嬲拇髷?shù)據(jù)時代是指不用隨機分析這樣的捷徑,而是通過觀察所有數(shù)據(jù),來尋找異常值進行分析。②數(shù)據(jù)量的大幅增加會造成一些錯誤的數(shù)據(jù)混進數(shù)據(jù)集。但是,正因為我們掌握了幾乎所有的數(shù)據(jù),所以我們不再擔心某個數(shù)據(jù)對整體分析結(jié)果的影響。我們要做的就是要接受這些“問題”數(shù)據(jù),而不是以高昂的代價消除所有的“問題”數(shù)據(jù)。③我們不再需要對一個現(xiàn)象探究到底,只要掌握了事物發(fā)展的大體方向,適當忽略微觀層面上的精確度,會讓我們在宏觀層面上擁有更好的把控。④我們要重視相關(guān)分析,而不僅僅是因果分析。也就是我們不必非得知道現(xiàn)象背后的原因,而是讓數(shù)據(jù)自已發(fā)聲。知道結(jié)論是什么就夠了,沒必要知道為什么會產(chǎn)生這樣的結(jié)論。例如,我們只需知道用戶對什么感興趣即可,沒必要去研究用戶為什么感興趣。
3.4 從復(fù)雜算法到簡單算法
足夠的數(shù)據(jù)使我們變量更加聰明。在大數(shù)據(jù)時代,復(fù)雜的“智能問題”變成了簡單的“數(shù)據(jù)問題”。我們可以對大數(shù)據(jù)進行簡單查詢便能達到“基于復(fù)雜算法的智能計算的效果”。例如,Google在翻譯時就改變了“實現(xiàn)策略”,不再使用復(fù)雜算法進行語言的翻譯,而是通過對他們之前收集的跨語言語料庫進行簡單查詢,來找出合適的結(jié)果。通過這一方式提升了機器翻譯的效果及效率,提升了用戶滿意度。
3.5 從業(yè)務(wù)數(shù)據(jù)化到數(shù)據(jù)業(yè)務(wù)化
企業(yè)不僅是把業(yè)務(wù)進行數(shù)據(jù)化,更重要的是使數(shù)據(jù)業(yè)務(wù)化,也就是把數(shù)據(jù)作為直接生產(chǎn)力,將數(shù)據(jù)價值直接通過前臺產(chǎn)品作用于消費者。數(shù)據(jù)可以反映用戶過去的喜好行為,也可以預(yù)測用戶將來的喜好傾向。例如,當用戶購買了自己喜歡的商品后,可以給用戶推薦可能會購買的商品。
3.6 從目標驅(qū)動型到數(shù)據(jù)驅(qū)動型
在設(shè)計產(chǎn)品的過程中,兩種設(shè)計方案都可以,可以讓用戶做一下選擇,從而統(tǒng)計出數(shù)據(jù)。根據(jù)選擇數(shù)據(jù)數(shù)據(jù)比例進行方案的選取。這就是數(shù)據(jù)驅(qū)動,這樣的轉(zhuǎn)變不是靠感覺,而是通過數(shù)據(jù)去決策。
3.7 從不接受到接受數(shù)據(jù)的復(fù)雜性
海量數(shù)據(jù)的涌現(xiàn)一定會增加數(shù)據(jù)的混亂性且會造成結(jié)果的不準確性,如果仍然依循準確性,那么將無法適應(yīng)大數(shù)據(jù)時代。大數(shù)據(jù)通常用概率說話,與數(shù)據(jù)的混雜性可能帶來的數(shù)據(jù)錯誤相比,數(shù)據(jù)量的擴張帶給我們新的洞察、新趨勢和新價值。所以,允許數(shù)據(jù)的混雜性和容許結(jié)果的不準確性才是我們擁抱大數(shù)據(jù)的正確態(tài)度。
3.8 從小眾參與到大眾協(xié)同
在大數(shù)據(jù)時代,用戶不再僅僅熱衷于消費,他們更愿意參與產(chǎn)品的創(chuàng)造過程。大數(shù)據(jù)技術(shù)讓用戶參與創(chuàng)造與分享成果的需求得到實現(xiàn)。例如,“小米”這樣的新興品牌就建立了用戶粉絲論壇,企業(yè)能直接了解他們的需求,從而提高用戶滿意度。
結(jié)語:大數(shù)據(jù)技術(shù)在短短的數(shù)年之內(nèi),從少數(shù)科學家主張轉(zhuǎn)變?yōu)槿驊?zhàn)略實踐,進一步上升為國家競爭戰(zhàn)略的歷史潮流。三分技術(shù),七分數(shù)據(jù),得數(shù)據(jù)者得天下。這句話的正確性已經(jīng)毋庸置疑。我們現(xiàn)在要做的是用大數(shù)據(jù)思維去發(fā)掘大數(shù)據(jù)的潛在價值。這樣,可以更好的為人們的學習、工作、生活以及社會的發(fā)展服務(wù)。
參考文獻:
[1] 武志學.大數(shù)據(jù)導論[M].人民郵電出版社,2019年4月:7-14
[2] 夏道勛.大數(shù)據(jù)素質(zhì)讀本[M].人民郵電出版社,2019年4月:30-45
[3] 楊偉強.電子商務(wù)數(shù)據(jù)分析[M].人民郵電出版社,2019年5月:11-20
作者簡介:王靜寧(1982.1-),女,漢族,河北省石家莊市人,講師,信息系統(tǒng)項目管理師,碩士,研究方向:安卓應(yīng)用于開發(fā)、數(shù)據(jù)庫開發(fā)與設(shè)計。底慧萍(1980.9-),女,回族,河北省石家莊市人,講師,信息系統(tǒng)項目管理師,碩士,研究方向:計算機網(wǎng)絡(luò)與數(shù)據(jù)庫。