摘要:不同產(chǎn)業(yè)在發(fā)展過程中需要對(duì)相關(guān)的數(shù)據(jù)進(jìn)行分析,從而將其作為產(chǎn)業(yè)規(guī)劃以及發(fā)展的重要參考,互聯(lián)網(wǎng)技術(shù)的發(fā)展推動(dòng)了大數(shù)據(jù)時(shí)代的到來,同時(shí)對(duì)于數(shù)據(jù)挖掘有了新的要求,本文主要就大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘及其在產(chǎn)業(yè)發(fā)展中的作用進(jìn)行分析。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;數(shù)據(jù)挖掘;產(chǎn)業(yè)發(fā)展;作用分析
數(shù)據(jù)信息在不同產(chǎn)業(yè)發(fā)展中具有重要的參考價(jià)值,隨著大數(shù)據(jù)時(shí)代的來臨,在互聯(lián)網(wǎng)中充斥著各類數(shù)據(jù),通過對(duì)大量數(shù)據(jù)的挖掘,可以從其中尋找出具有重要價(jià)值的數(shù)據(jù),并將其作為產(chǎn)業(yè)發(fā)展的支撐。本文結(jié)合相關(guān)文獻(xiàn)資料,對(duì)大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘及其在產(chǎn)業(yè)發(fā)展中的作用問題進(jìn)行分析。
一、大數(shù)據(jù)概述
1、大數(shù)據(jù)的定義
所謂的大數(shù)據(jù),主要是充斥在互聯(lián)網(wǎng)中的各類數(shù)據(jù)信息,數(shù)據(jù)信息容量極大,這些數(shù)據(jù)信息以多種形式存在,比如:社交網(wǎng)絡(luò)、電子商務(wù)網(wǎng)站、顧客來訪紀(jì)錄等等,這些數(shù)據(jù)與公司顧客關(guān)系管理數(shù)據(jù)庫中的常態(tài)數(shù)據(jù)組存在著明顯的差異,大數(shù)據(jù)作為一種重要的信息資源,只有在數(shù)據(jù)挖掘的基礎(chǔ)上才能夠找出其中具有應(yīng)用價(jià)值的數(shù)據(jù),并將其用于不同行業(yè)中的決策、流程優(yōu)化等。
2、大數(shù)據(jù)特點(diǎn)
大數(shù)據(jù)具有以下特點(diǎn):(1)數(shù)據(jù)來源的多樣性:從上述大數(shù)據(jù)定義中可知,大數(shù)據(jù)中的數(shù)據(jù)來源具有多樣性,比如:社交網(wǎng)絡(luò)、電子商務(wù)網(wǎng)站、顧客來訪紀(jì)錄等;(2)數(shù)據(jù)量龐大:大數(shù)據(jù)相對(duì)于常規(guī)數(shù)據(jù),單位從TB已經(jīng)發(fā)展到PB;(3)數(shù)據(jù)價(jià)值密度低:盡管大數(shù)據(jù)中有各種各樣的數(shù)據(jù),但是能夠真正對(duì)產(chǎn)業(yè)發(fā)展有價(jià)值的數(shù)據(jù)需要挖掘,而不能直接拿來應(yīng)用;(4)數(shù)據(jù)類型的復(fù)雜性:數(shù)據(jù)類型除了最直接的數(shù)據(jù)外,在視頻資料、圖片資料、音頻資料等相關(guān)資料中也有數(shù)據(jù)的存在;(5)數(shù)據(jù)增長速度快:大數(shù)據(jù)時(shí)代下的數(shù)據(jù)增長幾乎符合于指數(shù)增長規(guī)律;(6)對(duì)于數(shù)據(jù)挖掘技術(shù)要求較高:在大量的數(shù)據(jù)中要找到具有應(yīng)用價(jià)值的數(shù)據(jù)信息,需要有高效的數(shù)據(jù)挖掘技術(shù)作為支持[1]。
二、大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘分析
1、數(shù)據(jù)挖掘定義
大數(shù)據(jù)時(shí)代中對(duì)于數(shù)據(jù)的處理至關(guān)重要,其中基礎(chǔ)性的是數(shù)據(jù)產(chǎn)生和收集,關(guān)鍵性的則是數(shù)據(jù)挖掘,所謂的數(shù)據(jù)挖掘就是從大量的、隨機(jī)性的、有噪聲的、模糊的數(shù)據(jù)中通過應(yīng)用一定技術(shù)方法,從中提取出能夠直接用于產(chǎn)業(yè)發(fā)展規(guī)劃或者是具有潛在應(yīng)用價(jià)值的相關(guān)數(shù)據(jù),這個(gè)過程就是數(shù)據(jù)挖掘,當(dāng)然實(shí)際的數(shù)據(jù)挖掘操作較為復(fù)雜。
2、大數(shù)據(jù)挖掘特點(diǎn)
大數(shù)據(jù)在挖掘過程中同樣也具有以下特點(diǎn):(1)應(yīng)用性特點(diǎn):數(shù)據(jù)挖掘后獲得的數(shù)據(jù)資料主要用于指導(dǎo)不同產(chǎn)業(yè)發(fā)展或者決策,具有明顯的應(yīng)用性特點(diǎn);(2)集合性特點(diǎn):數(shù)據(jù)挖掘過程中集合了多種功能,并非單一功能的應(yīng)用,比如在挖掘功能方面包含了異常檢測(cè)、關(guān)聯(lián)規(guī)則挖掘、數(shù)據(jù)可視化、聚類分析等,當(dāng)然不同功能在實(shí)現(xiàn)中所需要的理論支持以及技術(shù)要求也存在差異;(3)交叉性特點(diǎn):數(shù)據(jù)挖掘中需要有多種學(xué)科的介入,有明顯的交叉性特點(diǎn),如:人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析、數(shù)據(jù)庫技術(shù)等;(4)工程性特點(diǎn):數(shù)據(jù)挖掘過程屬于一個(gè)工程化過程,除了最基礎(chǔ)的算法分析外,還需要有數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)管理、數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換等相關(guān)過程的參與[2]。
三、大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘在產(chǎn)業(yè)發(fā)展中的作用
在大數(shù)據(jù)時(shí)代背景下,不管是現(xiàn)實(shí)生活中還是在互聯(lián)網(wǎng)生活中都存在著各類數(shù)據(jù)信息,而我國眾多產(chǎn)業(yè)的發(fā)展過程中都需要有數(shù)據(jù)信息的支撐,比如電信業(yè)、銀行業(yè)、醫(yī)療產(chǎn)業(yè)等,通過數(shù)據(jù)挖掘技術(shù)能夠根據(jù)不同行業(yè)需求,從中找尋出具有應(yīng)用價(jià)值的數(shù)據(jù)以及不同數(shù)據(jù)之間隱藏的規(guī)律,根據(jù)已經(jīng)掌握的數(shù)據(jù)信息建立相應(yīng)的模型,通過模型分析和預(yù)測(cè),能夠指導(dǎo)并用于不同企業(yè)以及不同行業(yè)的日常經(jīng)營,也就是說需要具備大量數(shù)據(jù)信息的行業(yè)在實(shí)際發(fā)展過程中,大數(shù)據(jù)挖掘都能夠在其中發(fā)揮重要作用。
四、實(shí)例分析
1、大數(shù)據(jù)挖掘在銀行中的應(yīng)用
大數(shù)據(jù)挖掘在銀行中具有重要的應(yīng)用價(jià)值,比如通過構(gòu)建FICO評(píng)估模型、貝葉斯分析模型等,可作為銀行信用評(píng)級(jí)的重要模型,從而以此為依據(jù)對(duì)貸款方進(jìn)行信用風(fēng)險(xiǎn)評(píng)估,降低銀行在借貸方面的風(fēng)險(xiǎn)。通過數(shù)據(jù)挖掘還能夠進(jìn)行客戶管理,一方面維持老客戶,另一方面則能夠及時(shí)發(fā)現(xiàn)以及開拓新客戶。在銀行客戶流失方面,大數(shù)據(jù)挖掘同樣具有重要的應(yīng)用價(jià)值,通過數(shù)據(jù)挖掘能夠發(fā)現(xiàn)部分客戶表現(xiàn)出的流失特點(diǎn),此時(shí)需要及時(shí)采取措施避免大量客戶的流失。
2、大數(shù)據(jù)挖掘在電力行業(yè)中的應(yīng)用
電力行業(yè)在發(fā)展中也存在著大量數(shù)據(jù)信息,尤其是在智能電網(wǎng)發(fā)展、電力企業(yè)信息系統(tǒng)構(gòu)建、電力企業(yè)客戶管理等方面都具有重要的應(yīng)用價(jià)值。比如在電力信息系統(tǒng)建立過程中,傳統(tǒng)的管理模式正在不斷的進(jìn)行轉(zhuǎn)變,基本實(shí)現(xiàn)了網(wǎng)上業(yè)務(wù)咨詢、網(wǎng)上業(yè)務(wù)辦理等,這些都會(huì)產(chǎn)生大量的數(shù)據(jù),通過對(duì)數(shù)據(jù)的分析以及利用,可以掌握不同地區(qū)網(wǎng)上業(yè)務(wù)辦理的比例、主要繳費(fèi)方式、用電量情況以及主要用電區(qū)間等,這些信息都有助于電力企業(yè)更好地為廣大用戶服務(wù)。
結(jié)束語
大數(shù)據(jù)時(shí)代下,看似雜亂無章的數(shù)據(jù),通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)其中具有重要應(yīng)用價(jià)值的數(shù)據(jù),這些數(shù)據(jù)在不同產(chǎn)業(yè)發(fā)展中均屬于重要的數(shù)據(jù)資料,能夠?yàn)椴煌a(chǎn)業(yè)的發(fā)展規(guī)劃奠定基礎(chǔ)。
參考文獻(xiàn):
[1]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘——從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015,1(04):57-80.
[2]吳漢華.大數(shù)據(jù)時(shí)代中如何進(jìn)行醫(yī)療數(shù)據(jù)挖掘與利用[J].硅谷,2014,7(05):12-13.
[3]盧建昌,樊圍國.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用[J].廣東電力,2014,27(09):88-94.
作者簡(jiǎn)介:付世豪(2000.02.02—)男,漢族,遼寧省丹東市人,高中學(xué)歷,研究方向:計(jì)算機(jī)(大數(shù)據(jù)方向)。endprint