周凌
(桂林電子科技大學(xué)計算機與信息安全學(xué)院,廣西桂林541000)
大數(shù)據(jù)是數(shù)據(jù)集優(yōu)化、分配和管理發(fā)展的背景和平臺。在操作過程中,數(shù)據(jù)的潛在信息不易準(zhǔn)確搜索,需要進一步挖掘和優(yōu)化數(shù)據(jù)挖掘技術(shù)??梢?,數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)時代占有重要地位。它的技術(shù)發(fā)展和應(yīng)用表明,數(shù)據(jù)信息的編輯和處理功能影響重大,具有重要的發(fā)展意義和作用。
隨著我國各行業(yè)市場化進程的推動,以及互聯(lián)網(wǎng)、數(shù)據(jù)分析技術(shù)對傳統(tǒng)產(chǎn)業(yè)的顛覆,“大數(shù)據(jù)分析”遲早會成為中國企業(yè)界突破藩籬的關(guān)鍵手段,依靠單一信息進行分析的系統(tǒng)已經(jīng)無法滿足市場需求,建立以多種信息采集、分析、識別、研判、歸檔、展現(xiàn)的綜合性平臺成為發(fā)展趨勢。
聚類分析是將數(shù)據(jù)集劃分為多個類似的組,其目的是最大限度地提高識別相同的數(shù)據(jù)類型之間的關(guān)聯(lián)性。通過不同數(shù)據(jù)之間的關(guān)聯(lián)性,找到有用的數(shù)據(jù)集。這種分析方法可以應(yīng)用在客戶群體、客戶分類、背景分析,以此事先分析客戶需求并提前進行準(zhǔn)備,聚類分析廣泛存在于心理學(xué)、醫(yī)學(xué)、銷售等領(lǐng)域中的數(shù)據(jù)識別分析。
分類是對相同的數(shù)據(jù)庫里面的數(shù)據(jù)根據(jù)形式、特點進行對應(yīng)分類,并針對不同的目的進行統(tǒng)計和劃分。這種方式的好處是可以通過數(shù)據(jù)的某一特點,反映該數(shù)據(jù)項的目的需求。該方式可用于客戶分類、客戶特征、滿意度、購買趨勢的分析,該方式對于單一行業(yè)來說數(shù)據(jù)積累越多價值越高,是一種連續(xù)積累的價值功能模型。
在自然界中,各事物之間存在一定的聯(lián)系。關(guān)聯(lián)分析利用這一特性,查找存在于本數(shù)據(jù)集合與對象集合之間的關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。該方式能發(fā)現(xiàn)交易數(shù)據(jù)中不同商品的關(guān)聯(lián)性,防止在交易過程中可能出現(xiàn)的問題,或者尋找市場的影響因素以不斷改良自身產(chǎn)品,使利益達到最大化。
特征分析方法的特點是在數(shù)據(jù)庫內(nèi)部的一組數(shù)據(jù)中提取關(guān)于該組的數(shù)據(jù),從而顯示整個數(shù)據(jù)的特征,作為營銷人員對客戶流失數(shù)據(jù)的提取,了解如何利用這些數(shù)據(jù)找到原因,有助于留住客戶。
挖掘技術(shù)是一個集數(shù)據(jù)集成、數(shù)據(jù)挖掘過程于一體的綜合分析系統(tǒng),其需要依賴一個固定的工作流程來完成信息資源的整合和挖掘工作,一般分為三個步驟:一是數(shù)據(jù)的準(zhǔn)備,從一開始就進行數(shù)據(jù)挖掘,必須明確需要挖掘的“目標(biāo)數(shù)據(jù)”,也就是說進行數(shù)據(jù)挖掘時首先需要有數(shù)據(jù)基礎(chǔ)及挖掘目的,不能盲目進行分析工作。在數(shù)據(jù)準(zhǔn)備過程中,系統(tǒng)將根據(jù)特定的操作和指令,檢索滿足需求和目標(biāo)的信息資源,并進行分類、清理、編輯甚至預(yù)處理。二是數(shù)據(jù)挖掘。經(jīng)過處理后,需要對目標(biāo)數(shù)據(jù)信息進行挖掘處理,使其能夠正確、高效地引入管理機制。因此,操作環(huán)節(jié)是整個程序的關(guān)鍵環(huán)節(jié)。例如在數(shù)據(jù)挖掘中,我們可以結(jié)合數(shù)據(jù)挖掘目標(biāo)要求,針對性地選取科學(xué)而又合適的計算和分析方法,對數(shù)據(jù)信息特征與應(yīng)用價值等進行尋找和歸納;當(dāng)然,也可以結(jié)合程序應(yīng)用的需要,對數(shù)據(jù)區(qū)域進行固定,并在固定的數(shù)據(jù)區(qū)域內(nèi)分類挖掘數(shù)據(jù),從而得到更具深度和內(nèi)涵以及價值的數(shù)據(jù)信息資源,并就挖掘到的數(shù)據(jù)結(jié)果進行分析和解釋,從結(jié)果中將具有使用價值和意義的規(guī)律進行提取,并還原成便于理解的數(shù)據(jù)語言。最后是切實加強管理和計算等專業(yè)知識的應(yīng)用,將數(shù)據(jù)挖掘技術(shù)實施中進行的總結(jié)和提取所獲得的數(shù)據(jù)信息與評估結(jié)果在現(xiàn)實之中應(yīng)用,從而對某個思想、決策是否正確和科學(xué)進行判斷,最終體現(xiàn)出數(shù)據(jù)挖掘及時的應(yīng)用價值。
在大數(shù)據(jù)時代,未來的幾年中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域?qū)⑦M一步擴大,現(xiàn)已廣泛應(yīng)用于市場營銷、科研、生產(chǎn)、制造、電信、教育,將逐步擴展到其他行業(yè)如航空航天、生物醫(yī)藥、刑偵、技術(shù)應(yīng)用的發(fā)展,數(shù)據(jù)挖掘的功能要求必須變得更加豐富,以滿足高新技術(shù)產(chǎn)業(yè)的發(fā)展[1]。
3.2.1 挖掘后數(shù)據(jù)信息資源的職能范圍和表現(xiàn)形式
依靠單一的轉(zhuǎn)型背景和環(huán)境促進數(shù)據(jù)挖掘技術(shù)是不科學(xué)不合理的,因此,在網(wǎng)絡(luò)信息環(huán)境下,我們將不得不考慮社會經(jīng)濟的變化,科學(xué)技術(shù),文化和環(huán)境的發(fā)展趨勢等因素,這樣才能更好地促進數(shù)據(jù)挖掘技術(shù)職能的轉(zhuǎn)變,以最大化地發(fā)揮其應(yīng)用成效。這主要是因為數(shù)據(jù)信息資源在挖掘后,其自身的職能作用將變得更加豐富,所以在信息技術(shù)環(huán)節(jié)下的數(shù)據(jù)挖掘技術(shù)將會隨著限定條件變化,而將數(shù)據(jù)挖掘信息應(yīng)用于技術(shù)管理和決策管理之中,能夠更好地彰顯企業(yè)在經(jīng)濟活動中的物質(zhì)性質(zhì)與價值變化趨勢,并結(jié)合數(shù)據(jù)變化特點和具體的表現(xiàn)規(guī)律,將數(shù)據(jù)信息的基本要素、質(zhì)量特點、管理要求等展示出來,所以其表現(xiàn)形式十分豐富。數(shù)據(jù)挖掘之后的信息在職能范圍和表現(xiàn)形式方面均得到了豐富和拓展,而這也在一定程度上體現(xiàn)了網(wǎng)絡(luò)擬定目標(biāo)服務(wù)具有較強的完整性,且屬于特殊的個體物品,同時也是對傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的創(chuàng)新和發(fā)展,從而更好地滿足當(dāng)前大數(shù)據(jù)時代對信息進行數(shù)據(jù)化的處理,并對不同種類業(yè)務(wù)進行整合和優(yōu)化,從而提高數(shù)據(jù)挖掘技術(shù)服務(wù)的一體化水平。
3.2.2 充分利用大數(shù)據(jù)背景,防止數(shù)據(jù)挖掘技術(shù)信息失真
數(shù)據(jù)挖掘技術(shù)源于社會信息,因此,在各行各業(yè)對數(shù)據(jù)挖掘技術(shù)有需要的人應(yīng)該對社會、網(wǎng)絡(luò)等自身需要的信息資源進行總體規(guī)劃,使其成為具有公共屬性的產(chǎn)品,促進其個性化職能的發(fā)揮,主導(dǎo)、控制管理數(shù)據(jù)挖掘技術(shù)管理的各項工作[2]。首先,大數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術(shù),信息技術(shù)程度要高,能被記錄,挖掘、管理,因此,要促進數(shù)據(jù)挖掘技術(shù)和信息資源應(yīng)用的轉(zhuǎn)變,必須充分利用大數(shù)據(jù)背景,在業(yè)務(wù)和技術(shù)程序?qū)崿F(xiàn)一體化。業(yè)務(wù)和技術(shù)程序的一體化也意味著數(shù)據(jù)挖掘技術(shù)可以把帶來的資源消耗、變化及管理等進行科學(xué)有效的記憶,只要技術(shù)經(jīng)營者愿意,能夠獲得發(fā)生在資源消耗源頭的信息,這對評價數(shù)據(jù)信息資源消耗的效益是非常有意義的,有助于作業(yè)價值的評估,優(yōu)化業(yè)務(wù)流程。在大數(shù)據(jù)背景下,重新定義了數(shù)據(jù)挖掘技術(shù)職能,數(shù)據(jù)挖掘技術(shù)的信息有內(nèi)部和外部服務(wù)之間的差異,因此合理控制企業(yè)內(nèi)部各階段,各種類型的數(shù)據(jù)挖掘技術(shù)信息,以及輔助管理機制,提高了數(shù)據(jù)挖掘技術(shù)的相關(guān)功能。
大數(shù)據(jù)時代給現(xiàn)在的社會發(fā)展帶來很大的幫助,各種挖掘技術(shù)不斷涌現(xiàn),給數(shù)據(jù)的存儲、分析、解決帶來很大幫助,同時可以快速地將數(shù)據(jù)轉(zhuǎn)換成財富,成為企業(yè)發(fā)展的工具,應(yīng)該理解數(shù)據(jù)挖掘和應(yīng)用的基本方法,這是企業(yè)轉(zhuǎn)型發(fā)展的一個重要機遇,它可以幫助企業(yè)快速發(fā)展和生存,能最大限度對客戶需求進行深度分析以制定合理的發(fā)展規(guī)劃及產(chǎn)品定型,減少資金投入。
總之,大數(shù)據(jù)與深度挖掘技術(shù)不僅是一種新型技術(shù)形態(tài),也是時代發(fā)展的必然趨勢,具備極大的研究價值以及市場前景,正等待著我們的發(fā)掘和應(yīng)用。