武煜
【摘要】 數據挖掘技術目前是全球各個國家和地區(qū)重點投資研究的重大新技術,更是數據庫系統(tǒng)研究和應用領域的熱點之一。移動通信領域市場競爭日益激烈,中國的三大運營商的經營管理模式開始向“以客戶為中心”的趨勢發(fā)展,數據挖掘技術顯得尤為重要。本文闡述了數據挖掘的相關知識,并介紹了數據挖掘技術在電信行業(yè)的應用現(xiàn)狀。
【關鍵詞】 數據挖掘 概述 應用現(xiàn)狀 電信行業(yè)
社會的發(fā)展和時代的進步給電信行業(yè)帶來了更加殘酷激烈的競爭環(huán)境,移動通信產業(yè)的服務經濟業(yè)態(tài)進化逐漸完成。移動增值業(yè)務作為新興市場在基本的移動業(yè)務上為用戶和市場提供了更具針對性的、可供選擇的業(yè)務,成為了電信行業(yè)的重要組成部分。而數據挖掘技術的應用讓移動增值業(yè)務在飛速發(fā)展中找到了擴大企業(yè)用戶規(guī)模的有效途徑。
一、數據挖掘概述
1、數據挖掘。數據挖掘是知識發(fā)現(xiàn)的核心部分,也是利用知識積累數據的高層次形式,它包含了一系列通過研究數據集探索新模式的技術。數據挖掘指的就是從大量的數據中篩選出有價值的知識的過程,它能做到高度自動化的對數據進行分析并歸納性的進行推理,挖掘出有價值的知識、模型、規(guī)則,預測未來、評估風險。數據挖掘在商業(yè)中的應用主要表現(xiàn)為在大型數據庫中搜集有價值的信息,探索商業(yè)規(guī)律,驗證商業(yè)預測。數據挖掘模式分為預測型和描述型兩種。數據挖局過程是不斷反饋,不斷利用分析工具在大量數據中挖掘模型的過程。2、數據挖掘算法。在分類數據挖掘算法中采用的決策樹算法常為C5.0、CART等,而回歸算法則是邏輯回歸、線性回歸等。決策樹是實例的分類器,其理論依據是信息論。決策樹算法的實質是在學習的基礎上獲得分類規(guī)則。決策樹的每個分支就是一個分類問題,樹葉是帶有分類的數據分割。決策樹的構造方法是自上而下的遞歸構造。決策樹算法的缺點主要有過度擬合問題、分類規(guī)則復雜。作為最基本的回歸算法,線性回歸的研究內容是自變量的線性組合對一個獨立因變量的影響。3、數據挖掘工具。主流的數據挖掘工具可分為數據挖掘和統(tǒng)計分析平臺、與數據庫集成的數據挖掘平臺、行業(yè)應用及解決方案三類。數據挖掘平臺能根據用戶的商業(yè)經驗快速建立獨特的預測性模型,并將結果分享給相關決策人員,以輔助決策。優(yōu)秀的數據挖掘平臺能為用戶提供成熟、廣泛的數據挖掘技術,以便找到適合需求的分析技術,進而將商務問題最好的解決。Clementine是一個優(yōu)良的數據挖掘平臺,支持整個數據挖掘過程及其標準化流程。4、數據倉庫。數據倉庫是一個面向主題的數據集合,具有集成性、相對穩(wěn)定性、反映歷史變化等優(yōu)點,用于支持管理決策。數據倉庫中的數據根據一定的主題域進行組織,主題指的是用戶在利用數據倉庫輔助決策時的關注重點。數據倉庫的集成指的是其在對原有分散的數據庫中抽取、清理數據,并在此基礎上加工、匯總、整理相關數據,以便消除源數據中的不一致性,保證數據庫的全局性。
二、數據挖掘技術在電信行業(yè)的具體應用領域
1、業(yè)務預測。業(yè)務預測指的是通過分析歷史數據確定業(yè)務發(fā)展影響因素,并評估這些因素的未來發(fā)展,以便確定大致的未來業(yè)務量,并有針對性的對預測中有價值的客戶進行精確營銷。業(yè)務預測是企業(yè)制定發(fā)展計劃的重要依據??梢酝ㄟ^對比、驗證實際值與預測值測量預測的準確度,以便更加精確的找出相關因素,改進預測方法。移動運營商業(yè)務種類很多,需要進行預測的場合也很多。如確定市場未來規(guī)模時需預測移動電話客戶的增長。2、預測、控制客戶流失。與爭取一個新用戶相比,挽留一個老客戶的代價明顯更小??蛻舻牧魇c市場份額和營業(yè)經濟效益有著直接關聯(lián),為此,預測客戶流失是移動運營商最關注的一個重點??蛻袅魇ьA測的分析對象已流失的客戶和未流失的客戶??蛻袅魇ьA測的工作內容即為從分析對象的自然屬性及行為屬性等屬性中確定流失客戶的特點,預測客戶未來一段時間的流失概率。3、分析客戶呼叫模式??蛻艉艚心J降姆治龉ぷ髂艽龠M運用商對客戶喜好的了解,而分析結果則是移動運營商市場營銷活動的依據。運營商通過分析客戶呼叫模式能掌握客戶的部分基本特征,如客戶打電話的時間喜好。這些基本特征在提取后能為客戶差異性分析提供依據。4、特征識別大客戶。企業(yè)的大客戶群體是利潤的主要來源,而大客戶資源也是企業(yè)競爭力的重要體現(xiàn),更是其他移動運營商的焦點。將大客戶單獨識別出來并有針對性的制定采取措施可以有效的提高客戶的忠誠度,這是移動運營商保持領先的關鍵。5、管理網絡資源。通信網的運行過程會產生大量的運行數據。挖掘這些運行數據是早日發(fā)現(xiàn)潛在網絡故障的有效手段,這對網絡利用率的提高功不可沒。數據挖掘可以應用通信網流量峰值預測、故障預測、網絡流量優(yōu)化等方式管理網絡資源。
小結:數據挖掘技術在移動通信領域具有巨大的商業(yè)應用價值,而新興市場移動增值業(yè)務如果能科學合理的應用數據挖掘技術也能獲得良好的收益。但目前數據挖掘技術雖然在移動增值業(yè)務中被應用,其實際過程中仍存在一些不足之處,亟需改善、解決。
參 考 文 獻
[1]郭勇.簡述數據挖掘技術在電信客戶分析中的應用研究[J].電腦迷,2016,(1):40-40.
[2]梁霄波.電信客戶細分中基于聚類算法的數據挖掘技術研究[J].現(xiàn)代電子技術,2016,39(15):95-98.
[3]楊逸凡,趙夏.數據挖掘在電信客戶流失分析中的應用[J].甘肅科技縱橫,2015,44(5):30-33.endprint