国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向大數(shù)據(jù)的電信客戶細(xì)分模型研究與展望

2018-04-12 11:45張小敏王小丫左小雪
數(shù)字通信世界 2018年3期
關(guān)鍵詞:細(xì)分數(shù)據(jù)挖掘聚類

張小敏,王小丫,左小雪

(安徽財經(jīng)大學(xué) 管理科學(xué)與工程學(xué)院,蚌埠 233030)

1 引言

21世紀(jì)以來,數(shù)據(jù)的快速增長使得電信行業(yè)面臨著巨大的機遇與挑戰(zhàn)。隨著移動互聯(lián)網(wǎng)的快速發(fā)展,電信運營商主營業(yè)務(wù)由傳統(tǒng)的語音業(yè)務(wù)逐漸向移動數(shù)據(jù)業(yè)務(wù)轉(zhuǎn)變。作為大數(shù)據(jù)的生產(chǎn)者,電信企業(yè)擁有極有價值的用戶數(shù)據(jù),如何利用這些大數(shù)據(jù)實現(xiàn)客戶的價值分析、產(chǎn)品的高效營銷以及市場的領(lǐng)先地位,成為決定企業(yè)未來發(fā)展的關(guān)鍵。移動通信高速發(fā)展的同時也帶來了電信市場激烈的競爭,對電信運營商提出了更加嚴(yán)酷的要求。現(xiàn)有研究表明,電信運營商想要保持市場的相對領(lǐng)先,就必須善于利用客戶數(shù)據(jù)進(jìn)行客戶細(xì)分,提高客戶價值,并針對不同的客戶群實現(xiàn)精準(zhǔn)市場營銷[1]。

2 客戶細(xì)分方法演進(jìn)及現(xiàn)狀

客戶細(xì)分的目的是為了將有潛力的客戶與無潛力的客戶區(qū)分開,以此對不同的客戶群進(jìn)行不同的針對性營銷策略。自Smith(1956)首次提出客戶細(xì)分的概念以來,客戶細(xì)分方法經(jīng)歷了一系列的變化[2]。

傳統(tǒng)的統(tǒng)計法主要是以客戶基本屬性特征的簡單統(tǒng)計來進(jìn)行細(xì)分,包括諸如年齡、性別、家庭、種族、職業(yè)、教育狀況等客戶基本信息。但由于該方法不具備定量分析的功能,統(tǒng)計細(xì)分得出的結(jié)果往往帶有較強的主觀性,不能反映出真正的客戶價值。

經(jīng)過多年的研究和探索,營銷學(xué)者們提出了一種基于客戶價值的細(xì)分方法,由于不同的客戶對企業(yè)的價值不同,通過分析客戶的盈利能力及公司的利潤貢獻(xiàn)率將客戶進(jìn)行細(xì)分,再針對不同價值的客戶群采取精準(zhǔn)營銷策略,從而實現(xiàn)企業(yè)的利潤最大化。

為了動態(tài)的對客戶的行為特征進(jìn)行劃分,隨后提出了基于數(shù)據(jù)挖掘的客戶細(xì)分方法,也是現(xiàn)在電信企業(yè)實現(xiàn)客戶細(xì)分重點關(guān)注的研究領(lǐng)域[3]。基于數(shù)據(jù)挖掘的方法主要是運用聚類算法對客戶進(jìn)行細(xì)分,通過客戶的歷史數(shù)據(jù)來分析未知的客戶行為特征,大致可分為兩類客戶細(xì)分方法:1)多元統(tǒng)計分析,如K-means方法;2)神經(jīng)網(wǎng)絡(luò)模型,如自組織神經(jīng)網(wǎng)絡(luò)SOM算法。

目前,國內(nèi)外學(xué)術(shù)界比較關(guān)注的是對于數(shù)據(jù)挖掘技術(shù)的優(yōu)化與改進(jìn),以提高細(xì)分結(jié)果的準(zhǔn)確性和可靠性,為企業(yè)界提供一定的理論結(jié)果和方法創(chuàng)新。而國內(nèi)學(xué)者對客戶細(xì)分的研究起步較晚,相關(guān)理論主要來源于國外,沒有與中國企業(yè)的現(xiàn)狀很好地結(jié)合起來。隨著市場的不斷發(fā)展,相信客戶細(xì)分解決方法的需求會越來越強烈,在一定程度上會加快客戶細(xì)分理論的研究進(jìn)程。

3 電信客戶細(xì)分模型構(gòu)建

目前,數(shù)據(jù)挖掘已經(jīng)逐漸被應(yīng)用到國內(nèi)外電信業(yè)的生產(chǎn)和經(jīng)營中,而數(shù)據(jù)挖掘建模方法是數(shù)據(jù)挖掘順利開展的先決條件,由歐洲委員會和相關(guān)行業(yè)的四大公司提出的行業(yè)標(biāo)準(zhǔn)過程CRISP-DM[4],是目前業(yè)界權(quán)威的標(biāo)準(zhǔn)流程方法。CRISP-DM將數(shù)據(jù)挖掘過程看作一個商業(yè)過程,提供了一個數(shù)據(jù)挖掘項目生命周期的全面描述,如圖1所示。

CRISP-DM參考模型大致可分為6個階段:商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、模型建立、模型評估和結(jié)果部署,最終構(gòu)成一個統(tǒng)一的循環(huán)周期。在整個過程的每一個階段,如果發(fā)現(xiàn)某個階段產(chǎn)生的結(jié)果和預(yù)想的結(jié)果有偏差,則需要用戶重復(fù)以前的工作。本文將從這6個過程對電信客戶細(xì)模型進(jìn)行詳細(xì)闡述。

3.1 商業(yè)理解

根據(jù)數(shù)據(jù)挖掘的流程,對客戶細(xì)分進(jìn)行商業(yè)理解主要是從商業(yè)角度理解項目的目標(biāo)和要求。對于積累了大量客戶數(shù)據(jù)的電信行業(yè)來說,商業(yè)目標(biāo)可概括如下:利用系統(tǒng)化的方式組織和分析龐大的數(shù)據(jù)量,從中發(fā)現(xiàn)有價值的規(guī)律;把有相近交易行為的客戶歸到一個客戶群,深入了解每一客戶群組的客戶消費行為特征;從而為發(fā)展新業(yè)務(wù)、挽留高價值客戶打下基礎(chǔ),實現(xiàn)利潤最大化、提升企業(yè)競爭力。

3.2 數(shù)據(jù)理解

移動通信企業(yè)擁有計費、賬務(wù)、欠費、寬帶上網(wǎng)等系統(tǒng),而這些系統(tǒng)數(shù)據(jù)庫中存儲了大量的客戶消費及行為數(shù)據(jù)。通常情況下電信運營商會以消費樣本數(shù)據(jù)作為研究對象構(gòu)建模型,主要包括客戶基本數(shù)據(jù)、消費數(shù)據(jù)以及行為數(shù)據(jù)。主要收集的用戶數(shù)據(jù)清單如表1所示。

圖1 CRISP-DM參考模型

表1 數(shù)據(jù)收集清單

3.3 數(shù)據(jù)準(zhǔn)備

獲得客戶的消費樣本數(shù)據(jù)后,還需要對數(shù)據(jù)樣本進(jìn)行充分的準(zhǔn)備與分析。數(shù)據(jù)準(zhǔn)備過程的關(guān)鍵步驟是數(shù)據(jù)檢測、屬性約簡及數(shù)據(jù)轉(zhuǎn)換[5]。對電信企業(yè)來說,數(shù)據(jù)檢測主要是指缺省值和異常值的檢測,一般采用值分析、統(tǒng)計分析和頻次分析等方法來進(jìn)行檢測。在客戶所有的屬性中,許多屬性對客戶細(xì)分的意義不大,甚至還會影響結(jié)果,因此,需要進(jìn)行屬性約簡將冗余的屬性清除。此外,電信企業(yè)數(shù)據(jù)倉庫包含大量不同數(shù)據(jù)類型的數(shù)據(jù),需要根據(jù)建模的要求,對數(shù)據(jù)加以變換,以消除量綱不同可能引起的數(shù)據(jù)差異。

3.4 模型建立

聚類算法在客戶細(xì)分模型構(gòu)建中得到了大量的應(yīng)用,本文針對適合大數(shù)據(jù)分析且效果較好的K-means聚類算法進(jìn)行詳細(xì)闡述。K-means[6]算法的基本步驟可表述如下:

(1)隨機或按照某種先驗知識選擇一個K值,用來確定簇的總數(shù)。

(2)在數(shù)據(jù)集中任意選擇K個樣本,作為初始聚類中心c1,c2,…,ck。

(3)依據(jù)樣本{xi,i=1,2,…,n}到聚類中心的距離,將其賦給最近的中心cj的簇Xj,即若

則x∈Xj。

確定好數(shù)據(jù)挖掘算法之后,才能建立挖掘模型。從整個流程來看,建立模型是一個反復(fù)的模型調(diào)優(yōu)過程,不僅涉及不同算法的選擇,也取決于屬性參數(shù)的設(shè)置,確保建立最合適的電信客戶細(xì)分模型。

3.5 模型評估

建立好模型以后,評估是重要的環(huán)節(jié)。模型評價標(biāo)準(zhǔn)就看其是否有效,能否正確反映前期定義或假設(shè),結(jié)果是否存在偏差。對于聚類、關(guān)聯(lián)規(guī)則挖掘等無監(jiān)督學(xué)習(xí)系統(tǒng)來說,模型的評估是困難的,因為結(jié)果的好壞很大程度上取決于使用工具的特定環(huán)境。

3.6 結(jié)果部署

結(jié)果部署,即對挖掘結(jié)果進(jìn)行解釋分析,對其盡可能使用統(tǒng)計工具和可視化方法來刻畫屬性特征,如表格或圖形的形式,最后根據(jù)挖掘結(jié)果提出相應(yīng)的決策方案和建議。

4 面向大數(shù)據(jù)的電信客戶細(xì)分方法未來展望

大數(shù)據(jù)背景下電信客戶細(xì)分方法也會有所轉(zhuǎn)變,筆者將基于大數(shù)據(jù)對電信客戶細(xì)分方法進(jìn)行展望,同時也為進(jìn)一步研究客戶細(xì)分方法提供相關(guān)依據(jù)。

(1)基于技術(shù)不斷發(fā)展的大背景下,電信客戶細(xì)分模型中數(shù)據(jù)網(wǎng)絡(luò)型用戶已經(jīng)取代了電信傳統(tǒng)的話務(wù)型客戶,電信客戶細(xì)分模型應(yīng)該趨于面向數(shù)據(jù)業(yè)務(wù)的分群分析,企業(yè)逐漸培養(yǎng)客戶使用數(shù)據(jù)的習(xí)慣。

(2)近年來,中國電信與互聯(lián)網(wǎng)公司開始進(jìn)行產(chǎn)業(yè)融資合作,在迅速增強其競爭優(yōu)勢的同時,在客戶細(xì)分過程中充分利用互聯(lián)網(wǎng)企業(yè)的網(wǎng)絡(luò)資源、網(wǎng)絡(luò)平臺、客戶服務(wù)與營銷渠道,達(dá)到需要的細(xì)分效果,可大大提高企業(yè)的獲利。

(3)在大數(shù)據(jù)時代,獲取信息的途徑更為豐富,可以通過社交網(wǎng)絡(luò)獲取客戶之間的聯(lián)系信息,增加個體客戶對所在群體內(nèi)其他客戶的影響力指標(biāo),這樣客戶的價值不再僅是個體客戶消費體現(xiàn)的價值,營銷效率將會有很大的提高。

5 結(jié)束語

本文首先詳細(xì)描述了客戶細(xì)分方法的發(fā)展歷程并對其現(xiàn)狀進(jìn)行分析,其次介紹了數(shù)據(jù)挖掘過程參考模型CRISP-DM,并依據(jù)其6個過程對電信客戶細(xì)分模型進(jìn)行闡述與構(gòu)建,重點介紹了K-means聚類算法。最后,就大數(shù)據(jù)時代背景,對未來電信客戶細(xì)分方法進(jìn)行展望,為進(jìn)一步研究客戶細(xì)分方法提供相關(guān)依據(jù)。

[1]賀仁龍,葉宇航,趙曉康.電信企業(yè)客戶細(xì)分模型構(gòu)建與應(yīng)用研究[J].情報雜志,2011,30(S1):148-151.

[2]楊茜.基于大數(shù)據(jù)的客戶細(xì)分模型及精確營銷策略研究[D].南京郵電大學(xué),2015.

[3]陳治平,胡宇舟,顧學(xué)道.聚類算法在電信客戶細(xì)分中的應(yīng)用研究[J].計算機應(yīng)用,2007(10):2566-2569+2577.

[4]薛薇.SPSS Modeler數(shù)據(jù)挖掘方法及應(yīng)用(第二版)[M].北京:電子工業(yè)出版社,2014:270-290.

[5]陳金波.面向電信CRM的數(shù)據(jù)挖掘應(yīng)用研究[D].東南大學(xué),2006.

[6]Survey of clustering algorithm.XU R,WUNSCHLL D.IEEE Transactions on Neural Networks.2005.

猜你喜歡
細(xì)分數(shù)據(jù)挖掘聚類
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
深耕環(huán)保細(xì)分領(lǐng)域,維爾利為環(huán)保注入新動力
基于K-means聚類的車-地?zé)o線通信場強研究
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進(jìn)及并行化實現(xiàn)
1~7月,我國貨車各細(xì)分市場均有增長
基于改進(jìn)的遺傳算法的模糊聚類算法
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
整體低迷難掩細(xì)分市場亮點