肖艷群
摘要:數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)是存儲(chǔ)、分析和提取海量數(shù)據(jù)的重要工具。針對(duì)企業(yè)客戶關(guān)系的特點(diǎn),將數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)運(yùn)用到企業(yè)客戶關(guān)系管理中,具體介紹了在預(yù)防和減少客戶流失中的應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;客戶關(guān)系管理;客戶流失
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)26-6200-03
Application of Customer Relationship Management Based on Data Warehouse and Data Mining
XIAO Yan-qun
(Yangzhou polytechnic college,Yangzhou 225009,China)
Abstract: Data Warehouse and Data Mining are important tools in storage, analysis and extracting data. According to Customer Relationships characteristics, Data Warehouse and Data Mining are added to its management,which mainly focuses on introduc? ing the application in the prevention and reduction of customer loss.
Key words: data warehouse; data mining; customer relationship management; customer loss
隨著市場(chǎng)經(jīng)濟(jì)的發(fā)展,產(chǎn)品種類日益豐富,企業(yè)之間的競(jìng)爭(zhēng)越來(lái)越激烈,賣(mài)方市場(chǎng)已過(guò)渡到了買(mǎi)方市場(chǎng),對(duì)現(xiàn)代企業(yè)而言,當(dāng)下最主要提升的不僅僅是產(chǎn)品本身,更為重要的是客戶的爭(zhēng)奪。因此,企業(yè)要想立于不敗之地,必須能夠?qū)κ袌?chǎng)上發(fā)生的變化做出迅速的反應(yīng),而導(dǎo)致市場(chǎng)變化的根源就是客戶行為的變化。企業(yè)已經(jīng)逐漸認(rèn)識(shí)到保有客戶的重要性,只有不斷提升服務(wù)意識(shí),有針對(duì)性地滿足客戶的需求,企業(yè)才能長(zhǎng)期發(fā)展。因此,企業(yè)當(dāng)下的重要課題就是要加強(qiáng)客戶關(guān)系管理,提高核心競(jìng)爭(zhēng)能力。
客戶數(shù)據(jù)的收集與存儲(chǔ)是實(shí)施客戶關(guān)系管理的根基。隨著辦公自動(dòng)化的推廣,數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)技術(shù)的應(yīng)用,各企業(yè)擁有的客戶信息越來(lái)越多,增長(zhǎng)迅速。在這海量的、異構(gòu)的信息資源中,蘊(yùn)含著具有巨大潛在價(jià)值的信息資源,比如客戶的基本資料、產(chǎn)品交易信息及客戶反饋信息等[1]。企業(yè)要想不陷入信息的沼澤中,必須擁有強(qiáng)有力的數(shù)據(jù)分析工具,用以實(shí)現(xiàn)客戶關(guān)系管理的目標(biāo)。而數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)的發(fā)展可以很好地解決這個(gè)問(wèn)題。
1數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)
1.1數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)在企業(yè)管理和決策中面向主題的(Subject- Oriented)、集成的(Integrated)、反映歷史變化的(TimeVariant)、相對(duì)穩(wěn)定(Non-Volatile)的數(shù)據(jù)集合[2]。
數(shù)據(jù)倉(cāng)庫(kù)要求數(shù)據(jù)量大,數(shù)據(jù)正確全面,所以數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)前必須經(jīng)過(guò)提取、轉(zhuǎn)換與集成,把數(shù)據(jù)按主題分類,形成多維數(shù)據(jù)模型。它以多維數(shù)據(jù)模型為基礎(chǔ),實(shí)現(xiàn)數(shù)據(jù)的分析處理,主要用于支持管理決策。數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)后,一般會(huì)被長(zhǎng)期保存,基本不會(huì)進(jìn)行修改和刪除操作,主要實(shí)現(xiàn)數(shù)據(jù)的查詢。
數(shù)據(jù)倉(cāng)庫(kù)與傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)不同,主要區(qū)別在于數(shù)據(jù)倉(cāng)庫(kù)打破了關(guān)系數(shù)據(jù)庫(kù)中數(shù)據(jù)的規(guī)范性,實(shí)現(xiàn)了數(shù)據(jù)的重組,增加了數(shù)據(jù)冗余度;其次傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)為了實(shí)現(xiàn)數(shù)據(jù)處理的及時(shí)性,要求數(shù)據(jù)盡量少,而數(shù)據(jù)倉(cāng)庫(kù)為了更有效的實(shí)現(xiàn)數(shù)據(jù)查詢,要求存儲(chǔ)的數(shù)據(jù)盡量多,實(shí)現(xiàn)海量存儲(chǔ)。
1.2數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù),是近幾年國(guó)內(nèi)外迅速發(fā)展起來(lái)的一門(mén)交叉學(xué)科,涉及到數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)、人工智能與機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域,并在金融、商業(yè)零售、電信以及生物醫(yī)學(xué)和基因分析等領(lǐng)域得到廣泛應(yīng)用。
1.2.1數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Ming),是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程,提取的知識(shí)一般可表示為概念(ConcePts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式[3]。
數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的過(guò)程,是將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個(gè)過(guò)程。該過(guò)程包含一系列的步驟:確定業(yè)務(wù)對(duì)象、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、模式評(píng)估和知識(shí)表示[4]。
1.2.2數(shù)據(jù)挖掘的技術(shù)與方法
數(shù)據(jù)挖掘方法是以數(shù)據(jù)庫(kù)為對(duì)象,基于機(jī)器學(xué)習(xí)、科學(xué)計(jì)算、統(tǒng)計(jì)分析等技術(shù),形成了數(shù)據(jù)挖掘方法和技術(shù)。一般,數(shù)據(jù)挖掘常用的技術(shù)與方法可以分為以下幾個(gè)方面:
1)決策樹(shù)方法
決策樹(shù)方法是利用信息論的原理建立決策樹(shù),主要用于分類和預(yù)測(cè)。決策樹(shù)是一種簡(jiǎn)單的知識(shí)表示方法,它將事例逐步分類成代表不同的類別。由于分類規(guī)則比較直觀,易于理解,實(shí)用效果好,影響較大,因而得到廣泛應(yīng)用。決策樹(shù)最早的算法是Quinlan提出的ID3算法,最流行的是其改進(jìn)版的C4.5算法。
2)聚類方法
聚類分析是直接分析樣本,按照各樣本數(shù)據(jù)間的距離遠(yuǎn)近將樣本數(shù)據(jù)分成若干個(gè)不同的類。一般,同一類中的對(duì)象相似度很高,不同類中的對(duì)象相似度很差。聚類分析屬于無(wú)監(jiān)督的分類方法。
3)統(tǒng)計(jì)分析方法
統(tǒng)計(jì)分析方法是通過(guò)統(tǒng)計(jì)學(xué)中的技術(shù)方法實(shí)現(xiàn)數(shù)據(jù)庫(kù)的數(shù)據(jù)分析,發(fā)現(xiàn)數(shù)據(jù)間的關(guān)系和規(guī)律。常用的方法有:回歸分析、相關(guān)分析、主成分分析等。
4)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則通過(guò)對(duì)給定數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,描述一個(gè)事物中某些屬性頻繁同時(shí)出現(xiàn)的條件,發(fā)現(xiàn)隱藏在其中的有趣的聯(lián)系或規(guī)律。一旦建立起數(shù)據(jù)項(xiàng)間的關(guān)聯(lián)規(guī)則,則其中某一項(xiàng)的屬性值就可以依據(jù)其他屬性值進(jìn)行預(yù)測(cè)。
5)可視化技術(shù)
可視化數(shù)據(jù)分析技術(shù)在傳統(tǒng)圖表功能基礎(chǔ)上進(jìn)行了拓展,為用戶提供交互式的數(shù)據(jù)瀏覽,幫助用戶更清楚地剖析數(shù)據(jù)。當(dāng)所要識(shí)別的不規(guī)則事物是一系列圖形而不是數(shù)字表格時(shí),人的識(shí)別速度是最快的。
2數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用
2.1客戶關(guān)系管理
客戶關(guān)系管理(CRM)關(guān)注的是企業(yè)與客戶之間實(shí)時(shí)、方便的信息交互,通過(guò)與客戶多渠道的接觸、交流和溝通,實(shí)現(xiàn)從“接觸管理”到“客戶關(guān)懷”的角色轉(zhuǎn)變,企業(yè)的經(jīng)營(yíng)中心也從產(chǎn)品或市場(chǎng)轉(zhuǎn)變?yōu)榭蛻???蛻絷P(guān)系管理最核心的任務(wù)是對(duì)企業(yè)運(yùn)營(yíng)過(guò)程中所得到的各種數(shù)據(jù)進(jìn)行分析,進(jìn)而為企業(yè)經(jīng)營(yíng)決策提供支持和依據(jù)。
從功能上來(lái)看,CRM系統(tǒng)可分為三種類型[5]:
1)操作型CRM
操作型CRM也稱為流程型CRM,主要用于客戶信息的自動(dòng)集成過(guò)程,實(shí)現(xiàn)企業(yè)各部門(mén)對(duì)客戶信息的協(xié)同合作。
2)分析型CRM
分析型CRM用于分析操作型CRM中產(chǎn)生的各種數(shù)據(jù),使用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)產(chǎn)生商務(wù)智能,為企業(yè)決策提供支持。3)合作型CRM
合作型CRM用于企業(yè)與客戶的合作服務(wù)系統(tǒng),包括電話、呼叫系統(tǒng)、電子郵件等,它能實(shí)現(xiàn)客戶信息的全面收集。
2.2數(shù)據(jù)倉(cāng)庫(kù)的形成
數(shù)據(jù)倉(cāng)庫(kù)是CRM的中央存儲(chǔ)系統(tǒng)。在這個(gè)信息爆炸的時(shí)代,各個(gè)企業(yè)經(jīng)過(guò)長(zhǎng)期經(jīng)營(yíng),收集了大量的客戶數(shù)據(jù)。而這些海量、異構(gòu)的數(shù)據(jù)被分散在不同部門(mén),沒(méi)有得到充分合理的利用。因此,首先要做的是對(duì)這些海量分散的數(shù)據(jù)進(jìn)行清洗、集成和轉(zhuǎn)換,建立一個(gè)整合的、標(biāo)準(zhǔn)化、結(jié)構(gòu)化的數(shù)據(jù)模型,形成全面、一致和面向決策的數(shù)據(jù),即數(shù)據(jù)倉(cāng)庫(kù)。對(duì)已形成的數(shù)據(jù)倉(cāng)庫(kù),按照不同的主題,產(chǎn)生多個(gè)對(duì)應(yīng)的數(shù)據(jù)處理模塊,如普通客戶數(shù)據(jù)模塊,Vip客戶數(shù)據(jù)模塊,團(tuán)體客戶數(shù)據(jù)模塊等,這種多數(shù)據(jù)模塊的建設(shè)有利于分析不同客戶的行為特點(diǎn)。
2.3數(shù)據(jù)挖掘技術(shù)的應(yīng)用
使用數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)客戶信息進(jìn)行分析,從而挖掘出對(duì)企業(yè)發(fā)展有價(jià)值的信息,如:新客戶開(kāi)發(fā)、交叉銷售及預(yù)測(cè)、客戶信用分析、客戶細(xì)分、客戶類別分析等客戶關(guān)系管理功能,為企業(yè)決策者提供更有效的的決策支持,最大程度地發(fā)揮企業(yè)CRM的作用。
近年來(lái),隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,企業(yè)要想獲得一個(gè)新客戶,所花費(fèi)的開(kāi)銷往往是爭(zhēng)取留住老客戶的幾倍。有統(tǒng)計(jì)數(shù)據(jù)表明:1)公司一般每年平均流失10%的老客戶;
2)企業(yè)留住5%的老客戶,利潤(rùn)提升100%;
3)開(kāi)發(fā)新客戶的成本是留住老客戶成本的5-8倍;
4)一個(gè)公司如果將其客戶流失率降低5%,其利潤(rùn)就可能增加25-85%。
因此保持老客戶就顯得更有價(jià)值。那么,如何才能預(yù)防、減少客戶的流失呢?一個(gè)非常重要的工作就是要找出顧客流失的原因。我們可以通過(guò)數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)這一目標(biāo)。
現(xiàn)以電信公司判斷用戶離網(wǎng)的可能性來(lái)做分析,首先進(jìn)行數(shù)據(jù)準(zhǔn)備,抽取一定量的用戶信息,提取的信息主要包括:用戶號(hào)碼、用戶類型、用戶狀態(tài)、話費(fèi)性質(zhì)(長(zhǎng)話/市話)、欠費(fèi)情況、投訴次數(shù)等,利用這些數(shù)據(jù),我們來(lái)建立判斷用戶離網(wǎng)可能性的模型。
在數(shù)據(jù)準(zhǔn)備和適當(dāng)?shù)念A(yù)處理之后,我們采用決策樹(shù)中的C4.5算法建立決策樹(shù)模型。這里,我們引入了信息論中的信息增益率的概念并以此作為屬性選擇的標(biāo)準(zhǔn),其核心是在決策樹(shù)的各級(jí)節(jié)點(diǎn)上選擇屬性時(shí)用信息增益率作為屬性選擇標(biāo)準(zhǔn)。通過(guò)計(jì)算這些屬性的信息增益率,找出“投訴次數(shù)”屬性作為決策樹(shù)的根節(jié)點(diǎn)。擴(kuò)展決策樹(shù)節(jié)點(diǎn),進(jìn)行分枝,其他中間節(jié)點(diǎn)也是選擇各節(jié)點(diǎn)檢測(cè)屬性增益最大的屬性,同級(jí)的預(yù)選屬性的增益相同時(shí),規(guī)定選擇屬性值個(gè)數(shù)較少的屬性作為當(dāng)前節(jié)點(diǎn)的分枝,最后,我們可以生成一棵決策樹(shù)。
生成的決策樹(shù)還需要進(jìn)行進(jìn)一步驗(yàn)證,才能最終得到可用的分類模型。選擇一些具有共同特征的已離網(wǎng)用戶作為測(cè)試數(shù)據(jù),輸入屬性值進(jìn)行離網(wǎng)判斷,檢驗(yàn)?zāi)P偷恼_性,生成最終的決策樹(shù)模型。
使用生成的決策樹(shù)模型,對(duì)比用戶的信息是否貼近離網(wǎng)用戶的特征屬性值,能大致預(yù)測(cè)出該用戶的離網(wǎng)可能性,對(duì)離網(wǎng)可能性高的用戶,根據(jù)其特征屬性進(jìn)行挽留工作,從而預(yù)防、減少客戶的流失。
3結(jié)束語(yǔ)
在當(dāng)前的技術(shù)形式下,將數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)有效運(yùn)用在CRM中,對(duì)企業(yè)收集的大量客戶數(shù)據(jù)信息進(jìn)行分析,挖掘出對(duì)企業(yè)發(fā)展有價(jià)值的客戶信息,從而更有效地提升企業(yè)的競(jìng)爭(zhēng)能力,樹(shù)立企業(yè)的品牌形象,幫助企業(yè)實(shí)現(xiàn)有效的市場(chǎng)營(yíng)銷和客戶服務(wù),達(dá)到成功挽留客戶的目的。相信未來(lái)會(huì)有更多的行業(yè)加入使用客戶關(guān)系管理的行列中,通過(guò)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)挖掘出對(duì)自身發(fā)展有用的信息,也必使CRM的目標(biāo)得到更好的實(shí)現(xiàn)。
參考文獻(xiàn):
[1]白雪.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用研究[J] .大眾科技,2012 (2).
[2] Han Jianwei,Micheline Kamber.Data Mining Concepts and Techniques[M].Morgan Kanfmann Publishing,2000.
[3]陳安.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2006.
[4]董寧.數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2007(6).
[5] Alex Berson,Stephen Smith,Kurt Thearling.Building DataMining Applications for CRM [M].北京:人民郵電出版社,2001.