国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹C5.0的商業(yè)銀行客戶細分研究

2014-04-29 09:52:17王未卿龔曉狄劉澄
中國管理信息化 2014年5期
關鍵詞:決策樹

王未卿 龔曉狄 劉澄

[摘 要] 客戶細分是商業(yè)銀行客戶關系管理的核心技術之一。本文首先對國內某商業(yè)銀行客戶的性別、年齡、學歷、職業(yè)、年薪、婚姻狀況、健康狀況和居住年限8類重要屬性進行標準化處理,利用聚類分析方法將客戶粗分為4類,進而采用決策樹C5.0算法對該銀行客戶進行細分,得出更為細致的分類規(guī)則。最后針對4類客戶的特征和屬性,設計出差異化的銀行客戶服務體系方案。

[關鍵詞] 客戶細分;決策樹;差異化營銷

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 05. 019

[中圖分類號] F830.33;F830.49 [文獻標識碼] A [文章編號] 1673 - 0194(2014)05- 0026- 04

0 引 言

在現(xiàn)代的商業(yè)銀行客戶關系管理(Customer Relationship Management, CRM)中,面對海量的客戶信息,銀行需要對數(shù)據(jù)庫中的原始客戶數(shù)據(jù)進行深層次挖掘、合理分類,才有可能實現(xiàn)高效的管理。據(jù)美國META集團的調查發(fā)現(xiàn),數(shù)據(jù)挖掘技術已經(jīng)在美國金融業(yè)、商貿業(yè)等行業(yè)得到了廣泛的應用。采用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的企業(yè)大幅度提高了投資回報率,部分優(yōu)秀企業(yè)的投資回報率甚至達到每年600%。毋庸置疑,數(shù)據(jù)挖掘技術優(yōu)化了CRM系統(tǒng)的服務功能,可以為客戶服務提供準確的參考信息,提高客戶事務的處理能力。因此,在銀行客戶管理中,數(shù)據(jù)挖掘技術得到高度重視。

利用數(shù)據(jù)挖掘技術對客戶進行細分是客戶關系管理的重要一環(huán)。學者們致力于開發(fā)不同的數(shù)據(jù)挖掘技術進行客戶細分研究,如基于KSP混合聚類算法的移動商務中的客戶細分、基于模糊聚類集成算法的客戶細分等。對商業(yè)銀行而言,客戶的細分可以幫助銀行識別優(yōu)質客戶,并針對不同客戶執(zhí)行個性化的營銷策略,以實現(xiàn)合理分配資源,更好地進行經(jīng)營決策。其中,決策樹分類技術就是一種有效的對銀行客戶進行分類的數(shù)據(jù)挖掘技術。最早,Quinlan等人(1986)提出決策樹ID3方法,該算法采用信息增益選擇策略的方式進行分類,具有使用簡單、樣本識別率高等優(yōu)點,被廣泛應用于客戶價值分析、反洗錢、客戶貸款預測等方面。ID3方法在銀行客戶分類中的應用在很大程度上提高了客戶分類的準確度。此后,一些學者開始嘗試對ID3算法進行改進。康健和梁允榮(2003)改進了決策樹的ID3算法,提出了數(shù)據(jù)挖掘結果可視化展現(xiàn)的兩層軟件結構,并以內蒙某銀行為例驗證了算法的可行性。鄒鵬 等(2011)針對客戶錯誤分類不平衡的問題,對經(jīng)典的ID3信息增益決策樹算法進行改進,把對客戶誤判的代價納入考量范圍,構建了一個代價敏感的決策樹對客戶價值進行細分,驗證了這個方法在挖掘優(yōu)質客戶時更有效。

綜上所述,客戶關系管理要求銀行與客戶之間建立有效的溝通渠道,而決策樹分類技術進一步優(yōu)化溝通的有效性,提高客戶關系管理效果,優(yōu)化管理決策。盡管如此,目前決策樹分類技術在銀行客戶分類應用中仍然存在一些不足之處:一是決策樹算法的精度和效率有待于進一步提高;二是在對銀行客戶細分之后,缺乏針對不同客戶營銷方案的設計。針對以上不足,本文將繼續(xù)探索基于決策樹的銀行客戶分類研究,利用精度更高的C5.0決策樹分類算法,以銀行的真實數(shù)據(jù)樣本為例,對銀行客戶進行細分,進而針對不同類型的客戶提供具體的營銷方案。

1 決策樹C5.0算法

在經(jīng)歷決策樹ID3、C4.5算法之后,C5.0算法采用決策樹剪枝技術和Boosting技術,減少了過度擬合問題,有效地提高了算法的效率和精度,并提升了處理大型數(shù)據(jù)的能力。

C5.0 算法采用最大屬性信息增益率來選擇屬性,下面簡要介紹 C5.0 決策樹的產(chǎn)生及計算過程。假設集合數(shù)據(jù)S按屬性C劃分為m類不同的類數(shù)據(jù)子集Ci(i=1,2,…,m),每個類數(shù)據(jù)子集Ci(i=1,2,…,m)的樣本數(shù)為ni(i=1,2,…,m),pi為類別Ci(i=1,2,…,m)樣本數(shù)ni(i=1,2,…,m)占總樣本數(shù)n的比例,即pi=ni /n。S是n個樣本數(shù)據(jù)的集合,樣本數(shù)據(jù)集合的信息熵用下式表示:

E(S)=-■pi log2(pi)(1)

假設屬性A將樣本數(shù)據(jù)集合S劃分成v個子集Sv,每個子集Sv的取值均為av,nij是子集Sj中屬于Ci(i=1,2,…,m)類的樣本數(shù),p′j是屬于屬性A的屬性值為aj的樣本數(shù)占總樣本數(shù)的比例,即p′j=■nij/n,pij是屬性A屬性值為aj時,類別為Ci(i=1,2,…,m)的概率,即pij=nij/■nij。屬性A的條件熵可以用下式表示:

E(S|A)=-■p′j■pij log2(pij)(2)

進而可以得到屬性A的信息增益Gain(A),信息熵SplitI(A)和信息增益率GainRatio(A),三者的表達式分別為:

Gain(A)=E(S)-E(S|A)(3)

SplitI(A)=-■p′j log2(p′j)(4)

GainRatio(A)=Gain(A)/SplitI(A)(5)

然后通過比較各個屬性的信息增益率即可確定決策樹的節(jié)點,重復以上過程,最終能夠得出屬性分類的決策樹。

2 商業(yè)銀行客戶分類

2.1 銀行客戶樣本及細分變量的選取

客戶樣本是從北京市某商業(yè)銀行客戶數(shù)據(jù)庫中隨機抽選得到,樣本數(shù)量為500個。每個銀行客戶樣本涵蓋其基本的個人信息、收入狀況和信用狀況等。

細分變量的選擇是客戶細分的基礎,在進行銀行客戶細分變量的選取時,重點考慮變量的代表指標的可獲得性、變量之間的差異性和變量的時效性。通常情況下,細分變量主要分為行為變量和描述型變量兩類。行為變量是指涉及客戶消費行為和其與銀行相互關系的一系列變量指標,它可以幫助銀行的營銷人員和客戶服務人員掌握和理解客戶的交易行為。描述型變量主要是描述客戶基本屬性信息的靜態(tài)數(shù)據(jù),如客戶的性別、年齡、年薪、房屋住所等變量。

綜合考量銀行客戶細分變量的注意事項,本文采取描述型變量細分法,選取性別、年齡、學歷、職業(yè)、年薪、婚姻狀況、健康狀況和居住年限8個變量作為銀行客戶細分的指標。

2.2 基于聚類分析的銀行客戶初分

為了對銀行客戶特征進行初步的判斷,采用聚類分析的方法對500個客戶樣本進行初分。在聚類分析之前,首先將銀行客戶的各類特征屬性進行標準化處理,處理的方法是將各指標按照屬性的特征分為2~4類,具體規(guī)則見表1。

以上指標經(jīng)過量化處理后,利用SPSS軟件中的系統(tǒng)聚類方法對原始數(shù)據(jù)進行聚類分析,其中距離分析采用歐氏距離和類平均法。選取閾值16,將500名銀行客戶分為4類:低檔客戶、關注客戶、普通客戶以及重要客戶。分類結果描述如下。

(1)低檔客戶:類別1為低檔客戶,共有51位,年齡大部分在40~50歲之間,年薪整體水平相對較低,不正常。

(2)重要客戶:類別2為重要客戶,共有264位,年齡大部分在40~50歲之間,年薪整體水平相對較高,正常。

(3)關注客戶:類別3為關注客戶,共有37位,年齡大部分在35~45歲之間,年薪整體水平相對較低,不正常。

(4)普通客戶:類別4為普通客戶,共有148位,年齡大部分在20~30歲之間,未婚者多,年薪整體水平相對不高,正常。

2.3 基于決策樹的銀行客戶細分

在對銀行客戶的進行決策樹細分之前,仍然需要對其8類特征屬性進行標準化處理,然后按照聚類分析的4類客戶結果進行匹配,挖掘客戶分類更為細致的規(guī)則。利用決策樹C5.0 方法對商業(yè)銀行客戶進行分類,主要通過第二部分介紹的計算節(jié)點特征屬性信息增益率的方法對各類屬性進行劃分。具體的過程利用SPSS Clementime軟件來實現(xiàn),并采用決策樹剪枝技術和Boosting技術提高分類的精確性。最終,在調節(jié)CF值為0.25,Boosting技術迭代5次的情況下,SPSS Clementime軟件進行決策樹分類達到最優(yōu)的效果。最優(yōu)決策樹共含有10個葉節(jié)點,如圖1所示。

總結銀行客戶決策樹分類結果,得出10個葉節(jié)點的決策規(guī)則,具體內容如下:

(1)年薪30萬元以上(第三、四類),則認定該客戶為重要客戶。

(2)年薪30萬元以下(第一、二類),年齡36歲以上(第三、四類),且學歷為高中、中專(第二類),則認定該客戶為低檔客戶。

(3)年薪30萬元以下(第一、二類),年齡36歲以上(第三、四類),且學歷為初中以下或本科以上(第一、三、四類),健康狀況良(第二類),則認定該客戶為重要客戶。

(4)年薪30萬元以下(第一、二類),年齡46歲以上(第四類),且學歷為初中以下或本科以上(第一、三、四類),健康狀況優(yōu)(第一類),則認定該客戶為重要客戶。

(5)年薪30萬元以下(第一、二類),年齡36~45歲之間(第三類),且學歷為初中以下或本科、大專(第一、三類),健康狀況為優(yōu)(第一類),則認定該客戶為關注客戶。

(6)年薪30萬元以下(第一、二類),年齡在36~45歲之間(第三類),且學歷為碩士或博士(第四類),健康狀況為優(yōu)(第一類),則認定該客戶為普通客戶。

(7)年薪30萬元以下(第一、二類),年齡20~35歲之間(第一、二類),性別男(第一類),則認定該客戶為普通客戶。

(8)年薪30萬元以下(第一、二類),年齡20~35之間(第一、二類),性別女(第二類),職業(yè)為教師、勘探設計、建筑設計、醫(yī)務服務類(第一、三類),學歷為本科、大專(第三類),則認定該客戶為重要客戶。

(9)年薪30萬元以下(第一、二類),年齡20~35之間(第一、二類),性別女(第二類),職業(yè)為教師、勘探設計、建筑設計、醫(yī)務服務類(第三類),學歷為碩士、博士(第四類),則認定該客戶為普通客戶。

(10)年薪30萬元以下(第一、二類),年齡20~35之間(第一、二類),性別女(第二類),職業(yè)為農民、工人、學生、服務員、廣播電視臺、石化公司、網(wǎng)通保險、銀行職員、軍人、煙草、公務員、房地產(chǎn)、進出口貿易類(第一、二類),則為普通客戶。

3 商業(yè)銀行客戶分類營銷方案設計

在對客戶細分之后,商業(yè)銀行可以針對不同的客戶采取差異化的營銷方式。這樣不僅能夠有效地降低銀行運營成本,同時還可以為目標客戶提供滿意的產(chǎn)品和服務,以擴大市場占有率。為此,本部分針對聚類分析得到的4類商業(yè)銀行客戶群,結合決策樹細分所得出的分類規(guī)則,為其設計差異化的營銷方案。

3.1 重要客戶

重要客戶對銀行的綜合貢獻最大,是銀行主要的收入來源。因此,針對此類客戶銀行應當采取的策略有:建立客戶經(jīng)理“一對一”的服務制度,為其提供“一對一”的人性化、優(yōu)質化服務,對此類客戶的服務最終應發(fā)展成為西方銀行所流行的私人銀行業(yè)務。提供個人高端理財業(yè)務、離岸業(yè)務、境外結算、實時匯兌、衍生交易、受托金融資產(chǎn)管理、代客投資理財?shù)确眨瑫r還可以提供各種優(yōu)惠,包括減免借記卡和信用卡的年費、透支使用的利息、代收付業(yè)務的費用;優(yōu)惠貸款利率、外匯買賣匯率、證券交易傭金等。通過上述方式為此類最有價值的客戶群體提供量身定制的個性化產(chǎn)品,提高客戶的滿意度與忠誠度。

3.2 普通客戶

從聚類分析的結果來看,本文所劃分的普通客戶的平均年薪整體水平不高,同時居住年限也多為10年以下甚至有1/3以上的居住年限為5年以下,但是平均學歷卻比較高,大多數(shù)為本科以上學歷,所以這類客戶基本處于事業(yè)發(fā)展的初期階段,大多數(shù)應為年輕客戶,同時,升為重要客戶的可能性比較大,因此可以針對其特點實行特別的營銷策略。

首先,要定期對客戶的成長潛力進行有效評估,比如可以觀察其年薪增長率和儲蓄基金等賬戶金額變動,對一些有較大可能發(fā)展為重要客戶的客戶,可以開展持卡消費積分或者抽獎以及持卡繳費減免手續(xù)費等優(yōu)惠活動。其次,對于這類客戶中年薪增長緩慢但是也能給銀行帶來穩(wěn)定收入的客戶,銀行可以盡可能多地進行客戶問卷調查或回訪,了解其需求,通過提供更優(yōu)質的、個性化的服務來吸引這些客戶,比如銀行可以針對性地為客戶提供一些理財產(chǎn)品或者基金產(chǎn)品;針對客戶的消費行為,提供POS消費免手續(xù)費;完善銀行的網(wǎng)上付款系統(tǒng),降低客戶消費成本,使他們更忠誠于本銀行,從而持久性地為銀行創(chuàng)造價值。

3.3 低檔客戶

本文所劃分的低檔客戶存在的特點是居住年限長達18.6年,平均年薪雖然遠遠低于重點客戶,但是卻高于普通客戶和關注客戶,說明這組客戶群應該是中年穩(wěn)定客戶,他們的賬戶總額應該不會有太大變動,收入也不是特別高,因此對于這類客戶主要任務是采取相應的營銷策略防止其流失。

因為該類客戶給銀行帶來穩(wěn)定的收益,且中年客戶不像年輕客戶沒有很多的消費金額,因此可以針對這類客戶的刷卡消費進行消費積分,一方面是鼓勵消費,增加銀行的業(yè)務收入,另一方面對客戶的消費積分進行累計換購或者積分換禮等活動,提升這類客戶的忠誠度,保證銀行的這類客戶的利潤來源。同時這類客戶可能對銀行的中間代收業(yè)務使用頻繁,可以為他們提供便捷的自助式繳費方式,如存折、銀行卡繳費服務等,以防止這類客戶流失。

3.4 關注客戶

關注類客戶群的年齡范圍在35~45歲之間,年薪在4類客戶群體中是最低的。此類客戶貸款違約的可能性較大,是對商業(yè)銀行的收入貢獻最低的,也是對于銀行來說價值最低的。因此,此類客戶對銀行的吸引力較小,銀行將投入較少的資源甚至采取一些營銷策略試圖解除與該類客戶的關系。

盡管如此,銀行也不能以任何理由將此類客戶拒之門外,而向其收取額外的服務費用也是有限制的。因此,銀行只好被動地為其提供存款類業(yè)務和一些中間服務,包括定期存款、活期存折、存單質押、轉賬匯款、自助銀行、網(wǎng)上銀行、電話銀行和代收代付中間業(yè)務等。而對于此類客戶的貸款業(yè)務,應當著重預防違約風險的發(fā)生。此外,銀行還可以通過縮減為此類客戶辦理業(yè)務的柜臺數(shù)量,鼓勵其使用自助柜員終端,而達到合理配置銀行有限資源的目的,同時,可以鼓勵或強制要求此類低效客戶歸并小額活期存款戶頭,并在政策的指導下收取小額賬戶管理費,以達到逐步清掃低價值客戶的目的,從而縮減銀行運營成本,增加收益。

4 結 論

商業(yè)銀行客戶細分,對銀行了解客戶特征和需求,實施差異化的服務體系,保持并擴大客戶資源具有重要意義。本文主要采用決策樹C5.0算法對商業(yè)銀行客戶進行了細分。首先梳理決策樹算法的發(fā)展概況,選用精度較高,使用范圍較廣的C5.0算法作為核心分類工具。通過遴選出商業(yè)銀行客戶的性別、年齡、學歷、職業(yè)、年薪、婚姻狀況、健康狀況和居住年限8類重要屬性,利用聚類分析方法將客戶粗分為重要客戶、普通客戶、低檔客戶與關注客戶4類,進而采用C5.0的決策樹算法對客戶進行細分,得出更為細致的分類規(guī)則。最后針對4類客戶的特征和屬性,設計了差異化的銀行客戶服務體系方案,以期為銀行與客戶之間建立長期而穩(wěn)定的合作關系,完善客戶關系管理,實現(xiàn)銀行收益的持續(xù)增加提供有價值的參考。

主要參考文獻

[1]Kim T S, Kim H K, Song H S, et al. Detecting the Change of Customer Behavior Based on Decision Tree Analysis [J]. Expert Systems, 2005, 22(4):193-205.

[2]Koh H C, Chan K L G. Data Mining and Customer Relationship Marketing in the Banking Industry[J]. Singapore Management Review, 2002, 24(2): 1-27.

[3]Quinlan J R. Bagging,Boosting, and C4.5[C]. Procceding of 14th National Conference on Artificial Intelligence.Portland, Oregon, 1996: 725-730.

[4]Quinlan J R. Boosting First-order Learning[C].Proceedings of 7th Internationol Work Shop of Algorithmic Learning Theory. Sydney,Australia, 1996: 143-155.

[5]Quinlan J R. Induction of Decision Trees[J]. Machine Learning,1986, 1(1):81-106.

[6]Tillett L S. Banks Mine Customer Data[J]. Internet Week, 2000(831):45-46.

[7]鄧曉懿,金淳,樋口良之,等.移動商務中面向客戶細分的KSP混合聚類算法[J].管理科學,2011(4):54-61.

[8]高偉,賀昌政,蔣曉毅.基于模糊聚類集成算法的客戶細分研究[J].情報雜志,2011(4):125-128.

[9]康健,梁允榮.分類挖掘技術在金融客戶關系管理中的應用[J].北京理工大學學報,2003,23(2):207-211.

[10]鄒鵬,莫佳卉,江亦華,等.基于代價敏感決策樹的客戶價值細分[J].管理科學,2011,24(2):20-29.

猜你喜歡
決策樹
基于決策樹和神經(jīng)網(wǎng)絡的高血壓病危險因素研究
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
電子制作(2018年16期)2018-09-26 03:27:06
基于改進決策樹的故障診斷方法研究
決策樹多元分類模型預測森林植被覆蓋
電子制作(2017年24期)2017-02-02 07:14:23
基于決策樹算法的數(shù)據(jù)挖掘應用研究
今日財富(2016年6期)2016-10-21 05:40:53
基于決策樹的出租車乘客出行目的識別
基于決策樹的復雜電網(wǎng)多諧波源監(jiān)管
電測與儀表(2016年2期)2016-04-12 00:24:40
基于模糊關聯(lián)規(guī)則和決策樹的圖像自動標注
基于肺癌CT的決策樹模型在肺癌診斷中的應用
萨嘎县| 延长县| 榆树市| 内江市| 开封县| 石河子市| 黔江区| 高邑县| 景德镇市| 和田市| 通河县| 明溪县| 新野县| 济南市| 花垣县| 溆浦县| 南宁市| 昌吉市| 西乡县| 武定县| 钦州市| 漯河市| 东宁县| 台中县| 华亭县| 衡南县| 商都县| 海南省| 辽阳县| 名山县| 永安市| 岗巴县| 仙居县| 西昌市| 绥化市| 锦屏县| 新乐市| 斗六市| 谢通门县| 南涧| 贡觉县|