国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于IBM SPSS決策樹之客戶流失分析

2017-01-13 09:50邱文俊
中國新通信 2016年22期
關(guān)鍵詞:字段決策樹級別

邱文俊

【摘要】 商務(wù)智能是從大量的數(shù)據(jù)和信息中發(fā)掘有用的知識、并用于決策以增加商業(yè)利潤,是一個從數(shù)據(jù)到信息到知識的處理過程。在 IBM SPSS Modeler中,使用四種常用的決策樹演算法對顧客流失進(jìn)行數(shù)據(jù)挖掘分析,幫助企業(yè)對留住顧客做出最有利的決策。

【關(guān)鍵字】 企業(yè) 顧客流失 數(shù)據(jù)挖掘 決策樹

一、背景

商務(wù)智能是從大量的數(shù)據(jù)和信息中發(fā)掘有用的知識、并用于決策,以增加商業(yè)利潤,是一個從數(shù)據(jù)到信息到知識的處理過程。商務(wù)智能輔助商業(yè)活動作出快速反應(yīng),加快知識的獲取速度,減少企業(yè)不確定性因素的影響,滿足管理層和決策層對信息知識的時間性和準(zhǔn)確性的要求。超過2000個世界領(lǐng)先的品牌依靠IBM數(shù)十載的商務(wù)經(jīng)驗改善業(yè)務(wù)洞察和執(zhí)行,幫助企業(yè)向客戶和合作伙伴增加交付的價值。政府或企業(yè)都需要在海量的信息中獲取有價值的信息,并據(jù)此做出科學(xué)的評估和決策。SPSS( 社會科學(xué)統(tǒng)計程序)是一套集數(shù)據(jù)信息的采集、處理、分析、評估、預(yù)測、并給出專業(yè)人士可接受解決方案的軟件。IBM在收購SPSS后發(fā)布了IBM SPSS,在原有SPSS基礎(chǔ)上融入商務(wù)智能理念,拓展了分析、評估、預(yù)測模型,具有了更加豐富強(qiáng)大的智能決策支持能力。

二、問題分析

市場調(diào)查顯示:一個公司平均每年約有10%-30%的顧客卻在流失。但很多公司常常不知道失去的是哪些顧客,更不知道這樣會給他們的銷售收入和利潤帶來怎樣的影響。冷靜地研究分析顧客流失,對于企業(yè)挽救危機(jī)、健康成長具有十分重要的意義。

顧客流失是現(xiàn)代公司通過計算一位顧客一生能為公司帶來多少銷售額和利潤來衡量顧客價值。尋找他們流失的原因即流失客戶的特征,通過數(shù)據(jù)處理,根據(jù)以前擁有的客戶流失數(shù)據(jù)建立基本屬性、服務(wù)屬性和客戶消費數(shù)據(jù)與客戶流失可能性的數(shù)據(jù)模型,找出其潛在的關(guān)系,分析出客戶流失的因素,預(yù)測客戶是否流失的可能性。對于客戶的基本數(shù)據(jù)、行為數(shù)據(jù)及消費數(shù)據(jù),進(jìn)行數(shù)據(jù)挖掘研究已流失客戶數(shù)據(jù),從中找出先前未知的、對企業(yè)決策有潛在價值的知識和規(guī)則,發(fā)掘潛在流失客戶,讓企業(yè)適時把握住市場及客戶動態(tài),掌握客戶流失的規(guī)律。

三、解決算法

決策樹演算法

人們認(rèn)識事物時往往先把被認(rèn)識的對象進(jìn)行分類,以便尋找其中同與不同的特征,從而構(gòu)建特征模型。在數(shù)據(jù)挖掘中一般用規(guī)則或決策樹模式表示。

一個決策樹的架構(gòu),是由三個部分所組成:葉節(jié)點、決策節(jié)點以及分支。決策樹演算法的基本原理為:通過演算法中所規(guī)定的分類條件對于整體數(shù)據(jù)進(jìn)行分類,產(chǎn)生一個決策節(jié)點,并持續(xù)依照演算法規(guī)則分類,直到數(shù)據(jù)無法再分類為止。在IBM SPSS Modeler中,主要提供了四種常用的決策樹演算法供使用者選擇。使用者可依據(jù)數(shù)據(jù)類型以及分析需求的不同,選擇適當(dāng)?shù)臎Q策樹演算法進(jìn)行分析。雖然不同的決策樹演算法有各自適用的數(shù)據(jù)類型以及演算架構(gòu)等差異,但概括來說,決策樹的主要原理均為通過演算法所定義的規(guī)則,對數(shù)據(jù)進(jìn)行分類,以建立決策樹。

①C5.0由C4.5演化而來。此演算法的分類原理主要是利用資訊衡量標(biāo)準(zhǔn)來構(gòu)建決策樹,并對每一個節(jié)點產(chǎn)生不同數(shù)目的分支來分割數(shù)據(jù),直到數(shù)據(jù)無法分割為止。C5.0的目標(biāo)字段測量級別,不適用于連續(xù)類型的測量級別。而輸入字段的數(shù)據(jù)型態(tài)則適用連續(xù)類型的測量級別。②CHAID此演算法和前述的C5.0概念很像,均可以在每一個節(jié)點產(chǎn)生不同數(shù)目的分支來分割數(shù)據(jù),用來建立決策樹。但是在背后分類的原理則利用卡方分析檢定來進(jìn)行分支,通過卡方檢定來計算節(jié)點中的P-value,來決定數(shù)據(jù)是否仍須進(jìn)行分支。另外,CHAID的目標(biāo)字段的測量級別可適用于連續(xù)類型的測量級別,但在輸入字段則只適用分類類型的測量級別。③QUEST此演算法是利用統(tǒng)計方法分割數(shù)據(jù),即以判定決策樹是否仍需進(jìn)行分支,以建立二元的決策樹。QUEST在變數(shù)的數(shù)據(jù)型態(tài)限制上,跟C5.0一樣,目標(biāo)字段測量級別,不適用于連續(xù)類型的測量級別。但在輸入字段的測量級別則適用連續(xù)類型的測量級別。④C&R Tree 又稱為 CART,構(gòu)建決策樹的原理是使用Gini Ratio作為判定決策樹是否仍須進(jìn)行分支的依據(jù),并建立二元的決策樹。此演算法不管是在目標(biāo)變數(shù)以及輸入字段的測量級別均適用連續(xù)類型的測量級別做分析。

四、方案對策

隨著國內(nèi)各種企業(yè)的改革,激烈的競爭下各企業(yè)都面臨嚴(yán)重的客戶流失問題。大量的客戶流失延長了企業(yè)利潤回收的周期,給企業(yè)造成了巨大的損失。在這種形勢下,如何分析客戶行為預(yù)測客戶的流失,并結(jié)合競爭環(huán)境的變化制定有效的客戶挽留以實現(xiàn)企業(yè)利益的最大化,已成為企業(yè)的一個重要課題。減少客戶流失的具體措施:開展品牌工程建設(shè)、開展個性化服務(wù)、做好客戶關(guān)系的開發(fā)和維持工作、積極參與建立公平的市場秩序、完善自身業(yè)務(wù)能力、做好營銷隊伍建設(shè)等。

參 考 文 獻(xiàn)

[1] 劉小虎,李生. 決策樹的優(yōu)化算法[J]. 軟件學(xué)報. 1998(10)

[2] 王秀巖. 決策樹算法及其應(yīng)用[J]. 電子技術(shù)與軟件工程. 2014(05)

猜你喜歡
字段決策樹級別
帶鉤或不帶鉤選擇方框批量自動換
多崇尚些“精神級別”
基于BSTL與XGDT算法對多級別心理壓力的評估
簡述一種基于C4.5的隨機(jī)決策樹集成分類算法設(shè)計
級別分明
決策樹學(xué)習(xí)的剪枝方法
探討CNMARC格式中200字段題名的規(guī)范著錄
無正題名文獻(xiàn)著錄方法評述
決策樹在施工項目管理中的應(yīng)用
中網(wǎng)級別聯(lián)賽武漢站打響頭炮