王素娟
摘要:隨著移動互聯(lián)網(wǎng)的蓬勃發(fā)展,電信服務(wù)企業(yè)處于日趨激烈的競爭漩渦中,對于電信企業(yè)來說,客戶的多少決定著企業(yè)的自身競爭力與效益,精準(zhǔn)預(yù)測客戶流失風(fēng)險對企業(yè)的戰(zhàn)略決策來說至關(guān)重要。因此,本文結(jié)合電信行業(yè)的背景,利用BP神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)理論,融合CRM系統(tǒng)中的數(shù)據(jù),建立了電信行業(yè)客戶風(fēng)險預(yù)測模型,并通過Matlab實驗平臺驗證模型預(yù)測的可行性、準(zhǔn)確性與有效性。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);電信行業(yè);風(fēng)險預(yù)測;客戶流失
中圖分類號:F416? ? 文獻標(biāo)識碼:A
文章編號:1005-913X(2020)10-0050-03
近些年來,我國的互聯(lián)網(wǎng)產(chǎn)業(yè)進入了高速發(fā)展的軌道,各種互聯(lián)網(wǎng)產(chǎn)品和移動終端相繼出現(xiàn),其中移動互聯(lián)網(wǎng)行業(yè)更是連續(xù)幾年保持飛速增長,這種飛速增長的態(tài)勢相應(yīng)地也加快了我國電信行業(yè)的發(fā)展。根據(jù)有關(guān)數(shù)據(jù)表明,我國的移動互聯(lián)網(wǎng)產(chǎn)業(yè)產(chǎn)值已躍居全球第一,移動智能手機產(chǎn)量位居世界第一,4G用戶也在保持持續(xù)增長。截至2019年,中國電信擁有3.258億4G用戶,中國聯(lián)通擁有3.2462億用戶,中國移動用戶數(shù)高達9.38641億,占全國用戶60.16%。電信行業(yè)面臨著日益嚴(yán)峻的競爭壓力,激烈的競爭也就迫使各電信企業(yè)采取措施發(fā)展新客戶和留住老客戶,以此提高自身在行業(yè)的競爭力,而從運營成本來說,挽留老客戶的成本相對較少。因此,如何精確的預(yù)測客戶流失的風(fēng)險,對運營商的決策起著舉足輕重的作用。
行業(yè)客戶流失風(fēng)險的預(yù)測是當(dāng)前學(xué)術(shù)界研究的熱點,從研究對象和研究方法上來看,相關(guān)研究可分為兩類:第一類大多從客戶層面出發(fā),利用數(shù)據(jù)挖掘技術(shù),結(jié)合決策樹、支持向量機等分類算法深入研究客戶性質(zhì)和消費行為,構(gòu)建客戶流失的風(fēng)險預(yù)測模型。例如Ahmad AK[5]利用SyriaTel電信公司的大量原始數(shù)據(jù),結(jié)合XGBOOST算法構(gòu)建電信公司的客戶流失風(fēng)險預(yù)測模型,并應(yīng)用于客戶流失的分類。第二類從客戶關(guān)系管理角度出發(fā)結(jié)合其他的算法例如邏輯回歸、灰色預(yù)測等對客戶流失行為預(yù)測并采取挽救措施。例如,Vijaya J[6]結(jié)合粗糙集理論本提出了一種識別電信客戶流失預(yù)測有效特征的方法。
這些研究為電信行業(yè)決策者理解客戶流失風(fēng)險預(yù)測提供了很好的視角,但也存在一些不足:一是,大多學(xué)者的研究對象在客戶層面,研究領(lǐng)域主要集中在金融行業(yè)、電子商務(wù)、銀行業(yè)務(wù)領(lǐng)域,缺乏電信行業(yè)的針對性的客戶流失風(fēng)險預(yù)測;二是,從大量學(xué)者的研究反饋中得出,眾多研究者的研究仿真精準(zhǔn)度不高,須要對模型展開改進與完備。本文認為要克服上述的第一個問題就必須充分結(jié)合我國電信行業(yè)的客戶關(guān)系管理的相關(guān)理念,從企業(yè)的客戶管理角度構(gòu)建評價指標(biāo)體系,克服第二個問題應(yīng)挖掘相關(guān)電信企業(yè)的數(shù)據(jù),借助于BP神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建電信行業(yè)客戶風(fēng)險預(yù)測模型,并通過MATLAB仿真實驗驗證模型的科學(xué)性、精確性。
一、電信行業(yè)客戶流失風(fēng)險預(yù)測指標(biāo)體系的構(gòu)建
在電信行業(yè)中,影響著客戶的流失存在諸多的原因,可能是客戶自身原因,也有可能是運營商的原因。對于運營商來說,影響客戶流失主要有套餐資費優(yōu)惠程度、工作人員服務(wù)態(tài)度等,而對于客戶本身來說,則影響原因更為復(fù)雜,有可能是工作人員的服務(wù)質(zhì)量問題,也有可能是客戶自身的原因。構(gòu)建合理、高效又完善的客戶流失風(fēng)險預(yù)測指標(biāo)體系對提高風(fēng)險預(yù)測的準(zhǔn)確性極其重要。綜合考慮了國內(nèi)外關(guān)于電信行業(yè)客戶流失風(fēng)險預(yù)測的相關(guān)資料,用頻數(shù)統(tǒng)計分析挑選出4個一級指標(biāo),財務(wù)、客戶、運營商和服務(wù),16個二級指標(biāo)。其中財務(wù)方面包括銷售收入X1、欠費率X2、利潤率X3、業(yè)務(wù)價格X4、合同簽約率X5,客戶方面包括客戶滿意度X6、新客戶增長率X7、投訴率X8、忠誠度X9、合約到期時間X10;運營商方面包括技術(shù)開發(fā)費X11、市場開拓力X12、營銷人員態(tài)度X13;服務(wù)方面包括網(wǎng)絡(luò)功能實現(xiàn)度X14、業(yè)務(wù)多樣性X15、服務(wù)人員流動率X16。經(jīng)過分析眾多專家學(xué)者的觀念并結(jié)合數(shù)據(jù)的特征,去除了代表性差、隨機性大、實用性低的指標(biāo),以確保各指標(biāo)的科學(xué)性與獨立性,使得指標(biāo)體系更加科學(xué)與完善。
二、神經(jīng)網(wǎng)絡(luò)相關(guān)理論
(一)BP神經(jīng)網(wǎng)絡(luò)概述
BP(back propagation)神經(jīng)網(wǎng)絡(luò),是一種應(yīng)用廣泛、誤差方向傳播的多層前饋神經(jīng)網(wǎng)絡(luò),可以對輸入的數(shù)據(jù)進行學(xué)習(xí),并輸出相應(yīng)的結(jié)果,其優(yōu)勢在于不需要去建立數(shù)學(xué)方程式,就可以進行訓(xùn)練和學(xué)習(xí),其核心思想是梯度下降法,運用一些數(shù)學(xué)手段使得BP神經(jīng)網(wǎng)絡(luò)的實際輸出和預(yù)期輸出的誤差方差達到最小。BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)大致分為三層:輸入層、隱含層、輸出層。
(二)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程
BP的訓(xùn)練過程存在兩個子過程,分別為正向傳遞與誤差反向傳遞過程。在正向傳遞過程中,數(shù)據(jù)集通過輸入層傳輸至隱含層,在隱含層經(jīng)過計算,傳輸至輸出層。輸出層的輸出結(jié)果與真實值進行比較,若誤差大或未符合預(yù)期值,則進行反向傳遞,傳遞途徑與正向傳遞過程相反,但需要逐層修改權(quán)值與閾值,不斷循環(huán)此過程至與預(yù)期輸出值的誤差值達到最小。
三、電信行業(yè)客戶流失風(fēng)險預(yù)測模型結(jié)構(gòu)的確定
一是輸入層的確定。本文把影響客戶流失風(fēng)險的16個二維指標(biāo)作為模型的輸入。
二是輸出層的確定。模型的輸出層為4個,本文用客戶流失風(fēng)險的等級來表示,共劃分為4個等級,目標(biāo)輸出格式為(0001)、(0010)、(0100)和(1000),分別對應(yīng)風(fēng)險較小、風(fēng)險一般、風(fēng)險較大和風(fēng)險極大。
三是隱含層層數(shù)和節(jié)點數(shù)的確定。本文所建立的電信行業(yè)客戶流失風(fēng)險預(yù)測模型結(jié)構(gòu)相對較簡單,故模型的隱含層的層數(shù)可以取1。據(jù)相關(guān)實驗表明,當(dāng)構(gòu)建的風(fēng)險預(yù)測模型時,若隱含層的節(jié)點數(shù)少會導(dǎo)致神經(jīng)網(wǎng)絡(luò)處理信息能力差,但若節(jié)點數(shù)過多又會導(dǎo)致訓(xùn)練速度慢。因此,節(jié)點數(shù)應(yīng)合理選取,既要保證訓(xùn)練速度又要保證模型的處理信息能力。目前BP神經(jīng)網(wǎng)絡(luò)的隱含層的節(jié)點數(shù)并沒有明確規(guī),一般由經(jīng)驗確定。眾多學(xué)者總結(jié)出相關(guān)經(jīng)驗公式如下:(m,n和h分別表示輸入層、輸出層和隱含層的節(jié)點數(shù))
本文根據(jù)上述經(jīng)驗公式得出最優(yōu)節(jié)點數(shù),然后繼續(xù)利用最優(yōu)節(jié)點數(shù)的附近值對模型的最優(yōu)隱含層節(jié)點數(shù)進行實驗驗證。
四是傳遞函數(shù)的確定。S型函數(shù)是BP神經(jīng)網(wǎng)絡(luò)中傳遞函數(shù)的使用主流。本文使用“Tansig”函數(shù)作為隱含層的傳遞函數(shù),表達式為(4);輸出層的傳遞函數(shù)使用 “Logsig”函數(shù),表達式為(5);而對于訓(xùn)練函數(shù),本文使用“Trainlm”函數(shù)。
四、電信行業(yè)客戶流失風(fēng)險預(yù)測模型的構(gòu)建
(一)數(shù)據(jù)采集與處理
本文采取了某移動公司近五年的統(tǒng)計數(shù)據(jù),由于指標(biāo)數(shù)據(jù)之間量綱級不同,本文采用公式:
對數(shù)據(jù)進行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化的數(shù)據(jù)均落在[0,1]之間,并對數(shù)據(jù)進行平滑處理,得到1000個標(biāo)準(zhǔn)化數(shù)據(jù)。處理后的部分?jǐn)?shù)據(jù)如下表。
(二)模型結(jié)構(gòu)的確定
根據(jù)上文可知,模型的輸入層、隱含層和輸出層的層數(shù)均為1,其中輸入層的節(jié)點數(shù)確定為16,輸出層的節(jié)點數(shù)確定為4,根據(jù)目前的隱含層個數(shù)確定的經(jīng)驗公式,分別為4、8、33,為了使模型的結(jié)構(gòu)擬合程度更高,采用五種隱含層個數(shù),添加節(jié)點數(shù)為31、32和34三種方式,其他參數(shù)值保持一致。則BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以大致確定為:16-4-4、16-8-4、16-31-4、16-32-4、16-33-4、16-34-4三種。
將標(biāo)準(zhǔn)化數(shù)據(jù)中前900組數(shù)據(jù)作為模型的訓(xùn)練樣本,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差設(shè)置為0.001,顯示中間結(jié)果的周期設(shè)置為50,最大迭代次數(shù)設(shè)置為1000,學(xué)習(xí)率設(shè)為0.1,運用建立好的模型對數(shù)據(jù)進行訓(xùn)練,通過不斷的迭代學(xué)習(xí),直至訓(xùn)練結(jié)束。經(jīng)過訓(xùn)練實驗,根據(jù)所得誤差分析結(jié)果知,隱含層的節(jié)點數(shù)分別為4、8和33時,模型的誤差與預(yù)先設(shè)定的誤差均存在差距,相差分別為0.058、0.061、0.002、0.012、0.041、0.027、0.027。由回歸分析的結(jié)果可知,模型的回歸系數(shù)分別R1=0.98921、R2=0.98074、R3=0.97436、R4=0.9717、R5=0.98037、R6=0.9579。當(dāng)神經(jīng)網(wǎng)絡(luò)層的誤差值設(shè)為0.001時,一般認為當(dāng)模型的回歸系數(shù)達到80%時即為高精度模型。以上隱含層節(jié)點數(shù)下,模型均滿足高精度模型的要求,通過對比模型的誤差值,當(dāng)隱含層數(shù)為33時,誤差值最小。因此,當(dāng)模型的隱含層數(shù)設(shè)為33時,模型的擬合程度最好,可用于電信行業(yè)客戶風(fēng)險的預(yù)測。
(三)模型的訓(xùn)練
經(jīng)過上述分析,電信行業(yè)客戶流失風(fēng)險預(yù)測模型的結(jié)構(gòu)確定為16-33-4,為了進一步驗證模型的預(yù)測準(zhǔn)確率,采用余下的100組測試數(shù)據(jù)對模型進行驗證,在MATLAB上對測試數(shù)據(jù)進行仿真誤差分析,其測試樣本最小誤差為0.00612,其訓(xùn)練結(jié)果迭代曲線如圖所示。
橫坐標(biāo)表示算法的迭代次數(shù),縱坐標(biāo)表示誤差的結(jié)果,由圖可知,BP神經(jīng)網(wǎng)絡(luò)算法的經(jīng)過12次迭代后,網(wǎng)絡(luò)停止了訓(xùn)練,此時訓(xùn)練樣本的誤差趨近于10-3。誤差處在可控范圍之內(nèi),說明該模型預(yù)測電信行業(yè)客戶流失的風(fēng)險出錯率較低,可以用于客戶流失風(fēng)險的預(yù)測。 通過與實際值的比較,發(fā)現(xiàn)所建立的電信行業(yè)客戶流失的預(yù)測模型成功反映了輸入和輸出之間的關(guān)系,也成功預(yù)測了客戶流失的風(fēng)險,因此,該模型適用于電信行業(yè)客戶流失風(fēng)險的預(yù)測。
我國三大電信運營商正處于深化“提速降費”和“攜號轉(zhuǎn)網(wǎng)”的激烈競爭環(huán)境中,運營商們均有“存量經(jīng)營”戰(zhàn)略轉(zhuǎn)型的考量。從CRM角度來說,存量客戶的價值遠大于新增用戶,即需采取相應(yīng)措施挽留老客戶進而提高企業(yè)自身競爭力。因此,如何精準(zhǔn)預(yù)測客戶流失風(fēng)險并制定相應(yīng)的挽留與維系對策是運營商降低運營成本,提高核心競爭優(yōu)勢的關(guān)鍵。在此背景下,本文在企業(yè)客戶關(guān)系管理角度上,利用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力強、網(wǎng)絡(luò)穩(wěn)定的特點,以某移動運營商近五年客戶數(shù)據(jù)為研究對象,構(gòu)建了電信行業(yè)客戶流失預(yù)警模型,研究結(jié)果表明基于BP神經(jīng)網(wǎng)絡(luò)算法的電信客戶流失預(yù)測模型準(zhǔn)確率高達到98.8%,驗證了模型的精確性、科學(xué)性,幫助電信行業(yè)運營商對潛在客戶流失風(fēng)險的預(yù)測提供新思路,從而采取相應(yīng)個性化措施以便降低客戶的流失率。
參考文獻:
[1] Ahmad AK, Jafar A, Aljoumaa K. Customer Churn Prediction in Telecom Using Machine Learning in Big Data Platform[J]. Journal of Big Data, 2019(1).
[2] Vijaya J,Sivasankar E. Computing Efficient Features Using Rough Set Theory Combined with Ensemble Classification Techniques to Improve the Customer Churn Prediction in Telecommunication Sector[J]. Computing, 2018(8).
[責(zé)任編輯:譚志遠]