葉敏 季國民 張希君
(福州大學(xué)至誠學(xué)院 經(jīng)濟管理系,福建 福州 350004)
客戶關(guān)系管理盡管不是一個全新的課題,但是由于客戶在企業(yè)發(fā)展中的重要地位,因此對其研究一直沒有中斷過。姚博(2017)研究表明,公司高端20%的顧客創(chuàng)造出公司80%以上的利潤,在企業(yè)資源有限的情況下,有效地預(yù)測客戶流失,保持優(yōu)質(zhì)客戶成為客戶關(guān)系管理的重心。
目前客戶流失管理方面的研究主要體現(xiàn)以下幾個方面。
第一,客戶流失動機的識別。主要研究是客戶在什么情況下,客戶會流失。通過分析客戶的行為動機及購買頻率等因素來預(yù)判客戶流失的動向。
第二,分析客戶流失的動因。主要研究是什么原因促使客戶流失,是企業(yè)自身原因,還是客戶消費者偏好發(fā)生改變,等等。
第三,防止客戶流失的應(yīng)對措施。主要探討在企業(yè)資源有限的情況下,分析客戶流失的動因,有針對性地進行挽留客戶,進而提高客戶的留存率。
通過對前人的研究整理發(fā)現(xiàn),更多的研究體現(xiàn)在定性而非定量研究,有些雖是定量研究但在實務(wù)操作中不具有可操作性,更多的是停留在理論階段層面。因為企業(yè)在評估客戶對企業(yè)的價值時,不僅要考慮成本與效益的問題,還要考慮可操作性與外部環(huán)境等因素。因此,如何構(gòu)建一個可操作的客戶流失預(yù)測模型,對企業(yè)價值的提升具有十分重要意思。
客戶流失就是原客戶不再購買原企業(yè)的產(chǎn)品或服務(wù)。Yeh I C(2009)將客戶流失定義為“轉(zhuǎn)換意愿”,客戶流失就是指客戶不再重復(fù)購買或終止原先使用的產(chǎn)品或服務(wù)。但是定義較為籠統(tǒng),不夠準確。例如客戶不再重復(fù)購買沒有時間限定,是一個月還是一年,另外客戶不重復(fù)購買的行為與產(chǎn)品的特性也有關(guān)系。大件商品重復(fù)購買的周期比較長,而日常用品其重復(fù)購買周期就比較短。因此有些學(xué)者從定量的角度探討客戶流失的定義。張珠香(2018)認為當(dāng)一個客戶連續(xù)3個月沒有在該企業(yè)進行任何消費,就是客戶流失。林芳(2016)將流失的客戶界定為已經(jīng)流失指徹底停止消費企業(yè)所提供的產(chǎn)品或服務(wù),同時作者還對客戶流失進行簡單分類:包括已經(jīng)流失的客戶和即將流失的客戶[1~4]。即將流失的客戶就是較之前對企業(yè)所提供的產(chǎn)品或服務(wù)消費變少,而已經(jīng)流失的客戶是已經(jīng)開始向企業(yè)的競爭對手尋求替代品,但目前還沒有完全斷絕與公司的交易。也有學(xué)者王瑩(2015)將客戶流失按流失意愿分為自發(fā)流失、強制流失和預(yù)期流失。筆者研究的主要是自發(fā)流失。因為強制流失的客戶實質(zhì)上未能給企業(yè)帶來效益,這樣的客戶對企業(yè)沒有價值;而預(yù)期流失表明客戶從根本上不再需要企業(yè)產(chǎn)品,是正常的退出機制,不會減少企業(yè)價值。
客戶流失預(yù)測方法隨著科學(xué)技術(shù)的不斷提升,大數(shù)據(jù)應(yīng)用的普及,其預(yù)測也越來越精確。目前對客戶流失預(yù)測采用的主要方法是利用大數(shù)據(jù),運用決策樹、神經(jīng)網(wǎng)絡(luò)、遺傳算法、生存分析、回歸等,同時結(jié)合數(shù)據(jù)分析等軟件操作,通過數(shù)據(jù)庫的統(tǒng)計,分析客戶購買時間,購買頻率,購買數(shù)量,等等,預(yù)測客戶流失動向。
常見的客戶流失模型有二元結(jié)構(gòu)模型和預(yù)測客戶剩余生存期。二元結(jié)構(gòu)模型就是將客戶的流失分為兩個維度:一個是客戶流失的維度,一個是客戶保留的維度。然后運用邏輯回歸等相關(guān)方法建立模型,預(yù)測客戶流失規(guī)律、時間及分布。客戶剩余生命期就是利用企業(yè)客戶數(shù)據(jù)庫,分析客戶在企業(yè)中保留期限,其目標就是建立模型評估客戶流失的一種方法。
比較有代表性的研究成果有Kisioglu P(2011)運用貝葉斯方法對電信公司客戶流失行為進行預(yù)測。研究結(jié)論表明客戶平均通話時間等因素是判斷客戶流失傾向的較為重要因素,為企業(yè)尤其是電信企業(yè)流失預(yù)測模型的改進提供有效指導(dǎo)。鄭為益(2011)運用生存分析技術(shù)風(fēng)險模型建立客戶流失預(yù)測模型,分析客戶流失的主要因素,為通訊運營商進行后續(xù)有針對性的客戶營銷方案提供重要理論決策依據(jù)。
企業(yè)的客戶千差萬別,企業(yè)處理客戶關(guān)系也不盡相同??蛻袅魇右蜉^為復(fù)雜,包括主觀原因、客觀原因、內(nèi)部原因、外部原因,等等。目前研究沒有得出一個統(tǒng)一的結(jié)論。余路(2016)從客戶滿意和客戶價值的角度,分析客戶流失的主要原因。研究表明當(dāng)客戶的價值受損或滿意度降低,客戶就會流失。也有學(xué)者從企業(yè)的角度研究客戶流失,認為客戶流失主要是企業(yè)未能有效重視客戶管理,造成客戶的購買意愿下降進而流失,并且這種單一客戶的流失會導(dǎo)致其他客戶購買意愿降低[5~7]。較為常見的情形就是企業(yè)未能妥善處理客戶投訴,導(dǎo)致客戶流失。
客戶挽留實質(zhì)上是企業(yè)的一種補救措施。如果企業(yè)在前期客戶管理中能夠有效滿足客戶需求,增加客戶滿意度,提高產(chǎn)品的附加值,不但不會造成客戶流失反而會吸引更多的客戶。因此客戶挽留一定要做到有針對性的挽留,不能脫離企業(yè)與客戶而無目的的挽留。較為有效的客戶挽留要分析客戶流失動因,分析動因產(chǎn)生的機理,同時結(jié)合企業(yè)成本效益前提下,評估挽留客戶給企業(yè)帶來價值與成本關(guān)系情形下,進而決定采用何種挽留措施。
目前關(guān)于客戶挽留的研究主要是從定性和定量兩個角度。定性研究通過研究客戶流失動因出發(fā),提出客戶挽留建議。其主要優(yōu)點在于簡單可以行,不需要大量數(shù)據(jù)支撐,但是其缺點就是無法量化,不能準確的衡量企業(yè)挽留客戶的成本效益比。相反定量研究就是利用大數(shù)據(jù),采用一些數(shù)理統(tǒng)計模型進行分析,能夠較好的測算出挽留客戶的成本效益。但是其不足也非常明顯就是需要大量數(shù)據(jù)支持,計算模型復(fù)雜,參數(shù)較多,結(jié)果受參數(shù)質(zhì)量影響較大。孫樹壘(2011)通過定量研究的方法建立客戶挽留模型,提出客戶保持對客戶挽留的重要意義。[8]
生存時間原本是一個醫(yī)學(xué)名詞,是指某種疾病患者從開始患病到死亡所經(jīng)歷的時間跨度。而本文將生存時間界定為客戶與企業(yè)初次購買到終止購買關(guān)系時間過程。
生存率就是客戶留下的可能性,指客戶經(jīng)歷 若干個時間個單位時段后仍與企業(yè)保持消費關(guān)系的可能性。流失率與生存率的關(guān)系是,流失率=1-生存率。
因此生存分析就是用來研究客戶保留狀態(tài)的規(guī)律。如客戶挽留的時間分布特點,某一時間段內(nèi)客戶的挽留比率。其優(yōu)點在于解決傳統(tǒng)統(tǒng)計模型對數(shù)據(jù)要求過高的缺陷。
生存分析模型中最為重要的就是對生存函數(shù)的估計,而生存函數(shù)常用的估計方法,有參數(shù)法、半?yún)?shù)法等方法。參數(shù)法就是先對某種事件與時間的關(guān)系作出特定假定,并通過研究時間與對象之間的特定聯(lián)系建立客戶的生存函數(shù)S(t)和時間t的關(guān)系。在使用參數(shù)法對生存函數(shù)進行模擬估計是通常采用指數(shù)分布模型。指數(shù)分布是一種常用的概率統(tǒng)計分布,用來描述獨立隨機事件發(fā)生的時間間隔,反應(yīng)時間與事件之間的相互變量關(guān)系。將變量關(guān)系用其概率密度函數(shù)進行表述:
其生存函數(shù)為:
但是,實際中,如果某些參數(shù)無法獲知的情形下,通常使用半?yún)?shù)法,就是模型中部分變量予以量化,部分變量定性分析。非參數(shù)法就是對客戶保持與挽留的時間分布不作任何假設(shè),直接對樣本數(shù)據(jù)進行統(tǒng)計分析。半?yún)?shù)模型較參數(shù)模型的優(yōu)點在于該模型不考慮研究對象的時間與事件之間的變量關(guān)系,允許觀測對象在數(shù)據(jù)有缺失或截尾現(xiàn)象,并且可以全面觀測變量與時間的長效關(guān)系。因此半?yún)?shù)模型對客戶流失的預(yù)測,從客戶生存角度無疑是一個比較好的方法。較為經(jīng)典的半?yún)?shù)模型就是Kotler(1999)提出的Cox 比例風(fēng)險模型。
該模型的數(shù)理表達式為:
式中,Xj是隨著時間推移,會對客戶的生存結(jié)果造成影響的變量因素。h0(t)是指自變量因素Xj(j=1,2,…,P)都處于某種特定狀態(tài)下的特定系數(shù),h0(t)數(shù)字的確定與該函數(shù)特征狀態(tài)有關(guān)。βj(j=1,2,…,P)成為Cox回歸系數(shù),是模型中的待定參數(shù)。
任何兩個個體風(fēng)險函數(shù)之比,即相對危險度可寫為:
=exp[(β1(xi1-xj1)+β2(xi2-xj2)+...
+βp(xip-xjp)]
i≠j,i,j=1,2,...n
RR是相對危險度的一個結(jié)果,該比值在一定特定的狀態(tài)下是一個特定數(shù)字,與時間無關(guān),成為比例風(fēng)險假定,簡稱PH假定。因此βj的參考意義是:當(dāng)自變量Xj每改變一個觀測單位時,所引起的相對風(fēng)險度的自然對數(shù)值。
筆者在前人的研究基礎(chǔ)上構(gòu)建客戶流失預(yù)測模型,總體思路是從企業(yè)端提取客戶交易數(shù)據(jù),采用一定的數(shù)理統(tǒng)計方法,據(jù)不同群體的特征對客戶進行分類,然后基于生存分析的視角建立客戶流失預(yù)測模式。
客戶分類中主要采用聚類分析方法。聚類分析是對分類對象按是否具有同一屬性或類似屬性的客戶分為一類,在數(shù)理上主要通過客戶的數(shù)量關(guān)系來表述,即不同分類主體之間的距離來度量分類對象是否有差異,這樣有利于后續(xù)模型的構(gòu)建及數(shù)據(jù)處理。在聚類分析中,筆者對不同客戶群體運用下列數(shù)量指標進行分類:設(shè)xik為第i個對象的第k個指標,每個對象測量了p個變量,則對象xi和xj之間的距離(Dij)的定義為:
式中q為大于0的正數(shù)。
同時也是基于生存分析視角探討客戶流失預(yù)測模型,因此對客戶流失率也給予限定??蛻袅魇适侵冈谝欢螘r間內(nèi),客戶流失數(shù)量與企業(yè)全部客戶的比值。而生存率是指客戶在一段時候后仍與企業(yè)保持購買關(guān)系或意愿的可能性,常用 p(x>t)表示??蛻袅魇?、客戶保持率的關(guān)系為:客戶流失率+客戶保持率=1,表明客戶保持率越大,客戶流失率也越小。
基于上述分析構(gòu)建了基礎(chǔ)生存分析視角的客戶流失預(yù)測模型,模型如下:設(shè)觀測從0時刻開始,記錄樣本總體的n個觀測對象的生存數(shù)據(jù)t1,t2,...tn為壽終數(shù)據(jù)時,記δi=1:若ti為右刪失數(shù)據(jù)時,記δi=0。t(1)≤t(2)≤...t(n)是t1,t2,...tn的次序統(tǒng)計量,對應(yīng)得到一系列δ(i)(1≤i≤n),用下列函數(shù)表示:
即設(shè)n是包含所有刪失數(shù)據(jù)和非刪失數(shù)據(jù)的觀測對象總數(shù),將n個對象生存時間觀察值從小到大排序,使得X(1)≤X(2)...≤X(n),則有生存函數(shù):
式中i取遍所有滿足X(i)≤t的正整數(shù),這里X(i)是非刪失觀察。
研究的數(shù)據(jù)來源于對福建省某大型商場2014~2017年的交易數(shù)據(jù),根據(jù)其內(nèi)部數(shù)據(jù)源,進行有效的數(shù)據(jù)篩選。為了保護調(diào)研對象的商業(yè)信息,對部分數(shù)據(jù)進行適當(dāng)修正。樣本總數(shù)定位在2131名客戶,該樣本均為有效樣本,已考慮相關(guān)不合理數(shù)據(jù)。統(tǒng)計變量中購買金額用M表示,以元為單位;客戶兩次購買時間間隔用T表示,以天數(shù)為單位;客戶兩次購買時間間隔越長表示客戶越容易流失,因此,筆者將客戶流失界定為兩次購買時間超過半年以上的;購買頻率用N表示,單位用次數(shù)表示。
在對樣本分析過程使用SPSS進行相關(guān)數(shù)據(jù)分析,樣本的描述性統(tǒng)計見表1、表2、表3。
表1 樣本描述統(tǒng)計
表2 方差分析表
表3 特征客戶群
從表2中我們可以看出p值(sig.)很小,因此可以初步購買金額、購買時間間隔和購買頻率三個變量是影響客戶分類的主要因素。上述通過TNM分類,將調(diào)研的客戶群體分為如上兩大類。
A類客戶群體:該類客戶近期有購買,其購買的次數(shù)與其消費金額較大,該類客戶購買時間間隔低于人均平均間隔時間132天,購買次數(shù)多于人均購買次數(shù)12次,購買金額大于人均購買金額12478.80元,人數(shù)410人,占比19.24%,購買總金額21785474元,占比79.69%。因此該類客戶為企業(yè)的有效客戶,可以持續(xù)為企業(yè)帶來價值,企業(yè)應(yīng)當(dāng)重視對該類客戶的維持與提升。
B類客戶群體:該類客戶表現(xiàn)為近期幾乎沒有購買行為,或者購買次數(shù)較低,遠遠低于平均數(shù)。從表3中可以看出B類客戶購買時間間隔高于平均客戶購買的時間間隔132天,購買次數(shù)少于人均12次的購買次數(shù),購買所消費的金額低于人均購買金額12478.80元,人數(shù)1721人,占比80.76%,購買金額5554426元,占比20.31%。因此該類客戶屬于企業(yè)流失的客戶,企業(yè)可以通過后續(xù)的客戶管理進行持續(xù)觀察。
盡管筆者嘗試建立一個定量預(yù)測客戶流失模式,但是由于模式中涉及參數(shù)角度,尤其是與時間相關(guān)的變量,其輸入值層級的高低,最終會影響模型的準確性,因此在參數(shù)的限定方面,研究做得還不夠,模型的精準度需要提高。同時,在對客戶分類與識別過程中,由于使用的數(shù)理方法不同,造成分類結(jié)構(gòu)有一定的偏差,對后面模型結(jié)果會造成一定影響。因此,在后續(xù)的研究中盡可能以觀察輸入值為依據(jù),提高參數(shù)的可控性,進而提高預(yù)測模型的精準度。