作者簡(jiǎn)介:周楊頔(1999-),女,漢族,北京人。主要研究方向:信息管理與信息系統(tǒng)(大數(shù)據(jù)與商務(wù)分析方向)。
摘要:隨著民用航空運(yùn)輸?shù)牟粩喟l(fā)展,乘機(jī)出行已經(jīng)成為越來越多人的選擇,航空公司也面臨著愈加龐大的客戶群體。那么,了解客戶特點(diǎn)和計(jì)算客戶價(jià)值成為航空公司必須面臨的課題。本文以某一航空公司為例,分析航空公司客戶群體的整體分類并且利用已有的數(shù)據(jù)對(duì)客戶進(jìn)行流失預(yù)測(cè)。通過研究,發(fā)現(xiàn)該航空公司的客戶可以分為五類,對(duì)應(yīng)著不同的客戶價(jià)值,并從不同角度對(duì)分類和價(jià)值進(jìn)行驗(yàn)證。在此基礎(chǔ)上,本文還分析不同指標(biāo)之間的相互影響和關(guān)聯(lián),幫助航空公司更好的了解客戶和市場(chǎng)。
關(guān)鍵詞:RFM模型改進(jìn) 客戶細(xì)分 Logistic回歸 流失預(yù)測(cè)
隨著人們生活水平的不斷提高,我國(guó)航空客運(yùn)業(yè)務(wù)發(fā)展迅速。2014-2019年,我國(guó)民航主要客運(yùn)能力指標(biāo)保持平穩(wěn)增長(zhǎng),其中2019年全行業(yè)完成旅客周轉(zhuǎn)量11705.1億人公里,較2018年增長(zhǎng)9.3%。航空客運(yùn)需求不斷增大的同時(shí),各個(gè)航空公司之間的競(jìng)爭(zhēng)也日益激烈。
一.研究背景及目的
客戶價(jià)值理論經(jīng)過前人不斷地研究,例如RFM模型、CRM理論等等相關(guān)研究,已經(jīng)為如今市場(chǎng)面臨的客戶價(jià)值分析和客戶關(guān)系建立打下了堅(jiān)實(shí)的基礎(chǔ)。其中,研究的主要目的即為客戶細(xì)分和流失預(yù)測(cè)。使用改進(jìn)后的RFM模型對(duì)客戶評(píng)估打分,量化每一位客戶的客戶價(jià)值,并給出航空公司相應(yīng)的營(yíng)銷策略,幫助航空公司對(duì)客戶流失進(jìn)行預(yù)測(cè),盡可能早地察覺客戶的流失風(fēng)險(xiǎn),為挽留客戶爭(zhēng)取時(shí)間和機(jī)會(huì)。
(一)數(shù)據(jù)處理
樣本數(shù)據(jù)主要包括客戶的會(huì)員卡號(hào)、入會(huì)時(shí)間、性別、會(huì)員卡級(jí)別、飛行里程數(shù)、飛行積分情況、飛行次數(shù)、飛行時(shí)間間隔等屬性。根初步分析,將數(shù)據(jù)雜亂和缺失較多的變量刪除并剔除部分分析指標(biāo)上有缺失的個(gè)案。
其次,將“WORK_COUNTRY”“GENDER”轉(zhuǎn)換為啞變量“IS_DOMASTIC”(0-國(guó)外,1-國(guó)內(nèi))和“NGENDER”(0-“男”,1-“女”);將“AGE”大于100的樣本剔除;“LOAD_TIME”有四個(gè)省缺值,故將省缺值記為相同日期;計(jì)算首末乘機(jī)時(shí)間差并剔除小于零的個(gè)案。
第一和第二年票價(jià)“SUM_YR_1”、“SUM_YR_2”兩個(gè)變量中均存在觀測(cè)值為0的個(gè)案,這可能是乘機(jī)人購(gòu)買到零元折扣機(jī)票或用積分兌換。由于此類個(gè)案所占比例較小,故不納入分析。因此刪除總票價(jià)為0,平均折扣率為0(數(shù)值越大,折扣越大),積分兌換次數(shù)為0,而飛行里程大于0或者乘機(jī)次數(shù)大于0的個(gè)案。
(二)數(shù)據(jù)初步分析
通過獨(dú)立樣本T檢驗(yàn)可知,男性觀測(cè)窗口內(nèi)的平均飛行次數(shù)比女性多3.47次。此外,在飛行加權(quán)公里數(shù)、觀測(cè)期內(nèi)支付的總票價(jià)以及入會(huì)時(shí)長(zhǎng)上,男性均與女性有顯著差異且平均值更大。
通過單因素的方差分析發(fā)現(xiàn),與級(jí)別4相比,會(huì)員卡級(jí)別5、6的客戶支付的總票價(jià)較高、乘機(jī)次數(shù)較多并且明顯更加活躍,客戶價(jià)值明顯高于級(jí)別4。通過ANOVA檢驗(yàn)發(fā)現(xiàn),會(huì)員級(jí)別越高,平均折扣率越大,這可能更加激勵(lì)了高級(jí)別會(huì)員的乘機(jī)選擇。
二.客戶細(xì)分
(一)RFM模型
RFM模型是常見的評(píng)價(jià)客戶價(jià)值的模型。R指客戶最后一次消費(fèi)行為發(fā)生到觀測(cè)點(diǎn)之間的時(shí)間差,F(xiàn)是指觀測(cè)窗口內(nèi)客戶的消費(fèi)頻率,M是指觀測(cè)窗口內(nèi)消費(fèi)的總金額。[1]為保證模型更加貼近研究,做出如下改進(jìn):
1.改進(jìn)R算法
借鑒季曉芬、賈真在該方向上的研究,R的測(cè)算可以做出如下改進(jìn):
其中為客戶觀察期內(nèi)首次乘機(jī)的時(shí)間,為客戶觀察期內(nèi)的末次乘機(jī)的時(shí)間,為觀測(cè)窗口結(jié)束時(shí)間。當(dāng)最遠(yuǎn)乘機(jī)時(shí)間差相同時(shí),最近乘機(jī)時(shí)間差越小,R越小,表示客戶更加活躍。當(dāng)時(shí),R=1,這可能是由新客戶在觀測(cè)窗口期內(nèi)僅乘機(jī)一次造成的[2]。同時(shí),為保證R大于0,在進(jìn)行日期之間差運(yùn)算時(shí),將首末乘機(jī)日期均向前推一天。
2.改進(jìn)后的RFM模型——DRFKM模型
由于原始數(shù)據(jù)中包含的屬性太多,且根據(jù)數(shù)據(jù)的初步探索之后可知有些變量不適合進(jìn)行計(jì)算,故選取與改進(jìn)后的RFM相關(guān)的屬性進(jìn)行分析和計(jì)算。
因?yàn)楹娇展緯?huì)員的加入時(shí)間一定程度上可以影響客戶價(jià)值,所以我們?cè)诤娇展究蛻魞r(jià)值分析模型中添加客戶關(guān)系長(zhǎng)度 D(Duration),作為區(qū)分客戶價(jià)值的一個(gè)指標(biāo)[3]。
1.D:Duration,“入會(huì)時(shí)長(zhǎng)”,以天數(shù)為單位
2.R:M_R,即“客戶活躍度”,參考改進(jìn)后的R算法
3.F:Frequency,“飛行總次數(shù)”
4.K:WEIGHTED_SEG_KM,即“飛行加權(quán)公里數(shù)”
5.M:Monetary,“支付的總票價(jià)”
首先,直接對(duì)相關(guān)的五個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化變換。此處沒有取到數(shù)運(yùn)算是因?yàn)槟嫦蛑笜?biāo)R的聚類結(jié)果更理想。由于樣本數(shù)量較大,故采取隨機(jī)抽樣的方式,抽取4%的個(gè)案進(jìn)行系統(tǒng)聚類,確定分為五類比較合適,并將各類的聚類中心作為K-Means聚類時(shí)的初始聚類中心。在各分類上,個(gè)案的分布情況和不同類別在不同指標(biāo)上的得分區(qū)別亦比較明顯。
(二)綜合評(píng)價(jià)體系計(jì)算客戶價(jià)值
1. 綜合評(píng)價(jià)體系
在前人研究經(jīng)驗(yàn)的基礎(chǔ)上構(gòu)建綜合評(píng)價(jià)體系,具體實(shí)現(xiàn)方式由圖表1所示[4]:
2. 數(shù)據(jù)處理
(1)將積分類變量進(jìn)行探索性因子分析
會(huì)員積分類變量包含18個(gè)相關(guān)變量,建立模型前先對(duì)這些指標(biāo)進(jìn)行初步探索分析,對(duì)部分不適于建立模型的變量進(jìn)行剔除。總共提取了四個(gè)因子,分別命名為“乘機(jī)積分”、“里程積分比例”、“其他積分”和“積分變動(dòng)”。因子分析結(jié)果中,KMO 取樣適切性量數(shù)為0.706,同時(shí),為了保證所有指標(biāo)的提取度大于75%,所以提取4個(gè)因子,總共解釋了84.214%的方差,提取度較好。
數(shù)據(jù)處理
“AGE(年齡)”與指標(biāo)M“支付的總票價(jià)”的散點(diǎn)圖,客戶支付總票價(jià)從40歲向兩邊遞減。故將年齡以40為界,大于40歲的個(gè)案按照比例:
映射到[10,40)歲的范圍內(nèi),可得“NEW_AGE(年齡N)”。y表示映射后的年齡,x表示個(gè)案的真實(shí)年齡。
“預(yù)期”指標(biāo)下的“客戶的成長(zhǎng)預(yù)期”是:以飛行總次數(shù)、支付的總票價(jià)和總累計(jì)積分三項(xiàng)指標(biāo)在觀測(cè)期的第二年與第一年的差值為基礎(chǔ),再對(duì)三項(xiàng)差值用主成分的方法提取一個(gè)因子,將因子得分作為觀測(cè)值。
“客戶活躍度(x9)”由改進(jìn)后的RFM模型中R(NEW_R)的倒數(shù)來衡量。
“會(huì)員價(jià)值”下的指標(biāo)可以從原數(shù)據(jù)和之前已經(jīng)計(jì)算的數(shù)據(jù)中獲得;“保持價(jià)值”的“積分變動(dòng)”可以從上述對(duì)積分類變量的因子分析中獲得。
3. 層次分析法
判斷矩陣由桂林電子科技大學(xué)市場(chǎng)管理學(xué)院老師做出,以此為參考計(jì)算各個(gè)客戶的各級(jí)指標(biāo)得分以及綜合得分(“SCORE”表示綜合得分)。數(shù)據(jù)規(guī)格化和權(quán)重計(jì)算過程用R語(yǔ)言實(shí)現(xiàn)。
三.客戶細(xì)分基礎(chǔ)上的探究
DRFKM模型和綜合評(píng)價(jià)體系結(jié)果對(duì)比,在數(shù)據(jù)的初步分析階段可知,男性客戶偏向高價(jià)值客戶。根據(jù)上述的分析將客戶分類:
重要保持客戶——分類1
這類客戶的飛行總次數(shù)、飛行的加權(quán)公里數(shù)明顯高于其他類型的客戶, 說明此類客戶對(duì)航空飛行的依賴程度較大,一般情況下不會(huì)改變對(duì)出行的選擇,是航空公司重要的優(yōu)質(zhì)客戶群。
重要發(fā)展客戶——分類2
與重要保持客戶相比,這類客戶在各指標(biāo)上的得分或者是數(shù)值明顯小,尤其是這類客戶的入會(huì)時(shí)長(zhǎng)短造。也就是說,只要能持續(xù)吸引此類客戶消費(fèi),培養(yǎng)其消費(fèi)習(xí)慣,這類客戶有很大的發(fā)展?jié)摿?,可以給企業(yè)帶來較高的潛在利潤(rùn)。
1.重要挽留客戶——分類3
組4應(yīng)當(dāng)屬于重要挽留客戶。這類客戶在入會(huì)時(shí)長(zhǎng)這一項(xiàng)指標(biāo)上明顯較高,但是飛行次數(shù)和活躍度等均不高。這類客戶游走在流失的邊緣,說明這類客戶對(duì)本企業(yè)或者是對(duì)于航空出行的方式依賴度不高,但是并沒有完全排除這種出行選擇。
2.一般客戶與低價(jià)值客戶——分類4、5
組2為一般客戶,這類客戶的入會(huì)時(shí)長(zhǎng)較短,其他指標(biāo)與組別1、3比較來說均比較低。組別5在所有衡量指標(biāo)上都呈現(xiàn)弱勢(shì),所以將此類歸為低價(jià)值客戶,這類客戶可能只在能夠獲得低價(jià)票時(shí)才會(huì)消費(fèi),所以企業(yè)不應(yīng)將精力過多花費(fèi)在此類客戶上。
四.Logistic回歸預(yù)測(cè)客戶流失
(一)模型建立
對(duì)客戶是否流失作預(yù)測(cè),有本文對(duì)流失客戶作如下定義:最后一次乘機(jī)時(shí)間至觀測(cè)窗口末端時(shí)長(zhǎng)大于等于觀測(cè)窗口內(nèi)最大乘機(jī)間隔[5]。
由于利用SPSS采用“向前:有條件”的方法二元回歸,并將原始數(shù)據(jù)中經(jīng)過數(shù)據(jù)處理后的數(shù)據(jù)均加入模型進(jìn)行篩選。同時(shí)為更好解釋結(jié)果和便于數(shù)據(jù)直接獲得,用轉(zhuǎn)換后的年齡作為“年齡”的觀測(cè)值,用“客戶活躍度”用末次乘機(jī)至觀測(cè)期結(jié)束的天數(shù)差為衡量標(biāo)準(zhǔn)。
(二)結(jié)果分析
經(jīng)過多次迭代,在步驟17篩選出最終的17個(gè)變量建立整體顯著且擬合效果較好的回歸模型,最終預(yù)測(cè)準(zhǔn)確率達(dá)到94%。
對(duì)方程中的變量進(jìn)一步分析可知,“季度平均飛行次數(shù)”每增加一個(gè)單位,客戶流失的風(fēng)險(xiǎn)與原來相比增加7.525。其他指標(biāo)的影響雖然沒有這項(xiàng)顯著,但是也可以看出整體的影響趨勢(shì)。例如,“積分兌換次數(shù)”、“末次乘機(jī)至觀測(cè)窗口末端時(shí)長(zhǎng)”兩項(xiàng)指標(biāo)的觀測(cè)值偏大的客戶容易流失,會(huì)員等級(jí)為4的客戶相對(duì)于會(huì)員等級(jí)為6的客戶容易流失。
從Exp(B)小于1的指標(biāo)來看,“第1年乘機(jī)次數(shù)比率”對(duì)客戶是否流失的影響最大,每增加一個(gè)單位,客戶流失的風(fēng)險(xiǎn)與原來相比降低。參考其他指標(biāo)的優(yōu)勢(shì)比可知,年齡越接近40歲、性別為女性,在國(guó)內(nèi)工作以及平均折扣率偏低的客戶流失的風(fēng)險(xiǎn)偏小。
結(jié)合DRFKM模型再次對(duì)樣本做相應(yīng)分析,用最優(yōu)標(biāo)度法做出類別點(diǎn)的聯(lián)合圖。由圖表2可知,只要各個(gè)指標(biāo)水平達(dá)到中等及以上,客戶的流失風(fēng)險(xiǎn)就會(huì)降低。流失趨勢(shì)和上述DRFKM模型和綜合評(píng)價(jià)體系分析結(jié)果相照應(yīng),流失風(fēng)險(xiǎn)和指標(biāo)得分呈現(xiàn)負(fù)相關(guān)。
五.結(jié)語(yǔ)
通過本文的分析和研究,可以對(duì)航空公司的客戶群體細(xì)分為五類,并向航空公司提出一下建議:
一.會(huì)員等級(jí)變更
建立會(huì)員制已經(jīng)是大多數(shù)商家的營(yíng)銷手段,從本文的樣本分析數(shù)據(jù)來看,乘坐過該航空的客戶基本都成為航空公司的會(huì)員。通過上述的分析可知,會(huì)員等級(jí)越高,客戶給航空公司帶來的價(jià)值就越高,相應(yīng)的客戶生命周期也越長(zhǎng)。級(jí)別5比級(jí)別6的客戶在總體上大約僅多出3%,對(duì)于航空公司而言,應(yīng)當(dāng)注重發(fā)展級(jí)別5的客戶,使級(jí)別5和6之間的有一定的差異,保證不同會(huì)員級(jí)別的人數(shù)合理,才能保證會(huì)員制度的有效性。航空公司還注重會(huì)員等級(jí)制度與其他服務(wù)的關(guān)聯(lián),尤其是“平均折扣率”以及“非乘機(jī)積分變動(dòng)”之間的聯(lián)系。
二.積分變動(dòng)與交叉銷售
從Logistic回歸分析可知,“非乘機(jī)積分的變動(dòng)次數(shù)”越多,客戶流失的風(fēng)險(xiǎn)就越小。因此,航空公司可以深入了解客戶非乘機(jī)積分的變化情況,分析客戶的主要積分獲取途徑。對(duì)于重要挽留客戶而言,如何提升乘機(jī)價(jià)值是航空公司應(yīng)當(dāng)重點(diǎn)考察的因素。這類客戶入會(huì)時(shí)間,但是乘機(jī)價(jià)值并不高,這可能因?yàn)榇祟惪蛻粲幸徊糠值某藱C(jī)需求具有季節(jié)性。由于消費(fèi)間隔期較長(zhǎng),客戶容易降低對(duì)對(duì)航空公司的關(guān)聯(lián)程度,所以航空公司可以通過與其他航空公司或者其他產(chǎn)品聯(lián)合銷售,讓客戶在非乘機(jī)期間持續(xù)與航空公司保持關(guān)聯(lián)。
三.保持優(yōu)質(zhì)客戶,挖掘客戶價(jià)值
綜合DRFKM模型和綜合評(píng)價(jià)得分結(jié)果來看,組1重要保持客戶和組3重要發(fā)展客戶的得分差異主要體現(xiàn)在客戶的當(dāng)前價(jià)值和潛在價(jià)值上,尤其使當(dāng)前價(jià)值上的差異。企業(yè)如果采取更積極、恰當(dāng)?shù)臓I(yíng)銷手段,讓這類客戶充分了解企業(yè)的產(chǎn)品或者提供更多接觸的機(jī)會(huì),會(huì)從這類客戶身上獲取相當(dāng)?shù)睦鎇7]。
參 考 文 獻(xiàn)
[1]Hughes A M. Making database pay off using recency, frequency and monetary analysis(J}. Journal of Database Marketing, 1995, 3:77-89.
[2]季曉芬,賈真.基于RFM行為模型的服裝企業(yè)VIP顧客數(shù)據(jù)挖掘[J].浙江理工大學(xué)學(xué)報(bào),2015,34(04):131-135.
[3]劉婷婷,王小麗,葛明濤.基于數(shù)據(jù)挖掘的航空公司客戶價(jià)值分析[J].山東工業(yè)技術(shù),2017(04):287-288.
[4]陳延杰. 基于數(shù)據(jù)挖掘技術(shù)的航空公司會(huì)員客戶價(jià)值研究[D].福州大學(xué),2015.
[5]申玉偉. 航空公司客戶分類及流失預(yù)測(cè)[D].貴州財(cái)經(jīng)大學(xué),2019.