郭 星,許旺土,任 沖
(1.廈門大學(xué) 建筑與土木工程學(xué)院,福建 廈門 361005;2.中鐵二院工程集團(tuán)有限責(zé)任公司 交通與城市規(guī)劃設(shè)計(jì)研究院,四川 成都 610031)
高速鐵路常旅客指能夠穩(wěn)定且持續(xù)地為鐵路運(yùn)輸部門帶來利潤和價(jià)值的乘客,從鐵路運(yùn)輸部門的角度看,高速鐵路常旅客的價(jià)值指其對(duì)高速鐵路客運(yùn)營業(yè)利潤的貢獻(xiàn)能力,即常旅客的終身價(jià)值,不僅包含當(dāng)前價(jià)值、潛在價(jià)值,忠誠度也是常旅客價(jià)值的重要組成部分。根據(jù)巴萊多定律分析,20%的極少量的優(yōu)質(zhì)客戶為企業(yè)貢獻(xiàn)了80%的價(jià)值,常旅客價(jià)值的分析有助于篩選出利潤貢獻(xiàn)大的優(yōu)質(zhì)客戶和潛力升級(jí)的客戶,以便有針對(duì)性地制定服務(wù)提升計(jì)劃[1]。
近年來,高速鐵路常旅客分類與客戶關(guān)系管理的相關(guān)問題研究逐漸被重視。在客戶關(guān)系管理方面,楊亞偉等[2]從分布式工作流的角度分析探討了鐵路大客戶系統(tǒng)的構(gòu)建管理;俞誠成等[3]基于大數(shù)據(jù)技術(shù)和時(shí)間序列分析的密度聚類算法構(gòu)架了可描繪旅客特征的畫像系統(tǒng);李建光等[4]通過結(jié)構(gòu)方差模型對(duì)鐵路中小運(yùn)營商科學(xué)精細(xì)化管理體系的影響因素進(jìn)行測度分析;郭玉華[5]基于工作流管理和數(shù)據(jù)倉庫等技術(shù)開展鐵路貨運(yùn)大客戶管理系統(tǒng)的設(shè)計(jì)與研發(fā)。在客戶價(jià)值與分類方面,張斌等[6]在消費(fèi)時(shí)間間隔-消費(fèi)頻率-消費(fèi)額度(Recency-Frequency-Monetary,RFM)模型的基礎(chǔ)上,對(duì)鐵路貨運(yùn)客戶進(jìn)行細(xì)分研究;郝曉培等[7]以客戶價(jià)值指數(shù)為目標(biāo)并通過神經(jīng)網(wǎng)絡(luò)算法,建立計(jì)算模型分析旅客的歷史價(jià)值以及潛在價(jià)值以此進(jìn)行客戶分類;帥斌、馬小龍等[8-9]改進(jìn)傳統(tǒng)RFM模型分別對(duì)鐵路客運(yùn)和貨運(yùn)客戶市場的分類進(jìn)行研究;段力偉等[10]基于潛力模型得出的客戶選擇偏好性,建立鐵路貨運(yùn)客戶的分類管理模型;鄧程等[11]改進(jìn)K均值算法對(duì)樣本的孤立點(diǎn)進(jìn)行處理。
目前客戶分類模型研究中,多是注重大客戶的挖掘,較少把常旅客作為目標(biāo)進(jìn)行研究分析。為探究高效的常旅客分類方法,把價(jià)值度相近的常旅客盡可能地聚集到同一類別。根據(jù)RFM模型,提出了一種可以自動(dòng)確定聚類數(shù)目和初始聚類中心的算法,并通過問卷調(diào)查所獲的常旅客數(shù)據(jù)對(duì)算法的可行性和有效性進(jìn)行驗(yàn)證,可為鐵路運(yùn)輸部門提升服務(wù)水平和運(yùn)營策略提供參考。
高速鐵路客運(yùn)是一類典型的運(yùn)輸服務(wù)業(yè),不同于一般商品的有眾多選擇,主要與航空和公路之間競爭。高速鐵路與公路的競爭主要集中在300 km內(nèi)的短途客運(yùn),而與航空的競爭則集中在500 ~1 000 km的中長途客運(yùn)[12]。高速鐵路出行主觀目的性較強(qiáng),主要取決于乘客自身的選擇偏好和其實(shí)際的出行需要,故需要基于高速鐵路的常旅客的出行數(shù)據(jù),主動(dòng)挖掘出具有較為穩(wěn)定的高出行需求的常旅客。高速鐵路常旅客的價(jià)值的高峰值一般處于年齡段25 ~ 45歲之間,該年齡段的常旅客一般有著較為穩(wěn)定的出行需求。由于高速鐵路常旅客的出行需求并不固定,是動(dòng)態(tài)變化的,無法進(jìn)行較長周期的價(jià)值評(píng)估與預(yù)測,但某個(gè)階段會(huì)處于暫時(shí)的穩(wěn)定狀態(tài),故一般選取1年作為研究常旅客價(jià)值的生命周期的時(shí)間跨度。
常用的客戶價(jià)值評(píng)估方法有RFM模型、客戶生命周期價(jià)值(Customer Lifetime Value,CLV)模型,其中RFM模型簡單易懂,靈活方便,可操作性高,能夠較為精確且高效地進(jìn)行客戶的分類管理,篩選出優(yōu)質(zhì)客戶,適用于零售企業(yè)和酒店、餐飲、運(yùn)輸、快遞等行業(yè);CLV模型多是研究整個(gè)生命周期的客戶利潤變化,主要用于企業(yè)客戶關(guān)系管理中的戰(zhàn)略管理層面,但是目前并未形成系統(tǒng)的理論體系,難以對(duì)客戶的價(jià)值進(jìn)行較為精細(xì)的量化分析,模型計(jì)算成本相對(duì)偏高。故RFM模型較為適合用于評(píng)估短期跨度的高速鐵路常旅客價(jià)值,RFM模型最早是由Hughes提出的, R (Recency)指客戶距離最近一次消費(fèi)時(shí)間跨度,F(xiàn) (Frequency)指客戶在研究期內(nèi)消費(fèi)的次數(shù),M (Monetary)指客戶在研究期內(nèi)總共消費(fèi)的數(shù)額[13]。指標(biāo)R越小、指標(biāo)F和指標(biāo)M越大表示客戶忠誠度高,客戶的忠誠度對(duì)長遠(yuǎn)的經(jīng)營利益和價(jià)值發(fā)揮著至關(guān)重要的作用[14],而客戶的滿意度又很大程度決定忠誠度,客戶價(jià)值V計(jì)算公式為
式中:V(R),V(F),V(M)分別為近期消費(fèi)跨度、消費(fèi)次數(shù)及消費(fèi)額度的量化價(jià)值;α,β,γ分別為近期消費(fèi)跨度、消費(fèi)次數(shù)及消費(fèi)額度3個(gè)指標(biāo)的權(quán)重。
RFM模型的3個(gè)評(píng)價(jià)指標(biāo)可以根據(jù)實(shí)際需要把每個(gè)維度的指標(biāo)細(xì)分為若干層次,然后把3個(gè)指標(biāo)中不同層次的元素進(jìn)行組合可得到不同類別的組合,以每個(gè)維度指標(biāo)均分2個(gè)層次為例,可得到2×2×2 = 8組類別的客戶分類,但由于這種分類在多數(shù)情況下并不適用于所有情況,只能在特定的數(shù)據(jù)集中取得較好的分類效果,故RFM模型常常結(jié)合其他分類方法進(jìn)行客戶的精細(xì)劃分。
客戶分類是指有選擇性地根據(jù)客戶價(jià)值、個(gè)人消費(fèi)偏好和特殊需求等指標(biāo)將客戶歸類研究,目前聚類分析方法是將一組特定的集合中類似的對(duì)象聚集在一起,組成若干個(gè)不同類別的一種數(shù)據(jù)挖掘分析法,其中K均值聚類是最為常用的快速聚類方法,廣泛用于各個(gè)行業(yè)領(lǐng)域市場的客戶細(xì)分,故選取K均值聚類用于基于常旅客價(jià)值的高速鐵路客戶分類。
K均值聚類原理是根據(jù)初始設(shè)定的聚類數(shù)目隨機(jī)從樣本數(shù)據(jù)中選取K個(gè)初始聚類中心,分別計(jì)算每個(gè)樣本點(diǎn)到K個(gè)聚類中心的距離(一般為歐幾里得距離),按就近原則將各個(gè)樣本點(diǎn)歸到其K個(gè)簇中,然后再把K個(gè)簇中的中心點(diǎn)設(shè)定為新的聚類中心,如此反復(fù)迭代至聚類中心位置不再發(fā)生改變時(shí)完成聚類。因選取的不同評(píng)價(jià)指標(biāo)的計(jì)量單位不同,數(shù)量級(jí)別也有一定的差異,若初始指標(biāo)的數(shù)據(jù)直接被用來聚類分析,數(shù)量級(jí)別較小的指標(biāo)數(shù)據(jù)影響性將會(huì)被削弱,從而使聚類結(jié)果誤差較大,故在聚類之前一般需要對(duì)原始指標(biāo)的數(shù)據(jù)作標(biāo)準(zhǔn)化處理。K均值聚類快速高效,但其聚類數(shù)目需要預(yù)先設(shè)定且聚類效果還依賴于初始聚類中心的選擇[15]。
為選取較為合理的K值,通常先按分類群體的特征和分類需求,確定一個(gè)大致的K值選取范圍,后通過引入代價(jià)函數(shù),根據(jù)不同K值下代價(jià)函數(shù)的變化趨勢來確定一個(gè)最佳K值,典型的代價(jià)函數(shù)有差值平方和函數(shù)、輪廓系數(shù)等,其中差值平方和函數(shù)SSE計(jì)算公式為
式中:d(vki,)為第k分類下的第i個(gè)數(shù)據(jù)點(diǎn)的坐標(biāo)與其所在類的中心坐標(biāo)的距離。
輪廓系數(shù)計(jì)算公式為
式中:SC(i)為某個(gè)點(diǎn)的輪廓系數(shù);d(i)為某個(gè)點(diǎn)與其所在類中其他點(diǎn)的平均距離;b(i)為某個(gè)點(diǎn)與其他類的點(diǎn)的平均距離,樣本總體的輪廓系數(shù)為其所有樣本數(shù)據(jù)的平均輪廓系數(shù),取值范圍為[-1,1],當(dāng)其值越大,說明聚類效果越好。
高速鐵路客戶分類管理就是將客戶價(jià)值相似的常旅客歸在同一類下,便于定制差別化服務(wù),實(shí)現(xiàn)效益最大化?;诖?,先把所有維度指標(biāo)值通過RFM價(jià)值模型降成一維的值,即常旅客價(jià)值,在一維數(shù)組里確定合適的聚類個(gè)數(shù)和初始聚類中心。由于一維數(shù)組可直接按數(shù)值大小等分歸類,平均值即為其各類的中心點(diǎn),不需要迭代確定,可直接求代價(jià)函數(shù)的值,故無需將整個(gè)多維指標(biāo)數(shù)據(jù)重復(fù)選取不同K值聚類多次后確定最佳K值,即可高效地選出合適的K值提高聚類效率。
傳統(tǒng)K均值聚類確定最佳K值,當(dāng)數(shù)據(jù)量過大或維度較多時(shí),每次設(shè)定不同的K值都需要重新迭代計(jì)算非常麻煩,若能在樣本數(shù)據(jù)聚類之前得出較合適的K值和初始聚類中心,就能較為有效地提高聚類效率和精準(zhǔn)度[16-17]。此外,初始聚類中心選取不同級(jí)別價(jià)值的數(shù)據(jù)點(diǎn),可更有效將性質(zhì)相似且價(jià)值相近的樣本聚集在一起,故引入價(jià)值偏差度VD用以衡量聚類結(jié)果中各類別常旅客價(jià)值的差異性大小,作為判定聚類效果的額外條件,價(jià)值偏差度VD計(jì)算公式為
式中:STD (vk)為第k類旅客中價(jià)值的標(biāo)準(zhǔn)差;nk為第k類樣本中的總數(shù)。
基于常旅客價(jià)值的高速鐵路客戶分類算法流程圖如圖1所示,先是對(duì)原始數(shù)據(jù)做標(biāo)準(zhǔn)化處理,再通過計(jì)算常旅客價(jià)值達(dá)到降維的目的,然后進(jìn)行算法迭代,找出初始聚類中心并確定聚類個(gè)數(shù),最后得出分類結(jié)果。通過多組樣本數(shù)據(jù)發(fā)現(xiàn)相鄰K值的代價(jià)函數(shù)下降值之間的比值φ值下降到10%以后能夠得到較好的聚類結(jié)果,可作為程序自動(dòng)終止的判斷條件。自動(dòng)確定K值和初始聚類中心的原理是初始設(shè)定K值為1,最大的分類數(shù)目為Kmax,根據(jù)價(jià)值的數(shù)值大小將數(shù)組分為K等分,而后計(jì)算各分類的K值下的代價(jià)函數(shù)值,當(dāng)代價(jià)函數(shù)值不滿足要求時(shí),自動(dòng)增加1個(gè)等分量至代價(jià)函數(shù),滿足要求時(shí)輸出最佳分類數(shù)目Km,多維數(shù)組的初始聚類中心則選取為在Km分類下各類中距離其平均值最近的點(diǎn),此處選取差值平方和函數(shù)SSE作為代價(jià)函數(shù)。
圖1 基于常旅客價(jià)值的高速鐵路客戶分類算法流程圖Fig.1 Program flow chart of customer classification algorithm for high speed railway based on frequent rail-traveler value
高速鐵路的常旅客多出現(xiàn)在城市間有密切經(jīng)濟(jì)活動(dòng)聯(lián)系的城市路線之間,以城際路線為主,如京津城際鐵路(北京南—濱海)、滬寧城際鐵路(上海—南京)、成渝城際鐵路(成都東—重慶)等路線均存在相當(dāng)數(shù)量的常旅客,高速鐵路常旅客數(shù)據(jù)在城際路線中較為容易獲取。因此以福廈高速鐵路(福州—漳州)的常旅客為例進(jìn)行驗(yàn)證分析。
(1)數(shù)據(jù)收集。為了更全面了解旅客的出行需求和特點(diǎn),采用線上問卷調(diào)查的方式統(tǒng)計(jì)共977份福廈高速鐵路的常旅客數(shù)據(jù),樣本人群主要集中于福建戶籍人員和福廈高速鐵路途經(jīng)城市的工作人員及福建省內(nèi)高校大學(xué)生。統(tǒng)計(jì)信息包括年齡、職業(yè)、出行頻率、消費(fèi)額度、出行報(bào)銷比例等,得到福廈高速鐵路常旅客2019年出行數(shù)據(jù)如表1所示。
表1 福廈高速鐵路常旅客2019年出行數(shù)據(jù)Tab.1 Travel data of frequent rail-travelers for Fuzhou-Xiamen high speed railway in 2019
(2)建立價(jià)值評(píng)估模型。根據(jù)問卷調(diào)查反饋,由于鐵路出行不同于一般商品的消費(fèi),而是根據(jù)實(shí)際需要選擇,與個(gè)人的乘車偏好和出行目的有較大關(guān)系,外加福廈高速鐵路的壓倒性競爭優(yōu)勢,原始的RFM模型中“R”指近期消費(fèi)跨度,由于選取的常旅客研究周期以年為單位,故這一參考價(jià)值并不大。此外,絕大部分旅客的乘車偏好均為二等座,選擇一等座的不足10%,短途出行中,無人選擇商務(wù)座。而常旅客的出行報(bào)銷比例體現(xiàn)了出差率,結(jié)合常旅客職業(yè),能在一定程度上反映旅客消費(fèi)潛能,故選取出行報(bào)銷比例(R)、出行頻率(F)及消費(fèi)額度(M) 3個(gè)指標(biāo),建立改進(jìn)的RFM模型。
(3)RFM模型各指標(biāo)權(quán)重。評(píng)分標(biāo)度取1-9,對(duì)3個(gè)指標(biāo)進(jìn)行專家綜合評(píng)分,得到RFM模型各指標(biāo)判斷矩陣如表2所示。
表2 RFM模型各指標(biāo)判斷矩陣Tab.2 Judgment matrix of indexes in RFM model
通過和積法求得R,F(xiàn),M各指標(biāo)權(quán)重向量為:{α,β,γ} = {0.106 2,0.260 5,0.633 3},得到最大特征值為:λmax= 3.039 0,表明計(jì)算結(jié)果通過一致性檢驗(yàn)。
(4)數(shù)據(jù)的標(biāo)準(zhǔn)化處理。采用Z-Score法標(biāo)準(zhǔn)化處理數(shù)據(jù)后,得到報(bào)銷比例、出行頻率、消費(fèi)額度的量化價(jià)值,分別為V(R),V(F),V(M),然后再計(jì)算出常旅客價(jià)值V。匯總?cè)柯每蜆?biāo)準(zhǔn)化數(shù)據(jù)如表3所示。
表3 標(biāo)準(zhǔn)化數(shù)據(jù)Tab.3 Standardized data
(5)K均值聚類。設(shè)定Kmax值為10,在程序中輸入數(shù)據(jù)后運(yùn)行,確定最佳聚類個(gè)數(shù)Km為4,初始聚類中心為 (3.578 0,3.443 0,3.324 2),(0.506 9,-0.186 1,-0.025 3),(0.799 3,0.372 7,0.548 3),(2.115 6,1.786 3,1.768 5)。
(6)初始聚類中心有效性驗(yàn)證。設(shè)定K和初始聚類中心后進(jìn)行聚類,程序運(yùn)行17次后算法收斂得到聚類結(jié)果如表4所示。
表4 聚類結(jié)果Tab.4 Clustering results
而當(dāng)聚類數(shù)據(jù)只設(shè)定K值,按隨機(jī)方式選取初始聚類中心時(shí),算法實(shí)現(xiàn)收斂在不同的初始聚類中心下迭代的次數(shù)有所不同,運(yùn)行程序20次,得到平均迭代次數(shù)為35次,最低迭代次數(shù)為21次,最高迭代次數(shù)為60次。可見,算法自動(dòng)選取的初始聚類中心可以提高聚類效率,加快最終聚類中心的收斂。
(7)Km的準(zhǔn)確性驗(yàn)證。輪廓系數(shù)是用于判斷聚類效果的常用指標(biāo)值,不同K值下的輪廓系數(shù)變化趨勢如圖2所示,可以確定K= 4時(shí),輪廓系數(shù)達(dá)到最大值,故聚類分為4類的聚類效果是最佳的。
圖2 不同K值下的輪廓系數(shù)變化趨勢Fig.2 Variation trend of silhouette coefficient under different K values
(8)價(jià)值偏差性驗(yàn)證。分別在設(shè)置初始聚類中心和未設(shè)初始聚類中心時(shí),運(yùn)行程序計(jì)算價(jià)值偏差度,得到價(jià)值偏差度如圖3所示,可以看出,設(shè)置算法中自動(dòng)選取的初始聚類中心的情況下價(jià)值偏差度更低,能夠更有效地選取性質(zhì)相似且價(jià)值更為接近的樣本聚集在一起,產(chǎn)生更優(yōu)的聚類效果。
圖3 價(jià)值偏差度Fig.3 Value deviation
根據(jù)上一節(jié)的聚類分析,選取K值為4,聚類得出各類別常旅客特征如表5所示,價(jià)值越高的客戶群體,25 ~ 45歲旅客所占比例越高,差旅穩(wěn)定率(職業(yè)崗位和差旅需求較為固定的人員所占比例)也越高。4類常旅客中,第Ⅳ類常旅客的價(jià)值最高,往后依次是第Ⅰ類、第Ⅲ類、第Ⅱ類。第Ⅳ類常旅客人數(shù)最少,各項(xiàng)指標(biāo)值都非常高,平均每月出行超過2次,對(duì)福廈高速鐵路運(yùn)營的貢獻(xiàn)度最高,屬于貴賓級(jí)客戶,在配置出行服務(wù)資源方案時(shí)考慮向這類旅客傾斜,提供專門化的服務(wù)。第Ⅰ類常旅客各指標(biāo)值都處于中上水平,有著較高且穩(wěn)定的出行需求,屬于黃金客戶,應(yīng)當(dāng)重點(diǎn)發(fā)展,提供優(yōu)質(zhì)服務(wù)。第Ⅲ類常旅客出行頻率和消費(fèi)額度屬于中下水平,但出行報(bào)銷比率較高,差旅穩(wěn)定率較高,有著較為穩(wěn)定的出行需求,屬于潛在價(jià)值高的客戶,也需要重視忠誠度的維系。第Ⅱ類常旅客人數(shù)占比最高,多為在校學(xué)生、低收入從業(yè)者和老人,屬于低價(jià)值客戶,只需一般維系,但在校學(xué)生具備一定的遠(yuǎn)期潛在價(jià)值。
表5 各類別常旅客特征Tab.5 Frequent rail-traveler characteristics
福廈高速鐵路有較多的時(shí)間車次可供選擇,不同車次時(shí)速和票價(jià)略有差異,總體服務(wù)水平較高。鐵路部門自2017年底推出“鐵路暢行”常旅客服務(wù)計(jì)劃,但并未得到較大程度的推廣,存在較大的提升空間。根據(jù)常旅客分類的結(jié)果,建議加快推行針對(duì)高價(jià)值的第Ⅳ類常旅客的“高端會(huì)員專享”服務(wù),同時(shí)對(duì)不同等級(jí)的會(huì)員積分采用不同的使用和兌換規(guī)則,以體現(xiàn)高級(jí)會(huì)員專享的差異化服務(wù);對(duì)于第Ⅰ類和Ⅳ類高頻出差的旅客考慮實(shí)施“積分升座”服務(wù)計(jì)劃,因其差旅費(fèi)均可報(bào)銷,折扣優(yōu)惠并不能增加其滿足感。“積分升座”既可使得高等級(jí)席位客座率增加,又可增強(qiáng)旅客感知服務(wù)質(zhì)量,提高旅客忠誠度;而對(duì)于Ⅱ、Ⅲ類價(jià)值較低的常旅客,可考慮與高速鐵路服務(wù)站點(diǎn)的商業(yè)合作,提供積分兌換商品抵用券和折扣券等服務(wù)以維系旅客忠誠度。
常旅客分類管理的最終目的就是鎖定高價(jià)值客戶,不斷挖掘更多的潛在客戶,可考慮從以下2個(gè)方面進(jìn)一步提升服務(wù)水平。
(1)推出“個(gè)性化”服務(wù)。對(duì)出行需求穩(wěn)定的異地情侶、探親者和出游者提供“情侶票”“親子票”“假日票”等,根據(jù)不同類別旅客的價(jià)值劃分不同等級(jí);同時(shí)還可考慮推行積分兌換折扣的功能以及贈(zèng)送定制有特殊意義的專屬紀(jì)念品等以提高旅客滿意度。此外,不同類別的常旅客對(duì)出行感知服務(wù)的側(cè)重點(diǎn)有所不同,如考慮為高頻出差的高價(jià)值旅客提供噪音指數(shù)低的專享車廂。
(2)完善客戶關(guān)系管理系統(tǒng)。建立綜合高效的客戶關(guān)系管理系統(tǒng),在旅客購買車票時(shí)獲取更多旅客出行需求、目的和職業(yè)等可挖掘客戶價(jià)值的信息,以便于掌握更全面的常旅客信息進(jìn)行快速分類管理,同時(shí)完善常旅客服務(wù)滿意度評(píng)價(jià)反饋系統(tǒng),及時(shí)調(diào)整運(yùn)營服務(wù)模式。
對(duì)高速鐵路常旅客進(jìn)行客戶分類管理,一方面使得鐵路運(yùn)輸部門能夠通過旅客的分類配置資源,提高運(yùn)營效率與效益,加速實(shí)現(xiàn)高速鐵路投入的資金回收;另一方面有助于完善鐵路運(yùn)輸部門客戶關(guān)系管理機(jī)制,不斷完善客運(yùn)服務(wù)水平,提供高效率、高質(zhì)量的服務(wù),提升高速鐵路在運(yùn)輸市場的占有率。高效的客戶關(guān)系管理必然要求對(duì)旅客價(jià)值有著清晰、精準(zhǔn)的定位和分析,根據(jù)不同層次價(jià)值旅客的實(shí)際需求制定服務(wù)提升方案以提高客戶忠誠度和滿意度,從而追求長期效益的最大化?;诔B每蛢r(jià)值的客戶分類方法有助于鐵路運(yùn)輸部門精準(zhǔn)定位目標(biāo)用戶,實(shí)現(xiàn)對(duì)高速鐵路客戶的高效分類管理。