劉婷婷+王小麗+葛明濤
摘 要:伴隨著航空公司的競爭日益劇烈,怎樣改善個性化服務提高客戶滿意度是公司在體驗經(jīng)濟時代必須面對的問題。面對海量數(shù)據(jù),傳統(tǒng)的統(tǒng)計辦法弊病浮現(xiàn),筆者嘗試用數(shù)據(jù)挖掘技術(shù)處理航空公司客戶價值分析問題。數(shù)據(jù)挖掘技術(shù)應用到航空范疇,可以實現(xiàn)對航空公司現(xiàn)有數(shù)據(jù)資源深度挖掘,為航空公司針對不同的客戶群采取個性化的營銷方案提供科學依據(jù)。本文的創(chuàng)新之處在于將數(shù)據(jù)挖掘技術(shù)應用于解決航空公司具體問題之中,目的在于提高客戶價值分析的準確性和高效性,提高信息化應用水平。
關(guān)鍵詞:數(shù)據(jù)挖掘;客戶價值分析;K-Means聚類分析
DOI:10.16640/j.cnki.37-1222/t.2017.04.248
1 緒論
體驗經(jīng)濟時代消費趨勢主要有以下六個方面:體驗化、情感化、個性化、主動化、休閑化和求美化。[1]第三次工業(yè)革命以來,現(xiàn)代信息技術(shù)得到迅猛發(fā)展,各行各業(yè)意識到數(shù)據(jù)的重要性,建立了無數(shù)的數(shù)據(jù)庫,面對數(shù)以億計的數(shù)據(jù),傳統(tǒng)的統(tǒng)計方法的弊端日益顯現(xiàn)。人們面對海量的數(shù)據(jù),卻不能挖掘出有用的信息,隨著“數(shù)據(jù)爆炸”困惑的增加,人們迫切需要新的數(shù)據(jù)處理技術(shù),因而數(shù)據(jù)挖掘技術(shù)應運而生。法國著名雕塑家羅丹說,生活中從不缺少美,而是缺少發(fā)現(xiàn)美的眼睛。如今,企業(yè)從不缺少數(shù)據(jù),而是缺少挖掘數(shù)據(jù)價值的能力。通過對現(xiàn)有數(shù)據(jù)的挖掘,發(fā)現(xiàn)隱藏在數(shù)據(jù)里的模式,有用信息,指導航空公司作出決策,增加顧客的滿意度,是航空公司必須解決的問題。自從1989年舉行的第十一屆國際聯(lián)合公認學術(shù)會上首次提出數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD),到目前為止,美國人工智能協(xié)會曾經(jīng)舉辦了9次KDD全球研討會。規(guī)模從原來的專題討論會到策略和技術(shù)的集成以及多學科跨領(lǐng)域融合。數(shù)據(jù)挖掘技術(shù)迅速在航空電子領(lǐng)域,航空安全領(lǐng)域,航空維修等等航空領(lǐng)域得到較好的應用與發(fā)展。我國在上世紀90年代的時候就已經(jīng)開始的對數(shù)據(jù)挖掘的研究,經(jīng)過多年的研究,我國已經(jīng)形成數(shù)據(jù)挖掘基礎理論的框架,并且越來越多的學者投入數(shù)據(jù)挖掘的研究之中。不過相對于國外來說,我國的數(shù)據(jù)挖掘應用并沒有得到較高的發(fā)展,依然面臨著嚴重的挑戰(zhàn),仍舊有很多問題等待著研究人員去探索和發(fā)現(xiàn)。
2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘有三大步驟:第一數(shù)據(jù)籌備,第二數(shù)據(jù)挖掘,第三結(jié)果表達和解釋[5]。
數(shù)據(jù)籌備包含數(shù)據(jù)集成,數(shù)據(jù)選擇,目標數(shù)據(jù)預處理。
數(shù)據(jù)挖掘主要是對預處理后的數(shù)據(jù)進行挖掘。
結(jié)果表達和解釋即我們所說的結(jié)果可視化。
3 航空公司客戶價值分析
3.1 傳統(tǒng)客戶價值分析方法
傳統(tǒng)的客戶價值分析使用RFM方法(Recency--最近購買日期, Frequency--各時期購買頻率, Monetary一段時間內(nèi)消費總和)在多數(shù)領(lǐng)域中的多數(shù)情況下能有效地預測老顧客今后可能的消費行為和費用,之后對銷售毛利率、關(guān)系營銷費用進行預測,就能按不同時間段分析出今后短期內(nèi)的客戶價值。[6]說明, 在這種分析方法中,客戶價值是指CRM毛利。CRM毛利 = 購買金額 - 產(chǎn)品成本 - 關(guān)系營銷費用。[7]
RFM模型以Recency為X軸,F(xiàn)requency為Y軸,Monetary為Z軸做一個三維立體模型,可以把客戶價值分為八種:重要發(fā)展客戶、重要價值客戶、一般發(fā)展客戶、一般價值客戶、一般保持客戶、一般挽留客戶、重要保護客戶、重要挽留客戶。
由于航空公司客戶的獨特性,RFM方法分析航空公司客戶價值存在多種弊端和不足,造成分析結(jié)果的不準確和實用性降低。
(1)在RFM模型中,消費金額是一段時間內(nèi)客戶消費總和,由于航空票價受到運輸距離,艙位等級,閑忙時,天氣等眾多因素的影響,同樣消費金額的客戶對于航空公司的價值是不同的。所以用這個指標分析航空公司客戶價值存在不妥。
(2)RFM是使用屬性分箱法分析客戶價值的,這種方法細分客戶群較多,需要逐個識別客戶特征和行為,大大提高的針對性營銷的成本。
(3)RFM方法在處理大量數(shù)據(jù)時由于模型的限制需要的成本較高。
3.2 航空公司客戶數(shù)據(jù)分析方法與步驟
航空客戶信息,包含會員檔案信息和其他乘坐航班記錄信息等
(1)因為消費金額總和這一指標在航空公司客戶價值分析過程中不太實用,所以我們可以選擇航空客戶在一段時間內(nèi)積累的乘坐距離M和乘坐艙位折扣系數(shù)平均值C來替代消費金額總和。同時,因為航空公司會員的加入時間一定程度上可以影響客戶價值,所以我們在航空公司客戶價值分析模型中添加客戶關(guān)系長度L,當做區(qū)分客戶價值的另一個指標,所以我們構(gòu)建出LRFMC模型。
(2)使用聚類分析的方法把客戶進行分類,并且分析客戶群的特征,分析客戶價值。
第1步數(shù)據(jù)抽取。
(1)以2014年3月31為結(jié)束日期,選取寬度為兩年的時間段作為分析觀測窗口,抽取觀測窗口內(nèi)有乘機記錄的所有顧客的詳細資料形成歷史數(shù)據(jù)。對于后來新增客戶信息利用數(shù)據(jù)中最大的某個時間作為結(jié)束時間,采用同樣的方法進行抽取,形成增量數(shù)據(jù)。
(2)根據(jù)末次飛行日期從航空公司系統(tǒng)內(nèi)抽取2012年4月1日至2014年3月31日內(nèi)所有所有乘客的詳細數(shù)據(jù),共62988條記錄。
第2步數(shù)據(jù)探索分析。
在原始數(shù)據(jù)中存在票價為空的情況,票價為空值的數(shù)據(jù)有可能是航空客戶未有乘機記錄造成的。票價最小值為0,折扣率最小值為0,總飛行里程不為0的數(shù)據(jù)有可能是顧客使用0折機票或者是使用積分兌換的機票造成的。
第3步數(shù)據(jù)預處理。
(1)數(shù)據(jù)清洗:從航空公司業(yè)務和數(shù)據(jù)挖掘建模需要考慮篩選出需要的數(shù)據(jù)。
A)不需要票價為空的數(shù)據(jù)。
B)不需要票價為0,平均折扣率不為0,總飛行里程不為0的數(shù)據(jù)。
(2)屬性規(guī)約。在原始數(shù)據(jù)中數(shù)據(jù)屬性太多,我們只需要與LRFMC模型相關(guān)的6個數(shù)據(jù)屬性,所以我們需要刪除不相關(guān),弱相關(guān)和冗余的數(shù)據(jù)屬性。
(3)數(shù)據(jù)變換。A)數(shù)據(jù)屬性構(gòu)造 B)數(shù)據(jù)標準化
第4步建構(gòu)模型。
構(gòu)建航空公司客戶價值分析LRFMC模型
A)客戶K-Means聚類分析 B)客戶價值分析 C)應用模型
A客戶K-Means聚類分析。
采用K-Means辦法對所有客戶數(shù)據(jù)進行聚類分析,將客戶數(shù)據(jù)聚為5類。(具體情況具體分析,必須依據(jù)實際狀況決定分幾類)
B客戶價值分析。
對聚類結(jié)果進行屬性分析:顧客群1在L、M屬性上最??;顧客群2在R屬性上最大,在F、M上最?。豢蛻羧?在屬性F、M上最大,在R上最??;客戶群4在屬性L上最大;客戶群5在屬性C上最大。
根據(jù)航空公司業(yè)務定義為五個等級的客戶類別:重要保持客戶,重要發(fā)展客戶,重要挽留客戶,普通價值客戶,低價值客戶。
根據(jù)每種客戶群類型的特征對客戶群進行客戶價值排名,以便獲得高價值客戶的信息。
C模型應用:根據(jù)每種客戶群的特征,可以采取更多個性化服務和營銷策略。
由于各種行業(yè)面臨的具體問題不同,數(shù)據(jù)挖掘技術(shù)的發(fā)展受到不同的挑戰(zhàn),不過總大趨勢來說,數(shù)據(jù)挖掘技術(shù)必將會得到更好發(fā)展和更加普遍的運用。隨著數(shù)據(jù)量爆炸式的激增,分析決策難度的增加,傳統(tǒng)分析方法弊端的顯現(xiàn),人們對分析決策智能化和自動化的迫切需求,數(shù)據(jù)挖掘技術(shù)與工具將得到更廣泛的使用和發(fā)展。在數(shù)據(jù)爆炸時代,航空公司面臨的新挑戰(zhàn)為數(shù)據(jù)挖掘技術(shù)提供了發(fā)展背景,個性化服務的發(fā)展為數(shù)據(jù)挖掘技術(shù)提供了很好的基礎和發(fā)展平臺。
數(shù)據(jù)挖掘未來會吸引越來越多的研究人員,會涌現(xiàn)出越來越多的研究成果。從目前來看,數(shù)據(jù)挖掘在中國的研究與應用還有很多務實的問題沒有解決。本文僅僅是數(shù)據(jù)挖掘技術(shù)在航空公司客戶價值分析中的初步嘗試,展望未來數(shù)據(jù)挖掘的發(fā)展,有以下幾點需要注意的地方:要充分考慮是否有必要進行數(shù)據(jù)挖掘。傳統(tǒng)的數(shù)據(jù)分析辦法的確有很多弊病,但是相對于傳統(tǒng)的方法數(shù)據(jù)挖掘需要成本較高。在傳統(tǒng)數(shù)據(jù)分析技術(shù)可以滿足要求的情況下,沒有必要必須進行數(shù)據(jù)挖掘,這樣能更加節(jié)省成本。數(shù)據(jù)挖掘需要較大的成本,須要大量的人力,物力和財力用于數(shù)據(jù)籌備,數(shù)據(jù)搜集,問題建模,生成模型和數(shù)據(jù)分析等等。
參考文獻:
[1]吳釗.體驗經(jīng)濟時代六大消費趨勢[J].商業(yè)研究,2003(24).[2]Jiaweihan,Miche line kan ber.Data ming:Concepts and techniques.Diane Cerra Publisher.20063
[3]劉浩,韓晶.MATLAB R2014a一本通[J].電子工業(yè)出版社.
[4]李定遠.CIO時代網(wǎng).2012,09(29).
[5]耿向華.數(shù)據(jù)挖掘在旅游商務系統(tǒng)中的應用研究[J].魅力中國,2013,5(27).
[6]郭良.基于數(shù)據(jù)挖掘技術(shù)的客戶信息分析[J].華東師范大學碩士論文,2015.
[7]郭良.基于數(shù)據(jù)挖掘技術(shù)的客戶信息分析[J].華東師范大學碩士論文,2015.
項目基金:鄭州大學西亞斯國際學院2016校級課題,編號2016KY0