鮑俊穎,吳瑤瑤
(重慶第二師范學院 數(shù)學與信息工程學院,重慶400065)
伴隨“互聯(lián)網(wǎng)+”網(wǎng)絡時代的沖擊,網(wǎng)絡銷售逐漸取代傳統(tǒng)銷售,網(wǎng)絡銷售行業(yè)競爭日趨嚴重。本文以淘寶某高級禮服商家為例,該店鋪為淘寶皇冠店鋪,近期銷售額持續(xù)下滑,通過促銷、聚劃算等營銷手段能夠在短暫時期內(nèi)增加較多的客流量,但是新流量的后期維護問題困擾著商家。同時,買家的回頭率與回購的訂單價的把控都存在嚴重缺陷[1]。而這些問題的存在主要是對顧客的資源發(fā)掘不充分,通過選取店鋪銷售數(shù)據(jù)中的11 013個樣本進行分析,根據(jù)有效客戶制定營銷計劃,實現(xiàn)精準營銷(如提供價格折扣、產(chǎn)品對比等服務),使銷售商在有效預算下獲得利益最大化。此外,本文通過有效客戶預測近期購買力,還能為商家減少貨物積壓等,有助于改良現(xiàn)有的銷售模式、提高銷售收益[2]。
以RFM模型度量買家價值及買家盈利能力,構(gòu)建3個要素動態(tài)展示客戶的整體輪廓,即最近一次交易的時間(記為R)、近期交易次數(shù)(記為F)和近期交易金額(記為M)。將時間段內(nèi)客戶的交易金額進行分等級評分,3類指標計算得到“有效”評分數(shù)為RFM=100R×10F×M[3]。
本文對店鋪某季度的銷售數(shù)據(jù)11 013個樣本進行RFM分析,構(gòu)建RFM模型所需數(shù)據(jù)(交易時間、金額、次數(shù))。作出離散化之后的RFM塊計數(shù)圖和RFM熱圖,如圖1。RFM塊計數(shù)圖呈現(xiàn)根據(jù)離散化方法設定的塊的分布,每個條的高度代表著對應RFM得分的客戶數(shù)量。該圖主要用來查看每個RFM得分的客戶數(shù)量分布是否均勻,我們期望均勻的分布。若不均分,則需要重新考慮RFM的適用性或者試驗其他分箱方法[4]。圖1中生成的125個組段樣本數(shù)量大致上是相等的。RFM熱圖是交易金額均值在交易時間和交易次數(shù)上繪制的矩陣圖,用于表示不同購買時間*購買頻次分組時該組段的平均購買金額分布,從而能夠快速確定高價值組段所在的區(qū)域;用顏色深淺表示交易金額均值的大小。其中頻率分值為5分的幾個組段其平均購買金額更大,并且其中又以時間順序分值為3~5分的幾個組段更大[5]。
根據(jù)離散化之后的數(shù)據(jù)計算樣本的RFM值,選擇RFM得分大于500的作為“最有價值”客戶作為本次活動的促銷名單,本文共選擇出2 145位客戶作為本次活動的促銷名單,成為“最有價值”客戶[6]。
圖1 RFM塊計數(shù)和RFM熱圖Fig. 1 RFM block count and RFM thermal map
RFM模型的結(jié)果顯示,購物頻率和購物金額正相關(guān),且購買頻率為5的購物金額明顯較大,商家可以針對RFM得分大于500的客戶開展相應的促銷活動,為進—步分析,研究頻率得分和交易數(shù)間的關(guān)系,其結(jié)果見表1。
表1 頻率得分和交易數(shù)對比Tab. 1 Frequency score and transaction number comparison
由表1可知,頻率得分為5的這一組包括全部交易頻數(shù)大于1次的客戶,表1中呈現(xiàn)了交易頻次多于1次的客戶和只有1次交易的客戶之間的差異。因此,將消費者分為1次購物客戶和重購客戶2組,比較這2組消費者之間的差異[7]。
本文研究對象為多變量,且不同變量對于客戶群體具有不同方面的重要意義,根據(jù)數(shù)據(jù)屬性,結(jié)合變量取值特點,需要考慮不同因素下不同客戶群體的構(gòu)成。本文運用分類樹模型分析重購客戶群體特征,分類樹模型首先瀏覽全部變量來確定最優(yōu)分組,再根據(jù)不同變量對客戶依次遞歸劃分。選取變量買家信譽、性別、年齡、地區(qū)、是否重購、次均交易金額,將是否重購變量視為響應字段,其結(jié)果見表2。
表2 樹模型分析結(jié)果Tab. 2 Tree model analysis results
由表2可知,只有次均交易金額和買家信譽2個變量為模型提供顯著貢獻,響應率最高的一組次均交易金額介于49~107.743 33元,買家信譽高于4星級,這731人中有26.54%為重購買家;其次為次均交易金額小于或等于37.955元的人群,其中有25.77%為重購買家;以此類推,第11組的重購率只有7.1%。而11個亞群大致根據(jù)次均交易金額和買家信用劃分的,意味著重購群體并不存在明顯的性別、年齡、地區(qū)等差異。
前5組的響應率較高,但5,6組之間有較大差距,通過分析前5組,總結(jié)重購客戶特征為:信用等級在4星級以上,而次均交易金額小于150.95元,并且如果次均交易金額小于107.743 33元,信用等級將更高,購買比例較大。
不同的客戶群體可看做是不同的客戶類別,故可運用聚類分析對客戶進行分類,為確定各類型特征,通過方差分析評估每個類別變量的重要性,根據(jù)變量在不同類別中的作用識別客戶購買特征,定位有效客戶群體。本文運用兩步聚類法,選擇買家性別、買家信譽、是否多次交易、RFM得分、次均交易金額和買家年齡為分析變量進行聚類分析,結(jié)合聚類圖和預測變量重要性圖,如圖2將客戶群成功地分成了4類,每個客戶群的特點為:
圖2 聚類分析每組類別詳細信息和預測變量重要性圖Fig. 2 Cluster analysis of each group of category details and the importance of predictive variables
類別1:人數(shù)占比為23.5%,男性為主,單次交易為主,年齡均值為28.65,次均交易金額均值為167.61,RFM得分均值為328.51,4星級買家居多。
類別2:人數(shù)占比為15.5%,女性為主,多次交易為主,年齡均值為28.08,次均交易金額均值為121.38,RFM得分均值為378.77,1鉆買家居多。
類別3:人數(shù)占比為28.9%,女性為主,單次交易為主,年齡均值為27.81,次均交易金額均值為150.25,RFM得分均值為323.57,5星級買家居多。
類別4:人數(shù)占比為32.1%,女性為主,單次交易為主,年齡均值為27.83,次均交易金額均值為148.46,RFM得分均值為325.81,1鉆買家居多。
上述4個客戶群體中類別2多次交易占比為100%,與研究目標群體重購人群一致,則將類別2作為研究的特定群體。預測變量重要性圖反映預測變量的重要程度,顏色越深,重要性越突出,則買家信用、性別、是否多次交易對該聚類模型更重要一些[8]。即定義重購行為特征為:以女性為主,買家信用大于1鉆,RFM得分大于378.77,次均交易金額大于150.25。
在得到有效客戶群體后,往往有針對性地根據(jù)這部分客戶定制專門的營銷方案,需要監(jiān)測廣告投放或營銷方案的有效性,進而對更多未知客戶的購買行為進行預測,從而更加精準地營銷,同時為產(chǎn)品設計、生產(chǎn)和存儲提供依據(jù),實現(xiàn)利潤最大化。購買傾向分析根據(jù)已有響應測試結(jié)果的少數(shù)客戶作為訓練數(shù)據(jù),建立預測模型,運用該模型對其余客戶預測評分,從而預測響應推廣信息繼而購買產(chǎn)品的客戶。
將變量是否重構(gòu)作為響應字段,選取買家信譽、性別、年齡、次均交易金額和RFM得分作為預測傾向。經(jīng)測算整體模型質(zhì)量為0.62,大于一般標準0.5,說明模型整體水平較好。作出檢查分類表,如表3,訓練樣本中實際正響應的正確率為14.86%,測試樣本的正確率為16.2%,即以此模型選擇的客戶中有16.2%發(fā)生購買行為,它大于指定的最小響應率2%,故此模型可以用于確定超過指定的最小響應率的客戶。
表3 檢查分類表Tab. 3 Inspection classification table
根據(jù)已有響應數(shù)據(jù)建立的購買傾向分析模型,對待確定客戶的購買傾向進行量化打分,可以選出有可能發(fā)生購買的客戶群體,實現(xiàn)精準營銷。建立購買傾向分析的二項Logistic模型,二項Logistic模型可以根據(jù)不同自變量,計算每個客戶的響應概率,即預測客戶發(fā)生購買行為的概率,達到預測和判別的目的。設定閾值為0.25,根據(jù)計算結(jié)果,從1萬多個客戶中,共選出2 017個客戶,針對這組客戶制作活動方案,投放廣告可以得到更高的購買響應率,提高購買率。
基于RFM模型對客戶的細分[9],計算最近一次消費時間、消費頻數(shù)、消費金額得分的均值,將得分小于均值的視為低,記為0,其他視為高,記為1,再依據(jù)下述標準將客戶分為8類[10],將每個客戶定位到不同的類型,匯總?cè)绫?。
表4 客戶類型匯總表Tab. 4 The summary of customer types
重要價值客戶(111):最近一次交易時間間隔短、消費頻數(shù)及金額均很高。這類客戶具有很高潛在價值,是帶來企業(yè)利潤的最重要群體,此類客戶的維系是企業(yè)利潤的重要保證。
重要保持客戶(011):最近一次交易時間間隔長,但消費頻數(shù)和金額均很高。說明這是較長時間未消費的忠實顧客,需要主動發(fā)生聯(lián)系。
重要發(fā)展客戶(101):最近一次交易時間間隔短、消費金額高,但頻數(shù)不高。雖然忠實度不高,卻擁有很大潛力,如果企業(yè)適應他們的需求,通過針對性的營銷策略迎合他們,即可提高購買次數(shù),獲得更可觀的利潤,故需著重發(fā)展。
重要挽留客戶(001):最近一次交易時間間隔短、消費頻數(shù)不高,但消費金額高??赡転榧磳⒘魇Щ蛞呀?jīng)失去的用戶,對這類客戶企業(yè)應盡量挽回,是企業(yè)利潤的潛在來源之一。
一般價值客戶(110):最近一次交易時間間隔短,消費頻數(shù)高,但消費數(shù)額較小。這類客戶是活躍客戶,但存在經(jīng)濟實力不夠或者經(jīng)濟實力較強而產(chǎn)品不符合購買意愿的問題。若對于此類客戶的銷售投入較大,可能不能達到銷售目標,但適當保持關(guān)系仍可使企業(yè)獲取一定收益。因此,持有一般重要態(tài)度。
一般發(fā)展客戶(100):最近一次交易時間間隔短,但購買頻數(shù)和購買金額都較小,不能馬上為企業(yè)贏得可觀收益。
一般保持客戶(010):購買頻數(shù)較高,但長期不和該企業(yè)交易,并且消費金額很低,企業(yè)從這類客戶得到更多收益已經(jīng)較為困難。
無價值客戶(000):無論是購買頻數(shù)、購買金額,還是購買時間間隔,這類客戶均不能為企業(yè)帶來價值,因此不再需要維系和他們的關(guān)系。
由表4知,重要價值客戶有704人。根據(jù)RFM模型,重要價值客戶為分值最高的一類,故將這704名重要價值客戶定位為有效客戶。
本文運用分類樹模型,在RFM模型基礎上進行優(yōu)化,考慮潛在客戶價值與創(chuàng)收能力;結(jié)合聚類分析,基于所有客戶數(shù)據(jù)的分類,找到影響銷售的關(guān)鍵因素,定位客戶群體;運用二元Logistic回歸模型,有效預測客戶購買行為;針對分析結(jié)果,提出了客戶當前價值和潛在價值在客戶細分中的應用。通過數(shù)據(jù)挖掘技術(shù),采用真實數(shù)據(jù)進行量化分析,可以清楚直觀地定位更有價值的顧客,從而根據(jù)顧客群體制定銷售方案,推廣銷售信息,預測銷售數(shù)據(jù),實現(xiàn)精準營銷。同時,通過有效客戶定位的結(jié)果,同樣可以分析潛在客戶的特征,如將預測購買力接近0.25的作為潛在客戶,同時也可將客戶分類中的重要保持客戶、重要發(fā)展客戶作為潛在客戶進行促銷。