甘馥榕 鄧穎琪 黃曉娟 吳泳橈 溫秋麗
[摘 要] 隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)持續(xù)演進(jìn)與5G網(wǎng)絡(luò)的廣泛商用,利用海量互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行用戶畫(huà)像被廣泛應(yīng)用于人們?nèi)粘I钪小1狙芯恳园儇浬虉?chǎng)用戶為研究對(duì)象,擬構(gòu)建一整套完善的用戶畫(huà)像,借助其標(biāo)簽化、信息化、可視化的屬性,根據(jù)會(huì)員價(jià)值分析特征指標(biāo)建立LREM模型,利用K-Means聚類(lèi)分析對(duì)會(huì)員用戶精細(xì)劃分,針對(duì)不同群體制定對(duì)應(yīng)的營(yíng)銷(xiāo)策略,為零售運(yùn)營(yíng)商帶來(lái)穩(wěn)定的銷(xiāo)售額和利潤(rùn)并提供建設(shè)性的參考意見(jiàn)。
[關(guān)鍵詞] 零售運(yùn)營(yíng);用戶畫(huà)像;特征標(biāo)簽;K-Means聚類(lèi)分析
1.了解百貨商場(chǎng)用戶數(shù)據(jù)與建模流程
1.1了解百貨商場(chǎng)用戶數(shù)據(jù)
甲方所提供的數(shù)據(jù)集包括會(huì)員信息表和銷(xiāo)售流水表。會(huì)員信息表記錄的是會(huì)員的基礎(chǔ)信息,包括會(huì)員出生日期、性別等;銷(xiāo)售流水表記錄的是該商場(chǎng)的銷(xiāo)售數(shù)據(jù),其中包括會(huì)員與非會(huì)員的消費(fèi)數(shù)據(jù),數(shù)據(jù)時(shí)間范圍是2015年1月1日至2018年1月3日,詳情見(jiàn)表1-1內(nèi)容。
1.2實(shí)現(xiàn)用戶畫(huà)像描繪與價(jià)值分析的步驟與方法
百貨商場(chǎng)會(huì)員用戶畫(huà)像描繪與價(jià)值分析的主要步驟如下:
1獲取原始數(shù)據(jù);
2進(jìn)行數(shù)據(jù)探索;
3利用python對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化和特征構(gòu)建環(huán)節(jié);
4數(shù)據(jù)預(yù)處理完成后進(jìn)行描述性統(tǒng)計(jì)分析,并進(jìn)行可視化展實(shí);
5用處理干凈的數(shù)據(jù)構(gòu)建用戶畫(huà)像,并進(jìn)行數(shù)據(jù)建模,擬采用LRFM模型結(jié)合Kmeans聚類(lèi)算法對(duì)會(huì)員群體進(jìn)行劃分;
6會(huì)員用戶細(xì)分和營(yíng)銷(xiāo)方案制定。
2.對(duì)百貨商場(chǎng)用戶數(shù)據(jù)進(jìn)行預(yù)處理
該商場(chǎng)2015年1月1日至2018年1月3日的銷(xiāo)售數(shù)據(jù)和會(huì)員信息數(shù)據(jù)作為原始數(shù)據(jù)。對(duì)會(huì)員信息表進(jìn)行數(shù)據(jù)清洗,由于會(huì)員卡號(hào)是會(huì)員的唯一標(biāo)志,因此將重復(fù)的會(huì)員卡號(hào)進(jìn)行數(shù)據(jù)去重。由于出生日期有很多大于2018年,以及小于1900年的數(shù)據(jù),這顯然不符合邏輯,因此只抽取出生日期在1945-2010年的數(shù)據(jù),將初步清洗完的數(shù)據(jù)再一次進(jìn)行可視化。
3.統(tǒng)計(jì)分析及可視化
3.1會(huì)員的年齡構(gòu)成、男女比例情況
由數(shù)據(jù)顯示,大部分會(huì)員年齡在32歲至55歲之間,60歲以上以及24歲以下的會(huì)員人數(shù)較少。
為了進(jìn)一步探討年齡段構(gòu)成,將年齡在35歲以下的會(huì)員劃分為青年,36-59歲之間的劃分為中年,60歲以上的劃分為老年,由研究數(shù)據(jù)表明,中年人會(huì)員占比最大,所占比重為65.26%,老年人占比最小,僅有1.83% ,說(shuō)明對(duì)于本商場(chǎng)的用戶,中年人是主要消費(fèi)主體,不同年齡的消費(fèi)金額,30歲-56歲的用戶購(gòu)買(mǎi)力最強(qiáng),即購(gòu)買(mǎi)力最強(qiáng)的是大部分中年人,少部分青年人,中年人有較充足的社會(huì)經(jīng)驗(yàn)和經(jīng)濟(jì)基礎(chǔ),并且有較強(qiáng)的購(gòu)買(mǎi)需求和意愿,并能實(shí)施消費(fèi)行為,青年人相對(duì)來(lái)說(shuō)經(jīng)濟(jì)基礎(chǔ)薄弱,購(gòu)買(mǎi)力相對(duì)較弱,而老年人的購(gòu)買(mǎi)意愿并沒(méi)有中年人和青年人的購(gòu)買(mǎi)意愿強(qiáng)烈,所以老年會(huì)員用戶占比少,進(jìn)行的消費(fèi)力度也弱。
3.2會(huì)員的總訂單占比,總消費(fèi)金額占比等消費(fèi)情況
會(huì)員訂單數(shù)所占比重較小,非會(huì)員用戶的訂單數(shù)占絕大多數(shù),然而27.84%的會(huì)員貢獻(xiàn)了40.33%的消費(fèi)金額,會(huì)員訂單數(shù)雖然較少,但消費(fèi)金額多,說(shuō)明會(huì)員每單價(jià)值要比非會(huì)員每單價(jià)值要高,會(huì)員訂單數(shù)少,另一方面也是由于會(huì)員人數(shù)本來(lái)就少,還有更多非會(huì)員用戶有待吸收為會(huì)員。
3.3會(huì)員的消費(fèi)時(shí)間偏好
會(huì)員用戶的消費(fèi)金額在逐年增加,并且2016-2017年的增速要比2015-2016年的增速快,而會(huì)員及非會(huì)員的共同消費(fèi)金額雖在逐年增加,但增速明顯減弱,很大原因是很多非會(huì)員用戶可能只消費(fèi)一次,不能夠吸引更多非會(huì)員用戶來(lái)進(jìn)行二次或多次消費(fèi),都是在靠“老顧客”(會(huì)員)買(mǎi)單。
接下來(lái)分別以月份、季度和天為單位,探討分析會(huì)員不同時(shí)間段的消費(fèi)偏好。由圖3-1可知,2015年的1、2、3、5月份是會(huì)員進(jìn)行消費(fèi)較高的月份,2016年總體呈上升趨勢(shì),2017年從2月份開(kāi)始,也是呈曲折式上升。
現(xiàn)對(duì)月份進(jìn)行季節(jié)的劃分,定義3、4、5月為春季,6、7、8月為夏季,9、10、11月為秋季,12、1、2月為冬季。由圖3-2可知,2016年和2017年,會(huì)員多集中在秋季消費(fèi)。
節(jié)消費(fèi)金額
一天中會(huì)員用戶下單的時(shí)間集中在9點(diǎn)到23點(diǎn),其中15:00-17:00之間為會(huì)員的下單高峰,從早上9點(diǎn)到下午的16點(diǎn),會(huì)員訂單量呈遞增趨勢(shì),會(huì)員在這段時(shí)間可以有充分的考量進(jìn)而做出消費(fèi)行為,在這些時(shí)間段,商家可以合理地增加工作人員。從下午的16點(diǎn)到晚上23點(diǎn)會(huì)員訂單量呈下降趨勢(shì),商家可以合理地減少工作人員。
4.會(huì)員用戶標(biāo)簽構(gòu)建及畫(huà)像描繪
4.1構(gòu)建會(huì)員用戶基本特征標(biāo)簽
構(gòu)建會(huì)員用戶的基本特征標(biāo)簽,包括會(huì)員的年齡、性別、年齡分段。其中將16-35歲視為青年人,35-59歲視為中年人,59歲以上視為老年人。
4.2構(gòu)建會(huì)員用戶業(yè)務(wù)特征標(biāo)簽
構(gòu)建會(huì)員用戶業(yè)務(wù)特征標(biāo)簽,包括會(huì)員積分等級(jí)、入會(huì)程度、消費(fèi)頻率、消費(fèi)水平、平均每單價(jià)值、最近購(gòu)買(mǎi)時(shí)間共6個(gè)標(biāo)簽。
4.3構(gòu)建會(huì)員用戶興趣特征標(biāo)簽
針對(duì)會(huì)員興趣特征,構(gòu)建了購(gòu)物時(shí)間段偏好標(biāo)簽、購(gòu)物季節(jié)偏好標(biāo)簽、購(gòu)物商品偏好。匯總每位會(huì)員在各個(gè)時(shí)間段、各個(gè)季節(jié)的消費(fèi)次數(shù),將最多消費(fèi)次數(shù)對(duì)應(yīng)的時(shí)間段構(gòu)建會(huì)員用戶購(gòu)物時(shí)間段偏好標(biāo)簽,同理將最多消費(fèi)次數(shù)對(duì)應(yīng)的季節(jié)構(gòu)建購(gòu)物季節(jié)偏好標(biāo)簽。
4.4建立用戶畫(huà)像
從以上構(gòu)建的會(huì)員用戶標(biāo)簽庫(kù)中,隨機(jī)選擇一名會(huì)員,以卡號(hào)“978bf4cc”的會(huì)員為例,使用wordcloud模塊的WordCloud繪制用戶畫(huà)像詞云圖,將該會(huì)員用戶所有相關(guān)的標(biāo)簽數(shù)據(jù)保存至一個(gè)字典中,最后可視化結(jié)果見(jiàn)圖4-1。
從詞云圖中可以直觀看出該會(huì)員用戶是位青年女性,是該商場(chǎng)的老用戶,中等消費(fèi)水平、中等頻率消費(fèi),最近的一次消費(fèi)在39天前,每單的價(jià)值一般,大多數(shù)在中午時(shí)間段進(jìn)行消費(fèi),在夏季消費(fèi)意愿更高。
5.模型構(gòu)建
5.1 會(huì)員價(jià)值分析特征指標(biāo)的構(gòu)建
會(huì)員入會(huì)程度在一定程度上能夠影響會(huì)員價(jià)值,因此在傳統(tǒng)RFM模型中增加會(huì)員入會(huì)程度L,作為劃分會(huì)員的另一特征,因此本項(xiàng)目將會(huì)員入會(huì)程度L,最近消費(fèi)時(shí)間間隔R,消費(fèi)頻率F和消費(fèi)金額M四個(gè)特征作為會(huì)員價(jià)值特征,L代表的意義是會(huì)員入會(huì)登記時(shí)間距觀測(cè)窗口結(jié)束的天數(shù),R代表的意義是會(huì)員最近一次消費(fèi)時(shí)間距觀測(cè)窗口結(jié)束的天數(shù),F(xiàn)代表的意義是會(huì)員在觀測(cè)窗口內(nèi)進(jìn)行消費(fèi)的次數(shù),M代表的意義是會(huì)員在觀測(cè)窗口內(nèi)進(jìn)行消費(fèi)的金額,簡(jiǎn)記為L(zhǎng)RFM模型。
L越大,代表注冊(cè)會(huì)員時(shí)間距離觀測(cè)窗口時(shí)間越長(zhǎng),代表老客戶,該指標(biāo)越大越好;R越小,代表購(gòu)買(mǎi)時(shí)間距離觀測(cè)窗口時(shí)間越短,R越小越好;F越大,代表會(huì)員的購(gòu)買(mǎi)次數(shù)越多,表示會(huì)員的忠誠(chéng)度,M越大,代表會(huì)員購(gòu)買(mǎi)的金額越多。
5.2 進(jìn)行kmeans聚類(lèi)分析
將會(huì)員價(jià)值分析特征指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除量綱不同造成的影響,以LRFM為聚類(lèi)中心,將會(huì)員用戶劃分為四個(gè)類(lèi)別,具體分群結(jié)果如表所示:
會(huì)員群體1消費(fèi)頻率(F)、消費(fèi)金額(M)、入會(huì)時(shí)間(L)、距上次消費(fèi)時(shí)間(R)都較為均衡;會(huì)員群體2消費(fèi)頻率(F)大,消費(fèi)金額(M)高,但入會(huì)時(shí)間(L)較短,距上次消費(fèi)時(shí)間(R)也短,會(huì)員群體3入會(huì)時(shí)間(L)長(zhǎng),但消費(fèi)金額和消費(fèi)頻率不是很高;會(huì)員群體4,入會(huì)時(shí)間短,但距離上一次消費(fèi)的時(shí)間間隔長(zhǎng),消費(fèi)頻率和消費(fèi)金額都不高。
6.營(yíng)銷(xiāo)方案制定
6.1對(duì)會(huì)員用戶進(jìn)行精細(xì)劃分并分析不同群體帶來(lái)的價(jià)值差異
會(huì)員群體1分析:
對(duì)于消費(fèi)頻率(F)高,消費(fèi)金額(M)較高,入會(huì)時(shí)間(L)較短和距上一次消費(fèi)時(shí)間間隔(R)較小的用戶,這里判斷是重要發(fā)展客戶;
會(huì)員群體2分析:
對(duì)于消費(fèi)頻率(F)和消費(fèi)金額(M)都非常高,入會(huì)時(shí)間(L)較長(zhǎng)、距上一次消費(fèi)時(shí)間間隔(R)很小的用戶,這里判斷為重要保持客戶;
會(huì)員群體3分析:
對(duì)于入會(huì)時(shí)間(L)較長(zhǎng),距上一次消費(fèi)時(shí)間間隔(R)較小,消費(fèi)頻率(F)和消費(fèi)金額(M)一般高的用戶,這里判斷為一般價(jià)值客戶;
會(huì)員群體4分析:
對(duì)于距上一次消費(fèi)時(shí)間間隔(R)大,入會(huì)時(shí)間(L)較短,消費(fèi)頻率(F)和消費(fèi)金額(M)一般低的用戶,這里判斷為低價(jià)值客戶。
6.2針對(duì)不同類(lèi)型的群體制定相應(yīng)的營(yíng)銷(xiāo)方案
針對(duì)重要發(fā)展客戶:這類(lèi)會(huì)員近期在百貨商場(chǎng)進(jìn)行過(guò)消費(fèi),消費(fèi)的頻率和消費(fèi)金額較高,值得考慮對(duì)其進(jìn)行一對(duì)一營(yíng)銷(xiāo),進(jìn)一步提高這類(lèi)會(huì)員的忠誠(chéng)度和滿意度。
針對(duì)重要保持客戶:這類(lèi)會(huì)員最近在百貨商場(chǎng)進(jìn)行過(guò)消費(fèi),消費(fèi)頻率和消費(fèi)金額都比其他群體會(huì)員要高,這類(lèi)會(huì)員所占比例比較小,可考慮進(jìn)行線上線下多方式,加強(qiáng)商場(chǎng)與該類(lèi)會(huì)員的溝通,可考慮一對(duì)一售后服務(wù),鞏固保持這類(lèi)會(huì)員的忠誠(chéng)度與滿意度。
針對(duì)一般價(jià)值客戶:這類(lèi)會(huì)員雖消費(fèi)頻率或消費(fèi)金額屬于中等,但入會(huì)時(shí)間較長(zhǎng),這類(lèi)會(huì)員是百貨商場(chǎng)的潛在價(jià)值客戶。百貨商場(chǎng)可分析這類(lèi)會(huì)員近期消費(fèi)的商品類(lèi)目,設(shè)置有吸引力的禮品,或以套餐等形式,從而可以進(jìn)一步發(fā)展該類(lèi)會(huì)員。
針對(duì)低價(jià)值客戶:這類(lèi)會(huì)員已經(jīng)有一段時(shí)間沒(méi)有在商場(chǎng)進(jìn)行過(guò)消費(fèi),消費(fèi)頻率和消費(fèi)金額都中等水平高,但入會(huì)時(shí)間短,仍然有進(jìn)一步挖掘的價(jià)值,可多對(duì)這類(lèi)會(huì)員進(jìn)行價(jià)值較低產(chǎn)品的促銷(xiāo)活動(dòng)推送,刺激吸引該類(lèi)會(huì)員的二次消費(fèi)。
7.小結(jié)
本項(xiàng)目對(duì)百貨商場(chǎng)的會(huì)員及非會(huì)員消費(fèi)記錄進(jìn)行挖掘分析,經(jīng)過(guò)一系列數(shù)據(jù)清洗、去重、去除異常值、剔除缺失值等環(huán)節(jié),對(duì)原始數(shù)據(jù)進(jìn)行充分的預(yù)處理,并進(jìn)行描述性統(tǒng)計(jì)分析,進(jìn)行可視化展實(shí),了解會(huì)員各特征的構(gòu)成。再而從會(huì)員用戶基本特征、業(yè)務(wù)特征和興趣特征三個(gè)大維度構(gòu)建會(huì)員標(biāo)簽庫(kù),進(jìn)行會(huì)員用戶畫(huà)像描繪,本項(xiàng)目并在傳統(tǒng)RFM模型中增加會(huì)員入會(huì)程度L,并結(jié)合K-Means聚類(lèi)算法以LRFM為聚類(lèi)中心,對(duì)會(huì)員進(jìn)行精細(xì)劃分,總共分為四個(gè)群體,并針對(duì)不同類(lèi)型的群體制定相應(yīng)的營(yíng)銷(xiāo)方案。
【參考文獻(xiàn)】
[1]廖莎.大數(shù)據(jù)時(shí)代基于用戶畫(huà)像挖掘的電商精準(zhǔn)營(yíng)銷(xiāo)[J].數(shù)碼世界,2017(11):190.
[2]王裴.分析用戶畫(huà)像在企業(yè)精準(zhǔn)營(yíng)銷(xiāo)中的應(yīng)用方式[J].商場(chǎng)現(xiàn)代化,2017(18):70-71.
[3]巨星海,周剛,王婧,張鳳娟.用戶畫(huà)像構(gòu)建技術(shù)研究[J].信息工程大學(xué)學(xué)報(bào),2020,21(02):242-250.
作者簡(jiǎn)介:
甘馥榕(1999-),女?,籍貫:廣西扶綏,民族:壯族,職稱(chēng):學(xué)生,學(xué)歷:本科,研究方向:應(yīng)用統(tǒng)計(jì),單位名稱(chēng):玉林師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院、廣西玉林市,
【基金項(xiàng)目】玉林師范學(xué)院校級(jí)科研一般項(xiàng)目(2018YJKY29),玉林師范學(xué)院2021年大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(202110606113、202110606114).