孫洪波
摘要:本文主要基于獲取的商場(chǎng)會(huì)員信息數(shù)據(jù)、商場(chǎng)銷售流水表、會(huì)員消費(fèi)明細(xì)表、商品信息表,通過(guò)Oracle數(shù)據(jù)處理與分析,剔除異常數(shù)據(jù),為后續(xù)處理做準(zhǔn)備。通過(guò)分析商場(chǎng)的會(huì)員消費(fèi)特征,會(huì)員與非會(huì)員消費(fèi)特征的差異,有針對(duì)性的為商場(chǎng)管理者提供營(yíng)銷建議;建立了基于會(huì)員性別、入會(huì)時(shí)長(zhǎng)、年齡和消費(fèi)頻次的評(píng)估會(huì)員購(gòu)買力的多元線性回歸模型,并對(duì)模型的每個(gè)參數(shù)進(jìn)行了檢驗(yàn)。
Abstract: This paper is mainly based on the acquired mall member information data, shopping mall sales flow meter, member consumption schedule and commodity information table. Through Oracle data processing and analysis, the abnormal data is eliminated to prepare for subsequent processing. By analyzing the characteristics of member consumption of the mall and the difference between the consumption characteristics of members and non-members, the marketing suggestions for the mall managers are proposed; the multiple linear regression model for assessing member purchasing power based on the membership gender, the length of membership, the age and the frequency of consumption are established and each parameter of the model is tested.
關(guān)鍵詞:消費(fèi)特征;會(huì)員信息;銷售流水;購(gòu)買力模型
Key words: consumption characteristics;member information;sales flow;purchasing power model
中圖分類號(hào):TP311.13? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1006-4311(2019)18-0243-06
1? 研究背景
伴隨著大數(shù)據(jù)以及人工智能的爆炸式發(fā)展,我國(guó)零售業(yè)正在從O2O階段邁向線上線下深度融合的OMO階段。在這樣的背景下,零售企業(yè)唯有通過(guò)不斷創(chuàng)新?tīng)I(yíng)銷來(lái)提升品牌力和吸引客戶,才能更好地迎接新商業(yè)模式的到來(lái)。
在大數(shù)據(jù)時(shí)代,通過(guò)獲取的商場(chǎng)數(shù)據(jù)分析消費(fèi)特征,并以此為基礎(chǔ)進(jìn)行會(huì)員精準(zhǔn)營(yíng)銷,已經(jīng)是一種很常用的會(huì)員營(yíng)銷手段。在會(huì)員管理營(yíng)銷系統(tǒng)中,為每個(gè)會(huì)員打上個(gè)性化標(biāo)簽,則成一項(xiàng)基礎(chǔ)工作。比如某會(huì)員經(jīng)常來(lái)店鋪購(gòu)買零食,則可以給該會(huì)員打上“吃貨”、“零食”等標(biāo)簽。在零售行業(yè)中,電商的飛速發(fā)展嚴(yán)重沖擊了零售運(yùn)營(yíng)商,造成商場(chǎng)會(huì)員的大量流失,促使大型商場(chǎng)通過(guò)實(shí)施營(yíng)銷策略重視對(duì)現(xiàn)有會(huì)員的針對(duì)性管理,以此維系與會(huì)員之間長(zhǎng)久的、穩(wěn)定的關(guān)系,為零售運(yùn)營(yíng)商帶來(lái)穩(wěn)定的銷售額和利潤(rùn)。
因此,有必要通過(guò)分析零售業(yè)會(huì)員消費(fèi)特征和建立會(huì)員購(gòu)買力模型,為零售運(yùn)營(yíng)商策略的制定提供數(shù)據(jù)支持。本文以獲取的某大型百貨商場(chǎng)會(huì)員的相關(guān)信息為基礎(chǔ)展開(kāi)。
2? 研究方法
首先,依據(jù)某大型百貨商場(chǎng)會(huì)員的相關(guān)信息,分析會(huì)員和非會(huì)員的消費(fèi)特征并進(jìn)行比較,以研究會(huì)員與非會(huì)員群體的差異,得出會(huì)員和非會(huì)員給商場(chǎng)帶來(lái)的經(jīng)濟(jì)效益差異。其次,在分析會(huì)員購(gòu)買力的影響因素的基礎(chǔ)上,利用消費(fèi)金額刻畫會(huì)員的購(gòu)買力,建立多元線性回歸模型,并對(duì)該模型進(jìn)行參數(shù)檢驗(yàn)。
本文主要以O(shè)racle數(shù)據(jù)處理為基礎(chǔ),輔以O(shè)rigin進(jìn)行可視化。解題過(guò)程并不需要建立復(fù)雜的數(shù)學(xué)模型。技術(shù)路線如圖1所示。
3? 模型假設(shè)與準(zhǔn)備
①假設(shè)既有數(shù)據(jù),假定會(huì)員的購(gòu)買力只與會(huì)員性別、會(huì)員消費(fèi)時(shí)的年齡、會(huì)員入會(huì)的時(shí)長(zhǎng)以及會(huì)員在商場(chǎng)的購(gòu)買頻次有關(guān)。②根據(jù)既有數(shù)據(jù),假設(shè)會(huì)員最后一次消費(fèi)記錄即為會(huì)員的退出日期,否則無(wú)法評(píng)價(jià)會(huì)員何時(shí)退會(huì)。③假設(shè)會(huì)員入會(huì)時(shí)年齡小于18歲和大于80歲的數(shù)據(jù)為異常記錄。
解題過(guò)程的數(shù)據(jù)準(zhǔn)備主要是進(jìn)行數(shù)據(jù)預(yù)處理,本課題的數(shù)據(jù)預(yù)處理工作主要包括:①將附件中的數(shù)據(jù)導(dǎo)入Oracle數(shù)據(jù)庫(kù)中;②刪除會(huì)員信息表中會(huì)員出生年月為空;③刪除會(huì)員入會(huì)日期早于會(huì)員出生日期的記錄;④刪除會(huì)員入會(huì)時(shí)年齡小于18歲以及大于80歲的記錄;⑤刪除消費(fèi)數(shù)據(jù)中銷售數(shù)量為負(fù)值的記錄。
4? 商場(chǎng)會(huì)員消費(fèi)特征分析
要分析會(huì)員的消費(fèi)特征,可根據(jù)會(huì)員信息數(shù)據(jù)和會(huì)員消費(fèi)明細(xì)表,以會(huì)員卡號(hào)為數(shù)據(jù)融合字段,從會(huì)員的年齡、性別、不同會(huì)員的購(gòu)買力、購(gòu)買頻次等信息的基本統(tǒng)計(jì)特征入手,通過(guò)Oracle數(shù)據(jù)庫(kù)統(tǒng)計(jì)相關(guān)信息再進(jìn)行可視化。要比較會(huì)員與非會(huì)員群體的差異,可根據(jù)銷售流水表和會(huì)員消費(fèi)明細(xì)表,以商品編碼為數(shù)據(jù)融合字段,兩者做差集得出非會(huì)員消費(fèi)明細(xì),進(jìn)而對(duì)兩者的消費(fèi)特征進(jìn)行比較,以得出會(huì)員和非會(huì)員給商場(chǎng)帶來(lái)的經(jīng)濟(jì)效益差異。
①首先在會(huì)員信息表中添加字段會(huì)員入會(huì)時(shí)年齡,以會(huì)員入會(huì)登記時(shí)間減去會(huì)員出生時(shí)間即可得到會(huì)員入會(huì)時(shí)的年齡。根據(jù)獲取的年齡結(jié)果,剔除年齡小于18歲和大于80歲的記錄,進(jìn)行會(huì)員年齡分布統(tǒng)計(jì)以及會(huì)員性別統(tǒng)計(jì)。
通過(guò)圖2和圖3可以看出商場(chǎng)會(huì)員主要分布在20~30歲之間,隨著年齡的增長(zhǎng)會(huì)員數(shù)量呈現(xiàn)先增后長(zhǎng)的趨勢(shì),其中會(huì)員數(shù)量分布最多的年齡段為26~30歲,該類群體大多為剛畢業(yè)不久的青年人員注重保養(yǎng)和養(yǎng)生,購(gòu)買力較強(qiáng),屬于商場(chǎng)重點(diǎn)推銷對(duì)象。
②將會(huì)員消費(fèi)明細(xì)表和會(huì)員信息表通過(guò)會(huì)員卡號(hào)進(jìn)行融合,統(tǒng)計(jì)不同年齡段、不同性別在消費(fèi)金額、消費(fèi)商品上的特征。
通過(guò)圖4可以看出隨著年齡階段的增長(zhǎng),消費(fèi)金額同樣呈現(xiàn)先增后減的趨勢(shì),但通過(guò)圖5比較可以明顯看出,雖然20-35歲的會(huì)員數(shù)量居多,但是其消費(fèi)金額并非最多的,反之,36歲-55歲的會(huì)員雖然數(shù)量并非最多,但其消費(fèi)金額卻占比較高,充分體現(xiàn)了年輕人由于經(jīng)濟(jì)基礎(chǔ)相對(duì)薄弱,其購(gòu)買力相對(duì)較弱,而年長(zhǎng)者由于具有足夠的社會(huì)經(jīng)驗(yàn)和經(jīng)濟(jì)基礎(chǔ),購(gòu)買了相對(duì)較強(qiáng)。
通過(guò)圖6和圖7可以看出,該商場(chǎng)會(huì)員中女性會(huì)員占絕大多數(shù)(80.74%),而其消費(fèi)總金額占比更高,高達(dá)86.52%。男性會(huì)員數(shù)量占比19.26%,而其消費(fèi)金額占比13.48%。所以女性消費(fèi)者應(yīng)該為該商場(chǎng)的重點(diǎn)推銷對(duì)象。
③為求得會(huì)員和非會(huì)員信息的消費(fèi)情況,利用消費(fèi)流水表統(tǒng)計(jì)總消費(fèi)金額為1222599720.4元,利用會(huì)員消費(fèi)明細(xì)表統(tǒng)計(jì)會(huì)員總消費(fèi)金額為1204268449.39元,兩者相減即為非會(huì)員消費(fèi)金額,為18331271.01元。
從圖8中可以看出,商場(chǎng)中的銷售來(lái)源絕大部分是來(lái)源于會(huì)員,其中會(huì)員為商場(chǎng)帶來(lái)的經(jīng)濟(jì)效益高達(dá)98.5%,而非會(huì)員僅占1.5%,所以商場(chǎng)應(yīng)重點(diǎn)發(fā)展會(huì)員。
④提取非會(huì)員消費(fèi)明細(xì)表,將非會(huì)員消費(fèi)明細(xì)表與商品信息表通過(guò)商品編碼字段進(jìn)行融合,得到含有商品名稱的非會(huì)員消費(fèi)明細(xì)表,再利用會(huì)員消費(fèi)明細(xì)表和非會(huì)員消費(fèi)明細(xì)表,提取會(huì)員和非會(huì)員在商品類別購(gòu)買上的差別。
會(huì)員和非會(huì)員在商品購(gòu)買上也有較大差別,其中會(huì)員購(gòu)買的商品類別有7384類商品,非會(huì)員購(gòu)買的商品類別僅有249類商品,其中排名前50的商品及其銷售數(shù)量如表1所示。從表1中可以清晰看出,購(gòu)買商品數(shù)量排名靠前的幾件商品中,非會(huì)員的主要購(gòu)買特價(jià)和促銷商品較多,而會(huì)員購(gòu)買正價(jià)商品較多,體現(xiàn)出明顯的消費(fèi)觀念差異。此外,購(gòu)買商品排名情況可為商場(chǎng)管理者在進(jìn)貨、促銷等方面提供建設(shè)性指導(dǎo)參考。
⑤通過(guò)提取會(huì)員和非會(huì)員在不同價(jià)格區(qū)間上的商品購(gòu)買數(shù)量,獲取不同價(jià)格區(qū)間會(huì)員和非會(huì)員在商品銷售數(shù)量的差異。
從不同價(jià)格區(qū)間會(huì)員與非會(huì)員購(gòu)買商品數(shù)量的分布上來(lái)看,兩者變化趨勢(shì)相同,都是價(jià)格在0-1000的商品購(gòu)買數(shù)量最多,隨著價(jià)格的升高,購(gòu)買商品的數(shù)量也相對(duì)減少。該分析結(jié)果可指導(dǎo)商場(chǎng)管理者對(duì)不同價(jià)格區(qū)段的商品進(jìn)行針對(duì)性的促銷。
⑥利用會(huì)員消費(fèi)明細(xì)表和非會(huì)員消費(fèi)明細(xì)表,提取會(huì)員與非會(huì)員在一天內(nèi)不同時(shí)段購(gòu)買商品數(shù)量的差異,結(jié)果如圖11、圖12所示。
從圖11和圖12中可以看出,會(huì)員與非會(huì)員同樣是在下午14:00-17:00期間購(gòu)買商品數(shù)量較多,符合常人的購(gòu)買習(xí)慣,不同的是,會(huì)員在夜間00:00-02:00有少量消費(fèi),而非會(huì)員在此期間并無(wú)任何消費(fèi),此外,會(huì)員消費(fèi)開(kāi)始時(shí)間較早,早09:00便開(kāi)始有消費(fèi)行為,而非會(huì)員此期間仍然沒(méi)有消費(fèi)行為。根據(jù)此分析結(jié)果,商場(chǎng)管理者可重點(diǎn)集中在下午時(shí)段進(jìn)行促銷活動(dòng)。
⑦利用會(huì)員消費(fèi)明細(xì)表和非會(huì)員消費(fèi)明細(xì)表,提取會(huì)員與非會(huì)員在一年內(nèi)不同季節(jié)購(gòu)買商品數(shù)量的差異,結(jié)果如圖13、圖14所示。
從圖13和圖14中可以看出,會(huì)員購(gòu)買商品時(shí)在一年內(nèi)分布較均勻,其中1月、3月、5月、8月、11月商品購(gòu)買數(shù)量相對(duì)較多。而非會(huì)員1月份和2月份春節(jié)前后購(gòu)買商品數(shù)量明顯增多,商場(chǎng)管理者可據(jù)此在春節(jié)附近針對(duì)非會(huì)員做一些對(duì)應(yīng)的促銷活動(dòng),此外,非會(huì)員在4月、8月、11月購(gòu)買商品數(shù)量相對(duì)較多。
5? 會(huì)員購(gòu)買力多元線性回歸模型
要分析會(huì)員的購(gòu)買力,首先應(yīng)獲取會(huì)員消費(fèi)時(shí)的年齡、會(huì)員的入會(huì)時(shí)長(zhǎng)以及消費(fèi)頻次等數(shù)據(jù)。首先將會(huì)員消費(fèi)明細(xì)表和會(huì)員信息表通過(guò)會(huì)員卡號(hào)字段進(jìn)行融合,然后進(jìn)行統(tǒng)計(jì)分析。會(huì)員消費(fèi)時(shí)的年齡為消費(fèi)年月月出生年月之差,會(huì)員入會(huì)時(shí)長(zhǎng)為消費(fèi)年月與入會(huì)年月之差,會(huì)員消費(fèi)頻次為會(huì)員卡號(hào)出現(xiàn)的次數(shù)總和。
假設(shè)會(huì)員的購(gòu)買力與會(huì)員的性別、消費(fèi)時(shí)的年齡、消費(fèi)時(shí)的入會(huì)時(shí)長(zhǎng)以及消費(fèi)頻次有關(guān),建立消費(fèi)金額與性別、消費(fèi)年齡、入會(huì)時(shí)長(zhǎng)和消費(fèi)頻次的多元線性回歸模型進(jìn)行回歸:
其中,Y為消費(fèi)金額,即會(huì)員購(gòu)買力,X1為消費(fèi)年齡,X2為入會(huì)時(shí)長(zhǎng),X3為性別,X4為消費(fèi)頻次,b、A、B、C、D為模型參數(shù),利用origin進(jìn)行回歸后得回歸方程為:
其中各個(gè)參數(shù)的標(biāo)準(zhǔn)差及統(tǒng)計(jì)檢驗(yàn)結(jié)果如圖15、圖16、圖17、圖18所示。從輸出結(jié)果圖15中可以看出,模型擬合優(yōu)度較好。從輸出結(jié)果圖16中可以看出,在給定的顯著性水平α=0.05的情況下,回歸方程顯著性F檢驗(yàn)的概率p=0遠(yuǎn)小于α,說(shuō)明回歸方程的線性關(guān)系非常顯著。從輸出結(jié)果圖17中可以看出,各個(gè)參數(shù)的殘差也基本分布在0值兩側(cè)。
6? 結(jié)論
①本文中的會(huì)員購(gòu)買力多元線性回歸模型比較簡(jiǎn)單,以面向應(yīng)用為主,并不需要復(fù)雜的理論推導(dǎo),有利于推廣應(yīng)用。
②本文所使用的主要工具為Oracle,使用簡(jiǎn)單的sql語(yǔ)句解決復(fù)雜的實(shí)際應(yīng)用,有效避免了復(fù)雜理論模型需要大面積編程的難題,處理易于操作和修改。
③本文在分析結(jié)果的同時(shí),分別根據(jù)結(jié)果對(duì)商場(chǎng)管理者提供了針對(duì)性營(yíng)銷建議,有利于理論研究成果的應(yīng)用轉(zhuǎn)化以指導(dǎo)實(shí)際營(yíng)銷運(yùn)營(yíng)。
④由于在刻畫會(huì)員購(gòu)買力模型時(shí)考慮因素不夠充分,導(dǎo)致模型精度不高,后期可重新進(jìn)行自變量的選取,采用向前選擇法、向后選擇法、逐步選擇法等進(jìn)行回歸,以獲取更好的預(yù)測(cè)模型。
參考文獻(xiàn):
[1]朱道元,等.數(shù)學(xué)建模案例精選[M].北京:科學(xué)出版社,2003.
[2]姜啟源,謝金星,葉俊優(yōu).數(shù)學(xué)模型[M].四版.北京:高等教育出版社,2010.
[3]Oder R R, Price C R. HGMS: Mathematical modeling of commercial practice[C]// American Institute of Physics, 1976:641-643.
[4]Rivera R, Burnaev E. Forecasting of Commercial Sales with Large Scale Gaussian Processes[C]// IEEE International Conference on Data Mining Workshops. IEEE Computer Society, 2017:625-634.
[5]King N, Bax T J. Using Grocery Store Point-ofSale Date to Correlate Consumer Purchase Habits to Nutrition Targets:, US20160133140[P]. 2016.
[6]Dorismond J. Supermarket optimization: Simulation modeling and analysis of a grocery store layout[C]// Winter Simulation Conference. IEEE, 2017:3656-3657.
[7]Pasichnyk R, Maslyyak B, Vitsentiy V. Modeling of products sale velocity and products recommended structure on the basis of a data reduction method[C]// Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications, International Workshop on. IEEE, 2001:238-241.
[8]秦靖,劉存勇.Oracle從入門到精通[M].機(jī)械工業(yè)出版社, 2011.
[9]秦靖,劉存勇.ORACLE從入門到精通:視頻實(shí)戰(zhàn)版[M].機(jī)械工業(yè)出版社,2013.
[10]王秀峰.數(shù)據(jù)分析與科學(xué)繪圖軟件ORIGIN詳解[M].化學(xué)工業(yè)出版社,2008.