劉 海,盧 慧,阮金花,田丙強,胡守忠
(上海工程技術大學 服裝學院,上海 201620)
研究與技術
基于“用戶畫像”挖掘的精準營銷細分模型研究
劉 海,盧 慧,阮金花,田丙強,胡守忠
(上海工程技術大學 服裝學院,上海 201620)
針對大數(shù)據(jù)時代服裝企業(yè)不知道怎樣利用大數(shù)據(jù)進行營銷的問題,基于4C理論構建了“用戶畫像”數(shù)據(jù)庫,通過對數(shù)據(jù)庫的挖掘來進行消費者群體細分。在此基礎上,從營銷的角度構建了精準營銷細分模型,并以三槍集團的營銷數(shù)據(jù)為對象,利用SPSS工具對身高這一細分因素進行了挖掘。研究表明:大數(shù)據(jù)時代,以“用戶畫像”數(shù)據(jù)庫挖掘為基礎的精準營銷細分模型,能夠重構消費者的需求、精準定位消費者群體,并能為企業(yè)實施精準營銷提供科學的決策依據(jù)。
大數(shù)據(jù);用戶畫像;消費者細分;數(shù)據(jù)挖掘;精準營銷
隨著網(wǎng)絡與信息技術的快速發(fā)展,企業(yè)之間、企業(yè)與消費者之間都習慣了通過互聯(lián)網(wǎng)進行交易,由此帶來了電子商務的蓬勃發(fā)展,并產(chǎn)生了大量的消費數(shù)據(jù)。黃升民等[1]通過對大數(shù)據(jù)背景下營銷體系的解構與重構,認為數(shù)據(jù)的使用貫穿在整個營銷過程的始末,對于營銷的效果起著至關重要的作用。
大數(shù)據(jù)時代,消費者在網(wǎng)上的瀏覽、點擊、留言、評論等碎片化的行為軌跡被整理搜集并存儲起來,這些行為軌跡直接或間接反映了消費者的性格、習慣、態(tài)度等信息,能被用來為企業(yè)實施營銷提供決策依據(jù)。而這些碎片化的、整理存儲在數(shù)據(jù)庫中的數(shù)據(jù),能被企業(yè)用來完整地重構消費者的需求。這些從全方位、立體性的記錄消費者的數(shù)據(jù),被稱之為“用戶畫像”[2-3]。
《大數(shù)據(jù)時代》的作者維克托·邁爾-舍恩伯格[4]認為,大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效,大數(shù)據(jù)讓人們不再期待精準性,而是混雜性。怎樣從混雜性的大數(shù)據(jù)中挖掘有價值的相關信息,成為企業(yè)必須思考的問題。因此,由這些數(shù)據(jù)組成的“用戶畫像”,不僅再現(xiàn)了消費者的全貌,反映了消費者的需求,而且是企業(yè)挖掘消費者需求與價值、進行消費者細分、實施精準營銷及其他活動的基礎。
傳統(tǒng)營銷模式下,筆者通過訪談、調(diào)研的方式來探知消費者,做出假設,并根據(jù)這些數(shù)據(jù)構建模型,用科學化的方法對消費需求進行驗證并做出預測。大數(shù)據(jù)時代,當人們有能力解讀“全樣本”,從更多角度精細地描述消費者,并且數(shù)據(jù)可以實時、動態(tài)獲得的時候,消費需求的挖掘方式也要隨之改變。
1.1 “用戶畫像”數(shù)據(jù)庫的構建
傳統(tǒng)營銷模式下,數(shù)據(jù)來源于企業(yè)的營銷記錄,隨著網(wǎng)絡及電子商務的發(fā)展,消費者的網(wǎng)上痕跡也化為數(shù)據(jù),成為企業(yè)營銷數(shù)據(jù)的來源之一。構建“用戶畫像”所需要的數(shù)據(jù),除了傳統(tǒng)上從數(shù)據(jù)庫中獲得的數(shù)據(jù)、營銷平臺搜集的數(shù)據(jù)、歷史數(shù)據(jù)[5]之外,還要盡可能獲取消費者在互聯(lián)網(wǎng)社區(qū)上的一些視頻、圖片等信息(比如新浪微博)及地理空間信息等數(shù)據(jù)[6],這些數(shù)據(jù)能夠從側面反映消費者的態(tài)度、偏好等,使營銷更精確。
對于用來存儲“用戶畫像”所需要數(shù)據(jù)的數(shù)據(jù)庫有很多,本文選擇SQL Server數(shù)據(jù)庫。它是一款能用于大型聯(lián)機事務處理、數(shù)據(jù)倉庫和電子商務等方面應用的數(shù)據(jù)庫平臺,它不僅能在企業(yè)內(nèi)部共享服務器,查詢各種數(shù)據(jù),還能夠為企業(yè)降低管理、生產(chǎn)等各方面的成本[7]。
本文的“用戶畫像”是在“4C”理論的基礎上,結合消費者的需求特點,通過查閱文獻、調(diào)研、訪談并在專家的建議下構建起來的(圖1)。
圖1 用戶畫像Fig.1 Persona
“4C”理論包括消費者、成本、便利和溝通[8]。其中,消費者就是充分了解、研究、分析消費者的需求,可以從消費者的年齡、性別、職業(yè)等基本信息角度理解;而成本不僅指消費者愿意支付的價格成本,還包括時間、體力和精神成本;便利則主要指的是方便消費者購買及使用,這兩個因素可以從消費行為角度理解,包括網(wǎng)頁瀏覽時間、點擊記錄等購買前的信息搜集行為及購買記錄等行為;溝通則是通過互動的方式將消費者與企業(yè)結合在一起,這樣企業(yè)就能知道消費者的忠誠度、滿意度等,可以從購買后的評價及溝通平臺等角度理解。
由于“用戶畫像”屬于信息層面,因此需要用數(shù)據(jù)庫的語言進行設計,也就是需要用實體-聯(lián)系圖(entity-relation diagram,E-R圖)來完成。E-R圖提供了表示實體(即數(shù)據(jù)對象)、屬性和聯(lián)系的方法,用來描述現(xiàn)實世界的概念模型。用來描述“用戶畫像”的E-R圖如圖2所示。
1.2 市場營銷中的數(shù)據(jù)挖掘方法
“用戶畫像”構建完之后,需要對數(shù)據(jù)進行挖掘,這也是大數(shù)據(jù)時代數(shù)據(jù)分析最重要的一步,大數(shù)據(jù)分析,最關鍵的就是從不相關的數(shù)據(jù)到相關的關系。如何從大量不相關的數(shù)據(jù)發(fā)生聯(lián)系成為相關的關系,這就需要進行數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘方法有很多,對于營銷來說,主要有聚類、分類、關聯(lián)規(guī)則、決策樹和協(xié)同過濾等。其中,分類主要用來對銷售數(shù)據(jù)分析,其目的是通過構建分類模型,以此來確定顧客的興趣和消費傾向,然后將數(shù)據(jù)分成給定的類別,從而推斷消費者下一步的消費行為;關聯(lián)規(guī)則主要是利用產(chǎn)品相似性進行推薦營銷,比如經(jīng)典的啤酒與尿布的故事,就是利用關聯(lián)規(guī)則成功營銷的案例;決策樹主要用來保留顧客分析和顧客流失率分析,而聚類則是根據(jù)“物以類聚,人以群分”的思路,根據(jù)產(chǎn)品的相似性、顧客的群特征,對消費者進行分類。聚類方法包括許多,像基于層次的聚類、基于密度的聚類、基于網(wǎng)格的聚類,聚類可以用來對客戶群體進行分類、對客戶背景分析、對客戶購買趨勢預測等。
圖2 “用戶畫像”數(shù)據(jù)庫E-R圖Fig.2 E-R diagram of “persona” database
1.3 消費者細分因素的確定
消費者細分是一個陳舊的話題,但是在大數(shù)據(jù)時代,在人們擁有了更多的數(shù)據(jù)之后,借助更好的挖掘工具、分析工具,就能夠幫助企業(yè)對網(wǎng)上消費者進行全面的追蹤及精細的劃分,在準確地劃分群體之后,通過挖掘消費需求又可以進行個性化的精準營銷。大數(shù)據(jù)時代,消費者細分因素的確定是以“用戶畫像”為基礎的。傳統(tǒng)細分主要基于兩個角度,消費者角度和產(chǎn)品角度[9]。消費者角度就是以消費者為研究重點,主要從消費者的不同側面來細分消費群體;產(chǎn)品角度就是以產(chǎn)品為導向的市場細分,為企業(yè)制定營銷決策用。因此,細分的標準不同就會有不同的市場適用性[10]。
總之,從消費者角度來說,市場細分的依據(jù)主要有三方面:人口特征、行為特征和心理特征[11]。
人口特征因素主要包括性別、年齡、職業(yè)、地區(qū)及婚姻狀況[12]。通過以往的文獻可知,性別、年齡不同,消費需求也不同;消費者的教育程度、收入越高,購買新產(chǎn)品的可能性越高[13];而婚姻狀況對消費者的消費習慣也會產(chǎn)生影響[14]。
行為特征因素的選取主要參照消費者購買決策及專家意見來獲取并確定的。消費者在購買決策過程中大致經(jīng)歷需求誘發(fā)、信息搜集、比較選擇、購買決策、購后評價五個階段[15]。
心理特征因素主要包括偏好、態(tài)度和價值三個主要方面。偏好方面不僅包括消費者對顏色、價格等與產(chǎn)品有關的偏好,還包括消費者的一些行為偏好,態(tài)度指的是消費者的滿意度與忠誠度。而價值則主要指的是消費者的感知價值[16],消費者所感覺到的、一些與心理有關的利益[17]、價值等方面。
綜上所述,構建消費者細分因素模型如表1所示。
表1 消費者細分因素模型Tab.1 Consumer segmentation factors model
2.1 精準營銷細分模型的構建
大數(shù)據(jù)時代,構建精準營銷體系模型如圖3所示。
精準營銷的核心是以消費者為中心,精確和準確地滿足消費者的需求。大數(shù)據(jù)時代下,構建“用戶畫像”數(shù)據(jù)庫的目的就是為了全面、準確地描述消費者,用數(shù)據(jù)重構消費者的全貌,消費者的一切需求、偏好、動機都能利用數(shù)據(jù)挖掘技術從“用戶畫像”數(shù)據(jù)庫中提取出來,再通過消費者群體細分形成對營銷有價值的信息,從而為企業(yè)實施精準營銷提供有效的建議。精準營銷策略實施之后或者在實施過程之中,企業(yè)也可以通過與消費者互動溝通、消費者購買后的評價等數(shù)據(jù)查看營銷的效果,并將這些效果反饋到“用戶畫像”數(shù)據(jù)庫中,以便隨時改進營銷策略。
在整個精準營銷體系中,精準營銷策略的實施是以精準營銷細分模型為基礎的,精準細分模型的構建是整個精準營銷體系中最重要的一步。
傳統(tǒng)營銷模式下,人們是以“4P”理論(產(chǎn)品、渠道、價格、促銷)進行營銷的,大數(shù)據(jù)時代,營銷的理論基礎也不會脫離“4P”理論。基于數(shù)據(jù)挖掘及消費者細分模型的基礎上,本文從消費者、產(chǎn)品、購買行為、服務4個營銷的角度,重新細分影響因素,構建精準營銷細分模型進行營銷。精準營銷細分模型如表2所示。
表2 精準營銷細分模型Tab.2 Precision marketing segmentation model
2.2 基于兒童身高的精準營銷細分群體驗證
因為企業(yè)的營銷數(shù)據(jù)屬于商業(yè)機密,企業(yè)一般不會輕易給外人使用,因此憑借筆者所在學院與上海三槍集團的合作關系,采用三槍集團旗下迪士尼網(wǎng)上品牌的銷售數(shù)據(jù)做驗證分析。
限于時間與能力的原因,取上海三槍迪士尼品牌2014年全年的網(wǎng)上營銷數(shù)據(jù)作為全樣本進行分析,并以身高(服裝號型中的“號”表示人體的身高,“型”表示人體的圍度)這一細分因素為例,對數(shù)據(jù)進行處理并驗證。
對獲得的數(shù)據(jù)進行簡單處理之后,導入到SQL Server2012 數(shù)據(jù)庫中,其各個結構如表3所示。
根據(jù)GB/T 1335.3—2009《服裝號型 兒童》的規(guī)定,將兒童身高分為三檔,身高52~80 cm為嬰兒,身高以7 cm分檔;身高80~130 cm為兒童,身高以10 cm分檔;身高135~155 cm為女童及身135~160 cm為男童,身高以5 cm分檔。
第三檔分男女,主要在于胸圍出現(xiàn)了變化,考慮到本文做的主要是身高因素的細分,以及在兒童時期性別對于身高無明顯影響的情況下,結合三槍集團以10 cm作為分檔的情況,現(xiàn)將數(shù)據(jù)做統(tǒng)一處理:調(diào)取SQL Server數(shù)據(jù)庫中號型表中的數(shù)據(jù),導出到Excel表中,剔除身高號小于60 cm的(包括空值)數(shù)據(jù),剔除身高高于170 cm的數(shù)據(jù),得到165 391條記錄數(shù)據(jù),然后將處理好的Excel表中的數(shù)據(jù)導入到SPSS中,并設置變量名為身高,度量標準為度量。
表3 數(shù)據(jù)庫中的“號”型表結構Tab.3 Table structure of size designation in database
首先,對這些數(shù)據(jù)進行二階聚類,因為二階聚類是一個探索性的分析工具,除了能夠高效率地分析大數(shù)據(jù)集及分類變量和連續(xù)變量都可以參與二階聚類分析等優(yōu)點之外,它還可以自動確定分類數(shù)。所以,先運用二階聚類的方法確定最優(yōu)的分類數(shù)。結果如圖4所示。
圖4 二階聚類結果Fig.4 Result of two-order clustering
從圖4可知,數(shù)據(jù)被自動分成6類,聚類的平均輪廓值約為0.9(其范圍值為-1.0~1.0,值越大越好),說明聚類效果非常好。
如果只是從數(shù)據(jù)的角度看,效果是非常好的。但是如果結合服裝尺碼的背景來看,效果是不理想的。企業(yè)原來的劃分是以10 cm為單位,共有12組尺寸。精準營銷的理想情況是,以1 cm,甚至0.5 cm為分檔做分類,但是考慮到企業(yè)的實際成本及定位(不是高級定制)問題,這是不可能實現(xiàn)的,因此希望盡可能在盈利的情況下細分群體。如果只是按照6組來劃分,非但沒有精細劃分,而且更“粗糙”了,因此需要根據(jù)結果重新劃分??紤]到企業(yè)原來的12類分類,以及二階聚類方法分出的6類中100 cm以下訂單數(shù)較少并只分出一類的情況(圖5),暫時按照10類進行聚類。
圖5 二階聚類單元分布Fig.5 Distribution of two-order clustering unit
選用K-均值聚類法,運用SPSS對數(shù)據(jù)重新進行聚類。設置聚類數(shù)為10,進行聚類。結果如表4所示。
根據(jù)表4可知,2、4、6、9這四類,明顯案例數(shù)較少,而且這四類屬于身高100 cm以下、大約2歲以下的兒童,這部分兒童顯然不是三槍迪士尼品牌定位的主要消費群體。3、5、7、8、10這五類,身高在110~160 cm,年齡在4~14歲,這五類身高群體是主要的訂單來源,也是三槍迪士尼品牌主要的客戶群。
參照其他童裝品牌的分類情況,H&M品牌童裝以身高128 cm(約8歲)為分界點,128 cm以前以10 cm分檔,128 cm以后以5 cm分檔;ZARA品牌童裝以身高150 cm(約11歲)為分界點,150 cm以前以10 cm分檔,150 cm以后以5 cm分檔,再結合GB/T 1335.3—2009《服裝號型 兒童》分類標準及三槍迪士尼品牌的定位,建議:以130 cm為分界點,130 cm以前以10 cm分檔,130 cm以后以5 cm分檔。這樣,三槍迪士尼童裝品牌的分檔,身高110 cm以后,分為11類,110 cm以前可以根據(jù)企業(yè)的定位,保持不變繼續(xù)分為5類或是更少。
表4 最終聚類中心Tab.4 The final clustering center
因此,通過挖掘三槍集團迪士尼童裝的號型數(shù)據(jù)證明,運用聚類的方法,能夠?qū)⑼b的號型根據(jù)消費者的需求重新細分,并且重新細分的消費者人群,企業(yè)不僅可以比較精準的滿足其需求,還能夠節(jié)約企業(yè)的營銷成本,方便生產(chǎn)。
大數(shù)據(jù)時代,基于“用戶畫像”數(shù)據(jù)庫基礎上的精準營銷,不是對經(jīng)典營銷理論和方法的顛覆,而是在對數(shù)據(jù)深入理解的基礎上,重新理解消費者,精細劃分,挖掘消費需求。本文通過構建“用戶畫像”數(shù)據(jù)庫挖掘消費需求,并在整理消費者細分因素的基礎上,構建了大數(shù)據(jù)時代精準營銷細分模型,不僅為企業(yè)實施精準營銷策略提供了借鑒,同時也為大數(shù)據(jù)時代研究精準營銷提供了一點思路。
雖然本文精準營銷細分模型的構建不是很全面,有關模型的驗證只是以身高為例進行驗證,并且研究不是很深入,但是后續(xù)的有關其他因素的驗證也會繼續(xù)做下去。企業(yè)可根據(jù)自身的情況選擇某一細分因素或某幾個細分因素進行應用,比如性別與地區(qū)的關系,地區(qū)與顏色、款式的關系等。當企業(yè)利用已有的數(shù)據(jù)挖掘出某一地區(qū)的人們偏愛某一顏色時,對企業(yè)而言,不管是營銷策略的制定還是庫存的管理,企業(yè)都可以處理得游刃有余。同時,關于在數(shù)據(jù)挖掘基礎上的精準營銷細分研究,其余學者也可以繼續(xù)研究下去。
[1]黃升民,劉珊.大數(shù)據(jù)背景下營銷體系的解構與重構[J].現(xiàn)代傳播,2012(11):13-20. HUANG Shengmin, LIU Shan. Deconstruction and reconstruction of the marketing system under the background of big data[J]. Modern Communcation,2012(11):13-20.
[2]謝然.從五大行業(yè)案例看大數(shù)據(jù)的應用邏輯[J].互聯(lián)網(wǎng)周刊,2015(2):30-35. XIE Ran. Seeing the application logic from the five sectors of large data case[J]. China Internet Weekly,2015(2):30-35.
[3]張鵬,劉譯璟.為消費者畫像[J].銷售與市場:渠道版,2013(9):30-32. ZHANG Peng, LIU Yijing. Consumer map[J]. China Market: Channel Edition,2013(9):30-32.
[4]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013:7-30. MAYER-SCH?NBERGER V, CUKIER K. Big Data: a Revolution That Will Transform How We Live, Work, and Think[M]. Hangzhou: Zhejiang People Press,2013:7-30.
[5]段云峰,吳唯寧,李劍威,等.數(shù)據(jù)倉庫及其在電信領域中的應用[M].北京:電子工業(yè)出版社,2003:9-14. DUAN Yunfeng, WU Weining, LI Jianwei, et al. Data Warehouse and Its Application in the Field of Telecommunications[M]. Beijing: Electronic Industry Press,2003:9-14.
[6]史忠植.知識發(fā)現(xiàn)[M].北京:清華大學出版社,2011:13-15. SHI Zhongzhi, Knowledge Discovery[M]. Beijing: Tsinghua University Press,2011:13-15.
[7]廖夢怡,王金柱.SQL Server 2012寶典[M].北京:電子工業(yè)出版社,2014:2-8. LIAO Mengyi, WANG Jinzhu, Book of SQL Server 2012[M]. Beijing: Electronic Industry Press,2014:2-8.
[8]劉向暉,網(wǎng)絡營銷導論[M].北京:清華大學出版社,2005:40-46. LIU Xianghui, Introduction of Network Marketing[M]. Beijing: Tsinghua University Press,2005:40-46.
[9]WORCESTER R M, JOHN D H. Consumer market research handbook, third revised and enlarged edition[C]∥Elsevier Science Publishers, BV.1986:387-423.
[10]何宜軍.基于4C理論的網(wǎng)絡營銷策略研究[J].企業(yè)研究,2014(16):35-36. HE Yijun. Research of network marketing strategy based on the theory of 4C[J]. Business Research,2014(16):35-36.
[11]齊麗云,汪克夷,陸英賢,等.基于消費行為的市場細分模型構建與驗證:以移動通信行業(yè)為例[J].管理學報,2009,6(6):805-811. QI Liyun, WANG Keyi, LU Yingxian, et al. Model of market segmentation based on consumer behavior: the mobile communication industry perspective[J]. Chinese Journal of Management,2009,6(6):805-811.
[12]劉英姿,吳昊.客戶細分方法研究綜述[J].管理工程學報,2006,20(1):53-57. LIU Yingzi, WU Hao. A summarization of customer segmentation methods[J]. Journal of Industrial Engineering and Engineering Management,2006,20(1):53-57.
[13]WIND Y. Issues and advances in segmentation research[J]. Journal of Marketing Research,1978(8):317-337.
[14]雪鷹傳奇.電商大數(shù)據(jù):用數(shù)據(jù)驅(qū)動電商和商業(yè)案例解析[M].北京:電子工業(yè)出版社,2014:19-20. Xueying Chuanqi. The Big Data of E-commence, Data Driven Business and Business Case Analysis[M]. Beijing: Electronic Industry Press,2014:19-20.
[15]劉業(yè)政,姜元春,張結魁,等.網(wǎng)絡消費者行為:理論方法及應用[M].北京:科學出版社,2011:20-30. LIU Yezheng, JIANG Yuanchun, ZHANG Jiekui, et al. Network Consumer Behavior: Theory and Application[M]. Beijing: Science Press,2011:20-30.
[16]呂紅艷.基于顧客價值的市場細分研究[D].天津:天津大學,2007:5-8. Lü Hongyan. Research of Market Ssegmentation Based on the Customer Value[D]. Tianjin: Tianjin University,2007:5-8.
[17]武新麗,基于利益的網(wǎng)絡市場細分研究[D].南寧:廣西大學,2006:6-11. WU Xinli. Research of Network Market Segmentation Based on the Profit[D]. Nanning: Guangxi University, 2006:6-11.
Research on Precision Marketing Segmentation Model Based on Mining “Persona”
LIU Hai, LU Hui, RUAN Jinhua, TIAN Bingqiang, HU Shouzhong
(College of Fashion, Shanghai University of Engineering Science, Shanghai 201620, China)
For the issue that clothing companies do not know how to use big data for marketing in the era of big data, this paper builds “persona” database based on the theory of 4C, and segments consumers through mining the database. On this basis, a precision marketing segmentation model is established from marketing perspective. Besides, this paper takes marketing date of Three Gun Group as the object and utilizes SPSS tool to mine height. The researches show in the era of big data, the precision marketing segmentation model based on the data mining of “persona” can reconstruct the demands of consumers, precisely position the consumer groups and provide scientific basis for enterprises to implement the strategy of precision marketing.
big data; persona; consumer segmentation; data mining; precision marketing
2015-05-21;
2015-11-04
上海市科委公共服務平臺項目(13DZ2294300);上海市教委科研創(chuàng)新項目(13ZS173);上海教育科學研究項目(B14035);上海教委優(yōu)青項目(ZZGJD12017)
doi.org/10.3969/j.issn.1001-7003.2015.12.008
TS941.1
A
1001-7003(2015)12-0037-06 引用頁碼: 121108