張 第 羅曉娜 楊靜雯
1 中國聯(lián)通研究院 北京 100032
2 中國電信集團公司 北京 100031
隨著移動互聯(lián)網(wǎng)時代的到來,傳統(tǒng)通信行業(yè)正面臨著終端智能化、無線接入寬帶化、業(yè)務(wù)融合化、運營平臺化的挑戰(zhàn),用戶每天通過移動終端等信息載體、利用基礎(chǔ)網(wǎng)絡(luò)進行無線接入和信息交互,以獲得自己需要的信息。無處不在的網(wǎng)絡(luò)在給用戶提供便捷服務(wù)的同時,也帶來了流量爆炸式增長的壓力,這給運營商網(wǎng)絡(luò)擴建、升級帶來難題。為滿足用戶需求,運營商不斷加大對網(wǎng)絡(luò)建設(shè)的投資,但流量的激增并沒有給運營商帶來相應(yīng)的營業(yè)收入的快速增長。2013年,中國聯(lián)通實現(xiàn)營業(yè)收入2 950.4億元,同比增長18.5%,凈利潤達104.1億元,同比增長46.7%,而移動手機用戶數(shù)據(jù)流量增長則為120.3%,達到2 698億Mb[1]。與此同時,以騰訊、新浪為代表的大量OTT(Over The Top)企業(yè)通過運營商提供的網(wǎng)絡(luò)向自己的用戶提供互聯(lián)網(wǎng)產(chǎn)品及服務(wù),繞開了傳統(tǒng)的運營商收費路徑,通過客戶端廣告植入、在線商店等進行盈利。另外,即時通信類的互聯(lián)網(wǎng)產(chǎn)品使得傳統(tǒng)的語音、短信費用轉(zhuǎn)換為低廉的流量費用,從而大大降低了用戶對于運營商的黏性,也對傳統(tǒng)語音和短信業(yè)務(wù)造成巨大沖擊。運營商雖然投入大量人力、財力和物力建設(shè)基礎(chǔ)網(wǎng)絡(luò),但并沒有通過數(shù)據(jù)流量獲得應(yīng)有的營業(yè)收入,投入產(chǎn)出不成比例,面臨“被管道化”的危險。同時,用戶規(guī)模和流量規(guī)??焖僭鲩L,也導(dǎo)致了運營商之間同質(zhì)化競爭愈發(fā)激烈,數(shù)據(jù)產(chǎn)生的附加值越來越低。因此,運營商尋找新的利潤增長點、提高流量經(jīng)營的質(zhì)量迫在眉睫。
反觀消費渠道的多元化和消費內(nèi)容的多樣化,導(dǎo)致用戶在信息交互過程中產(chǎn)生大量各異的行為偏好、決策偏好和忠誠行為[2],而用戶的這些偏好反映在每一個上網(wǎng)行為的細節(jié)中,并最終影響運營商的業(yè)務(wù)收入和利潤水平。
在最先獲得用戶行為資料的前提下,運營商很有必要對用戶上網(wǎng)行為進行深入分析、深度發(fā)掘、細化分類,構(gòu)建流量差異化計費體系,提升流量價值,增加核心競爭力,才不會被移動互聯(lián)的時代浪潮所湮沒。
據(jù)統(tǒng)計,全球移動數(shù)據(jù)流量將在2014年達到每月4.2EB,預(yù)計到2016年時將增長到每月10.8EB,如圖1所示。
圖1 全球移動數(shù)據(jù)流量增長趨勢(2011~2016年)
以中國聯(lián)通為例,每月的上網(wǎng)記錄數(shù)已超過2萬億條,是目前運營商所有計費數(shù)據(jù)的30倍以上,并且以每月7%的速度遞增[3],運營商需要用數(shù)量巨大的服務(wù)器來存儲這些數(shù)據(jù),雖然服務(wù)器成本逐年下降,但與能耗相關(guān)的成本所占比重會逐漸平穩(wěn)或者上升,如果留存這些海量數(shù)據(jù)的意義僅僅在于查詢流量、解決客戶流量爭議,難免有些“大材小用”。
相比其他企業(yè),運營商能夠第一時間獲得用戶消費行為的資料,有著得天獨厚的優(yōu)勢。這些看起來毫無規(guī)律可循的用戶上網(wǎng)信息,內(nèi)部是存在關(guān)聯(lián)性的,利用數(shù)據(jù)挖掘技術(shù)[4],能夠定量地分析用戶行為,如上網(wǎng)瀏覽內(nèi)容偏好、時間偏好等,通過對這些數(shù)據(jù)的分析,運營商可以重新進行用戶市場劃分,提出更具有針對性的營銷體系。
本文主要是從數(shù)據(jù)挖掘的角度重新觀察這些數(shù)據(jù)并加以利用。由于電信運營商內(nèi)部數(shù)據(jù)庫中存儲著海量多維的信息,這些信息不僅包括常規(guī)的年齡、品牌、套餐資費[5]、終端的IMEI、終端品牌、終端類型等基礎(chǔ)信息,隨著運營商自身數(shù)據(jù)平臺的完善,還包括用戶何時何地上網(wǎng)、上網(wǎng)的內(nèi)容偏好、各種應(yīng)用的駐留時間、手機支付信息等等,從理論上來講,這些豐富的內(nèi)容為數(shù)據(jù)挖掘提供了可能性,同時,運營商將借助數(shù)據(jù)挖掘技術(shù)在日益激烈的流量競爭中制定準確的決策,提高流量經(jīng)營的質(zhì)量。
以WCDMA移動通信網(wǎng)絡(luò)系統(tǒng)為例,運營商可在核心網(wǎng)(Core Network,CN)網(wǎng)關(guān)GPRS支持節(jié)點(Gateway GPRS Support Node,GGSN)處通過一定的技術(shù)手段獲取用戶同外部IP分組網(wǎng)絡(luò)交互的信息,并利用自身服務(wù)器集群,按照一定的錄入數(shù)據(jù)庫規(guī)則,實時存儲用戶的上網(wǎng)數(shù)據(jù)。表1為用戶上網(wǎng)信息的簡單匯總,通過數(shù)據(jù)挖掘的過程,可以分析出對于用戶上網(wǎng)的影響因素,從而細分用戶群體,為精細化營銷奠定基礎(chǔ)。
表1 用戶上網(wǎng)記錄初始數(shù)據(jù)
數(shù)據(jù)挖掘技術(shù)是從海量數(shù)據(jù)中提取或者“挖掘”知識的過程,這些知識必須的是隱藏的、潛在有用的,常用的主要方法有聚類分析、決策樹分析、關(guān)聯(lián)分析、判別分析、回歸分析和神經(jīng)網(wǎng)絡(luò)分析等,本文主要使用的分析方法是決策樹分析。主要考慮方便快速地對用戶行為數(shù)據(jù)進行分析,提供有效的決策支持。
為便于對初始數(shù)據(jù)處理,需要進行預(yù)處理。首先對初始數(shù)據(jù)按照以下規(guī)則進行粗粒度的分類,形成訓(xùn)練樣本。
1) 按照年齡層次劃分。小于20,20~30,30~40,大于40,共計4部分。
2) 按照上網(wǎng)集中時段劃分。對于上網(wǎng)集中的定義為:以小時為計量單位,上網(wǎng)流量大于10M/小時。系統(tǒng)需要對每個用戶的小時用量進行累加,選出流量最多的一個小時,作為上網(wǎng)集中的時段。本文暫不考慮日均流量小于10M的用戶。9:00之前歸為上班途,9:00~12:00歸為上午,12:00~17:00歸為下午,17:00~19:00歸為下班途,19:00~24:00歸為晚上,共計5部分。
3) 按照主要流量劃分。①網(wǎng)頁類:主要指利用手機終端瀏覽各種門戶網(wǎng)站,圖片等。②即時通訊類:如QQ、飛信、微信等。③視頻類:優(yōu)酷、PPLive、樂視網(wǎng)等。④游戲類:網(wǎng)易游戲等。⑤社交類:開心網(wǎng)、人人網(wǎng)、微博等。⑥其他類:如某些炒股軟件等,共計6部分。
4) 按照終端類型劃分。Android、iPhone、Windows Phone,共計3部分。
從運營商BSS系統(tǒng)中讀取用戶相關(guān)的ARPU值,作為數(shù)據(jù)挖掘的一個目標函數(shù),如表2所示。
表2 用戶上網(wǎng)記錄預(yù)處理后的數(shù)據(jù)
根據(jù)數(shù)據(jù)挖掘的基本理論[6],任何樣本分類的信息期望為
其中,數(shù)據(jù)集為S,m為S的分類數(shù)目,
Ci為某分類標號,Pi為任意樣本屬于Ci的概率,Si為分類Ci上的樣本數(shù)。
將用戶群體劃分為A1、A2、A3三類,分別代表的ARPU值為低,中等,高,則用戶的信息熵為
按照先前的分類,對每一個年齡階段的用戶,統(tǒng)計其屬于A1、A2、A3三類的個數(shù),然后得出概率,從而計算屬性age的信息期望,如表3所示。
表3 每個年齡階段的ARPU分布及概率
P1、P2、P3分別表示每個年齡階段中的用戶屬于A1、A2、A3的概率。
由此得出屬性age的信息增益為
同理可得到其他屬性的信息期望
通過比較各個屬性信息增益的高低,可選出影響ARPU的關(guān)鍵因素,如表4所示,影響用戶ARPU的第一要素就是時間,根據(jù)上述實例,將用戶人群進行簡單的初步劃分,如圖2所示。
表4 各屬性的信息增益對比
圖2 用戶按照時間屬性進行分類
由于實例中的樣本量較小,第一層級的決策樹形成之后,就完全符合了用戶行為跟ARPU的對應(yīng)關(guān)系,即處于第二層級的屬性都是平等的,用戶只要處于某個時間段,其通常的上網(wǎng)行為對應(yīng)產(chǎn)生的ARPU就是固定的。
在實際生活中,由于海量樣本及影響ARPU的因素不止列出來的五類,如地域、收入等也會影響用戶ARPU值,則可以在第二層級去掉時間屬性后進行二次劃分,直至滿足下列停止分割的條件之一。1)一個節(jié)點上的實例都屬于同一個類別;2)沒有屬性可以再用于對數(shù)據(jù)進行分割。
經(jīng)過上述步驟之后,就可以形成一個完整的決策樹。圖3展示的就是具有普遍意義的決策樹。
圖3 普遍意義的決策樹
在移動互聯(lián)網(wǎng)時代,用戶通過移動終端進行無線接入,產(chǎn)生數(shù)據(jù)流量并非是一個一次性過程,通過時間的積累,可以從中發(fā)現(xiàn)用戶的行為規(guī)律,進而能夠促使決策樹的形成。
決策樹的形成是建立在大量用戶上網(wǎng)行為數(shù)據(jù)基礎(chǔ)上的,它代表了用戶行為的偏好,是市場的風(fēng)向標。經(jīng)過計算得出的決策樹,可指導(dǎo)規(guī)則制定者完善營銷方案。本文主要通過決策樹來關(guān)注用戶群體的上網(wǎng)需求,以制定更為靈活的套餐和資費,細分運營商目前的數(shù)據(jù)流量市場。
通常,規(guī)則的制定者要根據(jù)數(shù)據(jù)挖掘的結(jié)果,首先確定目標函數(shù)、制定套餐和資費的目的是提高用戶的ARPU值、挖掘潛在用戶、還是增加用戶使用品牌的忠誠度。以下分析以提高ARPU值為最終目標函數(shù)。
具體到上述的實例,時間增益為各個屬性中的最大值,即影響用戶ARPU值的第一要素是時間,則在套餐的制定上可以考慮專門設(shè)立基于上網(wǎng)時間段的套餐包,在特定的時間段內(nèi)享有流量優(yōu)惠,如閑時資費比忙時資費便宜,但此“忙閑時”不同于網(wǎng)絡(luò)中話務(wù)業(yè)務(wù)的忙閑,主要指數(shù)據(jù)業(yè)務(wù)。一方面滿足用戶的個性化需求差異,另一方面,有目的地引導(dǎo)用戶上網(wǎng)時間分布,疏導(dǎo)流量,緩解網(wǎng)絡(luò)壓力,提高用戶上網(wǎng)感知。而用戶在享受流量優(yōu)惠的同時也增加了黏性,提高了對產(chǎn)品的忠誠度,從而有利于發(fā)展低ARPU用戶至更高檔位的套餐。
在實際運營中,用戶的數(shù)量成千上萬,需求也迥異,假定影響用戶ARPU值的第一要素是流量,則可以在一定的時間內(nèi)持續(xù)觀察用戶上網(wǎng)記錄,根據(jù)用戶瀏覽的內(nèi)容進行推薦定制,如視頻套餐包(對優(yōu)酷、樂視等看視頻網(wǎng)站有定向流量),社交套餐(對新浪微博、人人網(wǎng)等有定向流量)等。2014年6月,為滿足用戶在沒有Wi-Fi的情況下順利觀看世界杯比賽,中國聯(lián)通和中央電視臺合作,推出了3元包月的“WO+視頻”看世界杯定向流量套餐。
定向流量的套餐模式一方面可以給用戶帶來流量使用的優(yōu)惠,在滿足用戶個性化需求的同時,降低了用戶離網(wǎng)風(fēng)險;另一方面可以加強和OTT企業(yè)的深度合作,雙方協(xié)作分成,探索新的運營商盈利模式,在移動互聯(lián)網(wǎng)時代,降低運營商“被管道化”的風(fēng)險。
若考慮影響用戶ARPU值的第一要素是年齡,則可以根據(jù)用戶的年齡進行定制,如少年套餐(側(cè)重游戲類、視頻類流量)、青年套餐(側(cè)重社交類、即時通信類流量)、中年套餐(側(cè)重網(wǎng)頁類流量)。每個套餐的側(cè)重點不一致,對于流量的內(nèi)容計費方式也不一樣,類似于目前中國聯(lián)通的3G網(wǎng)絡(luò) A、B、C三種套餐。但對于運營商的上網(wǎng)記錄查詢系統(tǒng)而言,需要能夠區(qū)分用戶訪問的網(wǎng)址及內(nèi)容,也就意味著運營商需要建立一個應(yīng)用地址信息庫來和互聯(lián)網(wǎng)URL進行一一匹配,并不斷更新完善。
隨著微信、微博等提供永久在線服務(wù)的互聯(lián)網(wǎng)產(chǎn)品迅速普及,加上智能終端為減少電量消耗而采取的“快速休眠節(jié)電功能”,這些都給網(wǎng)絡(luò)帶來了巨大的副作用:頻繁的接入制造了大量的信令開銷,呼損率降低,特別是在節(jié)假日或是傳輸中斷的時候,給網(wǎng)絡(luò)帶來的沖擊力會遠遠超過其承受力,極大地影響了用戶體驗。
運營商可以采取階梯計費的方式,優(yōu)先滿足一部分要求保證QoS而愿意提高資費的用戶需求,提供較高等級的上網(wǎng)保障,而普通用戶上網(wǎng)也不會因此受到較大影響。此劃分方法不僅在業(yè)務(wù)層面上需要進行細分,在網(wǎng)絡(luò)層面也要細化各種端到端需求。
用戶對于上網(wǎng)的需求各不相同,下載用戶對于網(wǎng)速的要求要高于觀看在線視頻等流媒體業(yè)務(wù)的網(wǎng)速,相比之下,瀏覽普通網(wǎng)頁對于網(wǎng)速的要求最低,基于此,也可進行上網(wǎng)速率的套餐劃分。網(wǎng)絡(luò)下行速率越快,資費越高,但要保證用戶的上網(wǎng)體驗。
由于運營商掌握著第一手用戶資料,具有天然的優(yōu)勢,而用戶上網(wǎng)行為信息,通過數(shù)據(jù)挖掘既可以預(yù)測用戶行為發(fā)生的可能性,幫助企業(yè)提供更多的且是用戶真正需要的服務(wù),還可以在一定的時間段內(nèi)積累用戶上網(wǎng)數(shù)據(jù),進行趨勢分析和周期性分析。同時,根據(jù)用戶上網(wǎng)喜好,可進行針對性更強的電話營銷、廣告投放等業(yè)務(wù)。
而與OTT企業(yè)開展合作,為戰(zhàn)略合作伙伴提供數(shù)據(jù)咨詢也是未來商業(yè)模式的一種,可以使“用戶上網(wǎng)行為信息”這個金礦得到最大價值的利用。
一直以來,電信運營商的用戶不斷要求更低的通話資費、更好的通話質(zhì)量、更快捷的客戶服務(wù),還要求更出色的上網(wǎng)體驗、更靈活的計費模式。通信行業(yè)的增速逐漸放緩,4G時代的到來更加劇了競爭,用戶在面對運營商時有了更多的選擇權(quán),使得運營商都非常重視用戶群體特征,以實現(xiàn)更為精準的營銷,增加用戶黏性。
要實現(xiàn)精細營銷,就要細分用戶群體,就要借助信息管理技術(shù),充分了解用戶行為信息,針對用戶的偏好對市場進行恰當?shù)膭澐帧?/p>
用戶上網(wǎng)記錄,一方面可以為客服人員直觀地解答用戶流量疑問,降低投訴率,提高用戶上網(wǎng)滿意度;另一方面經(jīng)過數(shù)據(jù)挖掘后的用戶行為,為市場部門制定更為有效的營銷方案提供數(shù)據(jù)支撐,業(yè)務(wù)人員也可以根據(jù)掌握的用戶消費習(xí)慣進行一定的業(yè)務(wù)推廣。
總之,對于第一手獲得用戶行為信息的運營商來說,要充分利用這個天然的優(yōu)勢,不斷提升流量價值,要抓住移動互聯(lián)網(wǎng)飛速發(fā)展的機遇,不斷優(yōu)化運營模式,及時轉(zhuǎn)型,避免被越來越多的OTT企業(yè)管道化,對這些數(shù)據(jù)進行深度挖掘,指導(dǎo)企業(yè)日常運營,與OTT企業(yè)開展深度合作,將數(shù)據(jù)封裝為服務(wù),形成可對外開放、可商業(yè)化的核心能力,實現(xiàn)商業(yè)模式的創(chuàng)新,營造雙贏的局面,運營商在移動互聯(lián)網(wǎng)時代也可以大展手腳。
參考文獻
[1] 中國聯(lián)通公布2013年度業(yè)績,凈利潤增長近五成[EB/OL].[2014-07-16].http://www.c114.net/news/119/a823233.html
[2] 周毅,孟衛(wèi)東,柳曉.移動數(shù)據(jù)業(yè)務(wù)購買意愿的關(guān)鍵影響因素研究[J].管理工程學(xué)報,2010,24(1):29-34
[3] 王志軍,黃文良.大數(shù)據(jù)在移動用戶上網(wǎng)記錄查詢中的應(yīng)用研究[J].信息通信技術(shù).2013,7(6):29-34
[4] 整合“大數(shù)據(jù)”商業(yè)化模式,提高流量經(jīng)營的質(zhì)量[EB/OL].[2014-05-21].http://labs.chinamobile.com/mblog/7539/194721
[5] 許冬琦.大數(shù)據(jù)時代,運營商機會大于挑戰(zhàn)[J].通信世界,2012(19):38
[6] Tan Pangning,Steinbach Michael,Kumar Vipin.數(shù)據(jù)挖掘?qū)д?完整版)[M].范明,范宏建,譯.北京:人民郵電出版社,2011