張延彬(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司山東分公司,濟(jì)南 250101)
?
基于移動(dòng)通信行業(yè)的大數(shù)據(jù)服務(wù)研究
張延彬
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司山東分公司,濟(jì)南 250101)
摘 要本文首先對(duì)大數(shù)據(jù)的概念和大數(shù)據(jù)應(yīng)用發(fā)展現(xiàn)狀進(jìn)行介紹,然后對(duì)移動(dòng)通信行業(yè)的大數(shù)據(jù)資產(chǎn)進(jìn)行了列舉及分析,根據(jù)移動(dòng)通信行業(yè)大數(shù)據(jù)的特點(diǎn)探討移動(dòng)通信行業(yè)可提供的大數(shù)據(jù)服務(wù)。
關(guān)鍵詞大數(shù)據(jù);大數(shù)據(jù)資產(chǎn);信令數(shù)據(jù)
近兩年來,大數(shù)據(jù)的概念受到了各界的熱捧,一時(shí)間大數(shù)據(jù)無處不在,而且隨著數(shù)據(jù)量的迅速膨脹并變大,它正在決定著企業(yè)的未來發(fā)展,在商業(yè)、經(jīng)濟(jì)及其它領(lǐng)域,決策更是越來越多的基于大數(shù)據(jù)分析,而不是基于經(jīng)驗(yàn)和直覺。
大數(shù)據(jù)是指其大小超出了典型數(shù)據(jù)庫軟件的采集、存儲(chǔ)、管理和分析等能力的數(shù)據(jù)集,一是符合大數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集的大小是變化的,會(huì)隨著時(shí)間的推移、技術(shù)進(jìn)步而增長(zhǎng);二是不同部門符合大數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集大小會(huì)存在差別。
大數(shù)據(jù)的特征:第一,數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB級(jí)別;第二,數(shù)據(jù)類型繁多。網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等。第三,處理速度快,可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息。第四,合理利用數(shù)據(jù)并對(duì)其進(jìn)行正確、準(zhǔn)確的分析,將會(huì)帶來很高的價(jià)值回報(bào)。業(yè)界將其歸納為4個(gè)“V”——Volume(數(shù)據(jù)體量大)、Variety(數(shù)據(jù)類型繁多)、Velocity(處理速度快)、Value(價(jià)值密度低)。
大數(shù)據(jù)的來源主要包含泛互聯(lián)網(wǎng)(物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)等)、工業(yè)互聯(lián)網(wǎng)(大量傳感器等)、行業(yè)/企業(yè)信息系統(tǒng)、社交網(wǎng)絡(luò)(Facebook、微信等)。
大數(shù)據(jù)應(yīng)用在各行各業(yè)的發(fā)展呈現(xiàn)“階梯式”格局,互聯(lián)網(wǎng)行業(yè)是大數(shù)據(jù)的領(lǐng)跑者,電信、金融、零售、公共管理等領(lǐng)域積極嘗試大數(shù)據(jù),以下為幾個(gè)典型的大數(shù)據(jù)應(yīng)用發(fā)展案例。
(1) 2009年,甲型H1N1流感在全球爆發(fā)傳播,為了發(fā)現(xiàn)和控制疫情,各國(guó)政府和衛(wèi)生相關(guān)部門付出了巨大努力,但得到的數(shù)據(jù)仍然滯后一兩周,而Google對(duì)人們的搜索的歷史記錄進(jìn)行處理,建立合理的數(shù)學(xué)模型后,得到的預(yù)測(cè)結(jié)果與官方的數(shù)據(jù)相關(guān)性高達(dá)97%,能夠立刻判斷出流感是從哪里傳播出來的,沒有一兩周的滯后。Google處理了5 000萬條歷史記錄、4.5億個(gè)不同的數(shù)學(xué)模型。
(2) Farecast是一個(gè)對(duì)機(jī)票價(jià)格進(jìn)行預(yù)測(cè)的公司,幫助消費(fèi)者抓住最佳購(gòu)買機(jī)票的時(shí)機(jī),使乘客節(jié)省很多錢。最初預(yù)測(cè)系統(tǒng)建立在41天之內(nèi)的12 000個(gè)價(jià)格樣本基礎(chǔ)上,數(shù)據(jù)是從旅游網(wǎng)站上抓取的,如今已經(jīng)擁有超過2 000億條飛行記錄。
移動(dòng)通信行業(yè)發(fā)展至今積累的數(shù)據(jù)非常豐富,從2G、3G到4G數(shù)據(jù),從話音話單數(shù)據(jù)到GPRS上網(wǎng)日志數(shù)據(jù),從音樂、視頻、閱讀等各類業(yè)務(wù)數(shù)據(jù)到各類通信的行業(yè)數(shù)據(jù)等等各類數(shù)據(jù),從數(shù)據(jù)量、數(shù)據(jù)質(zhì)量等方面提供各類大數(shù)據(jù)資產(chǎn),如表1、表2所示。
表1 大數(shù)據(jù)資產(chǎn)
表2 移動(dòng)通信行業(yè)大數(shù)據(jù)應(yīng)用分類
移動(dòng)通信行業(yè)的大數(shù)據(jù)資產(chǎn)非常豐富,但是如何將這些數(shù)據(jù)資產(chǎn)進(jìn)行深度挖掘,將分散在各個(gè)系統(tǒng)中的數(shù)據(jù)統(tǒng)一整合起來,形成有價(jià)值的數(shù)據(jù),是非常復(fù)雜和困難的,下面我們就選幾類數(shù)據(jù)進(jìn)行分析,來探索一下移動(dòng)通信行業(yè)的大數(shù)據(jù)應(yīng)用。
4.1 大數(shù)據(jù)分析方法及手段
大數(shù)據(jù)的分析方法在大數(shù)據(jù)領(lǐng)域顯得尤為重要,可以說是決定最終信息是否有價(jià)值的決定性因素,進(jìn)行大數(shù)據(jù)分析的方法及步驟如下。
(1) 確定目標(biāo)。在進(jìn)行數(shù)據(jù)采集前,需要業(yè)務(wù)部門根據(jù)科學(xué)的手段制定獲取價(jià)值數(shù)據(jù)的目標(biāo),通常需要進(jìn)行大量的數(shù)據(jù)收集和分析,制定一個(gè)可衡量的方式,判斷業(yè)務(wù)是否正向著目標(biāo)前進(jìn)。數(shù)據(jù)分析過程中,關(guān)鍵權(quán)值或性能指標(biāo)必須及早發(fā)現(xiàn)。
(2) 確定業(yè)務(wù)手段。通過業(yè)務(wù)的改變,來提高關(guān)鍵指標(biāo)和達(dá)到業(yè)務(wù)目標(biāo),在項(xiàng)目中盡早確定目標(biāo)、指標(biāo)和業(yè)務(wù)手段能為項(xiàng)目指明方向,避免無意義的數(shù)據(jù)分析。
(3) 數(shù)據(jù)采集。通過各類不同數(shù)據(jù)源,采集盡可能多的數(shù)據(jù),才能找到數(shù)據(jù)之間更好的相關(guān)性,建立更好的模型。
(4) 數(shù)據(jù)清洗。對(duì)采集的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)校驗(yàn)、數(shù)據(jù)清洗、數(shù)據(jù)關(guān)聯(lián)、轉(zhuǎn)換處理等,形成目標(biāo)文件和匯總數(shù)據(jù),為數(shù)據(jù)分析提供數(shù)據(jù)基礎(chǔ)。
(5) 數(shù)據(jù)建模。數(shù)據(jù)建模是數(shù)據(jù)業(yè)務(wù)分析的關(guān)鍵所在,需要利用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)等知識(shí),結(jié)合業(yè)務(wù)實(shí)現(xiàn)目標(biāo),構(gòu)建科學(xué)、精確的模型。
(6) 優(yōu)化和重復(fù)。為了保證預(yù)測(cè)數(shù)據(jù)的準(zhǔn)確,業(yè)務(wù)達(dá)到預(yù)定的目標(biāo),要對(duì)模型進(jìn)行重復(fù)的修正和迭代。
由于數(shù)據(jù)量非常龐大,因此在進(jìn)行大數(shù)據(jù)分析時(shí)需要更高效的分析手段和工具,目前比較流行的包括Hadoop、Spark Streaming、Storm、MPP DB等。
4.2 大數(shù)據(jù)分析應(yīng)用
移動(dòng)通信行業(yè)的大數(shù)據(jù)即可以為通信行業(yè)內(nèi)提供大數(shù)據(jù)應(yīng)用分析,也可以提供行業(yè)外的數(shù)據(jù)分析服務(wù),下面通過舉例介紹來探討一下具體的應(yīng)用分析服務(wù)。
4.2.1 通信行業(yè)內(nèi)大數(shù)據(jù)應(yīng)用
4.2.1.1 基于Gn口信令數(shù)據(jù)
Gn口的信令數(shù)據(jù)包括終端信息(IMEI、URL、UA 等)、上網(wǎng)內(nèi)容(URL、UA等)、上網(wǎng)流量信息、上網(wǎng)時(shí)網(wǎng)絡(luò)交互信息等內(nèi)容。
(1)通過實(shí)時(shí)監(jiān)控用戶的終端信息,可以完善終端庫,及時(shí)發(fā)現(xiàn)用戶換機(jī)需求,掌握用戶換機(jī)時(shí)機(jī),對(duì)換機(jī)用戶進(jìn)行新套餐推薦。
(2)引入基地業(yè)務(wù)平臺(tái)的內(nèi)容信息,構(gòu)建自有業(yè)務(wù)內(nèi)容資源庫,采集用戶上網(wǎng)瀏覽和搜索數(shù)據(jù)等上網(wǎng)內(nèi)容,根據(jù)用戶行為對(duì)客戶進(jìn)行分群,并根據(jù)偏好等數(shù)據(jù),通過網(wǎng)頁彈窗、商城運(yùn)營(yíng)位廣告以及客服等方式向用戶進(jìn)行個(gè)性化營(yíng)銷,實(shí)現(xiàn)營(yíng)銷的自動(dòng)化和精細(xì)化。
(3)根據(jù)用戶上網(wǎng)流量信息,可以實(shí)時(shí)向用戶推薦流量套餐、流量疊加包、各類視頻APP、即時(shí)通信類工具等。
4.2.1.2 基于Mc口信令數(shù)據(jù)
Mc口的信令數(shù)據(jù)主要是位置信令數(shù)據(jù),能夠反應(yīng)出用戶漫出、漫入的位置軌跡信息。
通過用戶在校園位置基站的漫入漫出等位置軌跡,配以校園V網(wǎng)、飛信等業(yè)務(wù)輔助,將原有校園識(shí)別模型進(jìn)行重構(gòu)優(yōu)化,可提升位置軌跡對(duì)學(xué)生群體識(shí)別的精準(zhǔn)性,實(shí)現(xiàn)精確的校園營(yíng)銷。
4.2.2 通信行業(yè)外大數(shù)據(jù)服務(wù)
4.2.2.1 基于Mc口信令數(shù)據(jù)
Mc口的信令數(shù)據(jù)主要是位置信令數(shù)據(jù),能夠反應(yīng)出用戶漫出、漫入的位置軌跡信息。
(1)根據(jù)位置信息實(shí)時(shí)動(dòng)態(tài)地了解重點(diǎn)區(qū)域流動(dòng)人口的來源及分布情況,可以實(shí)時(shí)動(dòng)態(tài)知道突發(fā)性事件的人員的聚集情況,具備對(duì)突發(fā)事件短信通知疏導(dǎo)人員的功能。
(2)通過融合用戶位置數(shù)據(jù)和用戶畫像的商鋪選址,提供客戶人流量、區(qū)域客戶數(shù)據(jù)、季度/小時(shí)數(shù)據(jù)等維度分析,幫助商業(yè)用戶以低成本快速、精準(zhǔn)選址,實(shí)現(xiàn)運(yùn)營(yíng)商增值業(yè)務(wù)和商業(yè)客戶的深度捆綁。
(3)通過對(duì)整個(gè)運(yùn)營(yíng)商用戶位置軌跡的分析,可以提供用戶的整體出行遷移分析,提供出行人次、出行目的地、乘坐交通工具等,通過分析數(shù)據(jù)可以為航空、鐵路、公路等運(yùn)輸提供線路規(guī)劃,機(jī)票、車票、出行客戶住宿等優(yōu)惠促銷等活動(dòng)。
4.2.2.2 基于賬務(wù)數(shù)據(jù)
通過賬務(wù)數(shù)據(jù)可幫助金融機(jī)構(gòu)完善征信包含消費(fèi)者互聯(lián)網(wǎng)和移動(dòng)終端等數(shù)據(jù)。運(yùn)營(yíng)商建立征信平臺(tái)提供征信服務(wù),彌補(bǔ)征信中的部分空白。支持個(gè)人征信與企業(yè)(自有代理商)征信。
大數(shù)據(jù)是一個(gè)蘊(yùn)含無限機(jī)會(huì)的寶藏,海量的數(shù)據(jù)就是財(cái)富,隨著大數(shù)據(jù)越來越融入到人們?nèi)粘I钪?,如何從大量?shù)據(jù)中挖掘出有價(jià)值的信息,這才是大數(shù)據(jù)核心的價(jià)值。
參考文獻(xiàn)
[1] 劉昭,張海峰,李瑋,韋薇. 運(yùn)營(yíng)商發(fā)展大數(shù)據(jù)技術(shù)及建設(shè)模式展望[J]. 電信工程技術(shù)與標(biāo)準(zhǔn)化,2015(3).
[2] IT架構(gòu)設(shè)計(jì)研究組. 大數(shù)據(jù)時(shí)代的IT架構(gòu)設(shè)計(jì)[M]. 北京:電子工業(yè)出版社, 2014.
[3] 朗為民. 漫畫大數(shù)據(jù)[M]. 北京:人民郵電出版社, 2014.
Study on the service of mobile communication industry based on big data
ZHANG Yan-bin
(China Mobile Group Design Institute Co., Ltd. Shandong Branch, Ji’nan 250101, China)
AbstractFirstly the concept of big data and big data application development present situation are introduced, and then the big data assets of the mobile communications industry were enumerated and analyzed, according to the characteristics of the mobile communications industry big data on the mobile communication industry to provide services.
Keywordsbig data; big data assets; signaling data
News
愛立信與華為續(xù)簽全球?qū)@徊嬖S可協(xié)議
愛立信日前宣布,與華為續(xù)簽全球?qū)@徊嬖S可協(xié)議。該協(xié)議覆蓋了兩家公司包括GSM、UMTS以及LTE蜂窩標(biāo)準(zhǔn)在內(nèi)的無線通信標(biāo)準(zhǔn)相關(guān)基本專利。根據(jù)協(xié)議,雙方都許可對(duì)方在全球范圍內(nèi)使用自身持有的標(biāo)準(zhǔn)專利技術(shù)。作為續(xù)簽協(xié)議的一部分,華為自2016年起將基于實(shí)際銷售向愛立信支付許可費(fèi)。
華為知識(shí)產(chǎn)權(quán)部部長(zhǎng)丁建新表示:“我們非常高興能夠與愛立信續(xù)簽全球?qū)@徊嬖S可協(xié)議。該項(xiàng)協(xié)議的達(dá)成體現(xiàn)了雙方的共識(shí):創(chuàng)新和知識(shí)產(chǎn)權(quán)應(yīng)該得到保護(hù)。為使用他人知識(shí)產(chǎn)權(quán)支付合理的補(bǔ)償,對(duì)于促進(jìn)技術(shù)創(chuàng)新、對(duì)技術(shù)進(jìn)行共享與標(biāo)準(zhǔn)化、驅(qū)動(dòng)和加速產(chǎn)業(yè)進(jìn)步至關(guān)重要。”
愛立信首席知識(shí)產(chǎn)權(quán)官Kasim Alfalahi表示:“我們非常高興能夠續(xù)簽協(xié)議,該協(xié)議的達(dá)成體現(xiàn)了我們致力于推動(dòng)創(chuàng)新及產(chǎn)業(yè)發(fā)展的承諾。未來,萬事萬物都將通過網(wǎng)絡(luò)社會(huì)和物聯(lián)網(wǎng)相連接。我們的角色是驅(qū)動(dòng)變革,為創(chuàng)新、合作開辟新的道路,并激發(fā)個(gè)人、商業(yè)以及社會(huì)的無限潛能。”
(齊瑋奕)
收稿日期:2015-04-07
中圖分類號(hào)TN915
文獻(xiàn)標(biāo)識(shí)碼A
文章編號(hào)1008-5599(2016)02-0044-04