中國聯(lián)通研究院 北京 100032
以手機(jī)為代表的移動終端能力越來越強,不僅體現(xiàn)在計算能力和存儲能力的提升,還體現(xiàn)在對越來越多通信方式的支持,比如GPS、GSM、CDMA、LTE、Wi-Fi、Bluetooth等,此外,加速度傳感器、數(shù)字指南針、陀螺儀、磁力計、光照傳感器等也逐漸成為移動終端的基本配置,這為更加精準(zhǔn)地獲取移動終端位置提供更加豐富的數(shù)據(jù)支持。
與此同時,ICT資源越來越如水電一樣容易獲取,軟件工具也越來越趨向于開源與開放,這大大促進(jìn)了移動互聯(lián)網(wǎng)應(yīng)用的創(chuàng)新發(fā)展,不斷推陳出新的移動互聯(lián)網(wǎng)應(yīng)用真可謂百花齊放、百家爭鳴。在用戶使用移動互聯(lián)網(wǎng)應(yīng)用的過程中,移動互聯(lián)網(wǎng)應(yīng)用平臺通常會以文本、圖片、語音、視頻等多媒體形式記錄用戶的使用行為,這些行為記錄成為商家實現(xiàn)精準(zhǔn)化營銷的大數(shù)據(jù)基礎(chǔ)。與此同時,海量的數(shù)據(jù)、越來越快的數(shù)據(jù)形成速度、移動用戶位置的實時變動等也對應(yīng)用平臺提出更大的挑戰(zhàn),要求應(yīng)用平臺既要保證服務(wù)提供的實時性,還要處理好隱私保護(hù)、信息安全、電量消耗、成本效益等問題。
基于位置的服務(wù)(Location Based Service,LBS)分為位置獲取和服務(wù)提供兩個階段。對于面向特定用戶的精準(zhǔn)化營銷而言,需要實時、準(zhǔn)確地掌握用戶在某個時點或者時間段所處的場景,包括時間、空間、人物這三個位置相關(guān)的關(guān)鍵信息[1],滿足用戶在特定時間、特定地點的實際需求。位置獲取與服務(wù)提供具有很強的時效性要求,如果服務(wù)在用戶離開商家后再提供,那么服務(wù)提供的效果就會大打折扣,甚至?xí)D(zhuǎn)變成對客戶的騷擾。
Storm、Spark是兩個典型的分布式計算框架,可以解決服務(wù)提供的海量數(shù)據(jù)處理和實時性問題。其中,Storm屬于事件驅(qū)動的實時處理框架,處理性能可達(dá)秒級,例如用戶興趣點統(tǒng)計等實時應(yīng)用;Spark為基于內(nèi)存的計算框架,中間處理結(jié)果放置在內(nèi)存而不是磁盤,因此,適用于內(nèi)存承載數(shù)據(jù)、迭代式計算以及交互式查詢。位置營銷要結(jié)合用戶近期搜索、點擊等互聯(lián)網(wǎng)使用行為來預(yù)測用戶興趣點,同時,還要結(jié)合用戶實時位置和用戶興趣預(yù)測推送滿足用戶需求的服務(wù),因此,需要綜合使用Storm和Spark技術(shù)。
實現(xiàn)精準(zhǔn)化營銷的關(guān)鍵是將位置三要素(時間、空間、人物)精準(zhǔn)匹配。時間可以切分為多個時間點或者多個時間段,地點可以分為地理數(shù)據(jù)和屬性數(shù)據(jù),地理數(shù)據(jù)描述空間的絕對位置,屬性數(shù)據(jù)描述地名、空間功能、空間類型等地理位置對應(yīng)的特征信息,人物則需要描述客戶的消費偏好。時間、地點和客戶偏好可以組成不計其數(shù)的個性化情境。如圖1所示。
圖1 移動客戶營銷情境
由圖1可見,實現(xiàn)基于位置的精準(zhǔn)營銷需要把時間、空間、人物三者緊密地結(jié)合起來,在某個時點、特定的位置,將營銷信息傳遞給恰當(dāng)?shù)娜?。比如,?dāng)客戶在家庭居住區(qū)域內(nèi)的非工作時間(比如晚上或者周末)可以向用戶推送一些居家用商品的營銷信息;當(dāng)客戶處于乘坐地鐵等公共交通工具并且是上下班時段,商家可以在推送商品信息的同時推送一些讓人輕松或提示性的信息,比如冷笑話或者天氣變化等;當(dāng)客戶處于商場或者超市等購物環(huán)境時,可以根據(jù)用戶年齡、性別、以往購買歷史等為用戶推薦商品與優(yōu)惠券等信息??傊?,要結(jié)合客戶所在的時空屬性,推送客戶最可能需要的服務(wù)。
日常生活中,我們通常會借助各種無線通信技術(shù)在不同的出行場景訪問移動互聯(lián)網(wǎng):在上下班的途中乘坐地鐵,會上網(wǎng)瀏覽、閱讀電子書、觀看視頻短片等;在外面游玩時,會通過地圖軟件查詢周圍的餐飲店以及打折促銷信息;在登山或者輪船上休息時,您或許希望商家提供戶外商品的營銷信息;在商品琳瑯滿目、商家眾多的商場里,您或許希望快速找到自己想要的商品。移動生活的各種場景如圖2所示。
圖2 使用各種無線通信技術(shù)的移動生活場景
從圖2可以看出,移動終端、通信網(wǎng)絡(luò)、云端應(yīng)用構(gòu)成了滿足各種使用場景的技術(shù)支撐體系。無線通信技術(shù)多個維度的對比如表1所示。
從表1可以看出,不同的無線通信或者移動通信技術(shù)具有不同的特點,它們在滿足人們工作與生活的各種需求方面相互補充。比如,地上的無線通信可以采用移動通信和衛(wèi)星通信,地下隧道內(nèi)的無線通信需要采用泄露電纜作為信號收發(fā)天線;在人口密集的區(qū)域,通常采用無線基站(含室內(nèi))滿足移動通信需求,而在高山、海洋、高速公路等遮擋物少、難以架設(shè)無線基站的地方則采用衛(wèi)星通信;在有建筑物遮擋的區(qū)域采用鋪設(shè)Wi-Fi、ZigBee無線網(wǎng)絡(luò)的方式;在小于10米的近距離通信場景下,采用藍(lán)牙、NFC、RFID等近距離通信方式。
表1 典型的無線通信技術(shù)特征與能力對比
不同的無線通信技術(shù)都有其適用的場景。比如衛(wèi)星通信可以實現(xiàn)全球范圍7×24小時的覆蓋,地球上幾乎所有室外環(huán)境都可以覆蓋,但是到了森林、隧道、辦公室等室內(nèi)或者地下環(huán)境它就無能為力了;對于無線基站這樣的移動通信技術(shù),在不同的區(qū)域其定位能力也不同,通常人口稠密的城市或地區(qū)會架設(shè)更多的基站,因此,定位精度較高;而對于人口稀少的鄉(xiāng)村地區(qū)由于無線基站數(shù)量少,定位精度也就低得多;Wi-Fi是無線局域網(wǎng)(WLAN)的典型通信技術(shù),可以鋪設(shè)在家庭、辦公室、商場、機(jī)場等場所,可以達(dá)到1米以下的定位精度。從無線通信技術(shù)對于通信需求滿足的角度看,不同的通信技術(shù)具有互補性。
目前,大多數(shù)移動終端集成了各式無線通信模塊,移動終端逐漸成為人與環(huán)境的接口,成為用戶的貼身秘書,可以說,獲得移動終端位置就意味著找到了客戶的位置。
獲取移動終端的位置有多種物理測量方法,比如按照測量精度從高到低可以分為:距離測量、角度測量、區(qū)域測量、跳數(shù)測量以及鄰居測量。三種典型的測距數(shù)據(jù)模型為:基于接收信號強度的測距模型(Received Signal Strength,RSS)、基于信號到達(dá)時間的測距模型(Time of Arrival,ToA)、基于信號到達(dá)時間差的測距模型(Time Difference of Arrival,TDoA)。由于每種測距模型都具有各自的優(yōu)缺點,位置計算通常會綜合多種測距模型來實現(xiàn)。
下面介紹典型的無線通信技術(shù)獲取移動終端位置的思路與方法。
1)通過通信衛(wèi)星的位置定位獲取。通過移動終端到通信衛(wèi)星的擴(kuò)頻信號傳播時間算出移動終端到通信衛(wèi)星的距離(ToA),然后,再結(jié)合衛(wèi)星廣播的星歷信息計算衛(wèi)星的空間位置,完成定位計算。當(dāng)有3顆衛(wèi)星時,就可以實現(xiàn)二維定位;當(dāng)有4顆衛(wèi)星時,就可以實現(xiàn)三維定位;移動終端可以根據(jù)接收的多顆衛(wèi)星的導(dǎo)航信息,計算出自己的三維位置(經(jīng)緯度與海拔高度)、運行速度與方向以及精確的時間信息[2]。
2)通過無線基站的位置獲取。通過測量移動終端到無線基站的下行導(dǎo)頻信號的時間或者時間差,結(jié)合無線基站的坐標(biāo),采用三角公式估計算法,就可以得到移動終端的位置。還可以采用基于通信網(wǎng)絡(luò)的定位技術(shù),通信記錄中記錄了時間戳、位置區(qū)域代碼(LAC)、基站小區(qū)(cell-ID)等信息[3],可以獲取移動用戶的位置與運動軌跡,定位精度最高可達(dá)到150米,誤差通常大于125米,在人口稀少的地區(qū)電信運營商架設(shè)的基站通常較少,定位誤差可能會超過1千米。
3)通過Wi-Fi的位置獲取。Wi-Fi無線網(wǎng)絡(luò)主要應(yīng)用于室內(nèi)環(huán)境,在室內(nèi)定位中,受設(shè)備及成本限制,通常都采用基于RSS的測距[1]。如果采用無線信號的定位技術(shù),由于室內(nèi)環(huán)境復(fù)雜多變,無線信號在室內(nèi)環(huán)境下的衰減、多徑和衍射等效應(yīng)導(dǎo)致無線信號強度的波動,進(jìn)而帶來定位誤差[1]。相比于室外,室內(nèi)空間通常分為多個功能區(qū),因此,對于定位精度的要求更高。
4)通過泄漏電纜的位置獲取。地鐵通信環(huán)境由站廳層、站臺層和雙向隧道區(qū)間3個部分組成[4],地鐵站之間的隧道內(nèi)部通常是采用兩條泄漏電纜分別向隧道中間延伸的方式,隧道內(nèi)信號從地鐵站口到隧道內(nèi)部逐步減弱,因此,可以采用RSS的物理距離測量方式,借助泄漏電纜的信號強度確定移動終端在地鐵隧道內(nèi)部的位置[5],由于地下隧道有轉(zhuǎn)彎、高低等地形變化,會影響到獲取移動終端位置的準(zhǔn)確性。
融合通信是指同一臺移動終端借助移動通信(GSM/CDMA/LTE等)、Wi-Fi、藍(lán)牙、紅外、衛(wèi)星通信等多種無線通信技術(shù)與外部同時通信的場景。在多種無線通信技術(shù)同時使用的情況下,由于不同的無線通信技術(shù)的定位能力不同,最理想的情況是獲取盡可能多的與位置計算相關(guān)的數(shù)據(jù),為位置計算模型提供更多的輔助數(shù)據(jù),讓位置計算結(jié)果更為準(zhǔn)確。例如,衛(wèi)星信號通常無法覆蓋到室內(nèi),但是當(dāng)移動終端偶爾處于室內(nèi)能夠接收衛(wèi)星信號的位置,比如靠近窗戶、大門等,就可以利用這些偶爾獲取的數(shù)據(jù)提升位置獲取的能力。
此外,信號反射、散射、遮蔽等信號傳播動態(tài)特性也會影響位置計算的精度,因此,需要實施誤差控制,將移動終端位置精度控制在一定范圍之內(nèi)。
要實現(xiàn)融合通信場景下移動終端的混合定位,對移動終端和位置服務(wù)平臺的計算能力有非常高的要求。一方面,按照就近計算原則,移動終端應(yīng)當(dāng)采集并計算出自身的絕對位置,如果移動終端首先獲取的是相對于參照物的相對位置,還需要根據(jù)參照物絕對位置算出自身的絕對位置。另一方面,移動終端應(yīng)當(dāng)將自身絕對位置和位置誤差區(qū)間傳遞到位置服務(wù)平臺,位置服務(wù)平臺模糊匹配客戶所在位置與預(yù)先分析出來的消費傾向,將匹配結(jié)果以服務(wù)的形式推送給客戶。
位置服務(wù)需要解決客戶興趣分析和在特定場景下的消費行為預(yù)測與服務(wù)投遞兩大問題,由于客戶所處位置經(jīng)常變化,因此,需要位置服務(wù)平臺實時地解決以上兩大問題。例如,如果客戶在商家附近使用手機(jī)搜索某些關(guān)鍵詞,那么這些關(guān)鍵詞通常就是客戶迫切需求的信息,具有非常高的時效性特征,這就要求位置服務(wù)平臺具備快速匹配供需的能力,以便及時有效地為客戶推送商品與服務(wù)信息。由開源組織阿帕奇(Apache)開源的實時流式計算框架Storm和Spark,可以幫助解決以上兩大問題。
Storm將分布式計算環(huán)境稱為拓?fù)?Topology),拓?fù)溆蓴?shù)據(jù)流、Spouts(Stream Producers)、Bolts(Operations)組成[6]。Storm的核心數(shù)據(jù)結(jié)構(gòu)為元組(Tuple)。Spouts是Storm拓?fù)渲饕臄?shù)據(jù)入口點,Spouts承擔(dān)數(shù)據(jù)源適配器的角色,它將數(shù)據(jù)轉(zhuǎn)換為元組并且將元組作為數(shù)據(jù)流發(fā)送。Bolts被視為計算的運算符(operators)或者函數(shù)(functions),Bolts常用的函數(shù)包括過濾元組、聯(lián)合與聚合、計算、數(shù)據(jù)庫讀/寫。采用Storm流式計算過程如圖3所示。
圖3 Storm流式計算過程
Storm屬于事件驅(qū)動的流式計算模型,適用于單個數(shù)據(jù)量小的分析計算場景,其存放中間運算結(jié)果的磁盤占用了大量的I/O,這種實現(xiàn)方式降低了數(shù)據(jù)處理效率。與Storm相比,Spark將中間運算結(jié)果置于內(nèi)存之內(nèi),更適用于存放中間結(jié)果數(shù)據(jù)的迭代運算;其采用與MapReduce類似的計算模型,更適用于內(nèi)存容量可以承載的批量數(shù)據(jù)處理應(yīng)用;其采用時間片(缺省為0.1s)切割數(shù)據(jù)的方式,具有更長的時間延遲,并同時支持SQL、機(jī)器學(xué)習(xí)、圖形處理、流式計算等計算模型,是一款通用的計算引擎[7]。
Spark采用彈性分布式數(shù)據(jù)集(Resilient Distributed Datasets,RDD)的方式管理數(shù)據(jù),Spark流計算模型將輸入的數(shù)據(jù)流以時間片(0.5秒到幾秒)為單位進(jìn)行拆分,然后再以類似批處理的方式處理每個時間片數(shù)據(jù),由于每個數(shù)據(jù)流代表某個時間到達(dá)的RDDs序列,故稱之為離散式數(shù)據(jù)流(Discretized Stream,DStream)。Spark流計算過程如圖4所示。
根據(jù)對兩種分布式流式計算技術(shù)的特點分析,可以將兩種技術(shù)結(jié)合起來使用。對于類似用戶搜索、瀏覽、點擊等行為,由于產(chǎn)生的數(shù)據(jù)量小,對以上行為的分析可以發(fā)現(xiàn)用戶最新需求,因此,可以考慮采用Storm技術(shù);對于來自于電信、金融、交通、公共事業(yè)等反映用戶行為的數(shù)據(jù),由于數(shù)據(jù)量大,實時性要求高,可以考慮基于內(nèi)存計算的Spark計算,通過機(jī)器學(xué)習(xí)挖掘用戶消費行為偏好,根據(jù)用戶位置變化實時查詢和匹配用戶需求并推送滿足需求的服務(wù)。
位置營銷屬于移動電子商務(wù)的核心功能,移動電子商務(wù)主要包括5個需要實時完成的活動,即位置(人或物)、導(dǎo)航(到達(dá)路線)、跟蹤(移動軌跡)、繪圖(圖形化展示)、時間(從A位置到B位置的時長);其基礎(chǔ)架構(gòu)包括9個組成部分,即位置發(fā)現(xiàn)(定位)組件、移動定位中心、用戶、移動終端、移動通信網(wǎng)絡(luò)、服務(wù)或應(yīng)用提供商、數(shù)據(jù)或內(nèi)容提供商、地理信息系統(tǒng)、選擇性加入應(yīng)用[8]。精準(zhǔn)化移動營銷平臺總體架構(gòu)如圖5所示。
圖4 Spark流計算過程
圖5 精準(zhǔn)化移動營銷平臺總體架構(gòu)
從圖5可以看出,移動終端首先基于各種通信模塊計算移動終端的絕對位置或者相對位置,然后以移動終端位置為輸入,借助精準(zhǔn)化移動營銷平臺查詢/匹配適合于用戶的需求,并將需求對應(yīng)的服務(wù)推送給用戶,而精準(zhǔn)化移動營銷平臺則基于客戶大數(shù)據(jù)、空間大數(shù)據(jù)等形成位置三要素的營銷用基礎(chǔ)數(shù)據(jù)集,成為實現(xiàn)位置服務(wù)的前提和基礎(chǔ)。
移動終端借助藍(lán)牙、Wi-Fi、GSM、CDMA、GPS等各種無線通信模塊以及各式傳感器在運行過程中形成數(shù)據(jù),為更加精確地完成位置計算提供了前提和基礎(chǔ)。通過在融合通信環(huán)境下的混合位置計算,可以為基于位置的精準(zhǔn)化營銷提供有力支持。
客戶的購物偏好是提供位置服務(wù)的需求預(yù)測基礎(chǔ),是實現(xiàn)精準(zhǔn)化營銷的三大要素之一,應(yīng)當(dāng)融合移動用戶位置、用戶偏好、營銷服務(wù)推送策略,實時地為客戶提供營銷信息,提高營銷的成功概率,同時,由于位置服務(wù)的時效性特征明顯,需要借助實時分布式流式計算技術(shù),才能快速地完成位置獲取與服務(wù)提供。
制定位置營銷方案還需要在如下三個方面進(jìn)行權(quán)衡和取舍:第一,需要平衡定位精度和資金投入,保證較高的成本效益;第二,需要平衡位置計算算法的復(fù)雜度和移動終端用電消耗;第三,需要平衡服務(wù)質(zhì)量和隱私觸犯與信息安全問題。
參考文獻(xiàn)
[1] 楊崢,吳陳沭,劉云浩.位置計算:無線網(wǎng)絡(luò)定位與可定位性[M].北京:清華大學(xué)出版社,2014:2-4,112,116
[2] 李勇,徐小濤,楊志紅,等.位置信息服務(wù)(LBS)關(guān)鍵技術(shù)及應(yīng)用[M].北京:人民郵電出版社,2013:49,62
[3] 李福東,黃文良,羅云彬. 基于目標(biāo)IP大數(shù)據(jù)分析提升移動用戶上網(wǎng)體驗研究[J]. 郵電設(shè)計技術(shù),2014(12):65-67
[4] 黃艷福,戚喜成,姚賽彬,等. 地鐵移動通信無線網(wǎng)絡(luò)建設(shè)研究[J].郵電設(shè)計技術(shù),2011(1):23-25
[5] 張柯軍.論基站定位功能在地鐵中的應(yīng)用[J].通信設(shè)計與應(yīng)用,2015(3):9
[6] Jonathan Leibiusky,Gabriel Eisbruch,Dario Simonassi.Getting Started with Storm[J]. O'Reilly Media,2012(9):1
[7] Holden Karau,Andy Konwinski,Patrick Wendell,et al.Learning Spark[J].O'Reilly Media,2015(1):276
[8] Efraim Turban,David King,Jae Kyu Lee,et al. Electronic Commerce:A Managerial and Social Networks Perspective,Eighth Edition[M].Springer International Publishing AG,2015(2):281-282