国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

共享開(kāi)放的運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)架構(gòu)研究

2014-05-18 08:12:05
信息通信技術(shù) 2014年6期
關(guān)鍵詞:數(shù)據(jù)服務(wù)運(yùn)營(yíng)商組件

廣東省電信規(guī)劃設(shè)計(jì)院有限公司 廣州 510630

引言

近幾年來(lái),大數(shù)據(jù)以排山倒海之勢(shì)席卷全球,如何合理地將大數(shù)據(jù)轉(zhuǎn)換為有價(jià)值信息成為未來(lái)企業(yè)的必備技能。作為擁有豐富大數(shù)據(jù)資源的電信運(yùn)營(yíng)商,大數(shù)據(jù)浪潮既提供了巨大的機(jī)遇,也帶來(lái)了巨大的挑戰(zhàn)。一方面互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,移動(dòng)互聯(lián)網(wǎng)時(shí)代迅速到來(lái),加劇了OTT業(yè)務(wù)對(duì)電信業(yè)務(wù)的挑戰(zhàn)。電信運(yùn)營(yíng)商面臨長(zhǎng)期的量收剪刀差,收入增長(zhǎng)乏力,急需開(kāi)源(創(chuàng)新商業(yè)模式/新產(chǎn)品)、節(jié)流(提升精確管理水平/精準(zhǔn)營(yíng)銷能力/運(yùn)營(yíng)效率),這些使得大數(shù)據(jù)的廣泛應(yīng)用有著迫切的內(nèi)在需求驅(qū)動(dòng)。另一方面,大數(shù)據(jù)的4V+1C特性,對(duì)運(yùn)營(yíng)商的IT系統(tǒng)技術(shù)架構(gòu)和管理模式都提出了巨大的挑戰(zhàn)[1-2]。移動(dòng)互聯(lián)網(wǎng)發(fā)展趨勢(shì)、海量數(shù)據(jù)處理和分析需求、互聯(lián)網(wǎng)化戰(zhàn)略的推進(jìn),對(duì)運(yùn)營(yíng)商IT系統(tǒng)架構(gòu)在敏捷性、開(kāi)放性、可擴(kuò)展性、低成本等方面提出了新的要求。同時(shí),大數(shù)據(jù)應(yīng)用的規(guī)模效應(yīng)、技術(shù)復(fù)雜性和管控要求等也對(duì)大數(shù)據(jù)系統(tǒng)集約化建設(shè)和運(yùn)營(yíng)提出了要求。

當(dāng)前,大數(shù)據(jù)技術(shù)日趨成熟并快速發(fā)展,大數(shù)據(jù)業(yè)務(wù)模式和應(yīng)用場(chǎng)景日趨清晰。運(yùn)營(yíng)商如何在新形勢(shì)下,構(gòu)建適應(yīng)未來(lái)大數(shù)據(jù)戰(zhàn)略推進(jìn)的大數(shù)據(jù)平臺(tái),支撐對(duì)內(nèi)對(duì)外的數(shù)據(jù)服務(wù),成為迫切需要解決的問(wèn)題。

1 國(guó)內(nèi)運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)現(xiàn)狀與發(fā)展要求

1.1 運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)現(xiàn)狀概述

2011年大數(shù)據(jù)興起以來(lái),國(guó)內(nèi)各運(yùn)營(yíng)商緊密跟進(jìn)大數(shù)據(jù)技術(shù)發(fā)展,推出了各自的大數(shù)據(jù)發(fā)展戰(zhàn)略,并積極試點(diǎn)和推廣大數(shù)據(jù)應(yīng)用。總體而言,當(dāng)前,國(guó)內(nèi)各運(yùn)營(yíng)商大數(shù)據(jù)建設(shè)與應(yīng)用正處于從試點(diǎn)向大規(guī)模建設(shè)、推廣過(guò)渡階段。

運(yùn)營(yíng)商大數(shù)據(jù)具有廣闊的應(yīng)用前景。運(yùn)營(yíng)商具有用戶的賬戶、業(yè)務(wù)使用和行為數(shù)據(jù)以及位置、網(wǎng)絡(luò)體驗(yàn)等數(shù)據(jù)。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行加工處理、分析挖掘,可實(shí)現(xiàn)對(duì)內(nèi)提供面向企業(yè)內(nèi)部的客戶行為和消費(fèi)特征的分析挖掘,實(shí)現(xiàn)精準(zhǔn)分析、精確營(yíng)銷、精細(xì)服務(wù)等數(shù)據(jù)應(yīng)用業(yè)務(wù)需求。對(duì)外通過(guò)與廣告、實(shí)地銷售、金融和咨詢等多行業(yè)進(jìn)行合作,可快速實(shí)現(xiàn)大數(shù)據(jù)資產(chǎn)的增值,提高企業(yè)經(jīng)營(yíng)效益和市場(chǎng)競(jìng)爭(zhēng)能力。

從應(yīng)用場(chǎng)景角度分析,當(dāng)前國(guó)內(nèi)各運(yùn)營(yíng)商大數(shù)據(jù)應(yīng)用仍主要以內(nèi)部應(yīng)用為主。分布式聯(lián)機(jī)日志采集/存儲(chǔ)、分布式ETL、上網(wǎng)清單查詢和歷史數(shù)據(jù)查詢等較簡(jiǎn)單的應(yīng)用場(chǎng)景已較普遍和成熟[3-6];網(wǎng)絡(luò)運(yùn)營(yíng)分析、流量經(jīng)營(yíng)分析和用戶行為分析等分析型應(yīng)用場(chǎng)景正處于試點(diǎn)推廣階段。

從建設(shè)模式角度分析,當(dāng)前各運(yùn)營(yíng)商大數(shù)據(jù)類平臺(tái)建設(shè)除少量系統(tǒng)采用集約化、平臺(tái)化建設(shè)外(如聯(lián)通總部流量查詢平臺(tái)、移動(dòng)北方基地大數(shù)據(jù)平臺(tái)等),多為分散建設(shè)、單應(yīng)用集群模式(為單個(gè)應(yīng)用部署一個(gè)大數(shù)據(jù)集群),專業(yè)區(qū)隔、數(shù)據(jù)分散(各集群存儲(chǔ)單一數(shù)據(jù)源)。

從系統(tǒng)架構(gòu)角度分析,運(yùn)營(yíng)商傳統(tǒng)數(shù)據(jù)分析系統(tǒng)以SMP關(guān)系型數(shù)據(jù)庫(kù)和一體機(jī)等MPP數(shù)據(jù)庫(kù)為主,初期大數(shù)據(jù)技術(shù)引入主要用于解決傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)處理能力不足問(wèn)題,整體系統(tǒng)架構(gòu)采用混搭模式。Hadoop等新型大數(shù)據(jù)技術(shù)主要應(yīng)用于簡(jiǎn)單場(chǎng)景和基礎(chǔ)數(shù)據(jù)處理,復(fù)雜的數(shù)據(jù)分析仍主要基于傳統(tǒng)的SMP架構(gòu)和MPP架構(gòu)。某省級(jí)運(yùn)營(yíng)商EDA總體架構(gòu)如圖1所示。

圖1 運(yùn)營(yíng)商省級(jí)分公司EDA架構(gòu)示意圖

1.2 存在問(wèn)題與發(fā)展要求

當(dāng)前大數(shù)據(jù)系統(tǒng)建設(shè)模式與系統(tǒng)架構(gòu)存在缺乏整體規(guī)劃、技術(shù)體系雜亂、容易形成數(shù)據(jù)孤島、整體運(yùn)維困難和容易重復(fù)投資等缺點(diǎn)。

新形勢(shì)下,隨著大數(shù)據(jù)應(yīng)用的推進(jìn),大數(shù)據(jù)平臺(tái)需要面向企業(yè)內(nèi)外部提供大數(shù)據(jù)服務(wù),系統(tǒng)需要向共享的大數(shù)據(jù)中心和開(kāi)放的大數(shù)據(jù)能力平臺(tái)演進(jìn),如圖2所示。

圖2 大數(shù)據(jù)平臺(tái)演進(jìn)示意圖

運(yùn)營(yíng)商共享化、開(kāi)放式大數(shù)據(jù)平臺(tái)必須具備如下特性。

1)集約化。數(shù)據(jù)集約,統(tǒng)一匯聚企業(yè)各專業(yè)數(shù)據(jù);平臺(tái)集約,由統(tǒng)一平臺(tái)支撐大數(shù)據(jù)資產(chǎn)管理;應(yīng)用集約,對(duì)內(nèi)對(duì)外應(yīng)用整體規(guī)劃與集約管控。

2)開(kāi)放架構(gòu)體系。面向服務(wù),對(duì)內(nèi)、對(duì)外提供數(shù)據(jù)共享與數(shù)據(jù)服務(wù)開(kāi)放能力。

3)提供多計(jì)算框架支持的PaaS(Platform as a Service)服務(wù)。支持離線批量處理、流式處理、在線處理和交互式探索等多種計(jì)算框架;提供多租戶管理模式下的PaaS服務(wù)。

4)提供標(biāo)準(zhǔn)化、組件化的DaaS(Data as a Service)服務(wù)?;A(chǔ)數(shù)據(jù)處理和業(yè)務(wù)處理能力組件化,支持服務(wù)能力流程化、可視化配置與封裝;面向應(yīng)用,提供個(gè)性化推薦、實(shí)時(shí)位置營(yíng)銷等數(shù)據(jù)服務(wù)支撐。

5)平臺(tái)統(tǒng)一管控。包括整體計(jì)算框架的管理,任務(wù)工作流的靈活管理和調(diào)度,平臺(tái)基礎(chǔ)資源管理(如網(wǎng)絡(luò)、內(nèi)存、CPU等),平臺(tái)統(tǒng)一監(jiān)控與告警方案,應(yīng)用快速部署支撐等。

6)低成本、高并發(fā)、高性能和高可擴(kuò)展性。

7)基礎(chǔ)平臺(tái)技術(shù)/產(chǎn)品選型具備良好的產(chǎn)業(yè)生態(tài)系統(tǒng)支持。

2 大數(shù)據(jù)技術(shù)新動(dòng)態(tài)與選型分析

2.1 大數(shù)據(jù)技術(shù)趨勢(shì)概述

大數(shù)據(jù)時(shí)代,數(shù)據(jù)的處理與應(yīng)用方式均產(chǎn)生了巨大的變化。但從本質(zhì)上看,大數(shù)據(jù)工程技術(shù)的變革仍主要體現(xiàn)在數(shù)據(jù)管理方面,數(shù)據(jù)分析模型和算法本身沒(méi)有大的突破,主要是提升算法的執(zhí)行效率及并行化。近年來(lái),從計(jì)算存儲(chǔ)角度,大數(shù)據(jù)的數(shù)據(jù)管理演進(jìn)如圖3所示,針對(duì)不同場(chǎng)景發(fā)展出不同的計(jì)算框架。如為解決傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)無(wú)法滿足大體量下的交互性問(wèn)題,引入MPP ShareNothing數(shù)據(jù)倉(cāng)庫(kù),將數(shù)據(jù)與計(jì)算進(jìn)行分布化;為滿足高交互性、高時(shí)效性要求引入內(nèi)存分析型數(shù)據(jù)庫(kù);面向結(jié)構(gòu)復(fù)雜、計(jì)算復(fù)雜、計(jì)算/存儲(chǔ)線性擴(kuò)展需求,引入并行批量處理/NoSQL技術(shù);面向原始數(shù)據(jù)體量巨大的實(shí)時(shí)響應(yīng)要求提出流式處理技術(shù)等[7-9],如圖3所示。

圖3 數(shù)據(jù)管理(計(jì)算存儲(chǔ)層)的演進(jìn)示意圖

學(xué)術(shù)界和業(yè)界不斷研究推出新的和改進(jìn)的計(jì)算模式和系統(tǒng)工具平臺(tái),目前主要有以下三方面的重要發(fā)展趨勢(shì)和方向[7]。

1)主流的Hadoop平臺(tái)改進(jìn)后與其他計(jì)算模式和平臺(tái)共存,繼續(xù)作為近期大數(shù)據(jù)解決方案的主流。Hadoop2.0新版本“YARN”的出現(xiàn),極大地提升了Hadoop生態(tài)系統(tǒng)的適用性。各商業(yè)MPP產(chǎn)品也紛紛加強(qiáng)與Hadoop的融合。預(yù)計(jì)今后相當(dāng)長(zhǎng)一段時(shí)間內(nèi),Hadoop平臺(tái)將與各種新的計(jì)算模式和系統(tǒng)共存,并相互融合,形成新一代的大數(shù)據(jù)處理系統(tǒng)和平臺(tái)。

2)混合計(jì)算模式將成為滿足多樣性大數(shù)據(jù)處理和應(yīng)用需求的有效手段。當(dāng)前混合計(jì)算模式之集大成者Spark系統(tǒng)涵蓋了幾乎所有典型的大數(shù)據(jù)計(jì)算模式,包括迭代計(jì)算、批處理計(jì)算、內(nèi)存計(jì)算、流式計(jì)算、數(shù)據(jù)查詢分析計(jì)算以及圖計(jì)算。隨著系統(tǒng)的不斷穩(wěn)定和成熟,Spark有望成為與Hadoop共存的新一代大數(shù)據(jù)處理系統(tǒng)和平臺(tái)。

3)內(nèi)存計(jì)算將成為高實(shí)時(shí)性大數(shù)據(jù)處理的重要技術(shù)手段和發(fā)展方向。隨著內(nèi)存成本的不斷降低,內(nèi)存計(jì)算將成為最終跨越大數(shù)據(jù)計(jì)算性能障礙、實(shí)現(xiàn)高實(shí)時(shí)高響應(yīng)計(jì)算的一個(gè)最有效技術(shù)手段。內(nèi)存計(jì)算是一種在體系結(jié)構(gòu)層面上的解決方法,因此,它可以與各種不同的計(jì)算模式相結(jié)合。

2.2 改進(jìn)的Hadoop生態(tài)系統(tǒng)與Spark

Hadoop2.0及以上版本的發(fā)布與更新,使Hadoop在業(yè)務(wù)場(chǎng)景適應(yīng)性上有了質(zhì)的飛躍[8]。Hadoop2.0核心由HDFS、MapReduce和YARN三個(gè)分支構(gòu)成,其核心提升點(diǎn)包括以下三部分。

1)HDFS v2。支持NameNode HA,支持NameNode Federation,解決單點(diǎn)故障問(wèn)題,提升了集群擴(kuò)展能力。

2)MapReduce v2。MRv2變成運(yùn)行于通用資源管理框架YARN之上的計(jì)算框架MapReduce。YARN負(fù)責(zé)資源管理和調(diào)度,而MRv2僅負(fù)責(zé)作業(yè)的管理,作業(yè)與資源耦合度更低。

3)YARN。通用資源管理模塊,可為各類應(yīng)用程序提供資源管理和調(diào)度功能。YARN通過(guò)Container實(shí)現(xiàn)資源動(dòng)態(tài)管理和分配,而Hadoop1.0資源按Slot分配,只能實(shí)現(xiàn)資源的靜態(tài)管理和分配。YARN支持一個(gè)集群部署多個(gè)版本,計(jì)算資源按需伸縮,不同負(fù)載應(yīng)用混搭,共享底層存儲(chǔ),避免數(shù)據(jù)跨集群遷移。

Hadoop2.X的新特性,以及學(xué)術(shù)界、業(yè)界和Hadoop社區(qū)對(duì)基于Hadoop生態(tài)系統(tǒng)計(jì)算模式框架和平臺(tái)的擴(kuò)展,使Hadoop2.X技術(shù)架構(gòu)支持多種成熟的計(jì)算模式,如適合交互式查詢和分析的Tez、Impala,流式計(jì)算Storm、S4、內(nèi)存計(jì)算Spark等,如圖4所示。

Spark當(dāng)前已發(fā)展出較成熟的完整生態(tài)系統(tǒng)。比較Hadoop框架,Spark框架具有如下特點(diǎn)。1)Spark的中間數(shù)據(jù)放到內(nèi)存中,對(duì)于迭代運(yùn)算效率更高;2)Spark的彈性分布數(shù)據(jù)集(RDD),使其更適合于迭代運(yùn)算比較多的ML和DM運(yùn)算;3)Spark提供的數(shù)據(jù)集Transformations和actions操作類型更多,上層應(yīng)用開(kāi)發(fā)更方便;4)各個(gè)處理節(jié)點(diǎn)之間的通信模型更多樣化,編程模型更靈活。

Spark可以直接對(duì)HDFS進(jìn)行數(shù)據(jù)的讀寫(xiě),同樣支持Spark on YARN。讓Spark運(yùn)行于YARN上與Hadoop共用集群資源可以提高資源利用率,如圖5所示。

圖5 Spark on Yarn示意圖

綜上所述,改進(jìn)的Hadoop生態(tài)系統(tǒng)與Spark的興起,使電信運(yùn)營(yíng)商以開(kāi)源生態(tài)系統(tǒng)為基石,建立統(tǒng)一融合的大數(shù)據(jù)平臺(tái)成為可能。

2.3 大數(shù)據(jù)平臺(tái)技術(shù)選型分析

如前所述,隨著運(yùn)營(yíng)商集約化、互聯(lián)網(wǎng)化等策略的推進(jìn),大數(shù)據(jù)平臺(tái)面臨的數(shù)據(jù)處理體量急劇增長(zhǎng)。以某運(yùn)營(yíng)商為例,其集約大數(shù)據(jù)平臺(tái)2015年面臨的數(shù)據(jù)處理需求單移動(dòng)DPI數(shù)據(jù)增量就達(dá)到100T/天;同時(shí)為滿足對(duì)內(nèi)對(duì)外經(jīng)營(yíng)需求,平臺(tái)需要支撐批量和實(shí)時(shí)處理等多種計(jì)算場(chǎng)景需求。面對(duì)如此龐大的數(shù)據(jù)規(guī)模和支撐需求,典型解決方案對(duì)比如表1所示。

表1 典型解決方案對(duì)比分析

綜上所述,未來(lái)運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)建議采用以Hadoop為核心的融合化技術(shù)方案?,F(xiàn)有傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)、MPP數(shù)據(jù)倉(cāng)庫(kù)可作為大數(shù)據(jù)平臺(tái)的數(shù)據(jù)服務(wù)對(duì)象,主要專注企業(yè)經(jīng)營(yíng)分析或?qū)I(yè)數(shù)據(jù)集市應(yīng)用。

3 共享開(kāi)放的大數(shù)據(jù)平臺(tái)架構(gòu)設(shè)計(jì)

3.1 大數(shù)據(jù)平臺(tái)總體架構(gòu)

綜合前文業(yè)務(wù)支撐新要求與技術(shù)發(fā)展趨勢(shì)、技術(shù)選型分析,設(shè)計(jì)運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)總體架構(gòu)如圖6所示[9-10]。

圖6 總體架構(gòu)示意圖

系統(tǒng)由下到上依次為數(shù)據(jù)采集層、基礎(chǔ)平臺(tái)層和數(shù)據(jù)平臺(tái)與服務(wù)層;其中基礎(chǔ)平臺(tái)層為PaaS層,包括基礎(chǔ)設(shè)施域和基礎(chǔ)平臺(tái)管理域;數(shù)據(jù)平臺(tái)與服務(wù)層為DaaS層,包括數(shù)據(jù)處理域、數(shù)據(jù)服務(wù)域與數(shù)據(jù)平臺(tái)管理域。各域主要功能及特點(diǎn)如下。

1)數(shù)據(jù)采集層。實(shí)現(xiàn)數(shù)據(jù)接入、負(fù)載均衡、清洗過(guò)濾、內(nèi)容脫敏和數(shù)據(jù)稽核等功能,實(shí)現(xiàn)海量原始數(shù)據(jù)安全高效地采集、傳輸。

2)基礎(chǔ)設(shè)施域。基于X86和開(kāi)源軟件提供海量數(shù)據(jù)的存儲(chǔ)和計(jì)算能力,支持批量計(jì)算、流式計(jì)算和內(nèi)存計(jì)算等多種計(jì)算模式框架要求,提供PaaS基礎(chǔ)能力。

3)基礎(chǔ)平臺(tái)管理域。提供PaaS服務(wù)能力,主要包括能力管理、資源管理、任務(wù)管理、數(shù)據(jù)管理、安全管理和系統(tǒng)管理等功能;實(shí)現(xiàn)基礎(chǔ)平臺(tái)和應(yīng)用的隔離,無(wú)需訪問(wèn)基礎(chǔ)平臺(tái)即可實(shí)現(xiàn)應(yīng)用的開(kāi)發(fā)、測(cè)試、運(yùn)行和維護(hù)。

4)數(shù)據(jù)平臺(tái)與服務(wù)層。

a)數(shù)據(jù)處理域。對(duì)數(shù)據(jù)進(jìn)行加工處理,生成應(yīng)用所需要的結(jié)果數(shù)據(jù);面向公共數(shù)據(jù)的處理和特定應(yīng)用數(shù)據(jù)處理,提供數(shù)據(jù)服務(wù)基礎(chǔ)能力組件庫(kù)和數(shù)據(jù)處理、分析規(guī)則和模型庫(kù),提供DaaS基礎(chǔ)能力。

b)數(shù)據(jù)服務(wù)域。提供DaaS服務(wù)能力,包括提供多種方式訪問(wèn)應(yīng)用所需要的結(jié)果數(shù)據(jù),基礎(chǔ)數(shù)據(jù)處理能力的服務(wù)化封裝與管理,數(shù)據(jù)服務(wù)能力開(kāi)放管理等。

5)數(shù)據(jù)平臺(tái)管理域。提供全流程、全生命周期的數(shù)據(jù)管理能力;支持大數(shù)據(jù)的經(jīng)營(yíng)管理。

3.2 技術(shù)架構(gòu)

對(duì)應(yīng)于系統(tǒng)功能架構(gòu),相應(yīng)的技術(shù)架構(gòu)如圖7所示[11-12]。

圖7 總體技術(shù)架構(gòu)示意圖

平臺(tái)技術(shù)架構(gòu)采用開(kāi)放理念,以融合的支持多計(jì)算模式的Hadoop為基石,基于X86服務(wù)器,構(gòu)建面向集約管理、數(shù)據(jù)共享與能力開(kāi)放的低成本、高性能和高可擴(kuò)展性大數(shù)據(jù)平臺(tái)。各部分主要特性說(shuō)明如下。

1)采集層。支持FTP/SOAP /MQ/JDBC/爬蟲(chóng)等多種數(shù)據(jù)采集方式;支持分布式數(shù)據(jù)采集、加載和轉(zhuǎn)換。

2)數(shù)據(jù)計(jì)算/存儲(chǔ)集群。提供數(shù)據(jù)存儲(chǔ)與計(jì)算功能,整體以Hadoop為核心構(gòu)建大數(shù)據(jù)基礎(chǔ)設(shè)施,基于HDFS提供數(shù)據(jù)統(tǒng)一存儲(chǔ)能力,支持SQL、M/R、Spark內(nèi)存計(jì)算、實(shí)時(shí)流計(jì)算、數(shù)據(jù)挖掘等多種計(jì)算模式;基于YARN統(tǒng)一資源管理調(diào)度,具備多租戶模式支撐數(shù)據(jù)應(yīng)用能力;基礎(chǔ)數(shù)據(jù)處理和業(yè)務(wù)處理能力組件化,支持服務(wù)能力流程化、可視化配置與封裝;支持基于消息/事件驅(qū)動(dòng)的進(jìn)程調(diào)度。

3)數(shù)據(jù)共享與數(shù)據(jù)應(yīng)用服務(wù)。通過(guò)統(tǒng)一的共享與服務(wù)框架對(duì)外服務(wù),支持如Impala、Hbase和K-V數(shù)據(jù)庫(kù)等集群,并提供通用API接口對(duì)外開(kāi)放。

4)監(jiān)控管理。對(duì)平臺(tái)任務(wù)進(jìn)行實(shí)時(shí)監(jiān)控,記錄各種日志信息,保證數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全,并實(shí)行統(tǒng)一調(diào)度管理。

基于面向服務(wù)技術(shù)、業(yè)務(wù)能力以能力封裝形式由平臺(tái)完成裝載上線,并使用標(biāo)準(zhǔn)接口進(jìn)行進(jìn)程拼接,組裝成完整業(yè)務(wù)流程。進(jìn)程間使用內(nèi)存數(shù)據(jù)進(jìn)行交互,減少I(mǎi)O開(kāi)銷;平臺(tái)提供統(tǒng)一的進(jìn)程調(diào)度及日志服務(wù)管控。如圖8所示。

圖8 能力組件與業(yè)務(wù)流程關(guān)系示意圖

平臺(tái)按照多租戶部署模式承載不同部門(mén)、不同合作伙伴的應(yīng)用,并支撐通過(guò)統(tǒng)一的管理平臺(tái)進(jìn)行程序部署管理,包括資源分析、數(shù)據(jù)自動(dòng)遷移和共享,任務(wù)統(tǒng)一定義和監(jiān)控、調(diào)度,系統(tǒng)集中監(jiān)控和運(yùn)維。實(shí)現(xiàn)應(yīng)用開(kāi)發(fā)和平臺(tái)管理隔離,應(yīng)用開(kāi)發(fā)團(tuán)隊(duì)通過(guò)基礎(chǔ)平臺(tái)管理系統(tǒng)提供的Web界面,完成開(kāi)發(fā)、測(cè)試、運(yùn)行和運(yùn)維管理等所有工作,基礎(chǔ)平臺(tái)管理系統(tǒng)提供強(qiáng)制的安全、資源、數(shù)據(jù)、調(diào)度等控制策略,確保平臺(tái)本身的安全、穩(wěn)定運(yùn)行,如圖9所示。

圖9 多租戶應(yīng)用部署管理示意圖

3.3 服務(wù)能力與應(yīng)用支撐框架

融合、共享與開(kāi)放的大數(shù)據(jù)平臺(tái)可靈活提供大數(shù)據(jù)服務(wù)能力,支撐對(duì)內(nèi)對(duì)外數(shù)據(jù)應(yīng)用集約化服務(wù),其中對(duì)內(nèi)應(yīng)用主要面向精確營(yíng)銷、精準(zhǔn)維系、網(wǎng)絡(luò)優(yōu)化與效益評(píng)價(jià)等業(yè)務(wù)需求,對(duì)外服務(wù)主要面向數(shù)據(jù)查詢、數(shù)據(jù)咨詢和數(shù)據(jù)解決方案等應(yīng)用。

大數(shù)據(jù)服務(wù)能力可分為資源能力和數(shù)據(jù)能力兩種形式,其中數(shù)據(jù)能力是大數(shù)據(jù)運(yùn)營(yíng)的關(guān)鍵。運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)應(yīng)構(gòu)建和持續(xù)完善數(shù)據(jù)服務(wù)能力組件庫(kù)與規(guī)則庫(kù),作為企業(yè)大數(shù)據(jù)運(yùn)營(yíng)的基礎(chǔ)支撐工具。根據(jù)當(dāng)前的大數(shù)據(jù)對(duì)內(nèi)對(duì)外應(yīng)用場(chǎng)景需求,基礎(chǔ)數(shù)據(jù)能力組件主要可包括規(guī)則/行為分析類組件(如URL分析組件、通話交際圈分析組件)、標(biāo)簽類組件(如客戶行為標(biāo)簽、興趣標(biāo)簽)、客戶識(shí)別類組件(如寬帶LBS分析組件、AD-IP分析組件)、關(guān)鍵詞分析組件、統(tǒng)計(jì)挖掘類組件等,如圖10所示。數(shù)據(jù)服務(wù)能力組件域與服務(wù)開(kāi)放域組成對(duì)內(nèi)對(duì)外的DaaS服務(wù)框架并支撐上層SaaS應(yīng)用。

圖10 數(shù)據(jù)服務(wù)能力組件與規(guī)則庫(kù)示意圖

3.4 應(yīng)用實(shí)踐

某運(yùn)營(yíng)商正在采用上述思路構(gòu)建集約、共享的大數(shù)據(jù)平臺(tái),以支撐對(duì)內(nèi)對(duì)外大數(shù)據(jù)經(jīng)營(yíng)。平臺(tái)完全采用以Hadoop為主的開(kāi)源生態(tài)系統(tǒng)解決方案,系統(tǒng)設(shè)計(jì)日數(shù)據(jù)增量達(dá)到150TB以上,已承載多個(gè)深度大數(shù)據(jù)挖掘應(yīng)用。下文以DMP(服務(wù)于實(shí)時(shí)競(jìng)價(jià)廣告等業(yè)務(wù)的基礎(chǔ)數(shù)據(jù)平臺(tái))業(yè)務(wù)為例,簡(jiǎn)介平臺(tái)對(duì)應(yīng)用的支撐方案與效果。

依托大數(shù)據(jù)平臺(tái)的強(qiáng)大處理能力和豐富的數(shù)據(jù)資產(chǎn),DMP應(yīng)用實(shí)現(xiàn)方案如圖11所示。DMP應(yīng)用通過(guò)調(diào)用行為分析、標(biāo)簽?zāi)芰︻愃惴P团c產(chǎn)品組件,使用PaaS層提供的批量處理與實(shí)時(shí)分析能力,生成面向第三方的多維標(biāo)簽數(shù)據(jù)。平臺(tái)以多租戶模式滿足各DSP合作伙伴特定算法模型部署需求。DMP通過(guò)整合、關(guān)聯(lián)、匹配自有數(shù)據(jù)和第三方標(biāo)簽數(shù)據(jù),形成多維標(biāo)簽體系服務(wù)能力,通過(guò)KV內(nèi)存數(shù)據(jù)庫(kù)向DSP提供群組特征的命中查詢服務(wù),從而滿足RTB互聯(lián)網(wǎng)廣告業(yè)務(wù)對(duì)精準(zhǔn)數(shù)據(jù)的實(shí)時(shí)需求。

圖11 DMP支撐示意圖

根據(jù)前期試點(diǎn)測(cè)試與業(yè)務(wù)上線情況,驗(yàn)證了該技術(shù)方案可行性,大數(shù)據(jù)基礎(chǔ)平臺(tái)滿足PB級(jí)數(shù)據(jù)處理和多應(yīng)用場(chǎng)景支撐要求?;谠摷軜?gòu)的DMP應(yīng)用滿足對(duì)外“單服務(wù)器節(jié)點(diǎn)5萬(wàn)TPS、10ms以內(nèi)響應(yīng)時(shí)間”的實(shí)時(shí)信息查詢服務(wù)要求。

4 結(jié)語(yǔ)

電信運(yùn)營(yíng)商的大數(shù)據(jù)平臺(tái)建設(shè)與大數(shù)據(jù)應(yīng)用方興未艾,研究和探討適合運(yùn)營(yíng)商的大數(shù)據(jù)平臺(tái)架構(gòu)具有重要的理論和實(shí)際意義。本文結(jié)合業(yè)界大數(shù)據(jù)動(dòng)態(tài)與工程實(shí)踐,研究并給出了一種集約、融合、開(kāi)放的運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)架構(gòu)設(shè)計(jì)方案。由于各運(yùn)營(yíng)商當(dāng)前IT系統(tǒng)架構(gòu)的復(fù)雜性,以及大數(shù)據(jù)應(yīng)用場(chǎng)景和技術(shù)的多樣性,完成向本文技術(shù)架構(gòu)演進(jìn)仍需綜合考慮實(shí)施復(fù)雜度、管理支持等諸多因素。后續(xù)將持續(xù)結(jié)合各運(yùn)營(yíng)商大數(shù)據(jù)工程建設(shè)和應(yīng)用實(shí)踐進(jìn)行研究總結(jié)。

[1]劉智慧.張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2014,48(6):1-16

[2]陶雪嬌,胡要峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學(xué)報(bào).2013(S1):142-146

[3]康尚欽,李軍,葉何亮,等.基于分布式計(jì)算的電信聯(lián)機(jī)采集系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)與現(xiàn)代化,2013(01):91-94

[4]趙清,唐菁.電信業(yè)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)及關(guān)鍵技術(shù)研究[J].信息通信技術(shù),2013,7(6):15-19

[5]馬又良.采用云計(jì)算技術(shù)構(gòu)建大型數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)的探討[J].郵電設(shè)計(jì)技術(shù),2012(07):15-19

[6]成靜靜.基于Hadoop的分布式云計(jì)算/云存儲(chǔ)方案的研究與設(shè)計(jì)[J].數(shù)據(jù)通信,2012(05):14-18

[7]中國(guó)計(jì)算機(jī)協(xié)會(huì)大數(shù)據(jù)委員會(huì).中國(guó)大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書(shū)(2013)[R]

[8]董西成.hadoop技術(shù)內(nèi)幕:深入解析YARN架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)原理[M].北京:機(jī)械工業(yè)出版社,2013

[9]華為.大數(shù)據(jù)解決方案[R/OL].[2014-10-25].http://www.hwclouds.com/application/1356235944_16.html

[10]錢(qián)嶺.電信運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)和應(yīng)用實(shí)踐[C]//2014中國(guó)數(shù)據(jù)庫(kù)技術(shù)大會(huì),2014

[11]林仕鼎.大數(shù)據(jù)的系統(tǒng)架構(gòu)支持[C]//第五屆中國(guó)云計(jì)算大會(huì),2013

[12]明風(fēng).基于Spark on Yarn的淘寶數(shù)據(jù)挖掘平臺(tái)[R/OL].[2014-10-20].http://www.doc88.com/p-7804379529208.html

猜你喜歡
數(shù)據(jù)服務(wù)運(yùn)營(yíng)商組件
地理空間大數(shù)據(jù)服務(wù)自然資源調(diào)查監(jiān)測(cè)的方向分析
無(wú)人機(jī)智能巡檢在光伏電站組件診斷中的應(yīng)用
能源工程(2022年2期)2022-05-23 13:51:50
新型碎邊剪刀盤(pán)組件
U盾外殼組件注塑模具設(shè)計(jì)
如何運(yùn)用稅收大數(shù)據(jù)服務(wù)供給側(cè)結(jié)構(gòu)性改革
基于頻繁子圖挖掘的數(shù)據(jù)服務(wù)Mashup推薦
取消“漫游費(fèi)”只能等運(yùn)營(yíng)商“良心發(fā)現(xiàn)”?
第一章 在腐敗火上烤的三大運(yùn)營(yíng)商
三大運(yùn)營(yíng)商換帥不是一個(gè)簡(jiǎn)單的巧合
三大運(yùn)營(yíng)商換帥
汉源县| 隆子县| 湖南省| 西城区| 贡觉县| 波密县| 宣城市| 荣昌县| 什邡市| 梨树县| 垫江县| 平山县| 湖州市| 台安县| 万州区| 清流县| 彰化市| 怀集县| 同心县| 洪洞县| 铁力市| 青浦区| 丰镇市| 绥德县| 林周县| 井研县| 昆明市| 电白县| 开平市| 永修县| 瑞丽市| 晋江市| 县级市| 南汇区| 资中县| 承德县| 铜梁县| 东丽区| 和林格尔县| 儋州市| 揭东县|