国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向海量無線電監(jiān)測(cè)數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)研究

2015-01-04 06:10浩,賈年*
關(guān)鍵詞:數(shù)據(jù)類型存儲(chǔ)系統(tǒng)數(shù)據(jù)源

馮 浩,賈 年*

(西華大學(xué) 無線電管理技術(shù)研究中心,成都 610039)

近年來,各地各級(jí)無線電監(jiān)測(cè)站響應(yīng)國家無線電辦公室的要求,加快了小型無線電監(jiān)測(cè)站的建設(shè)和發(fā)展,監(jiān)測(cè)網(wǎng)絡(luò)的規(guī)模和監(jiān)測(cè)產(chǎn)生的數(shù)據(jù)量日益龐大的特點(diǎn)愈發(fā)突出。同時(shí),國家、省、地市級(jí)的無線電監(jiān)測(cè)中心互相傳輸監(jiān)測(cè)數(shù)據(jù)的業(yè)務(wù)需求還沒有實(shí)現(xiàn),監(jiān)測(cè)數(shù)據(jù)的利用率不高。存儲(chǔ)系統(tǒng)需要更大的存儲(chǔ)容量和更高的可擴(kuò)充功能,才能滿足發(fā)展的需要。

隨著無線電監(jiān)測(cè)業(yè)務(wù)迅猛發(fā)展,海量級(jí)歷史數(shù)據(jù)需要長期存儲(chǔ)、高效查詢。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫在存儲(chǔ)數(shù)據(jù)量越來越大的情況下,已經(jīng)無法滿足業(yè)務(wù)上的實(shí)時(shí)響應(yīng)查詢的需要。同時(shí),無線電監(jiān)測(cè)工作涉及國防安全,這對(duì)存儲(chǔ)數(shù)據(jù)提出了更高的要求。面對(duì)如此海量的無線電監(jiān)測(cè)數(shù)據(jù),怎樣提高數(shù)據(jù)的存儲(chǔ)、查詢與分析的效率,這是亟需解決的問題。傳統(tǒng)關(guān)系型數(shù)據(jù)庫無法滿足對(duì)海量數(shù)據(jù)的高效率存儲(chǔ),結(jié)構(gòu)化查詢語言(Structured Query Language,SQL)查詢效率也非常低,而且無法動(dòng)態(tài)擴(kuò)展。隨著云技術(shù)的發(fā)展,為存儲(chǔ)海量級(jí)的無線電監(jiān)測(cè)數(shù)據(jù)找到了新的方法。本系統(tǒng)選擇的Hadoop是一個(gè)開源的云計(jì)算平臺(tái),其核心是Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)、MapReduce和HBase,HBase是一個(gè)基于HDFS的開源的、面向列的分布式數(shù)據(jù)庫,可以利用集群處理大數(shù)據(jù)。

1 存儲(chǔ)系統(tǒng)體系結(jié)構(gòu)

由于不同系統(tǒng)集成商提供的監(jiān)測(cè)設(shè)備在應(yīng)用層通信協(xié)議上的差異所造成的系統(tǒng)無法互聯(lián)、互通以及資源無法共享,在國家無線電管理局和國家無線電監(jiān)測(cè)中心推動(dòng)下,結(jié)合《無線電管理VHF/UHF頻段監(jiān)測(cè)數(shù)據(jù)庫結(jié)構(gòu)技術(shù)標(biāo)準(zhǔn)》,目前的無線電監(jiān)測(cè)數(shù)據(jù)的編碼規(guī)范來源于無線電監(jiān)測(cè)網(wǎng)傳輸協(xié)議(Radio Monitor Transfer Protocal,RMTP),數(shù)據(jù)采集格式統(tǒng)一。

圖1 無線電監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)與查詢系統(tǒng)架構(gòu)圖

本監(jiān)測(cè)存儲(chǔ)系統(tǒng)依托Hadoop平臺(tái),海量無線電監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)在HBase數(shù)據(jù)庫,整個(gè)系統(tǒng)架構(gòu)如圖1所示。沿著數(shù)據(jù)的傳輸方向共有4層:數(shù)據(jù)源、統(tǒng)一接口平臺(tái)、存儲(chǔ)層和查詢層。數(shù)據(jù)源主要有2個(gè)部分:1)各個(gè)監(jiān)測(cè)執(zhí)行站監(jiān)測(cè)設(shè)備產(chǎn)生的原始監(jiān)測(cè)數(shù)據(jù)2)其他關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)。在向Hadoop云計(jì)算系統(tǒng)進(jìn)行數(shù)據(jù)轉(zhuǎn)移時(shí),數(shù)據(jù)源包括所有已存在的數(shù)據(jù)庫。不同類型的數(shù)據(jù)源的存儲(chǔ)方式和具體數(shù)據(jù)類型和結(jié)構(gòu)都有所不同,針對(duì)不同類型的數(shù)據(jù)源,在連接HBase過程中,所用的方法也是千差萬別。于是設(shè)計(jì)了一個(gè)統(tǒng)一接口平臺(tái)(Unified Interface Platform,UIP)。存儲(chǔ)層對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行持久化存儲(chǔ),監(jiān)測(cè)數(shù)據(jù)保存在HBase中。查詢層負(fù)責(zé)響應(yīng)監(jiān)測(cè)人員的查詢、分析操作,提交查詢請(qǐng)求、接收并解析,通過統(tǒng)一接口向外輸出。下面將對(duì)監(jiān)測(cè)數(shù)據(jù)查詢系統(tǒng)中的UIP、存儲(chǔ)層、查詢層以及時(shí)間同步系統(tǒng)(Time Synchronization System,TSS)的設(shè)計(jì)做詳細(xì)介紹。

1.1 統(tǒng)一接口平臺(tái)

數(shù)據(jù)源的類型很多,UIP為不同結(jié)構(gòu)的監(jiān)測(cè)數(shù)據(jù)提供統(tǒng)一的接口,在與HBase連接過程中,無需考慮具體的具體細(xì)節(jié),其結(jié)構(gòu)如圖2所示。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫通過sqoob法直接導(dǎo)入HBase數(shù)據(jù)庫,監(jiān)測(cè)執(zhí)行站產(chǎn)生的數(shù)據(jù)通過UIP提供的適配器進(jìn)行轉(zhuǎn)換,從而實(shí)現(xiàn)了不同數(shù)據(jù)采用統(tǒng)一接口存入的目標(biāo),有效降低了數(shù)據(jù)源導(dǎo)入HBase數(shù)據(jù)庫的復(fù)雜度。服務(wù)端口、HBase和ZooKeeper集群的地址等參數(shù)保存在UIP,UIP有許多不同類型的適配器,可以讓不同類型的數(shù)據(jù)源導(dǎo)入HBase。UIP優(yōu)化了不同數(shù)據(jù)類型的導(dǎo)入方法,針對(duì)采用RMTP協(xié)議、SCPI協(xié)議以及廠家協(xié)議的監(jiān)測(cè)數(shù)據(jù)都有相應(yīng)的適配器進(jìn)行轉(zhuǎn)換,提高了數(shù)據(jù)導(dǎo)入的準(zhǔn)確率和效率。

圖2 UIP的結(jié)構(gòu)

1.2 存儲(chǔ)層

在監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)層結(jié)構(gòu)中,HBase表中的一行數(shù)據(jù)存儲(chǔ)一幀監(jiān)測(cè)數(shù)據(jù),Hadoop的HDFS用來存儲(chǔ)HBase的數(shù)據(jù)文件。監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)層結(jié)構(gòu)的設(shè)計(jì)如圖3所示。

圖3 無線電監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)層結(jié)構(gòu)

監(jiān)測(cè)站的一幀監(jiān)測(cè)數(shù)據(jù)中包括許多字段,如經(jīng)緯度信息、執(zhí)行結(jié)果信息、監(jiān)測(cè)站業(yè)務(wù)數(shù)據(jù)、音頻數(shù)據(jù)、單信道中頻音頻數(shù)據(jù)、數(shù)據(jù)描述頭、設(shè)備參數(shù)信息等,它們描述了具體時(shí)間點(diǎn)監(jiān)測(cè)數(shù)據(jù)的信息詳情。關(guān)系型數(shù)據(jù)庫表的主鍵是幀頭(唯一地標(biāo)志表中一行監(jiān)測(cè)數(shù)據(jù)),表的列是監(jiān)測(cè)數(shù)據(jù)的屬性,以此建立監(jiān)測(cè)數(shù)據(jù)表。監(jiān)測(cè)數(shù)據(jù)表的結(jié)構(gòu)如表1所示。

表1 監(jiān)測(cè)數(shù)據(jù)表的結(jié)構(gòu)

1.2.1 幀頭說明

RMTP服務(wù)端發(fā)送的監(jiān)測(cè)數(shù)據(jù)報(bào)文,是由若干個(gè)數(shù)據(jù)幀組成的,每個(gè)數(shù)據(jù)幀,都有一個(gè)自描述的幀頭,其定義如表2所示。

表2 幀頭說明

1.2.2 數(shù)據(jù)類型

數(shù)據(jù)類型結(jié)構(gòu)如表3所示,通過幀頭中數(shù)據(jù)類型(nDataType)來識(shí)別數(shù)據(jù)的類型。

表3 數(shù)據(jù)類型

HBase數(shù)據(jù)庫表中的監(jiān)測(cè)數(shù)據(jù)是依照RowKey進(jìn)行結(jié)構(gòu)化存儲(chǔ),這種以單一屬性進(jìn)行存儲(chǔ)的方式有許多缺點(diǎn)。例如,當(dāng)RowKey以時(shí)間為時(shí)序的時(shí)候,當(dāng)有很多監(jiān)測(cè)執(zhí)行站都向HBase存入新的數(shù)據(jù)時(shí),所有的請(qǐng)求都會(huì)落入同一個(gè)Region,隨著數(shù)據(jù)的增多,新的數(shù)據(jù)又依次落入下一個(gè) Region,這樣,RegionServer的請(qǐng)求壓力將會(huì)很大。為了避免這種現(xiàn)象的發(fā)生,無線電監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)系統(tǒng)的Row Key采用nDataType+Timestamp的方式進(jìn)行存儲(chǔ)。以nDataType作為RowKey的前綴將監(jiān)測(cè)數(shù)據(jù)進(jìn)行分組,多個(gè)Region共同分擔(dān)了監(jiān)測(cè)執(zhí)行站的請(qǐng)求壓力,繼而再以時(shí)間戳為后綴,能夠提高對(duì)新寫入數(shù)據(jù)查找的效率。當(dāng)需要對(duì)包含海量數(shù)據(jù)的監(jiān)測(cè)數(shù)據(jù)表進(jìn)行數(shù)據(jù)挖掘時(shí),可以通過nDataType+Timestamp方式快速獲取監(jiān)測(cè)數(shù)據(jù)的信息。

按照ITU的提議,無線電監(jiān)測(cè)數(shù)據(jù)的占用度統(tǒng)計(jì)結(jié)果,每隔15 min向數(shù)據(jù)庫寫入,其中包括單站頻段占用度、信道占用度、多站頻段占用度等,在每次監(jiān)測(cè)任務(wù)停止后,將電平分布的統(tǒng)計(jì)數(shù)據(jù)存入數(shù)據(jù)庫中。Hadoop的專長是海量數(shù)據(jù)的存儲(chǔ)和處理,可以快速得到占用度等信息。利用Hadoop的快速處理數(shù)據(jù)的能力,對(duì)占用度、時(shí)間戳、經(jīng)緯度、特殊頻點(diǎn)等信息進(jìn)行實(shí)時(shí)預(yù)處理,分別建立分表,極大地提高了查詢效率。

表4 固定頻率測(cè)量表的結(jié)構(gòu)(MyRowKey=nDataType+TimeStamp)

表5 頻段掃描表的結(jié)構(gòu)(MyRowKey=nDataType+TimeStamp)

如表4所示,固定頻率測(cè)量(FIXFQ)表的結(jié)構(gòu)包含Index和DataDetail 2個(gè)列族,其中列族 Index存儲(chǔ)一幀數(shù)據(jù)的概要信息,如使用的監(jiān)測(cè)設(shè)備和天線、要進(jìn)行測(cè)量的業(yè)務(wù)、監(jiān)測(cè)執(zhí)行站編號(hào)、發(fā)起該功能的監(jiān)測(cè)站的代碼、當(dāng)前測(cè)量的優(yōu)先級(jí)代碼、控制本監(jiān)測(cè)執(zhí)行站的監(jiān)測(cè)站代碼等。當(dāng)對(duì)包含大量無線電監(jiān)測(cè)數(shù)據(jù)表進(jìn)行查詢時(shí),能夠根據(jù)Index迅速查詢到相應(yīng)的概要數(shù)據(jù),從而檢索到數(shù)據(jù)的詳細(xì)信息。

在表5中,頻段掃描(FSCAN)表的結(jié)構(gòu)包含Index和Data Detail 2個(gè)列族,其中:列族 Index存儲(chǔ)一幀數(shù)據(jù)的概要信息;列族Data Detail是詳細(xì)數(shù)據(jù)部分,包括監(jiān)測(cè)頻段起始和終止頻率、步長、檢波方式、極化方式、中頻帶寬、頻段掃描數(shù)段數(shù)和點(diǎn)數(shù)、頻段掃描數(shù)據(jù)值以及音頻數(shù)據(jù)等內(nèi)容。

表4和表5都給出了一些必要的列,其中列族中的列(如音頻數(shù)據(jù)和頻譜數(shù)據(jù)等)添加時(shí)可以不預(yù)先說明,監(jiān)測(cè)管理人員負(fù)責(zé)代維HBase數(shù)據(jù)庫表中的列信息。根據(jù)不同查詢類型,還設(shè)計(jì)了中頻測(cè)量(IF_FQ)表、單頻測(cè)向(FIXDF)表、中頻測(cè)向(IF_DF)表、離散掃描(MSCAN)表、寬帶測(cè)量(WB_FQ)表、寬帶測(cè)量(WB_FQ)表、寬帶測(cè)向(WB_DF)表等。

1.3 查詢層

查詢層用于監(jiān)測(cè)管理人員的查詢、統(tǒng)計(jì)、分析操作,該層主要由查詢接口、請(qǐng)求解析和結(jié)果處理組成,其結(jié)構(gòu)如圖4所示。查詢接口部分是查詢完畢返回?cái)?shù)據(jù)的統(tǒng)一接口,查詢請(qǐng)求解析單元根據(jù)查詢請(qǐng)求,調(diào)用相應(yīng)查詢方法,HBase數(shù)據(jù)庫返回的查詢結(jié)果由結(jié)果處理單元統(tǒng)一接受并解析,通過統(tǒng)一的查詢接口輸出數(shù)據(jù)。

圖4 查詢層的設(shè)計(jì)結(jié)構(gòu)

1.4 時(shí)間同步系統(tǒng)的設(shè)計(jì)

由于Hadoop集群中的設(shè)備太多,各種設(shè)備的配置和狀態(tài)都不一樣,因此各種設(shè)備的時(shí)間可能不同步。在平時(shí)的實(shí)驗(yàn)過程中,發(fā)現(xiàn)即使剛開始時(shí)候時(shí)間同步,工作一段時(shí)間后仍然會(huì)出現(xiàn)時(shí)間不同步的狀況。因此,本系統(tǒng)設(shè)計(jì)了TSS用于集群中的各節(jié)點(diǎn)時(shí)間自動(dòng)同步。

集群中的所有設(shè)備通過網(wǎng)絡(luò)時(shí)間同步協(xié)議(Network Time Synchronization Protocol,NTSP)進(jìn)行時(shí)間同步,其中的一個(gè)節(jié)點(diǎn)配置為 NTSP服務(wù)器,其余的節(jié)點(diǎn)作為同步客戶機(jī)與NTSP服務(wù)器進(jìn)行時(shí)間同步。TSS的架構(gòu)如圖5所示。

圖5 時(shí)間同步系統(tǒng)架構(gòu)圖

2 結(jié)語

本文針對(duì)無線電數(shù)據(jù)的數(shù)據(jù)特征設(shè)計(jì)了特殊的存儲(chǔ)格式,還進(jìn)行了壓縮編碼,有效的降低了存儲(chǔ)容量并且加速了查詢速度。對(duì)海量無線電監(jiān)測(cè)數(shù)據(jù)的分布式系統(tǒng)進(jìn)行了設(shè)計(jì),詳細(xì)介紹了統(tǒng)一接口平臺(tái)、存儲(chǔ)層、查詢層和時(shí)間同步系統(tǒng)的設(shè)計(jì)。同時(shí),HDFS的副本存放策略也可減少因不可抗拒因素導(dǎo)致的數(shù)據(jù)丟失。通過對(duì)無線電監(jiān)測(cè)數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)的設(shè)計(jì),極大地滿足了未來海量數(shù)據(jù)的存儲(chǔ)和檢索需求。

[1]徐鳳琴,賈年.基于膜計(jì)算的C波段異常信號(hào)特征選擇[J].成都工業(yè)學(xué)院學(xué)報(bào),2014,17(4):11-14.

[2]魏家賓.基于Hadoop的海量交易記錄查詢系統(tǒng)研究[D].南京:南京郵電大學(xué),2013.

[3]王滿周.基于RMTP的無線電監(jiān)測(cè)軟件設(shè)計(jì)[D].河南:解放軍信息工程大學(xué),2012.

[4]魏青松.大規(guī)模分布式存儲(chǔ)技術(shù)研究[D].成都:電子科技大學(xué),2014.

[5]焦冬冬,徐新國.一種基于HBase的海量微博數(shù)據(jù)高效存儲(chǔ)方案[J].微型機(jī)與應(yīng)用,2014,33(11):75-78.

[6]劉霖.分布式存儲(chǔ)系統(tǒng)中的能耗管理策略研究[D].廣州:華南理工大學(xué),2013.

[7]吳岳衷,劉琴,李長云,等.基于云存儲(chǔ)的網(wǎng)絡(luò)文檔共享研究[J].小型微型計(jì)算機(jī)系統(tǒng),2015,36(1):95-99.

[8]陳臣.一種基于新型存儲(chǔ)的數(shù)字圖書館分布式大數(shù)據(jù)存儲(chǔ)架構(gòu)[J].現(xiàn)代情報(bào),2015,35(1):100-103.

猜你喜歡
數(shù)據(jù)類型存儲(chǔ)系統(tǒng)數(shù)據(jù)源
分布式存儲(chǔ)系統(tǒng)在企業(yè)檔案管理中的應(yīng)用
如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
天河超算存儲(chǔ)系統(tǒng)在美創(chuàng)佳績
Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
基于SeisBase模型的地震勘探成果數(shù)據(jù)管理系統(tǒng)設(shè)計(jì)
線上眾籌產(chǎn)品的特征分析與研究
相似度計(jì)算及其在數(shù)據(jù)挖掘中的應(yīng)用
華為震撼發(fā)布新一代OceanStor 18000 V3系列高端存儲(chǔ)系統(tǒng)
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法