国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種高效的船舶活動(dòng)熱點(diǎn)海域探測(cè)算法

2017-08-12 12:22:06
關(guān)鍵詞:熱點(diǎn)海域船舶

楊 樂 包 磊 羅 兵

(海軍工程大學(xué)電子工程學(xué)院 湖北 武漢 430033)

?

一種高效的船舶活動(dòng)熱點(diǎn)海域探測(cè)算法

楊 樂 包 磊 羅 兵

(海軍工程大學(xué)電子工程學(xué)院 湖北 武漢 430033)

針對(duì)傳統(tǒng)數(shù)據(jù)處理工具處理海洋船舶位置大數(shù)據(jù)效率低、空間特征不敏感的問題,引入SpatialHadoop空間大數(shù)據(jù)處理平臺(tái),提出一種基于SpatialHadoop的船舶活動(dòng)熱點(diǎn)海域探測(cè)算法。該算法結(jié)合空間索引和MapReduce分布式處理框架實(shí)現(xiàn)了基于區(qū)域統(tǒng)計(jì)的熱點(diǎn)海域探測(cè)方法。從理論上分析,該方法能夠高效地探測(cè)船舶活動(dòng)熱點(diǎn)海域。利用真實(shí)AIS數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并從不同海域和算法運(yùn)行效率兩個(gè)方面對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比分析,結(jié)果表明該算法具有有效的探測(cè)結(jié)果和較高的處理效率,驗(yàn)證了理論分析的正確性。

位置大數(shù)據(jù) 熱點(diǎn)探測(cè) 空間大數(shù)據(jù)平臺(tái) 空間索引

0 引 言

隨著船載自動(dòng)定位系統(tǒng)(AIS)的安裝普及[1],規(guī)模巨大的海洋船舶活動(dòng)所產(chǎn)生的軌跡數(shù)據(jù)呈現(xiàn)大數(shù)據(jù)態(tài)勢(shì)。海洋船舶軌跡大數(shù)據(jù)富含位置信息和時(shí)間標(biāo)識(shí),屬于位置大數(shù)據(jù)的范疇,具有數(shù)據(jù)量大、信息碎片化、單記錄價(jià)值低和準(zhǔn)確性低等位置大數(shù)據(jù)普遍擁有的特點(diǎn)[2]。海洋船舶位置數(shù)據(jù)與城市交通軌跡數(shù)據(jù)類似,在時(shí)空域內(nèi)并不是均勻分布的,而是表現(xiàn)出明顯的聚集特性,這種聚集性常用“熱點(diǎn)海域”來表達(dá)。熱點(diǎn)海域較其余海域而言,具有數(shù)據(jù)集中、信息豐富、模式多樣等特點(diǎn),因此熱點(diǎn)海域的研究具有十分重要的價(jià)值。研究熱點(diǎn)海域首先需要探測(cè)發(fā)現(xiàn)熱點(diǎn)海域,有效的探測(cè)結(jié)果為熱點(diǎn)海域的研究提供基礎(chǔ)支撐。

熱點(diǎn)海域探測(cè)是指通過某種方法識(shí)別船舶活動(dòng)密集且彼此分離的區(qū)域或時(shí)段。該方向的研究國(guó)內(nèi)外較少,但是對(duì)于船舶位置數(shù)據(jù)的分析與研究較為豐富,其主要涉及聚類分析、關(guān)聯(lián)分析和異常檢測(cè)等方向,也取得了一定的研究成果[3-5]。但是,大多研究仍沿用傳統(tǒng)的分析工具,這導(dǎo)致船舶位置數(shù)據(jù)的分析面臨著兩大瓶頸問題:① 傳統(tǒng)工具的串行處理方式無法滿足海量位置數(shù)據(jù)對(duì)于處理速度的要求;② 傳統(tǒng)工具的空間數(shù)據(jù)特征不敏感性制約著處理效率的提升。

針對(duì)上述問題,本文結(jié)合了位置數(shù)據(jù)熱點(diǎn)探測(cè)相關(guān)方法,提出了基于空間大數(shù)據(jù)平臺(tái)的熱點(diǎn)海域探測(cè)算法。該算法彌補(bǔ)了傳統(tǒng)位置數(shù)據(jù)熱點(diǎn)探測(cè)算法串行計(jì)算方式和數(shù)據(jù)空間特征不敏感性的缺點(diǎn),很好地提升了探測(cè)效率,為下一步熱點(diǎn)海域模式挖掘和價(jià)值提取提供了支撐。文中采用真實(shí)AIS數(shù)據(jù)進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果也驗(yàn)證了該算法的高效性。

1 相關(guān)研究

1.1 空間大數(shù)據(jù)平臺(tái)

大數(shù)據(jù)處理工具與方法的研究是目前研究的熱點(diǎn)領(lǐng)域,分析該領(lǐng)域國(guó)內(nèi)外研究現(xiàn)狀可以發(fā)現(xiàn),該領(lǐng)域的研究仍處于起步階段。大數(shù)據(jù)處理工具的架構(gòu)大多基于Hadoop技術(shù),同時(shí)大量的研究集中在大數(shù)據(jù)分析方法上,支撐大數(shù)據(jù)平臺(tái)開發(fā)的相關(guān)技術(shù)體系還沒有形成[6]。關(guān)于大數(shù)據(jù)處理平臺(tái)工具,國(guó)內(nèi)已有一些研究開發(fā),比如中國(guó)移動(dòng)研究院研發(fā)的基于云計(jì)算平臺(tái)的并行數(shù)據(jù)挖掘工具BC-PDM,廈門大學(xué)數(shù)據(jù)挖掘研究中心與臺(tái)灣銘傳大學(xué)、中華資料采礦協(xié)會(huì)合作開發(fā)的一套基于云計(jì)算的數(shù)據(jù)挖掘決策支持系統(tǒng)─—云端數(shù)據(jù)挖掘決策系統(tǒng)(MCU Smart Score),以及基于Hadoop中科院計(jì)算所研制的并行數(shù)據(jù)挖掘工具平臺(tái)PDMiner。以上大數(shù)據(jù)處理工具只是實(shí)現(xiàn)了對(duì)事務(wù)性海量數(shù)據(jù)的并行化挖掘分析,并沒有針對(duì)空間數(shù)據(jù)進(jìn)行特殊設(shè)計(jì),還無法高效存儲(chǔ)、分析和挖掘空間數(shù)據(jù)。關(guān)于空間大數(shù)據(jù)平臺(tái),國(guó)外已有相關(guān)研究實(shí)踐,明尼蘇達(dá)大學(xué)計(jì)算科學(xué)與工程系A(chǔ)hmed和Mohamed兩人基于Hadoop大數(shù)據(jù)平臺(tái)進(jìn)行拓展,開發(fā)了一款專門用于空間大數(shù)據(jù)處理的平臺(tái)SpatialHadoop[7]。該平臺(tái)改變了傳統(tǒng)Hadoop數(shù)據(jù)存儲(chǔ)的堆文件方式,使用全局索引和局部索引相結(jié)合的兩級(jí)大數(shù)據(jù)空間索引結(jié)構(gòu)。該空間索引結(jié)構(gòu)為平臺(tái)提供了數(shù)據(jù)空間特征的敏感性,使數(shù)據(jù)的選取十分高效,從而提高了空間數(shù)據(jù)的處理效率。目前該平臺(tái)提供空間Grid、Rtree和R+tree三類空間索引。

1.2 熱點(diǎn)區(qū)域探測(cè)

由于海洋船舶交通位置數(shù)據(jù)與犯罪位置數(shù)據(jù)、交通軌跡數(shù)據(jù)在數(shù)據(jù)特征上存在著極大的相似性,加之犯罪熱點(diǎn)區(qū)域探測(cè)和交通軌跡熱點(diǎn)區(qū)域探測(cè)的一些理論方法對(duì)于熱點(diǎn)海域的探測(cè)具有十分重要的借鑒意義。因此可將熱點(diǎn)海域探測(cè)問題、犯罪熱點(diǎn)區(qū)域探測(cè)問題以及交通軌跡熱點(diǎn)區(qū)域探測(cè)問題統(tǒng)稱為位置數(shù)據(jù)熱點(diǎn)區(qū)域探測(cè)問題。

關(guān)于位置數(shù)據(jù)熱點(diǎn)區(qū)域探測(cè)方法的研究,主要是面向小量數(shù)據(jù)集。成熟的探測(cè)方法可分為兩大類:基于離散點(diǎn)的熱點(diǎn)區(qū)域探測(cè)方法和基于區(qū)域統(tǒng)計(jì)數(shù)據(jù)的熱點(diǎn)區(qū)域探測(cè)方法[8]?;陔x散點(diǎn)的熱點(diǎn)區(qū)域探測(cè)方法主要是指模式分析中的空間聚類方法,主要有統(tǒng)計(jì)法、分割法、層次聚類法和密度估計(jì)法?;趨^(qū)域統(tǒng)計(jì)數(shù)據(jù)的熱點(diǎn)區(qū)域探測(cè)方法,一般是指以某固定大小的區(qū)域?yàn)閱挝蛔訁^(qū)域計(jì)算每個(gè)子區(qū)域內(nèi)的位置點(diǎn)總量、位置點(diǎn)密度等統(tǒng)計(jì)指標(biāo),再利用相關(guān)算法確定某時(shí)段內(nèi)的“熱點(diǎn)區(qū)域”或者某區(qū)域內(nèi)的“熱點(diǎn)時(shí)間段”,也可對(duì)熱點(diǎn)區(qū)域數(shù)據(jù)類型進(jìn)行分析,從而探測(cè)“熱點(diǎn)類型”。兩類方法的區(qū)別在于:前者基于離散點(diǎn)進(jìn)行聚類處理,探測(cè)結(jié)果精度相對(duì)較高,而計(jì)算復(fù)雜度非常高;而后者基于子區(qū)域位置數(shù)據(jù)點(diǎn)統(tǒng)計(jì)結(jié)果進(jìn)行處理,結(jié)果的精確度相對(duì)減小,但是計(jì)算復(fù)雜度降低的程度更加可觀。熱點(diǎn)海域探測(cè)對(duì)于探測(cè)結(jié)果精度的要求并非很高,使用基于離散點(diǎn)的熱點(diǎn)探測(cè)方法造成精度冗余的同時(shí)又增加了算法的復(fù)雜度,因此本文采用基于區(qū)域統(tǒng)計(jì)的熱點(diǎn)海域探測(cè)方法。

對(duì)于海洋船舶交通大數(shù)據(jù)而言,熱點(diǎn)海域的實(shí)時(shí)探測(cè)和海量歷史積累數(shù)據(jù)的熱點(diǎn)區(qū)域探測(cè)處理對(duì)于算法計(jì)算速度的要求非常高?;趨^(qū)域統(tǒng)計(jì)的熱點(diǎn)海域探測(cè)方法雖然在一定程度上降低了計(jì)算復(fù)雜度,但是仍不滿足實(shí)際要求。因此,本文引入空間大數(shù)據(jù)處理平臺(tái),提出了一種基于SpatialHadoop的熱點(diǎn)海域探測(cè)算法,較大程度上提高了計(jì)算效率。

2 熱點(diǎn)海域探測(cè)算法

2.1 算法設(shè)計(jì)思路

船舶熱點(diǎn)海域探測(cè)算法是在已知的全海域?qū)ふ掖胺植急容^密集的網(wǎng)格子海域集,其算法內(nèi)容包括:基于SpatialHadoop平臺(tái)實(shí)現(xiàn)敏感海域船舶位置數(shù)據(jù)提取,網(wǎng)格化分區(qū)和網(wǎng)格子海域內(nèi)船舶數(shù)量統(tǒng)計(jì)的MapReduce化,以及使用迭代裁剪的方法獲取熱點(diǎn)海域。

基于SpatialHadoop平臺(tái)的敏感海域數(shù)據(jù)提取的實(shí)現(xiàn)首先需要為全球海域數(shù)據(jù)建立空間Rtree索引。空間Rtree索引的建立包括數(shù)據(jù)分割,本地索引建立和全區(qū)索引建立三個(gè)階段。在數(shù)據(jù)分割階段需要滿足三個(gè)要求:① 每個(gè)分割塊的數(shù)據(jù)量滿足HDFS塊大小;② 空間相鄰的位置點(diǎn)被分割在同一個(gè)塊內(nèi);③ 所有分割塊的負(fù)載均衡。本地索引是為數(shù)據(jù)分割結(jié)果建立Rtree索引,以便實(shí)現(xiàn)節(jié)點(diǎn)內(nèi)數(shù)據(jù)的快速查找。全局索引建立于節(jié)點(diǎn)之間,索引文件存儲(chǔ)于主節(jié)點(diǎn),一旦MapReduce開始運(yùn)行,可快速定位存儲(chǔ)數(shù)據(jù)的子節(jié)點(diǎn)位置。然后,使用SpatialHadoop自帶的區(qū)域查詢功能,獲取敏感區(qū)域的船舶位置數(shù)據(jù)集。區(qū)域查詢是在Rtree空間索引結(jié)構(gòu)之上實(shí)現(xiàn)的MapReduce并行化數(shù)據(jù)提取處理。該功能首先基于Rtree索引結(jié)構(gòu)濾除不包含查詢區(qū)域的數(shù)據(jù)分區(qū),接著針對(duì)剩余的數(shù)據(jù)分區(qū)實(shí)行并行化篩選處理?;赟patialHadoop平臺(tái)實(shí)現(xiàn)敏感海域船舶位置數(shù)據(jù)提取的技術(shù)框架見圖1。

圖1 敏感海域船舶位置數(shù)據(jù)提取技術(shù)圖

獲取敏感海域船舶位置數(shù)據(jù)之后,由于敏感海域范圍的粗略性,需要進(jìn)行細(xì)化分區(qū)統(tǒng)計(jì)處理。該步采用網(wǎng)格化分區(qū)方法對(duì)敏感海域船舶位置數(shù)據(jù)進(jìn)行分區(qū)處理,并統(tǒng)計(jì)每個(gè)子網(wǎng)格內(nèi)的船舶數(shù)量。由于船舶位置數(shù)據(jù)實(shí)例的相互獨(dú)立性,因此可以采用MapReduce編程框架進(jìn)行并行化處理。Map函數(shù)的數(shù)目由網(wǎng)格子海域分區(qū)的數(shù)量確定,在Map階段實(shí)現(xiàn)船舶位置數(shù)據(jù)與網(wǎng)格子海域的匹配。由于Map與Reduce階段不涉及Map間的數(shù)據(jù)交換,每個(gè)Map函數(shù)對(duì)應(yīng)一個(gè)Reduce函數(shù),因此Reduce函數(shù)的數(shù)量與Map函數(shù)保持一致,在Reduce階段實(shí)現(xiàn)網(wǎng)格子海域船舶數(shù)量的統(tǒng)計(jì)。

船舶活動(dòng)熱點(diǎn)海域的獲取是建立在網(wǎng)格子海域船舶數(shù)量統(tǒng)計(jì)結(jié)果的基礎(chǔ)之上實(shí)現(xiàn)的。通過迭代裁剪敏感海域中對(duì)船舶存在密度沒有貢獻(xiàn)或者貢獻(xiàn)較小的網(wǎng)格子海域,直至滿足最終的熱點(diǎn)海域船舶存在密度閾值,具體的裁剪方法在后文有詳細(xì)描述。

2.2 算法高效性理論分析

從理論角度分析,該算法較傳統(tǒng)方法有更高的執(zhí)行效率,其主要表現(xiàn)在兩個(gè)方面:

(1) 并行化處理

該算法從敏感海域位置數(shù)據(jù)提取、網(wǎng)格化分區(qū)和網(wǎng)格子海域內(nèi)船舶數(shù)量統(tǒng)計(jì)均采用了并行化處理方式。因此該算法并行化程度強(qiáng),與傳統(tǒng)串行方法相比較而言,必然較大程度上提高了執(zhí)行效率。

(2) 空間數(shù)據(jù)索引

在并行化基礎(chǔ)之上,該算法建立了位置數(shù)據(jù)空間索引。該算法在并行化處理之前基于空間索引結(jié)構(gòu)已經(jīng)濾除了大量的不相關(guān)數(shù)據(jù)分區(qū)。因此,減少了計(jì)算量,提高了計(jì)算效率。性能遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的串行處理方法,與優(yōu)于純粹的算法并行化。

2.3 算法具體實(shí)現(xiàn)步驟

(1) 建立全球海域船舶位置數(shù)據(jù)Rtree索引。

(2) 設(shè)定敏感海域C,提取敏感海域船舶位置數(shù)據(jù)。

(3) 計(jì)算敏感海域C的初始船舶存在密度,記為ρ0(船舶存在密度計(jì)算公式為:ρ=Q/S,其中Q表示海域的船舶總量,S表示海域面積;初始船舶存在密度ρ0=Q0/S0,其中Q0表示敏感海域的初始船舶總量,S0表示敏感海域初始面積)。

(4) 將敏感海域C按經(jīng)緯度平均劃分為N(N=X×Y,X為行數(shù)Y為列數(shù))塊網(wǎng)格子海域,并分別記為Rij(i表示行號(hào),j表示第列號(hào)),統(tǒng)計(jì)網(wǎng)格子海域Rij內(nèi)的船舶數(shù)量。

(5) 裁剪C的任意行網(wǎng)格子海域Ri或列網(wǎng)格子海域Rj,使裁剪后海域C的船舶存在密度最大并記為ρ(如果裁剪多行網(wǎng)格子海域或多列網(wǎng)格子海域或多行列網(wǎng)格子海域組合后,海域C的船舶存在密度相同,那么同時(shí)裁剪該多行或多列或多行列組合)。

(6) 判斷C的存在密度ρ是否滿足條件:ρ≥n×ρ0,如果滿足算法結(jié)束,否則返回執(zhí)行步驟5(其中n∈N+)。

為了讀者更清楚地了解裁剪步驟,本節(jié)提供一個(gè)裁剪示例。設(shè)有敏感海域C,其中Q0=50,S0=25,計(jì)算得ρ0=2。將全海域C平均劃分為25(X=Y=5)個(gè)子海域,存在密度閾值取n=3。經(jīng)過三次迭代裁剪后獲得最終結(jié)果,裁剪具體過程見圖2。

圖2 海域裁剪過程圖

3 實(shí)驗(yàn)結(jié)果及分析

3.1 實(shí)驗(yàn)環(huán)境

實(shí)驗(yàn)選取4臺(tái)計(jì)算機(jī)搭建SpatialHadoop平臺(tái),計(jì)算機(jī)系統(tǒng)采用Ubuntu Linux 14.04,SpatialHadoop版本采用SpatialHadoop 2.3,其中1臺(tái)機(jī)器作為Master和JobTracker控制節(jié)點(diǎn),其余3臺(tái)機(jī)器作為Slave和TaskTracker計(jì)算節(jié)點(diǎn)。機(jī)器的基本配置見表1。

表1 各個(gè)節(jié)點(diǎn)的基本配置

3.2 實(shí)驗(yàn)數(shù)據(jù)選取

實(shí)驗(yàn)數(shù)據(jù)選自真實(shí)的AIS歷史數(shù)據(jù)。AIS是海上船舶自動(dòng)定位數(shù)據(jù),數(shù)據(jù)屬于結(jié)構(gòu)化數(shù)據(jù),有著規(guī)整的數(shù)據(jù)格式,十分利于實(shí)驗(yàn)處理。本實(shí)驗(yàn)選取2012年1月的全球AIS數(shù)據(jù),數(shù)據(jù)量約102 GB。實(shí)驗(yàn)之前,對(duì)數(shù)據(jù)采取預(yù)處理操作,剔除了錯(cuò)誤數(shù)據(jù)和格式有誤數(shù)據(jù)。

選取南沙群島及周邊海域作為敏感海域,通過查閱世界地圖確定粗略的南沙島嶼經(jīng)緯度范圍為110°E~118°E,4°N~12°N,其中包括遠(yuǎn)洋海域數(shù)據(jù)(南沙海域)和近岸海域數(shù)據(jù)(馬來西亞西海岸)。

3.3 結(jié)果對(duì)比分析

獲取敏感海域船舶交通位置數(shù)據(jù)后,依照經(jīng)緯度將敏感海域等值網(wǎng)格化,網(wǎng)格的劃分?jǐn)?shù)量確定為100×100個(gè)網(wǎng)格。統(tǒng)計(jì)各網(wǎng)格內(nèi)船舶數(shù)量并繪制海域船舶存在密度圖態(tài)勢(shì)圖,如圖3所示。

圖3 海域船舶存在密度態(tài)勢(shì)圖

觀察圖3易見,遠(yuǎn)洋海域數(shù)據(jù)與近岸海域數(shù)據(jù)在數(shù)據(jù)密度上存在較大的差異,直接影響算法處理結(jié)果的準(zhǔn)確性,因此將遠(yuǎn)洋海域數(shù)據(jù)與近岸海域數(shù)據(jù)區(qū)分處理。依據(jù)我國(guó)南海劃界九段線將研究海域劃分為遠(yuǎn)洋海域和近岸海域,劃分結(jié)果見圖3,其中虛線以上為遠(yuǎn)洋海域,虛線以下為近岸海域。

下面從不同海域和算法性能兩個(gè)角度對(duì)實(shí)驗(yàn)結(jié)果和算法性能進(jìn)行了對(duì)比分析。

3.3.1 不同海域?qū)嶒?yàn)結(jié)果對(duì)比

實(shí)驗(yàn)對(duì)近岸海域數(shù)據(jù)與遠(yuǎn)洋海域數(shù)據(jù)分別進(jìn)行處理,根據(jù)處理結(jié)果繪制熱點(diǎn)海域面積占比與熱點(diǎn)海域船舶數(shù)量占比隨n值增大的變化趨勢(shì),如圖4所示。

(a) 近岸海域

(b) 遠(yuǎn)洋海域圖4 熱點(diǎn)海域面積占比與熱點(diǎn)海域船舶數(shù)量占比隨n值增大變化趨勢(shì)圖

由圖4可見,隨n值增大,熱點(diǎn)海域船舶數(shù)量占比和熱點(diǎn)海域面積占比普遍呈減小趨勢(shì)。但是,熱點(diǎn)海域船舶數(shù)量占比減小的速度較為平穩(wěn),減小速度沒有明顯的變小或變大趨勢(shì),而熱點(diǎn)海域面積占比的減小速度隨n值增大呈下降趨勢(shì),以致于最后熱點(diǎn)海域面積占比趨于穩(wěn)定。由此可見,隨n值增大熱點(diǎn)海域面積占比存在一個(gè)臨界穩(wěn)定值,此臨界穩(wěn)定值對(duì)應(yīng)的算法探測(cè)結(jié)果可被確定為熱點(diǎn)海域。

另外,近岸海域與遠(yuǎn)洋海域相比較而言,近岸熱點(diǎn)海域臨界穩(wěn)定值對(duì)應(yīng)的n值較大且隨n值增大近岸熱點(diǎn)海域船舶數(shù)量占比下降速度較慢。這與近岸海域船舶存在密度普遍較大,船舶空間分布較均勻的事實(shí)相一致,這證實(shí)了算法的有效性和實(shí)驗(yàn)結(jié)果的正確性。

基于上圖實(shí)驗(yàn)結(jié)果分析,選取n=100和n=39為近岸海域和遠(yuǎn)洋海域的熱點(diǎn)海域探測(cè)閾值,并將所對(duì)應(yīng)的熱點(diǎn)海域探測(cè)結(jié)果顯示在船舶存在密度態(tài)勢(shì)圖中,見圖5。

(a) 近岸海域

(b) 遠(yuǎn)洋海域圖5 熱點(diǎn)海域探測(cè)結(jié)果顯示圖

3.3.2 算法性能比較

選擇不同的網(wǎng)格劃分?jǐn)?shù)量,比較基于傳統(tǒng)處理工具的探測(cè)算法與基于SpatialHadoop的探測(cè)算法的運(yùn)行速度,實(shí)驗(yàn)結(jié)果見表2。

表2 算法執(zhí)行速度比較表

由表2可見,基于SpatialHadoop船舶交通位置數(shù)據(jù)熱點(diǎn)海域探測(cè)算法執(zhí)行速度明顯快于基于傳統(tǒng)工具的船舶交通位置數(shù)據(jù)熱點(diǎn)海域探測(cè)算法,與實(shí)驗(yàn)設(shè)計(jì)的初衷相符,同時(shí)驗(yàn)證了SpatialHadoop平臺(tái)在處理空間大數(shù)據(jù)上的優(yōu)勢(shì)。

4 結(jié) 語

對(duì)于海洋船舶交通位置大數(shù)據(jù)分析而言,傳統(tǒng)處理工具與方法暴露出時(shí)間復(fù)雜度高,空間特征不敏感等缺點(diǎn)。針對(duì)這些缺點(diǎn),本文提出了基于SpatialHadoop的熱點(diǎn)海域探測(cè)算法。該算法結(jié)合了空間數(shù)據(jù)索引和MapReduce并行化處理方法,很好地解決了上述缺點(diǎn)。

正如前文所述,船舶活動(dòng)熱點(diǎn)海域具有數(shù)據(jù)集中、信息豐富、模式多樣等特點(diǎn)。熱點(diǎn)海域內(nèi)部信息提取與模式挖掘具有十分重要的價(jià)值與意義。利用相關(guān)統(tǒng)計(jì)與挖掘方法分析熱點(diǎn)海域,這是下一步研究的內(nèi)容之一。同時(shí),海洋探測(cè)較普通空間位置探測(cè)而言存在其獨(dú)特性。將更多地挖掘分析海洋探測(cè)較普通空間位置探測(cè)的特點(diǎn),提出適應(yīng)性更強(qiáng)的海洋探測(cè)算法。

[1] Iphar C, Napoli A, Ray C. Data Quality Assessment For Maritime Situation Awareness[J]. Remote Sensing and Spatial Information Sciences, 2015, 2(3): 291-295.

[2] 劉經(jīng)南, 方媛, 郭遲,等. 位置大數(shù)據(jù)的分析處理研究進(jìn)展[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2014, 39(4):379-385.

[3] Scrofani J W, Tummala M, Miller D, et al. Behavioral detection in the maritime domain[C]// System of Systems Engineering Conference. IEEE, 2015:380-385.

[4] Iphar C, Napoli A, Ray C. Detection of false AIS messages for the improvement of maritime situational awareness[C]// Oceans’2015, Oct 2015, Washington, DC, United Stateds.

[5] Liu B, De Souza E N, Matwin S, et al. Knowledge-based clustering of ship trajectories using density-based approach[C]// IEEE International Conference on Big Data. IEEE, 2014:603-608.

[6] 宮夏屹, 李伯虎, 柴旭東,等. 大數(shù)據(jù)平臺(tái)技術(shù)綜述[J]. 系統(tǒng)仿真學(xué)報(bào), 2014, 26(3):489-496.

[7] Eldawy A, Mokbel M F. SpatialHadoop: A MapReduce framework for spatial data[C]// IEEE, International Conference on Data Engineering. IEEE, 2015:1352-1363.

[8] 陸娟, 湯國(guó)安, 張宏,等. 犯罪熱點(diǎn)時(shí)空分布研究方法綜述[J]. 地理科學(xué)進(jìn)展, 2012, 31(4):29-35.

ANEFFICIENTHOTSPOTSDETECTIONALGORITHMOFVESSELSACTIVITY

Yang Le Bao Lei Luo Bing
(SchoolofElectronicEngineering,NavalUniversityofEngineering,Wuhan430033,Hubei,China)

Traditional data processing tools were inefficient and not sensitive to spatial characteristics when processing traffic location big data of marine vessel. Aiming at the problem, the SpatialHadoop platform is introduced and a hotspots detection algorithm based on this platform is proposed. The algorithm combined the spatial index with MapReduce distributed processing framework which realized the method of hotspots detection based on regional statistics. In theory, the method could efficiently detect hotspots of vessels activities. Experiment was done on the real AIS data and the result indicated that the method had effective detection result and higher efficiency.

Position big data Hotspots detection SpatialHadoop Spatial index

2016-07-26。楊樂,碩士生,主研領(lǐng)域:時(shí)空數(shù)據(jù)挖掘。包磊,教授。羅兵,講師。

TP311

A

10.3969/j.issn.1000-386x.2017.08.053

猜你喜歡
熱點(diǎn)海域船舶
熱點(diǎn)
遺落海域
《船舶》2022 年度征訂啟事
船舶(2021年4期)2021-09-07 17:32:22
埕島海域海上獨(dú)立樁拆除方案探討
船舶!請(qǐng)加速
BOG壓縮機(jī)在小型LNG船舶上的應(yīng)用
熱點(diǎn)
車迷(2019年10期)2019-06-24 05:43:28
結(jié)合熱點(diǎn)做演講
快樂語文(2018年7期)2018-05-25 02:32:00
廣東省海域使用統(tǒng)計(jì)分析
船舶壓載水管理系統(tǒng)
民乐县| 墨脱县| 故城县| 社会| 葵青区| 邻水| 穆棱市| 多伦县| 榆中县| 馆陶县| 安达市| 沂水县| 曲麻莱县| 方正县| 江山市| 恩平市| 新宁县| 栾川县| 东阿县| 梁山县| 池州市| 武夷山市| 衡阳县| 永泰县| 苏尼特左旗| 比如县| 西林县| 英山县| 建平县| 博客| 岱山县| 青铜峡市| 高唐县| 施甸县| 容城县| 内江市| 中超| 房产| 三穗县| 资源县| 公安县|