崔亞奇 徐平亮* 龔 誠 余舟川 張建廷 于洪波 董 凱
①(海軍航空大學(xué)信息融合研究所 煙臺 264001)
②(91001部隊(duì) 北京 100000)
③(91977部隊(duì) 北京 100000)
多源航跡關(guān)聯(lián)問題在雷達(dá)數(shù)據(jù)處理領(lǐng)域中普遍存在,其中也包含中斷航跡接續(xù)關(guān)聯(lián)問題,并且有著較長的研究歷史,是目標(biāo)跟蹤[1]、態(tài)勢感知[2]、信息融合[3]的前提和基礎(chǔ)。中斷航跡可以表述為:在對目標(biāo)進(jìn)行跟蹤的過程中,受目標(biāo)機(jī)動(dòng)、平臺機(jī)動(dòng)、長采樣間隔、低探測概率等多種因素影響,存在大量的航跡中斷現(xiàn)象,即目標(biāo)的當(dāng)前航跡突然消失,一段時(shí)間后又在臨近區(qū)域重新起始跟蹤一條新的航跡。多源航跡可以表述為:在對目標(biāo)進(jìn)行跟蹤的過程中,經(jīng)過不同傳感器的觀測,上報(bào)了對同一目標(biāo)的多個(gè)航跡,各個(gè)航跡包含不同的系統(tǒng)誤差和隨機(jī)誤差。對于這兩種航跡關(guān)聯(lián)問題,傳統(tǒng)方法需要預(yù)先假定目標(biāo)的運(yùn)動(dòng)模型,利用目標(biāo)的先驗(yàn)信息,采用統(tǒng)計(jì)估計(jì)理論對待關(guān)聯(lián)航跡進(jìn)行復(fù)雜計(jì)算完成關(guān)聯(lián)任務(wù)[4–8],存在假設(shè)不合理、先驗(yàn)信息難以獲取、門限無法確定等問題。
近年來,隨著人工智能和深度學(xué)習(xí)技術(shù)的快速發(fā)展,有學(xué)者提出采用基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)方法完成航跡關(guān)聯(lián)任務(wù),利用神經(jīng)網(wǎng)絡(luò)提取航跡的運(yùn)動(dòng)特征、中斷特征、多源誤差特征等信息,通過損失函數(shù)對高維空間中的航跡特征進(jìn)行約束,實(shí)現(xiàn)從航跡數(shù)據(jù)到關(guān)聯(lián)結(jié)果的映射[9–11]。與傳統(tǒng)方法相比,深度學(xué)習(xí)方法可以基于實(shí)測航跡數(shù)據(jù),自動(dòng)訓(xùn)練航跡關(guān)聯(lián)模型,有效避免了人工對模型的選取、目標(biāo)運(yùn)動(dòng)參數(shù)的設(shè)置、目標(biāo)先驗(yàn)信息的采集分析等大量調(diào)試操作,具有關(guān)聯(lián)速度快、關(guān)聯(lián)精度高、泛化能力強(qiáng)等優(yōu)點(diǎn)。
然而,采用深度學(xué)習(xí)方法實(shí)現(xiàn)航跡關(guān)聯(lián)任務(wù),其網(wǎng)絡(luò)訓(xùn)練必須依賴大量的航跡數(shù)據(jù)。以上研究均基于仿真數(shù)據(jù)或采集到的少量真實(shí)數(shù)據(jù),缺乏一個(gè)統(tǒng)一的、規(guī)范的、規(guī)模大的航跡關(guān)聯(lián)數(shù)據(jù)集。在深度學(xué)習(xí)發(fā)展較為成熟的領(lǐng)域,均有相關(guān)的高質(zhì)量數(shù)據(jù)集作為支撐,例如圖像分類中的ImageNet數(shù)據(jù)集[12]、目標(biāo)檢測和分割的PASCAL-VOC數(shù)據(jù)集[13]和COCO數(shù)據(jù)集[14]、遙感圖像分類的AID數(shù)據(jù)集[15]、遙感圖像檢索的RSICD數(shù)據(jù)集[16]、自動(dòng)駕駛的KITTI數(shù)據(jù)集[17]、各類醫(yī)學(xué)影像數(shù)據(jù)集[18–20],等等??梢哉f,在深度學(xué)習(xí)領(lǐng)域,數(shù)據(jù)逐漸達(dá)到了與模型和算法同等重要的程度,必須有統(tǒng)一的、規(guī)范的、規(guī)模大的高質(zhì)量數(shù)據(jù)集,才能為某一相關(guān)研究的發(fā)展提供基本保障。但是,航跡關(guān)聯(lián)數(shù)據(jù)集在國內(nèi)外的構(gòu)建還是一個(gè)空白,航跡關(guān)聯(lián)數(shù)據(jù)集的缺失成為制約基于數(shù)據(jù)驅(qū)動(dòng)的航跡關(guān)聯(lián)研究的主要因素。因此,構(gòu)建一個(gè)與航跡關(guān)聯(lián)任務(wù)相適應(yīng)的數(shù)據(jù)集對相關(guān)研究的發(fā)展具有重要意義。
考慮到智能關(guān)聯(lián)算法研究的迫切需求和多雷達(dá)協(xié)同觀測航跡數(shù)據(jù)獲取困難,針對航跡關(guān)聯(lián)數(shù)據(jù)集缺失問題,該文公開了多源航跡關(guān)聯(lián)數(shù)據(jù)集(Multisource Track Association Dataset, MTAD),其由全球自動(dòng)識別系統(tǒng)(Automatic Identification System, AIS)航跡數(shù)據(jù)經(jīng)柵格劃分、自動(dòng)中斷和噪聲添加處理步驟構(gòu)建。該數(shù)據(jù)集包括訓(xùn)練集和測試集兩大部分,共有航跡百萬余條,其中訓(xùn)練集包含5000個(gè)場景樣本,測試集包含1000個(gè)場景樣本,每一個(gè)場景樣本由幾個(gè)到幾百個(gè)數(shù)量不等的航跡構(gòu)成,涵蓋多種運(yùn)動(dòng)模式、多種目標(biāo)類型和長度不等的持續(xù)時(shí)間。同時(shí),進(jìn)一步對構(gòu)造的MTAD數(shù)據(jù)集進(jìn)行可視化分析,詳細(xì)研究了各個(gè)柵格內(nèi)航跡的特點(diǎn),證明了該數(shù)據(jù)集的豐富性、合理性和有效性。最后,作為參考,給出了關(guān)聯(lián)評價(jià)指標(biāo)和關(guān)聯(lián)基線結(jié)果。
船舶自動(dòng)識別系統(tǒng)是一種廣播式的艦載應(yīng)答系統(tǒng),該系統(tǒng)能夠使船舶在公用無線信道上向附近的船舶和岸上的監(jiān)測部門持續(xù)發(fā)送自身的身份、位置、航向、航速等數(shù)據(jù)[21]。AIS系統(tǒng)具有定位精度高、船舶編碼唯一、自控時(shí)分多址聯(lián)接(SOTDMA)、電子海圖等特點(diǎn),為艦船目標(biāo)識別[22,23]、艦船目標(biāo)跟蹤[24,25]、加強(qiáng)海事管理[26,27]等應(yīng)用提供了可靠技術(shù)保障,在軍用和民用領(lǐng)域均有廣泛應(yīng)用。由于其廣播式的數(shù)據(jù)發(fā)送特點(diǎn),與雷達(dá)航跡數(shù)據(jù)相比,AIS航跡數(shù)據(jù)具有分布廣泛、獲取難度低和時(shí)效性好的優(yōu)點(diǎn),因此這里采用全球AIS數(shù)據(jù),構(gòu)建多源航跡關(guān)聯(lián)數(shù)據(jù)集。
MTAD數(shù)據(jù)集采用的基礎(chǔ)AIS數(shù)據(jù)特征包括目標(biāo)的用戶識別碼(MMSI碼)、時(shí)間(UNIX時(shí)間戳,單位:s)、緯度(l/10000°,±90°,北為+,南為–)、經(jīng)度(1/10000°,±180°,東為+,西為–)、航速(單位:kn)、航向(單位:(°))。利用以上基礎(chǔ)特征通過添加中斷和多源誤差構(gòu)造MTAD數(shù)據(jù)集。
全球柵格是MTAD數(shù)據(jù)集構(gòu)建的基礎(chǔ),數(shù)據(jù)集中的所有場景均從全球柵格中抽取產(chǎn)生,因此柵格中的航跡質(zhì)量對于MTAD數(shù)據(jù)集的質(zhì)量至關(guān)重要。為了分析全球柵格航跡信息,在全球地圖中根據(jù)所有柵格中的MMSI數(shù)量繪制熱力圖,對MMSI數(shù)量進(jìn)行可視化,結(jié)果如圖1所示。從圖1可以看出,在重要港口地帶,MMSI數(shù)量較多,在遠(yuǎn)海區(qū)域,MMSI數(shù)量較少。各航跡在全球各個(gè)海域均廣泛分布,為數(shù)據(jù)集的構(gòu)建提供了豐富的航跡資源。
圖1 MMSI數(shù)量熱力圖
之后,進(jìn)一步分析MMSI數(shù)量的分布情況。以柵格內(nèi)MMSI數(shù)量為橫軸,柵格所占比例為縱軸,繪制柱狀圖,如圖2所示。從圖2(a)可以看出,全球絕大多數(shù)柵格中的MMSI數(shù)量在300個(gè)以下,但也存在一些柵格中的MMSI數(shù)量達(dá)到了2000個(gè)以上。為了更細(xì)致地分析MMSI數(shù)量在0~300個(gè)的柵格比例,將MMSI數(shù)量在0-300個(gè)的柵格重新繪制其柱狀圖,如從圖2(b)所示。圖2(b)可以看出,在MMSI在0~300個(gè)的各個(gè)分段均有柵格分布,全面的AIS航跡庫為稀疏場景、普通場景、密集場景的構(gòu)建提供了豐富的航跡資源。
圖2 MMSI數(shù)量分布柱狀圖
航跡關(guān)聯(lián)數(shù)據(jù)集包括多個(gè)關(guān)聯(lián)場景樣本,每個(gè)關(guān)聯(lián)樣本包括信源航跡CSV文件和關(guān)聯(lián)映射表CSV文件,信源航跡CSV文件包括兩個(gè)信源的多條航跡,兩個(gè)信源可設(shè)置為艦載雷達(dá)、機(jī)載雷達(dá)或岸基雷達(dá)等不同類型。
關(guān)聯(lián)樣本生成流程如圖3所示,包括參數(shù)設(shè)置、基于空間柵格的真值航跡抽取和信源航跡生成等3個(gè)步驟。
圖3 關(guān)聯(lián)樣本生成流程圖
參數(shù)設(shè)置包括場景設(shè)置、目標(biāo)設(shè)置和信源設(shè)置。
2.4.1 場景設(shè)置場景設(shè)置主要對柵格精度和場景中心經(jīng)緯度進(jìn)行設(shè)置。其中柵格精度α,用于全球柵格劃分,表示對全球經(jīng)緯度劃分的最小間隔;場景中心經(jīng)緯度W0,用于后續(xù)空間柵格的平移。
2.4.2 目標(biāo)設(shè)置
2.4.3 信源設(shè)置
信源設(shè)置主要對信源1和信源2的探測特性進(jìn)行設(shè)置。主要參數(shù)包括更新周期、目標(biāo)發(fā)現(xiàn)概率、航跡開始時(shí)間范圍、航跡結(jié)束時(shí)間范圍、最小持續(xù)時(shí)間、中斷頻率、中斷時(shí)間范圍、位置系統(tǒng)偏差、航跡質(zhì)量噪聲(高斯噪聲或瑞利噪聲)。
基于空間柵格的真值航跡抽取包括AIS基礎(chǔ)航跡庫構(gòu)建和真值航跡抽取兩個(gè)步驟。
2.5.1 AIS基礎(chǔ)航跡庫構(gòu)建
AIS基礎(chǔ)航跡庫的構(gòu)建步驟為:
(1)從AIS數(shù)據(jù)文件中,按照MMSI號對單個(gè)目標(biāo)航跡進(jìn)行抽取,存為CSV文件,文件名為MMSI號。
(2)對單個(gè)目標(biāo)航跡進(jìn)行預(yù)處理,包括拆分長時(shí)間未更新航跡,刪除靜止、速度過低航跡,刪除采樣點(diǎn)跳變航跡,刪除過短航跡。
(a)拆分長時(shí)間未更新航跡。航跡的更新時(shí)間每大于600 s就將航跡截?cái)嘁淮危敝梁桔E結(jié)束。具體實(shí)施步驟為:
①設(shè)置初始索引I Ds=0 , 終止索引I De=0;
②遍歷航跡中的每個(gè)采樣點(diǎn),計(jì)算后一采樣點(diǎn)與前一采樣點(diǎn)之間的時(shí)間差?T=Te?Ts, 并令I(lǐng)De等于后一采樣點(diǎn)對應(yīng)的索引;
③如果前后兩個(gè)采樣點(diǎn)的時(shí)間差 ?T>600 s,保存[ IDs,IDe] 之 間的航跡,并設(shè)置I Ds=IDe+1;
④重復(fù)①—③,直到航跡結(jié)束,并保存[IDs,IDe]之間的航跡。
(b)刪除靜止、速度過低航跡。對(a)中保存的航跡進(jìn)行處理,若平均航速小于等于1,且經(jīng)度最大值減經(jīng)度最小值小于等于0.5,且緯度最大值減緯度最小值小于等于0.5,該航跡不保存。約束條件如式(3)所示。
(c)刪除采樣點(diǎn)跳變航跡。對(b)中保存的航跡進(jìn)行處理,遍歷航跡中的每個(gè)采樣點(diǎn),若前后兩點(diǎn)之間經(jīng)度差的絕對值大于0.5,或緯度差的絕對值大于0.5,該航跡不保存。約束條件如式(4)所示。
其中,∨表示或操作。
(d)刪除過短航跡。對(c)中保存的航跡進(jìn)行處理,只保存航跡采樣點(diǎn)數(shù)大于30且持續(xù)時(shí)間大于300 s的航跡,分別命名為MMSI_0, MMSI_1, ···,約束條件如式(5)所示。
(4)統(tǒng)計(jì)每個(gè)柵格內(nèi)的MMSI號、航跡數(shù)量、目標(biāo)數(shù)量、航向方差均值、航速方差均值、目標(biāo)密集程度、目標(biāo)機(jī)動(dòng)程度,并以CSV格式,存為AIS空間編碼索引文件,每個(gè)空間柵格一行,具體格式為{空間柵格緯度索引、空間柵格經(jīng)度索引、航跡數(shù)量、目標(biāo)數(shù)量、航向方差均值、航速方差均值、目標(biāo)密集程度、目標(biāo)機(jī)動(dòng)程度、MMSI號序列}。
2.5.2 真值航跡抽取
真值航跡抽取包括兩種模式,一是隨機(jī)抽取,二是條件抽取。其中隨機(jī)抽取為對空間編碼進(jìn)行隨機(jī)抽取,然后根據(jù)AIS空間編碼索引文件,得到柵格內(nèi)所有的MMSI號,然后得到真值航跡。
條件抽取為根據(jù)設(shè)定的目標(biāo)密集程度和目標(biāo)機(jī)動(dòng)程度,選取與設(shè)定密集程度和機(jī)動(dòng)程度最相似的空間柵格,或者從多個(gè)相似的空間柵格中進(jìn)行抽取。
(1)首先以抽取的柵格內(nèi)AIS航跡Z0為真值,根據(jù)場景中心經(jīng)緯度W0和信源參數(shù),依次生成信源1和信源2兩個(gè)信源航跡,具體步驟如下:
(a)根據(jù)場景中心經(jīng)緯度W0,對柵格內(nèi)AIS航
(d)目標(biāo)發(fā)現(xiàn)概率處理。根據(jù)設(shè)置的目標(biāo)發(fā)現(xiàn)概率(可設(shè)置為0.8或0.9),對柵格內(nèi)全部AIS航跡進(jìn)行隨機(jī)抽取,得到信源的探測航跡索引I1。如果抽取后信源的航跡個(gè)數(shù)為0,則重新抽取。
(e)航跡插值處理。根據(jù)柵格內(nèi)AIS真值航跡Z0和信源的探測航跡索引I1,對索引內(nèi)的每條航跡,除第1個(gè)時(shí)間點(diǎn)和最后1個(gè)時(shí)間點(diǎn)外,將航跡的持續(xù)時(shí)間以信源的更新周期Ts為斷點(diǎn)進(jìn)行分割,在每個(gè)時(shí)間點(diǎn)添加隨機(jī)誤差,然后進(jìn)行插值(插值方法可以選擇最近鄰插值、階梯插值、線性插值、B樣條曲線插值等),得到信源的探測航跡Z1。
從而實(shí)現(xiàn)將航跡中斷為nB段 。
(g)設(shè)置批號。記錄信源航跡與真值航跡的對應(yīng)關(guān)系,然后對信源的所有航跡進(jìn)行隨機(jī)編號,得到其航跡批號。
(h)添加系統(tǒng)誤差。根據(jù)設(shè)置的系統(tǒng)偏差(es1~es2,單位為(°)),采用均勻分布的形式,對每個(gè)航跡的經(jīng)度、緯度位置添加系統(tǒng)誤差。信源1不添加系統(tǒng)誤差,信源2的系統(tǒng)誤差以50%的概率服從U (?0.03,?0.01) 或U (0.01,0.03),單位為(°)。
(i)添加隨機(jī)誤差。根據(jù)設(shè)置的航跡質(zhì)量(1~15),按照高斯分布(或瑞利分布),對每個(gè)航跡經(jīng)度、緯度位置添加隨機(jī)誤差。其中,航跡質(zhì)量表示航跡的隨機(jī)誤差,分為1~15個(gè)級別,級別越高,誤差越小,每個(gè)級別對應(yīng)航跡隨機(jī)誤差的標(biāo)準(zhǔn)差,基于直角坐標(biāo)系計(jì)算,單位為m。由于該數(shù)據(jù)集是基于經(jīng)緯度添加誤差,而直角坐標(biāo)系和地理坐標(biāo)系之間的轉(zhuǎn)換是非線性的,因此需要對航跡質(zhì)量進(jìn)行變換,將原有的直角坐標(biāo)系標(biāo)準(zhǔn)差變?yōu)閳鼍爸行母浇慕?jīng)緯度標(biāo)準(zhǔn)差,再添加到數(shù)據(jù)當(dāng)中。
(j)根據(jù)每個(gè)航跡經(jīng)度和緯度,計(jì)算得到航速和航向,進(jìn)而得到每個(gè)航跡的信息Z3,包括{航跡批號、信源號(9001, 9002,隨機(jī)設(shè)置)、時(shí)間(一天內(nèi)的絕對秒)、經(jīng)度(°)、緯度(°)、航速(kn)、航向(°)}。
(k)同時(shí)生成關(guān)聯(lián)映射表,多個(gè){開始時(shí)間-結(jié)束時(shí)間-真值批號-信源號-航跡批號}列構(gòu)成的表。
(2)對兩信源的關(guān)聯(lián)映射表進(jìn)行混合,按開始時(shí)間進(jìn)行排序,設(shè)置新的航跡批號,重新編批,存為關(guān)聯(lián)映射表CSV文件。
(3)對兩信源的航跡信息進(jìn)行混合,并按時(shí)間進(jìn)行排序,根據(jù)關(guān)聯(lián)映射表中,重新編批,存為信源航跡CSV文件。
綜上,在生成信源航跡時(shí)所需的參數(shù)有信源1的更新周期Ts1、 信源2的更新周期Ts2、場景中心W0、 目標(biāo)發(fā)現(xiàn)概率Pd、航跡質(zhì)量Q,總結(jié)如表1所示。
表1 生成信源航跡時(shí)所需的參數(shù)表
將AIS航跡劃分到全球柵格中,是后續(xù)生成中斷航跡和多信源航跡的前提和基礎(chǔ)。由于數(shù)據(jù)集中的航跡均由柵格航跡抽取得到,所以柵格中航跡質(zhì)量的好壞程度將直接影響生成數(shù)據(jù)集的質(zhì)量。本節(jié)對劃分到全球柵格的AIS數(shù)據(jù)進(jìn)行可視化,包括MMSI數(shù)量可視化、目標(biāo)數(shù)量可視化、密集程度可視化、機(jī)動(dòng)程度可視化,分析柵格內(nèi)航跡的全面性和有效性。
3.1.1 目標(biāo)數(shù)量可視化
在2.5.1節(jié)中,由于對超過600 s的長時(shí)間未更新航跡進(jìn)行了截?cái)嗵幚?,?dǎo)致一條航跡分成了多個(gè)目標(biāo),因此目標(biāo)數(shù)量與MMSI數(shù)量并不相同,故有必要對目標(biāo)數(shù)量進(jìn)行可視化分析。在全球地圖中根據(jù)所有柵格中的目標(biāo)數(shù)量繪制熱力圖,對目標(biāo)數(shù)量進(jìn)行可視化,結(jié)果如圖4所示。從圖4可以看出,與MMSI數(shù)量可視化結(jié)果相似,在重要港口地帶,目標(biāo)數(shù)量較多,在遠(yuǎn)海區(qū)域,目標(biāo)數(shù)量較少。各航跡在全球各個(gè)海域均廣泛分布,為數(shù)據(jù)集的構(gòu)建提供了豐富的航跡資源。
圖4 目標(biāo)數(shù)量熱力圖
之后,進(jìn)一步分析目標(biāo)數(shù)量的分布情況。以柵格內(nèi)目標(biāo)數(shù)量為橫軸,柵格所占比例為縱軸,繪制柱狀圖,如圖5所示。從圖5可以看出,全球絕大多數(shù)柵格中的目標(biāo)數(shù)量在300個(gè)以下,但也存在一些柵格中的目標(biāo)數(shù)量達(dá)到了2000個(gè)以上,全面的AIS航跡庫為稀疏場景、普通場景、密集場景的構(gòu)建提供了豐富的航跡資源。
圖5 目標(biāo)數(shù)量分布柱狀圖
3.1.2 密集程度可視化
如式(1)所示,柵格的目標(biāo)密集程度反映了某一柵格內(nèi)的目標(biāo)數(shù)量的大小在總的柵格中的比重,其對數(shù)據(jù)集的構(gòu)建具有較高的重要性。在全球地圖中根據(jù)所有柵格中的目標(biāo)密集程度繪制熱力圖,對目標(biāo)密集程度進(jìn)行可視化,結(jié)果如圖6所示。從圖6可以看出,重要港口城市附近的目標(biāo)密集程度較高,遠(yuǎn)洋目標(biāo)的密集程度較低,因此在對算法進(jìn)行測試驗(yàn)證時(shí),可以根據(jù)對算法的使用場景需求,選擇密集柵格或稀疏柵格構(gòu)建測試場景。
圖6 目標(biāo)密集程度熱力圖
3.1.3 機(jī)動(dòng)程度可視化
如式(2)所示,柵格的目標(biāo)機(jī)動(dòng)程度反映了某一柵格內(nèi)的目標(biāo)航速和航向標(biāo)準(zhǔn)差的大小在總的柵格中的比重,其對數(shù)據(jù)集的構(gòu)建具有較高的重要性。在全球地圖中根據(jù)所有柵格中的目標(biāo)機(jī)動(dòng)程度繪制熱力圖,對目標(biāo)機(jī)動(dòng)程度進(jìn)行可視化,結(jié)果如圖7所示。
從圖7可以看出,復(fù)雜航道和航道轉(zhuǎn)彎處的目標(biāo)機(jī)動(dòng)程度較大(例如圖中的重要港口城市附近),航道的直行區(qū)域目標(biāo)機(jī)動(dòng)程度較小(例如圖中的遠(yuǎn)海區(qū)域),能夠滿足對于較大機(jī)動(dòng)目標(biāo)場景的構(gòu)建需求。
圖7 目標(biāo)機(jī)動(dòng)程度熱力圖
之后,進(jìn)一步分析目標(biāo)機(jī)動(dòng)程度的分布情況。以柵格內(nèi)目標(biāo)機(jī)動(dòng)程度為橫軸,柵格所占比例為縱軸,繪制柱狀圖,如圖8所示。從圖8可以看出,有96%以上的目標(biāo)其機(jī)動(dòng)程度在0.5以下,表明大多數(shù)海面目標(biāo)沒有進(jìn)行特大機(jī)動(dòng)運(yùn)動(dòng)。運(yùn)動(dòng)機(jī)動(dòng)程度在0至0.7均有目標(biāo)分布,為不同的場景構(gòu)建提供了充足的數(shù)據(jù)保證。
圖8 目標(biāo)機(jī)動(dòng)程度分布柱狀圖
為了說明數(shù)據(jù)的豐富性、合理性、有效性,本節(jié)從數(shù)據(jù)集中抽取一組典型的航跡數(shù)據(jù)進(jìn)行展示,給出其經(jīng)緯度的可視化結(jié)果,同時(shí)還有其時(shí)間-緯度圖像和時(shí)間-經(jīng)度圖像,用來說明“航跡共存時(shí)間處理”的有效性。典型場景如圖9所示,從上至下依次為航跡圖像、時(shí)間-緯度圖像、時(shí)間-經(jīng)度圖像,其中紅色航跡為信源1觀測到的航跡,信源號為9001;藍(lán)色航跡為信源2觀測到的航跡,信源號為9002。
從圖9可以看出:
(1)整體上,航跡運(yùn)動(dòng)類型豐富,包括各種機(jī)動(dòng)狀態(tài)以及各種密度場景,沒有靜止航跡、速度低航跡、過短航跡、跳變航跡。所有場景中心經(jīng)緯度均為(20°, 30°),符合預(yù)期設(shè)置要求。比較時(shí)間-緯度圖像和時(shí)間-經(jīng)度圖像可知,每個(gè)場景中均存在同時(shí)空航跡交叉現(xiàn)象,與實(shí)際情況相符,證明了“航跡共存時(shí)間處理”的有效性。
(2)中斷航跡方面,每個(gè)場景中均至少存在一條中斷的航跡,且兩個(gè)信源之間航跡的中斷位置、中斷時(shí)刻、中斷間隔、中斷目標(biāo)數(shù)量不一致,證明了航跡中斷設(shè)置的合理性,符合實(shí)際要求。
(3)多源航跡方面,比較圖9中9001信源(紅色)和9002信源(藍(lán)色)的航跡,可以發(fā)現(xiàn)存在明顯的多源觀測現(xiàn)象。由于設(shè)置了目標(biāo)發(fā)現(xiàn)概率,所以兩個(gè)信源觀測到的航跡數(shù)量不一致,符合實(shí)際要求。兩信源觀測得到的航跡起始點(diǎn)和終止點(diǎn)不一致證明了“航跡起始與終結(jié)時(shí)刻處理”的有效性。
圖9 典型場景展示
為了明確關(guān)聯(lián)的評價(jià)標(biāo)準(zhǔn)并為研究人員提供對比參考的依據(jù),本節(jié)提供一種關(guān)聯(lián)評價(jià)標(biāo)準(zhǔn)并在該標(biāo)準(zhǔn)下給出數(shù)據(jù)集訓(xùn)練場景和測試場景的基線結(jié)果。
首先,對關(guān)聯(lián)指標(biāo)中需要的重要變量進(jìn)行定義。
定義1 實(shí)際應(yīng)能關(guān)聯(lián)對AP
實(shí)際應(yīng)能關(guān)聯(lián)對 AP 定義為根據(jù)關(guān)聯(lián)映射表,存在關(guān)聯(lián)關(guān)系,且滿足以下條件的關(guān)聯(lián)對:對于中斷關(guān)聯(lián),兩條航跡的中斷時(shí)間間隔小于20 min,兩條航跡各自持續(xù)時(shí)間大于2 min;對于多源關(guān)聯(lián),兩條航跡段的相交時(shí)間大于2 min。
定義2 實(shí)際應(yīng)能關(guān)聯(lián)對集合TAP
實(shí)際應(yīng)能關(guān)聯(lián)對集合TAP定義為由場景中所有實(shí)際應(yīng)能關(guān)聯(lián)對 AP構(gòu)成的集合。
定義3 關(guān)聯(lián)對輸出集合OAP
關(guān)聯(lián)對輸出集合OAP定義為由航跡關(guān)聯(lián)算法輸出的航跡關(guān)聯(lián)對構(gòu)成的集合,包括中斷航跡關(guān)聯(lián)和多源航跡關(guān)聯(lián)對。
定義4 關(guān)聯(lián)對集合的模
關(guān)聯(lián)對集合的模定義為該關(guān)聯(lián)對集合中的關(guān)聯(lián)對的個(gè)數(shù),用“|?|”表示。
關(guān)聯(lián)指標(biāo)包括關(guān)聯(lián)正確率和關(guān)聯(lián)錯(cuò)誤率,在計(jì)算過程中同時(shí)考慮中斷航跡關(guān)聯(lián)和多源航跡關(guān)聯(lián),兩個(gè)指標(biāo)可以根據(jù)定義的重要變量按照如下公式進(jìn)行計(jì)算。
定義5 關(guān)聯(lián)正確率PCA
關(guān)聯(lián)正確率PCA定義為關(guān)聯(lián)對輸出集合OAP中屬于實(shí)際應(yīng)能關(guān)聯(lián)對的個(gè)數(shù)與實(shí)際應(yīng)能關(guān)聯(lián)對集合TAP中關(guān)聯(lián)對的個(gè)數(shù)之間的比值。
定義6 關(guān)聯(lián)錯(cuò)誤率PFA
根據(jù)4.1節(jié)定義的關(guān)聯(lián)評價(jià)指標(biāo),本節(jié)給出了基于最近鄰距離的航跡關(guān)聯(lián)算法的關(guān)聯(lián)基線結(jié)果。
4.2.1 算法描述
基于最近鄰距離的航跡關(guān)聯(lián)算法通過計(jì)算并比較不同航跡之間的距離,選擇最近鄰(距離最小)的航跡對作為關(guān)聯(lián)結(jié)果,其關(guān)聯(lián)步驟如下:
(1)針對多源航跡關(guān)聯(lián)
步驟1:初始化距離矩陣D=(di,j)N1×N2和關(guān)
其中,L為參與計(jì)算的航跡點(diǎn)數(shù),D為參考屬性個(gè)數(shù),xdi(l)表 示信源1的第i個(gè) 航跡的第l個(gè)采樣點(diǎn)的第d維屬性,xdj(l)表 示信源2的第i個(gè) 航跡的第l個(gè)采樣點(diǎn)的第d維屬性。
步驟3:選擇距離矩陣D中的最小元素,將關(guān)聯(lián)矩陣A中對應(yīng)位置元素設(shè)為1;
步驟4:將距離矩陣D中最小元素對應(yīng)的行和列的所有元素設(shè)置為正無窮;
步驟5:重復(fù)步驟3和步驟4,直到距離矩陣D中的所有元素均為正無窮;
步驟6:根據(jù)關(guān)聯(lián)矩陣進(jìn)行關(guān)聯(lián)判決,遍歷關(guān)聯(lián)矩陣中的所有元素,若該元素值為1,即ai,j=1,則信源1的第i個(gè)元素和信源2的第j個(gè)元素關(guān)聯(lián),否則,不關(guān)聯(lián)。
(2)針對中斷航跡關(guān)聯(lián)
步驟1:初始化距離矩陣D=(di,j)N×N和關(guān)聯(lián)矩陣A=(ai,j)N×N,距離矩陣內(nèi)元素為正無窮,關(guān)聯(lián)矩陣內(nèi)元素為0,其中N表示待關(guān)聯(lián)信源觀測到的航跡個(gè)數(shù);
步驟2:遍歷待關(guān)聯(lián)信源的所有航跡,設(shè)當(dāng)前航跡索引為i,將其設(shè)為老航跡,再遍歷待關(guān)聯(lián)信源的所有航跡,設(shè)當(dāng)前航跡索引為j,將其設(shè)為新航跡,若新航跡的開始時(shí)間大于老航跡的結(jié)束時(shí)間且新、老航跡索引不相同,則計(jì)算航跡i和 航跡j之間所有參考屬性的歐氏距離的平方,作為距離矩陣的第i行 第j列元素;
步驟3:選擇距離矩陣D中的最小元素,將關(guān)聯(lián)矩陣A中對應(yīng)位置元素設(shè)為1;
步驟4:將距離矩陣D中最小元素對應(yīng)的行和列的所有元素設(shè)置為正無窮;
步驟5:重復(fù)步驟3和步驟4,直到距離矩陣D中的所有元素均為正無窮;
步驟6:根據(jù)關(guān)聯(lián)矩陣進(jìn)行關(guān)聯(lián)判決,遍歷關(guān)聯(lián)矩陣中的所有元素,若該元素值為1,即ai,j=1,則待關(guān)聯(lián)信源的第i個(gè)老航跡和第j個(gè)新航跡關(guān)聯(lián),否則,不關(guān)聯(lián)。
根據(jù)基于最近鄰距離的航跡關(guān)聯(lián)算法可以看出,多源關(guān)聯(lián)和中斷關(guān)聯(lián)的核心都是比較航跡之間的距離,選出最近鄰航跡對作為關(guān)聯(lián)結(jié)果。其區(qū)別在于多源關(guān)聯(lián)的距離計(jì)算考慮的是不同源之間的航跡,而中斷關(guān)聯(lián)的距離計(jì)算考慮的是同源航跡。
4.2.2 關(guān)聯(lián)結(jié)果
為了便于研究人員的對比和參考,將多源關(guān)聯(lián)和中斷關(guān)聯(lián)的基線關(guān)聯(lián)結(jié)果分開表述,多源關(guān)聯(lián)基線結(jié)果如表2所示,中斷關(guān)聯(lián)基線結(jié)果如表3所示。表中的關(guān)聯(lián)正確率和關(guān)聯(lián)錯(cuò)誤率均為各類數(shù)據(jù)集中所有場景的平均值。
表2 多源關(guān)聯(lián)基線結(jié)果(%)
表3 中斷關(guān)聯(lián)基線結(jié)果(%)
從表2和表3可以看出,采用基于最近鄰距離的航跡關(guān)聯(lián)方法,對于多源關(guān)聯(lián)任務(wù)可以取得較好的關(guān)聯(lián)結(jié)果,但對于中斷關(guān)聯(lián)任務(wù),由于中斷前后新老航跡位置相差較大,且與周圍臨近航跡相互干擾,關(guān)聯(lián)效果急劇下降。并且,基于最近鄰距離的航跡關(guān)聯(lián)方法在兩種關(guān)聯(lián)任務(wù)中都具有較高的關(guān)聯(lián)錯(cuò)誤率,表明其關(guān)聯(lián)結(jié)果可靠性較低,亟需對關(guān)聯(lián)算法進(jìn)行進(jìn)一步研究和改善。
目前,在航跡關(guān)聯(lián)領(lǐng)域由于缺乏一個(gè)統(tǒng)一的、規(guī)范的、規(guī)模大的航跡關(guān)聯(lián)數(shù)據(jù)集,導(dǎo)致基于深度學(xué)習(xí)數(shù)據(jù)驅(qū)動(dòng)的航跡關(guān)聯(lián)研究受到制約,難以滿足模型訓(xùn)練和實(shí)驗(yàn)對比的需求??紤]到智能關(guān)聯(lián)算法研究的迫切需求和多雷達(dá)協(xié)同觀測航跡數(shù)據(jù)獲取困難,針對航跡關(guān)聯(lián)數(shù)據(jù)集缺失問題,該文公開了多源航跡關(guān)聯(lián)數(shù)據(jù)集(MTAD),其由全球AIS航跡數(shù)據(jù)經(jīng)柵格劃分、自動(dòng)中斷和噪聲添加處理步驟構(gòu)建。該數(shù)據(jù)集包括訓(xùn)練集和測試集兩大部分,共有航跡百萬余條,其中訓(xùn)練集包含5000個(gè)場景樣本,測試集包含1000個(gè)場景樣本,每一個(gè)場景樣本由幾個(gè)到幾百個(gè)數(shù)量不等的航跡構(gòu)成,涵蓋多種運(yùn)動(dòng)模式、多種目標(biāo)類型和長度不等的持續(xù)時(shí)間。同時(shí),進(jìn)一步對構(gòu)造的MTAD數(shù)據(jù)集進(jìn)行可視化分析,詳細(xì)研究了各個(gè)柵格內(nèi)航跡的特點(diǎn),證明了該數(shù)據(jù)集的豐富性、合理性和有效性。最后,作為參考,給出了關(guān)聯(lián)評價(jià)指標(biāo)和關(guān)聯(lián)基線結(jié)果。