陳曉峰,劉 興,高元博,鄭亞波
(1.海軍大連艦艇學(xué)院,遼寧 大連 116018;2.海軍蚌埠士官學(xué)校,安徽 蚌埠 233012)
基于數(shù)據(jù)挖掘的海戰(zhàn)場(chǎng)態(tài)勢(shì)可視化平臺(tái)構(gòu)建
陳曉峰1,劉 興2,高元博1,鄭亞波1
(1.海軍大連艦艇學(xué)院,遼寧 大連 116018;2.海軍蚌埠士官學(xué)校,安徽 蚌埠 233012)
可視化和數(shù)據(jù)挖掘是進(jìn)行海戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估、實(shí)現(xiàn)戰(zhàn)場(chǎng)可視化的兩項(xiàng)關(guān)鍵技術(shù)。海戰(zhàn)場(chǎng)態(tài)勢(shì)可視化能提高指揮員的戰(zhàn)場(chǎng)態(tài)勢(shì)感知能力,有效輔助指揮員進(jìn)行當(dāng)前態(tài)勢(shì)評(píng)估和未來態(tài)勢(shì)預(yù)測(cè)。而數(shù)據(jù)挖掘技術(shù)是對(duì)海量戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)進(jìn)行知識(shí)發(fā)現(xiàn)的有效工具,基于數(shù)據(jù)挖掘技術(shù)從頂層構(gòu)建了海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化挖掘平臺(tái),并對(duì)其中的各子模塊進(jìn)行了具體研究。
多戰(zhàn)場(chǎng)態(tài)勢(shì),數(shù)據(jù)挖掘,可視化,數(shù)據(jù)挖掘平臺(tái)
戰(zhàn)場(chǎng)態(tài)勢(shì)可視化能提高指揮員的戰(zhàn)場(chǎng)態(tài)勢(shì)感知能力,有效輔助指揮員進(jìn)行當(dāng)前態(tài)勢(shì)評(píng)估和未來態(tài)勢(shì)預(yù)測(cè)[1]。而面對(duì)充斥戰(zhàn)場(chǎng)的海量態(tài)勢(shì)信息,如何處理和有效利用這些數(shù)據(jù)變得非常棘手。
數(shù)據(jù)挖掘技術(shù)的使用可以幫助指揮員快速地獲取相關(guān)信息,及時(shí)地評(píng)估掌握的信息,科學(xué)地預(yù)測(cè)戰(zhàn)場(chǎng)態(tài)勢(shì)[2]??梢暬夹g(shù)方面,從1987年美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)第一次對(duì)科學(xué)計(jì)算可視化作系統(tǒng)闡述[3],到1995年10月,美軍訓(xùn)練和條令司令部(TRADOC)發(fā)表《TRADOC Pamphlet 525-70》手冊(cè)對(duì)戰(zhàn)場(chǎng)可視化進(jìn)行定義[4],再到2001年5月,北約研究和技術(shù)組織(RTO)發(fā)表題為《海量軍用數(shù)據(jù)可視化》的技術(shù)報(bào)告[5],可視化技術(shù)在軍事領(lǐng)域,尤其是戰(zhàn)場(chǎng)態(tài)勢(shì)可視化方面得到廣泛的應(yīng)用??梢姡瑢?shù)據(jù)挖掘和可視化技術(shù)結(jié)合構(gòu)建海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘平臺(tái)具有重要的軍事應(yīng)用價(jià)值。在數(shù)據(jù)可視化的步驟上,有的將其劃分為7個(gè)階段[6],這里則根據(jù)海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)特點(diǎn)和可視化的功能需求,將海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化分為數(shù)據(jù)源獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘和可視化顯示幾個(gè)步驟,下面在對(duì)各步驟進(jìn)行分別研究的基礎(chǔ)上,最終構(gòu)建海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化挖掘平臺(tái)。
這里將海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)分為靜態(tài)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)和數(shù)據(jù)的數(shù)據(jù)4種,獲取的一般過程為明確數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)校核驗(yàn)證和數(shù)據(jù)更新4個(gè)步驟,對(duì)不同數(shù)據(jù)獲取過程中每個(gè)步驟的具體任務(wù)和注意事項(xiàng)在這里不作贅述。
圖1 海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)獲取過程
包括數(shù)據(jù)獲取后的預(yù)處理,以及預(yù)處理后進(jìn)一步的數(shù)據(jù)挖掘。
2.1 數(shù)據(jù)預(yù)處理流程
圖2 海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)預(yù)處理流程
數(shù)據(jù)預(yù)處理的目的是生成供數(shù)據(jù)挖掘核心算法使用的目標(biāo)數(shù)據(jù),為后續(xù)進(jìn)行的數(shù)據(jù)挖掘提供高可靠性、數(shù)據(jù)集規(guī)模適當(dāng)、具有一定抽象程度的數(shù)據(jù),以提高數(shù)據(jù)挖掘效率。根據(jù)所要達(dá)到的目的,數(shù)據(jù)預(yù)處理的主要任務(wù)主要有以下幾個(gè)方面:
數(shù)據(jù)凈化指識(shí)別糾正或消除數(shù)據(jù)間的相互沖突、不完整的數(shù)據(jù)集、以及組合數(shù)據(jù)庫共有的不兼容性;一致性處理指在數(shù)據(jù)檢查的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行一致性處理,以規(guī)范目標(biāo)數(shù)據(jù)和數(shù)據(jù)集;抽象描述指針對(duì)所要解決的軍事問題對(duì)數(shù)據(jù)集進(jìn)行結(jié)構(gòu)和語義上的抽象,并將數(shù)據(jù)從低層概念集合映射到它們所對(duì)應(yīng)的更高一層;縮減數(shù)據(jù)集規(guī)模指通過數(shù)據(jù)抽樣等技術(shù)得到較原始數(shù)據(jù)小得多的數(shù)據(jù)樣本,將初始挖掘付諸于小的數(shù)據(jù)集上執(zhí)行,然后擴(kuò)展到更大的數(shù)據(jù)集,從而降低挖掘成本。
2.2 數(shù)據(jù)挖掘?qū)哟谓Y(jié)構(gòu)
圖3 海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘的層次結(jié)構(gòu)
海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘的層次結(jié)構(gòu)由算法層、邏輯層和應(yīng)用層組成:
(1)算法層是海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘的基礎(chǔ),包括了關(guān)聯(lián)規(guī)則、序列模式分析、分類和聚類分析、決策樹、神經(jīng)網(wǎng)絡(luò)和遺傳算法等一些數(shù)據(jù)挖掘的基礎(chǔ)算法。算法層是構(gòu)建海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘模型的基石,是海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化的核心技術(shù)支點(diǎn)之一。具體選用哪一種算法或組合選用幾種算法,要根據(jù)所要解決的具體軍事問題而定。
(2)邏輯層封裝了有關(guān)軍事應(yīng)用的特定規(guī)則和算法,是連接軍事應(yīng)用和挖掘算法的紐帶,它們和相關(guān)的數(shù)據(jù)挖掘算法相結(jié)合可以求解特定的軍事問題,如戰(zhàn)役力量基礎(chǔ)能力分析、作戰(zhàn)編組和兵力配置優(yōu)化、態(tài)勢(shì)估計(jì)、威脅判斷等。針對(duì)具體問題需要綜合運(yùn)用多種軍事運(yùn)籌方法,構(gòu)建各種軍事數(shù)學(xué)模型加以分析和計(jì)算。
(3)應(yīng)用層幾乎涵蓋了海戰(zhàn)場(chǎng)態(tài)勢(shì)所關(guān)心問題的各個(gè)方面。它由戰(zhàn)場(chǎng)環(huán)境分析、戰(zhàn)役力量基礎(chǔ)能力分析、作戰(zhàn)編組和兵力配置優(yōu)化、約束關(guān)系分析、態(tài)勢(shì)評(píng)估、態(tài)勢(shì)預(yù)測(cè)等子域組成。應(yīng)用層也是海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化的主體,它充分利用數(shù)據(jù)挖掘算法層和邏輯層的計(jì)算結(jié)果和知識(shí)發(fā)現(xiàn)成果,實(shí)現(xiàn)數(shù)據(jù)可視化在較高層次的綜合展現(xiàn),達(dá)到輔助指揮員感知海戰(zhàn)場(chǎng)態(tài)勢(shì)的目的。
2.3 數(shù)據(jù)挖掘過程模型
海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘的過程模型如下頁圖4所示,該模型對(duì)于海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)的提取層次由“數(shù)據(jù)”到“信息”,再到“知識(shí)”,態(tài)勢(shì)數(shù)據(jù)的流程也是隨著數(shù)據(jù)提取層次的深入而流動(dòng)。其中,“數(shù)據(jù)”是指對(duì)數(shù)據(jù)的獲取和必要的整理,“信息”是對(duì)數(shù)據(jù)的處理和挖掘過程,從中發(fā)現(xiàn)隱藏在數(shù)據(jù)中的有用信息;“知識(shí)”是對(duì)信息的理解和解釋,這種理解和解釋要針對(duì)所要解決的軍事問題,進(jìn)而提煉出對(duì)于解決該問題有用的知識(shí)。
在獲取數(shù)據(jù)源并經(jīng)過數(shù)據(jù)預(yù)處理后,數(shù)據(jù)挖掘過程是重要的一步,在對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)進(jìn)行挖掘過程中,需要運(yùn)用與軍事應(yīng)用息息相關(guān)的邏輯層算法和算法層的挖掘算法,即需要采用邏輯層的“軍事運(yùn)用模型庫”和算法層的“數(shù)據(jù)挖掘算法庫”。經(jīng)邏輯層與算法層的組合應(yīng)用,挖掘出的結(jié)果經(jīng)模型發(fā)現(xiàn)后形成更新的模型庫;而對(duì)挖掘結(jié)果進(jìn)行知識(shí)抽取后形成知識(shí)庫,模型庫和知識(shí)庫又反過來影響邏輯層模型庫的優(yōu)化和算法層挖掘算法的選擇,這是一個(gè)循環(huán)優(yōu)化的過程。同時(shí),對(duì)挖掘結(jié)果進(jìn)行軍事層面的提煉可以得到結(jié)果知識(shí)庫,結(jié)果知識(shí)庫可供指揮和參謀人員參考使用和輔助戰(zhàn)場(chǎng)決策。
圖4 海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)挖掘過程模型
依據(jù)海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)的流動(dòng)過程和處理過程,可視化同數(shù)據(jù)挖掘的結(jié)合主要有3種方式,即初始數(shù)據(jù)可視化、數(shù)據(jù)挖掘過程可視化和數(shù)據(jù)挖掘結(jié)果可視化,其在數(shù)據(jù)處理流程中所處的位置如圖5所示。
圖5 可視化與數(shù)據(jù)挖掘的3種結(jié)合方式
圖6 可視化顯示模塊
對(duì)以上3種結(jié)合方式的顯示模塊進(jìn)行設(shè)計(jì)(如圖6所示),數(shù)據(jù)通過中間層與可視化界面映射,通過調(diào)用可視化圖形庫中的可視化方法在界面上進(jìn)行最終的可視化顯示。
(1)初始數(shù)據(jù)可視化設(shè)計(jì)。經(jīng)過預(yù)處理和過濾后的待挖掘數(shù)據(jù)可以直接進(jìn)行可視化,通過數(shù)據(jù)的顯示可以獲得有關(guān)數(shù)據(jù)的統(tǒng)計(jì)信息或知識(shí),并對(duì)是否有進(jìn)一步挖掘的意義和價(jià)值進(jìn)行判斷。同時(shí)使用者通過界面中交互控制功能進(jìn)行可視化數(shù)據(jù)的交互操作,根據(jù)需要來觀察、探索數(shù)據(jù)。
(2)數(shù)據(jù)挖掘過程可視化設(shè)計(jì)。主要是對(duì)其使用的算法進(jìn)行可視化。使用人員可以通過界面設(shè)置數(shù)據(jù)挖掘算法的初始條件,算法運(yùn)行過程中的中間結(jié)果通過數(shù)據(jù)接口提供給界面做可視化處理,整個(gè)過程是動(dòng)態(tài)往復(fù)的,使用人員通過對(duì)中間結(jié)果的評(píng)判進(jìn)行多次調(diào)整,以選擇滿意的數(shù)據(jù)項(xiàng)和參數(shù)值進(jìn)行數(shù)據(jù)挖掘。
(3)數(shù)據(jù)挖掘結(jié)果可視化設(shè)計(jì)。其目的是為更好地理解挖掘結(jié)果模式,做出有效的評(píng)估與反饋。由于挖掘結(jié)果的多樣性,需要用不同的可視化方法來展現(xiàn),這要求界面在設(shè)計(jì)之初具有可擴(kuò)展性。
以上3種結(jié)合方式在可視化時(shí),由于特點(diǎn)各不相同,其映射層和可視化圖形庫接口要分別進(jìn)行開發(fā)。
4.1 平臺(tái)的框架結(jié)構(gòu)
綜合以上對(duì)海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化整個(gè)實(shí)現(xiàn)過程的論述,進(jìn)行海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化挖掘平臺(tái)的設(shè)計(jì)構(gòu)建,其框架結(jié)構(gòu)主要由數(shù)據(jù)源模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)挖掘算法和邏輯層模型模塊、可視化顯示模塊和用戶接口模塊5部分組成,如下頁圖7所示。
4.2 平臺(tái)的主要功能
數(shù)據(jù)可視化挖掘平臺(tái)中各模塊所要實(shí)現(xiàn)的具體功能如下:
圖7 海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化挖掘平臺(tái)的框架結(jié)構(gòu)
(1)數(shù)據(jù)源模塊。主要是通過數(shù)據(jù)接口實(shí)現(xiàn)數(shù)據(jù)的讀取和存儲(chǔ)問題,包括從不同的數(shù)據(jù)庫中讀取數(shù)據(jù)作為分析用的數(shù)據(jù)源,在預(yù)處理和過濾后存儲(chǔ)待挖掘的數(shù)據(jù)集,存儲(chǔ)挖掘的模式集合等。
(2)數(shù)據(jù)預(yù)處理模塊。主要實(shí)現(xiàn)數(shù)據(jù)預(yù)處理和數(shù)據(jù)過濾功能。數(shù)據(jù)過濾使預(yù)處理后的數(shù)據(jù)變成干凈的、規(guī)范的、可供數(shù)據(jù)挖掘模型使用的待挖掘數(shù)據(jù)集。
(3)數(shù)據(jù)挖掘算法和邏輯層模型模塊。在前面已經(jīng)討論過算法層、邏輯層和應(yīng)用層三者的作用和相互關(guān)系,該模塊是對(duì)數(shù)據(jù)挖掘算法和邏輯層軍事運(yùn)用模型的集成。由于挖掘算法和軍事運(yùn)用模型種類眾多,因此,要使用插件的思想來組織該模塊中的算法和模型,針對(duì)具體態(tài)勢(shì)問題為使用人員提供不同的數(shù)據(jù)挖掘模型,以實(shí)現(xiàn)使用人員對(duì)數(shù)據(jù)源的挖掘處理需求。如關(guān)聯(lián)規(guī)則模型、序列模式分析模型、分類模型、聚類模型等,每個(gè)模型又對(duì)應(yīng)若干具體算法,使用人員可以自主地實(shí)現(xiàn)這些算法的插入、卸載、執(zhí)行等操作,這樣保證了平臺(tái)的可擴(kuò)展性。
(4)可視化顯示模塊。該模塊是對(duì)數(shù)據(jù)、挖掘過程和挖掘模式的表述,除了通過可視化圖形的形式表述外,還可以通過文字規(guī)則形式或其他形式表述(其設(shè)計(jì)如第4節(jié)中所述)。由于顯示方法的多樣性,該模塊也可以用插件的形式整合到該平臺(tái)上,便于可視化方法的擴(kuò)展。初始數(shù)據(jù)可視化是通過一些數(shù)據(jù)可視化方法分析探索數(shù)據(jù)中蘊(yùn)含的各種信息,例如平行坐標(biāo)法、基于圖標(biāo)技術(shù)、散點(diǎn)圖、散列圖等;數(shù)據(jù)挖掘過程可視化主要是對(duì)挖掘算法和步驟進(jìn)行可視化,讓使用人員能夠?qū)崿F(xiàn)對(duì)挖掘過程的監(jiān)測(cè)和調(diào)整;數(shù)據(jù)挖掘結(jié)果可視化主要是對(duì)所得挖掘結(jié)果進(jìn)行各種可視化的表述和展現(xiàn),例如單維/多維關(guān)聯(lián)規(guī)則的可視化、時(shí)序規(guī)則可視化、分類的可視化和聚類的可視化等;隨后,還可通過模式篩選、知識(shí)抽取和結(jié)果解釋等方法進(jìn)行進(jìn)一步提取,形成知識(shí)的表達(dá)供軍事人員直接使用。
(5)用戶接口模塊。該模塊是使用人員和平臺(tái)交互的接口,包括數(shù)據(jù)的分析定義、初始數(shù)據(jù)可視化、挖掘過程可視化監(jiān)控和挖掘結(jié)果可視化及模式篩選等子模塊,還可以根據(jù)需要進(jìn)行子模塊的擴(kuò)展。
將數(shù)據(jù)挖掘技術(shù)與可視化技術(shù)結(jié)合構(gòu)建海戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)可視化挖掘平臺(tái),能夠?yàn)橹笓]員提供直觀的可視化戰(zhàn)場(chǎng)態(tài)勢(shì)信息,提高戰(zhàn)場(chǎng)指揮員的信息處理能力和戰(zhàn)場(chǎng)態(tài)勢(shì)感知能力,輔助指揮員快速地做出指揮決策。而隨著可視化理念和可視化技術(shù)的發(fā)展,又出現(xiàn)了將問題和可視化數(shù)據(jù)通過時(shí)間堆疊、信息映射等投射在具體場(chǎng)景的方式[7],這也為數(shù)據(jù)的可視化實(shí)現(xiàn)提供了更多的解決方案和模式。
海戰(zhàn)場(chǎng)態(tài)勢(shì)可視化挖掘平臺(tái)設(shè)計(jì)是頂層設(shè)計(jì),除此之外,還有諸如數(shù)據(jù)庫設(shè)計(jì)和構(gòu)建、數(shù)據(jù)管理和數(shù)據(jù)安全、可視化顯示方式設(shè)計(jì)、以及可視化挖掘平臺(tái)的最終實(shí)現(xiàn)等問題需要進(jìn)一步研究。
[1]夏青,萬剛,武志強(qiáng).戰(zhàn)場(chǎng)可視化綜述[J].系統(tǒng)仿真學(xué)報(bào),2001,13(增刊):273-275.
[2]紀(jì)希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實(shí)例[M].北京:機(jī)械工業(yè)出版社,2009:190.
[3]Mielson G M.Visualization in Scientific Computing[M].IEEE Computer Socelity Press,1990.
[4]TRADOC Pamphlet 525-70.United States Army Training and Doctrine Command Fort Monroe[M].Virginia 23651-5000,1995.
[5]RTO.Visualisation of Massive Military Datasets[R].Human Factors,Application,and Technologies,Published 2001:10.
[6]Ben F著,張羽,譯.可視化數(shù)據(jù)[M].北京:電子工業(yè)出版社,2009:5-14.
[7]Steele J,IIiinsky N編,祝洪凱,李妹芳,譯.數(shù)據(jù)可視化之美[M].北京:機(jī)械工業(yè)出版社,2011:20-22.
Structure for Naval Battlefield Situation Visualization Platform Based on Data Mining
CHEN Xiao-feng1,LIU Xing2,GAO Yuan-bo1,ZHENG Ya-bo1
(1.Dalian Naval Academy,Dalin 116018,China;2.Bengbu Naval Petty Officer Academy,Bengbu 233012,China)
Visualization and data mining are critical technologies in naval battlefield situation assessment.The visualization of naval battlefield situation can enhance the commanders’ability of battlefield situation awareness,and assist them to assess the current situation and forecast the future situation effectively.The data mining technology is an impactful measure to make the knowledge discoveries in massive battlefield situation data.It constructs a data visualization mining platform of naval battlefield situation based on data mining technology on top-level,and then makes a concrete research about each submodule.
battlefield situation,data mining,visualization,data mining platform
TP391.9
A
1002-0640(2015)04-0144-04
2014-01-05
2014-03-07
陳曉峰(1983- ),男,河南虞城人,博士研究生,講師。研究方向:海軍作戰(zhàn)模擬、三維態(tài)勢(shì)數(shù)據(jù)可視化及軍事航海。