国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向戰(zhàn)場態(tài)勢數(shù)據(jù)智能分析的預(yù)處理方法

2018-03-30 02:26郭瑞賀筱媛
電子技術(shù)與軟件工程 2017年16期

郭瑞 賀筱媛

摘要

現(xiàn)代戰(zhàn)場信息大數(shù)據(jù)產(chǎn)生的戰(zhàn)爭迷霧對指揮員的戰(zhàn)場態(tài)勢認(rèn)知產(chǎn)生了強(qiáng)烈干擾,這些都會增加指揮員的指揮決策的難度,針對某計(jì)算機(jī)兵棋系統(tǒng)具有高度模擬真實(shí)戰(zhàn)場的能力,本文依據(jù)對兵棋模擬數(shù)據(jù)研究的基礎(chǔ)上,選擇其中偵查相關(guān)數(shù)據(jù)作為處理對象,通過數(shù)據(jù)的清洗與集成能更清晰的認(rèn)知戰(zhàn)場模擬態(tài)勢環(huán)境,為認(rèn)識真實(shí)戰(zhàn)場提供一種模擬數(shù)據(jù)預(yù)處理方法,為戰(zhàn)場態(tài)勢認(rèn)知的研究打下基礎(chǔ)。

【關(guān)鍵詞】模擬戰(zhàn)場 仿真數(shù)據(jù) 數(shù)據(jù)預(yù)處理

1 引言

在信息技術(shù)和戰(zhàn)爭實(shí)踐的推動(dòng)下,聯(lián)合作戰(zhàn)和體系對抗己成為了現(xiàn)代戰(zhàn)爭的基本特征,現(xiàn)代戰(zhàn)爭與以往不同,戰(zhàn)爭的節(jié)奏越來越快,產(chǎn)生的戰(zhàn)場信息呈現(xiàn)幾何級增長,所以戰(zhàn)場態(tài)勢認(rèn)知的研究勢在必行。

在一次對抗演習(xí)中,數(shù)據(jù)是兵棋演習(xí)的基礎(chǔ)支撐部分,一般意義上來講,數(shù)據(jù)可以對應(yīng)、有序、準(zhǔn)確的顯示出演習(xí)中的一切行動(dòng)和特征,貫穿于演習(xí)的整個(gè)過程。在演習(xí)數(shù)據(jù)分類中,運(yùn)行數(shù)據(jù)由系統(tǒng)自動(dòng)產(chǎn)生,基礎(chǔ)想定數(shù)據(jù)則是根據(jù)演習(xí)的環(huán)境和實(shí)體參數(shù)在演習(xí)前設(shè)定完成,存放于對應(yīng)的兵棋演習(xí)數(shù)據(jù)庫中,兵棋演習(xí)數(shù)據(jù)絕大部分是實(shí)時(shí)的、準(zhǔn)確的,但是也會有部分?jǐn)?shù)據(jù)存在內(nèi)容不完整、格式不一致、存放重復(fù)、信息缺失等情況,這些會對之后的數(shù)據(jù)處理和信息分析產(chǎn)生影響,甚至有可能對模型算法造成偏差,所以數(shù)據(jù)的預(yù)處理是非常必要的。

2 數(shù)據(jù)的預(yù)處理研究

2.1 選擇偵查預(yù)警數(shù)據(jù)為預(yù)處理目標(biāo)

根據(jù)演習(xí)模型的規(guī)則和所得出數(shù)據(jù)的參數(shù)特征要求,計(jì)劃先選擇出相應(yīng)有價(jià)值的數(shù)據(jù),對之進(jìn)行兩次清洗,然后再集成出我們需要的格式數(shù)據(jù)。一次演習(xí)可能會產(chǎn)生海量的數(shù)據(jù),而研究工作可能要針對多次不同的演習(xí)情況,如果對這些數(shù)據(jù)都要加以處理的話,工作量的巨大程度無法評估,而且我們采用的算法的精確度也會受到一定的影響,所以我們要抽取出其中一部分有代表性意義而且對實(shí)驗(yàn)有幫助的數(shù)據(jù)進(jìn)行處理,這里選用偵查預(yù)警的相關(guān)態(tài)勢數(shù)據(jù)進(jìn)行舉例說明整個(gè)數(shù)據(jù)預(yù)處理過程。

2.2 對所選偵查預(yù)警數(shù)據(jù)進(jìn)行首次清洗

現(xiàn)實(shí)偵查預(yù)警任務(wù)中發(fā)生的一些突發(fā)問題,會產(chǎn)生相關(guān)預(yù)想不到的情況,對應(yīng)演習(xí)數(shù)據(jù)有時(shí)難免會發(fā)生一些錯(cuò)誤,另外在數(shù)據(jù)傳輸和采集的過程中已經(jīng)規(guī)則設(shè)定偏差等原因,都會產(chǎn)生一些異常,這些不僅僅影響數(shù)據(jù)庫的準(zhǔn)確性,而且會對后續(xù)研究造成不利影響。

為了提升己選數(shù)據(jù)的精確性和研究價(jià)值,需要對一些突出的錯(cuò)誤進(jìn)行修正,這作為第一步的數(shù)據(jù)清洗,用來糾正偏差,重新錄入殘缺部分,清除偏離數(shù)據(jù),提高這些備用數(shù)據(jù)的可用性。具體清洗辦法如下所示。

2.2.1 異常檢測方法

通過模式識別、聚類、基于鄰近性、關(guān)聯(lián)規(guī)則等方式實(shí)現(xiàn)兵棋演習(xí)數(shù)據(jù)異常的自動(dòng)檢測,并能夠?qū)?shù)據(jù)異常進(jìn)行分類,為確定數(shù)據(jù)清洗方法提供依據(jù)。

2.2.2 缺失值填充方法

通過忽略元組、全局常量填充、數(shù)據(jù)的中心度量填充以及特殊情況下的人工填寫等方法填充缺失值。

2.2.3錯(cuò)誤糾正方法

對形式和內(nèi)容不符合要求的數(shù)據(jù)進(jìn)行糾正,對錯(cuò)誤難以改正且不重要的數(shù)據(jù)采取刪除整條記錄的方法處理。

2.2.4 冗余消除方法

采取近鄰排序法對重復(fù)記錄進(jìn)行識別、比較和排序,刪除低價(jià)值的重復(fù)冗余數(shù)據(jù)。

2.2.5 光滑噪聲方法

分箱、回歸、離群點(diǎn)分析等。

現(xiàn)今階段,數(shù)據(jù)的這一方面清洗技術(shù)已經(jīng)比較完備,本研究打算以成熟工具為基礎(chǔ),例如WEKA,作為一個(gè)公共數(shù)據(jù)挖掘平臺,它集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對數(shù)據(jù)進(jìn)行預(yù)處理,分類、回歸、聚類,針對WEKA中的AddID、Remove、AddCluster、NumericCleaner、StringToWordVector等數(shù)據(jù)過濾器的具體特點(diǎn),具體流程如下所示。

(1)檢測偏差,通過對輸入數(shù)據(jù)的檢驗(yàn),抽出其中出現(xiàn)錯(cuò)誤、重復(fù)、缺失的數(shù)據(jù),并對其進(jìn)行記錄,并對原始數(shù)據(jù)進(jìn)行分析,確定是否需要下一步的清洗。

(2)確定方法,根據(jù)原始數(shù)據(jù)的異常類型,選擇確定清洗方案。

(3)檢驗(yàn)方法,調(diào)用檢驗(yàn)?zāi)K檢驗(yàn)選取的清洗方法是否適用于處理該類問題,如果適用,則執(zhí)行下一步,如果不適用,則進(jìn)入手工清洗模式。

(4)執(zhí)行清洗,調(diào)用清洗模塊、標(biāo)記異常數(shù)據(jù)、填補(bǔ)缺失數(shù)據(jù)、修改錯(cuò)誤數(shù)據(jù)、刪除冗余數(shù)據(jù)。

(5)數(shù)據(jù)歸檔,調(diào)用加載模塊,將清洗后的目標(biāo)數(shù)據(jù)歸檔到目的數(shù)據(jù)庫中。

2.3 對研究數(shù)據(jù)的最后集成

在演習(xí)中,根據(jù)模型的規(guī)則以及數(shù)據(jù)本身的特點(diǎn),相應(yīng)的會把數(shù)據(jù)分類存放在幾個(gè)數(shù)據(jù)庫以及文件中,這樣對模型本身的結(jié)構(gòu)會有很好的適應(yīng)性,但對于研究數(shù)據(jù)來說,會帶來一定的困難,因?yàn)橛行?shù)據(jù)會根據(jù)不同要求而重復(fù)存在,如果集成過程是簡單的把數(shù)據(jù)庫疊加在一起的話,可能會帶來一些數(shù)據(jù)的冗余甚至自相矛盾,另外還可能會產(chǎn)生相同數(shù)據(jù)的命名不一樣的問題等。所以要把所需的數(shù)據(jù)集成為一個(gè)結(jié)構(gòu)相同、適合研究的集成文件中,這次集成是數(shù)據(jù)庫內(nèi)部的另一次清洗過程,這里用到的是數(shù)據(jù)倉庫的相關(guān)技術(shù)。

所以這里采用Oracle grid和Oracle database來組建所需要的數(shù)據(jù)倉庫,Oracle作為一款普遍使用的數(shù)據(jù)庫軟件,具有強(qiáng)大的數(shù)據(jù)處理能力。

由于所選數(shù)據(jù)的類型有對實(shí)體進(jìn)行描述性的靜態(tài)數(shù)據(jù),也有在演習(xí)中進(jìn)行交互的動(dòng)態(tài)數(shù)據(jù),而這些數(shù)據(jù)是相關(guān)的,所以這次集成是要從不同的來源根據(jù)相互之間的關(guān)系進(jìn)行挑選與合成。

3 結(jié)束語

本文的是在認(rèn)知戰(zhàn)場的目的下,從模擬戰(zhàn)場環(huán)境的兵棋數(shù)據(jù)入手,從數(shù)據(jù)來源到數(shù)據(jù)的結(jié)構(gòu)以及存儲與采集方式,初步研究對戰(zhàn)場實(shí)時(shí)偵查預(yù)警模擬數(shù)據(jù)的處理方法,對數(shù)據(jù)預(yù)處理是為了進(jìn)一步更好的研究戰(zhàn)場認(rèn)知打下基礎(chǔ),通過對數(shù)據(jù)的清洗和集成可以更清晰明了的呈現(xiàn)戰(zhàn)場態(tài)勢。

參考文獻(xiàn)

[1]胡曉峰,范嘉賓.兵棋對抗演習(xí)概論[M].北京:國防大學(xué)出版社,2012.

[2]徐寧.計(jì)算機(jī)兵棋的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D].東北大學(xué),2009.

[3]彭春光,趙鑫業(yè),劉寶宏等.兵棋推演技術(shù)綜述[J].系統(tǒng)仿真技術(shù)及其應(yīng)用,11:366-370.

[4]彭希文.兵棋-從實(shí)驗(yàn)室走向戰(zhàn)場[M].北京:國防大學(xué)出版社,2013.

[5]陶雪嬌.基于仿真大數(shù)據(jù)的指揮效能分析方法研究[D].國防大學(xué),2014.

[6]李曉菲.數(shù)據(jù)預(yù)處理算法的研究與應(yīng)用[D].西南交通大學(xué),2003.