劉新海 馬彥恒 侯建強
摘要:針對裝備認(rèn)知測試性智能決策問題,提出基于云和頻繁項集的認(rèn)知測試性診斷方案權(quán)衡優(yōu)化方法。研究裝備認(rèn)知測試性中信息流在定性域和定量域的描述和轉(zhuǎn)換方法,給出基于數(shù)據(jù)概要的中心云產(chǎn)生方法,實現(xiàn)事務(wù)數(shù)據(jù)清洗與篩選;研究基于頻繁項集和新增項集的數(shù)據(jù)挖掘方法,提出基于2一范數(shù)及協(xié)方差的數(shù)據(jù)相關(guān)性分析方法,實現(xiàn)基于云和頻繁項集的認(rèn)知測試性診斷方案權(quán)衡優(yōu)化的數(shù)據(jù)挖掘過程:得到基于存儲層一云層一應(yīng)用層一決策層的認(rèn)知測試性仿真診斷與權(quán)衡優(yōu)化模型,并對該模型進(jìn)行補充說明。該方案可為裝備認(rèn)知測試性診斷方案權(quán)衡優(yōu)化的智能化發(fā)展奠定基礎(chǔ)。
關(guān)鍵詞:認(rèn)知測試性;云;頻繁項集;數(shù)據(jù)挖掘;診斷方案
0引言
由于現(xiàn)代戰(zhàn)爭多維度、一體化、快節(jié)奏、即時精確打擊的特點以及無人化作戰(zhàn)的發(fā)展趨勢,對作戰(zhàn)裝備的故障診斷與維修要求已從注重隔離故障、降低裝備全壽命周期費用,轉(zhuǎn)變?yōu)閺娬{(diào)基于狀態(tài)的預(yù)測性視情維修,滿足裝備的任務(wù)可靠性需求。
裝備認(rèn)知測試性的發(fā)展?jié)M足了這一要求。在裝備測試性設(shè)計階段,它不但要求裝備能夠提供裝備自身狀態(tài)、歷史信息、環(huán)境信息以及后方支援系統(tǒng)等信息,還要能綜合作戰(zhàn)使用要求、測試性要求、可靠性要求、維修性要求、保障要素等相關(guān)因素,對裝備的狀態(tài)、故障發(fā)展趨勢進(jìn)行估計和判斷,并結(jié)合任務(wù)可靠性的需求,做出維修決策。
但是,裝備認(rèn)知測試性的發(fā)展尚不完善,仍處于起步階段。其中,診斷方案綜合權(quán)衡優(yōu)化是根據(jù)裝備其履歷信息、認(rèn)知測試性的指標(biāo)體系和特征量信息、裝備保障信息以及任務(wù)環(huán)境信息等多元數(shù)據(jù),分析裝備及作戰(zhàn)體系的當(dāng)前狀態(tài),對裝備的測試性、維修性、保障性及任務(wù)可靠性進(jìn)行預(yù)測,并給出任務(wù)決策方案的過程。本文針對認(rèn)知測試性的發(fā)展,結(jié)合云計算理論和頻繁項集數(shù)據(jù)挖掘技術(shù),研究裝備認(rèn)知測試性發(fā)展中診斷方案的綜合權(quán)衡優(yōu)化問題。
1云計算理論和頻繁項集數(shù)據(jù)挖掘
裝備認(rèn)知測試性診斷方案權(quán)衡優(yōu)化,包含大量的數(shù)據(jù)分析過程。這些數(shù)據(jù)不僅包含裝備本身的測試性數(shù)據(jù),還包括裝備級聯(lián)、作戰(zhàn)體系、作戰(zhàn)環(huán)境、歷史信息、同型裝備信息、相關(guān)裝備信息、裝備保障信息、維修履歷信息、保障資源調(diào)度信息以及歷史決策信息等多方面,決策所需處理的信息巨大,具有大量化、多樣化和個性強等典型的大數(shù)據(jù)特點。因此,可以采用大數(shù)據(jù)思維,利用大數(shù)據(jù)技術(shù),有效地開發(fā)這些數(shù)據(jù),從而實現(xiàn)對診斷方案的綜合權(quán)衡和優(yōu)化。
利用大數(shù)據(jù)分析的方法可以實現(xiàn)裝備認(rèn)知測試性中信息流的大數(shù)據(jù)特征融合、機器學(xué)習(xí)、數(shù)據(jù)降維和數(shù)據(jù)流挖掘等過程。其中基于云模型的大數(shù)據(jù)相關(guān)方法,能夠?qū)崿F(xiàn)認(rèn)知測試性信息流中定量數(shù)據(jù)和定性概念之間的轉(zhuǎn)換,便于診斷方案的定量化分析。
1.1云和云模型
云是對定性域?qū)崿F(xiàn)定量描述的一種方法,云模型是云的一種具體實現(xiàn)。設(shè)U為定量域集合,C為其相應(yīng)的定性域集合,如果Vx∈U都是對C的隨機實現(xiàn),且x對C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機數(shù)。
則x在U的分布稱為云,x稱為云滴。云理論通常用期望、熵和超熵3個特征量進(jìn)行定量特征分析舊。在云計算中,通常有存儲層、端點云、中心層和應(yīng)用層4部分結(jié)構(gòu)。其中,存儲層采用分布式存儲的方式,是大數(shù)據(jù)存儲的理想模型:端點云則是對原始數(shù)據(jù)定量描述,產(chǎn)生端點云圖;中心層則是對端點云進(jìn)行合并運算,用于產(chǎn)生、存儲中心云滴;應(yīng)用層則主要實現(xiàn)對大數(shù)據(jù)的挖掘分析。
本文主要利用云計算中的分布式存儲和定量化描述過程,實現(xiàn)裝備認(rèn)知測試性中對信息流的定量描述和分布式存儲。然后,結(jié)合數(shù)據(jù)挖掘方法對存儲數(shù)據(jù)進(jìn)行中心云分層,實現(xiàn)對數(shù)據(jù)的挖掘分析,最終形成診斷方案。
1.2頻繁項集數(shù)據(jù)挖掘
頻繁項集挖掘是實現(xiàn)數(shù)據(jù)挖掘的有效方法之一。首先收集并清洗原始數(shù)據(jù)集(事務(wù)數(shù)據(jù));然后統(tǒng)計各項集之間出現(xiàn)的次數(shù),一般可取出現(xiàn)頻率靠前的項集作為頻繁項集。為提高頻繁項集的求解效率,常采用Apriori算法進(jìn)行優(yōu)化。結(jié)合Apriori的頻繁項集挖掘算法包括事務(wù)數(shù)據(jù)清洗、1項集求解、k項集迭代求解的過程。
事務(wù)數(shù)據(jù)清洗是根據(jù)任務(wù)條件和實際環(huán)境,過濾不需要或者不符合要求的原始數(shù)據(jù)。
1項集求解是掃描每條事務(wù)數(shù)據(jù)記錄,分解出每一項,并計數(shù)1,最后統(tǒng)計每一項出現(xiàn)的總次數(shù),取靠前的項集作為頻繁1項集。
k項集的求解中,k項集的生成依賴于k-1項集。若k-1項集完全自連接,則生成的候選k項集組合龐大,且容易生成部分無效k項集,降低算法效率,常采用Apriori算法對候選k項集生成過程進(jìn)行優(yōu)化。Apriori算法優(yōu)化的基本原理如下:
1)頻繁項集的任何非空子集都是頻繁的。
2)非頻繁項集的任何超集都是非頻繁的。
生成k項集階段,包括了連接和剪枝過程,其中兩個k-1項集進(jìn)行連接的條件是:它們至少有k-2項相同。
本文通過頻繁項集篩選實現(xiàn)診斷方案的測試性、可靠性和維修保障方案與歷史決策之間的學(xué)習(xí)分析過程。
2診斷方案權(quán)衡優(yōu)化方法
基于大數(shù)據(jù)的診斷方案權(quán)衡優(yōu)化技術(shù)在功能層面主要包括4個方面:供裝備作戰(zhàn)使用頂層要求的決策層分析、供本級狀態(tài)監(jiān)測使用的測試層分析、滿足裝備順利完成任務(wù)的可靠性分析、維修保障方案的方案分析。
在診斷方案權(quán)衡優(yōu)化中,云計算和云模型是將影響決策方案的所有定性量用定量域描述,定量域元素就組成了用于診斷方案權(quán)衡優(yōu)化的云滴。當(dāng)前的任務(wù)需求可以產(chǎn)生數(shù)據(jù)概要,用于清洗云數(shù)據(jù)池,以便產(chǎn)生包含有效數(shù)據(jù)的中心云數(shù)據(jù)。通過頻繁項集和新增項集實現(xiàn)信息流數(shù)據(jù)的相關(guān)性分析,并給出合并分析相關(guān)方案。通過歷史決策方案及評價指標(biāo),構(gòu)造代價函數(shù)對合并分析結(jié)果進(jìn)行修正,然后給出決策分析的測試性分析結(jié)果、任務(wù)可靠性分析結(jié)果和裝備維修保障方案。最后,結(jié)合決策方案評價體系對決策方案進(jìn)行優(yōu)化和評價。
如圖1所示,為認(rèn)知測試性診斷方案權(quán)衡優(yōu)化圖。其云架構(gòu)從功能上分為4層:頂層為數(shù)據(jù)存儲層:第2層為中心云發(fā)生層,其核心任務(wù)在于由原始數(shù)據(jù)產(chǎn)生各云端的云,即端點云;第3層為應(yīng)用層,基于中心云滴和頻繁項集進(jìn)行大數(shù)據(jù)分析和挖掘任務(wù);第4層為決策層,用于產(chǎn)生診斷方案,并根據(jù)決策評價對決策進(jìn)行優(yōu)化校正。
診斷方案權(quán)衡優(yōu)化具體過程為:首先根據(jù)當(dāng)前任務(wù)需求生成數(shù)據(jù)概要,實現(xiàn)數(shù)據(jù)分類,用于決定數(shù)據(jù)池的容量:其次將數(shù)據(jù)概要發(fā)送至中心云端和數(shù)據(jù)池,利用云運算匹配操作產(chǎn)生中心云數(shù)字特征,用于最優(yōu)決策特征要求:然后根據(jù)中心云數(shù)字特征,利用頻繁項集和新增項集方法,調(diào)取認(rèn)知測試性大數(shù)據(jù)信息,并施加數(shù)據(jù)相關(guān)性分析操作,用于數(shù)據(jù)挖掘?qū)崿F(xiàn)決策權(quán)衡優(yōu)化。
3信息流和數(shù)據(jù)概要的定量化描述
3.1信息流的量化描述
在認(rèn)知測試性中,裝備及其履歷信息流主要包括裝備的類型、生產(chǎn)廠家、批次、使用年限、壽命、維修履歷(故障率及故障分布)等內(nèi)容。認(rèn)知測試性信息流主要包括裝備本級的測試性指標(biāo)信息。裝備保障信息流主要包括維修保障力量的部署、保障代價、保障資源、保障技術(shù)要求等內(nèi)容。任務(wù)及環(huán)境信息流主要包括裝備需要進(jìn)行的任務(wù)(教學(xué)、演習(xí)、作戰(zhàn)等)、試用環(huán)境(溫度、海拔、濕度、氣壓、風(fēng)速、云雨等)。這些信息流都會對裝備的測試性、可靠性和維修保障方案產(chǎn)生影響,也是云平臺存儲的主要數(shù)據(jù)。在裝備認(rèn)知測試性的診斷方案綜合權(quán)衡優(yōu)化中都需要進(jìn)行定量化描述。
本文在進(jìn)行信息流定量化描述的過程中,將信息流類型分為裝備本級信息流量化和裝備支援信息流量化兩類。其中,裝備支援信息流量化主要包含裝備及其履歷信息流的量化、裝備保障信息流的量化和任務(wù)及環(huán)境信息流的量化。裝備本級信息流的量化主要是認(rèn)知測試性信息流的量化。兩者的差異主要在于信息流中特征量的分布不同。
在裝備支援信息流量化中,以裝備及其履歷信息流中的裝備類型為例分析。根據(jù)作戰(zhàn)體系的裝備類型差異,對裝備進(jìn)行類型編號,本文編號時,根據(jù)裝備統(tǒng)計由簡到繁,由裝備對作戰(zhàn)體系功能性影響較小到功能性影響較大的原則。記云存儲平臺共統(tǒng)計了Ⅳ種裝備類型,在分布式存儲時,裝備及其履歷信息流中裝備類型則按照(1,2,…n…N)進(jìn)行量化描述。為了統(tǒng)一化描述,將裝備類型信息定量描述進(jìn)行歸一化,則記為
對裝備本級信息流的量化,以電子裝備認(rèn)知測試性信息流中電壓值的分析為例。根據(jù)歷史統(tǒng)計信息,確定裝備正常工作時電壓值的變化范圍,并以正常狀態(tài)下測量值的期望和方差為準(zhǔn)構(gòu)建正態(tài)分布函數(shù)。記測量值為X(x1,x2,…x1),期望值為Ex,標(biāo)準(zhǔn)差為u,那么,電壓值的量化可以記為
根據(jù)第2節(jié)對云計算的分析,為更好地表示信息流的量化情況,需要對上述正態(tài)分布標(biāo)準(zhǔn)化,使得電壓值的量化分布服從標(biāo)準(zhǔn)正態(tài)分布,即:
根據(jù)裝備本級信息流的量化和裝備支援信息流的量化方法,就可以得到分布式存儲量化后的數(shù)據(jù)池原始數(shù)據(jù)信息。
3.2數(shù)據(jù)概要的量化描述
結(jié)合云計算理論和頻繁項集理論,本文的數(shù)據(jù)概要是依據(jù)當(dāng)前的任務(wù)及環(huán)境信息流,產(chǎn)生用數(shù)字特征表征的數(shù)據(jù)池篩選條件,從而實現(xiàn)對事務(wù)數(shù)據(jù)的清洗,產(chǎn)生中心云。數(shù)據(jù)概要的作用是以0和1的形式,從云平臺大數(shù)據(jù)的數(shù)據(jù)池中,篩選出本次任務(wù)的關(guān)注重點和應(yīng)用場景條件,表示如下:
對信息流量化產(chǎn)生的數(shù)據(jù)矩陣U而言,Data是與U同型的矩陣,當(dāng)任務(wù)要求考慮某個信息流時,相應(yīng)位置元素為1,當(dāng)任務(wù)要求不考慮某個信息流時,該位置元素記為0。那么,利用數(shù)據(jù)概要對事務(wù)數(shù)據(jù)進(jìn)行清洗的過程,實際上可以簡化為分布式矩陣U與數(shù)據(jù)概要Data元素的點乘,那么中心云數(shù)據(jù)可記為
4診斷方案權(quán)衡優(yōu)化過程
4.1頻繁項集與新增項集的產(chǎn)生
本文頻繁項集主要是根據(jù)歷史決策、歷史診斷及其評價所輸入的數(shù)據(jù)概要產(chǎn)生。根據(jù)數(shù)據(jù)概要產(chǎn)生的過程可知,數(shù)據(jù)概要主要描述當(dāng)前的任務(wù)要求和環(huán)境因素,且數(shù)據(jù)概要為{0,1}矩陣。那么,頻繁項集的產(chǎn)生過程可描述為
為盡快實現(xiàn)方案的確定,本文認(rèn)為元素值>1的項都可以作為頻繁項集數(shù)據(jù)概要的有效值。那么,頻繁項集篩選條件可表示如下:
4.2相關(guān)性分析
在完成頻繁項集和新增項集篩選的情況下,實現(xiàn)數(shù)據(jù)的相關(guān)性分析是實現(xiàn)診斷方案確定的關(guān)鍵過程之一。本文對于頻繁項集的相關(guān)性分析,采用歷史診斷方案數(shù)據(jù)的期望值矩陣與頻繁項集的2一范數(shù)表示,表征了當(dāng)前任務(wù)頻繁項集與歷史決策的偏離度:
對于新增項集的相關(guān)性分析,采用新增項集的協(xié)方差矩陣表示,表征了新增項集對任務(wù)指標(biāo)的影響:
通過頻繁項集和新增項集分析結(jié)果的合并,可以得到診斷方案的權(quán)衡優(yōu)化結(jié)果。
4.3方案優(yōu)化補充
通過上述分析,基本上形成了診斷方案權(quán)衡優(yōu)化的過程。但還需做如下說明:
1)本文對于數(shù)據(jù)概要未描述的數(shù)字特征采用最優(yōu)方案確定,不同任務(wù)背景可視情況而定。
2)在完成了數(shù)據(jù)的相關(guān)性分析后,基本上形成了決策方案。但是還需要結(jié)合決策方案的評價標(biāo)準(zhǔn)對方案進(jìn)行優(yōu)化,其中評價標(biāo)準(zhǔn)和代價函數(shù)將在后續(xù)研究工作中完成。
3)針對信息流的量化問題,在不同的任務(wù)側(cè)重點可以采用不同的分布函數(shù)表示,相關(guān)內(nèi)容將在后續(xù)的研究工作中進(jìn)行,本文不再贅述。
5結(jié)束語
本文針對裝備認(rèn)知測試性診斷方案權(quán)衡優(yōu)化問題展開研究,給出了基于云計算的信息流定量域與定性域轉(zhuǎn)化方法,并通過數(shù)據(jù)的相關(guān)性分析方法實現(xiàn)了診斷方案權(quán)衡優(yōu)化的數(shù)據(jù)挖掘過程,形成了基于云計算和頻繁項集的診斷方案權(quán)衡優(yōu)化方法,為裝備認(rèn)知測試性診斷方案權(quán)衡優(yōu)化的智能化奠定了基礎(chǔ)。后續(xù)將針對診斷方案的評價標(biāo)準(zhǔn)和信息流量化的分布函數(shù)進(jìn)行進(jìn)一步研究。