李 奎,張 侹,吳 娟,廖 斌,余 樂
(1.地理信息工程國家重點(diǎn)實(shí)驗(yàn)室,西安 710054;2.西安測繪研究所,西安 710054)
近年來,隨著我軍裝備試驗(yàn)工作的轉(zhuǎn)型與發(fā)展,各型武器裝備的試驗(yàn)鑒定以及專項(xiàng)試驗(yàn)評估均已開展相關(guān)工作,試驗(yàn)評估是裝備建設(shè)決策的重要支撐,是發(fā)現(xiàn)裝備問題缺陷、促進(jìn)裝備性能提升、確保裝備質(zhì)量的重要手段。
試驗(yàn)評估工作中,試驗(yàn)數(shù)據(jù)是客觀公正的基礎(chǔ)。由于裝備試驗(yàn)的過程環(huán)節(jié)多、參與單位多,實(shí)施過程產(chǎn)生的試驗(yàn)數(shù)據(jù)類型多、數(shù)據(jù)量大,由于受到技術(shù)、人力等的限制,數(shù)據(jù)中包含的深層次信息難以得到有效利用,數(shù)據(jù)有效獲取和應(yīng)用比較困難。目前,裝備試驗(yàn)鑒定領(lǐng)域尚沒有形成一套完整的裝備試驗(yàn)數(shù)據(jù)采集、整編、使用和質(zhì)量控制標(biāo)準(zhǔn),試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)與管理方面的研究還不夠深入,缺少相關(guān)理論成果和技術(shù)方法研究,各類試驗(yàn)鑒定任務(wù)的開展面臨著數(shù)據(jù)質(zhì)量不高、評價(jià)標(biāo)準(zhǔn)不規(guī)范、應(yīng)用效率低等突出問題,難以真正做到試驗(yàn)數(shù)據(jù)的綜合有效利用,并將嚴(yán)重制約裝備試驗(yàn)評估工作的實(shí)施。
現(xiàn)有的數(shù)據(jù)質(zhì)量評價(jià)方法多采用模糊數(shù)據(jù)理論、“缺陷扣分法”、權(quán)重法和粗集理論,這些方法的缺點(diǎn)是在評價(jià)過程中難以充分利用數(shù)據(jù)的模糊性和隨機(jī)性,從而影響評價(jià)結(jié)果的準(zhǔn)確性。
為有效提高試驗(yàn)數(shù)據(jù)質(zhì)量和利用率,確保裝備試驗(yàn)評估工作科學(xué)合理地開展,本文采用基于云模型的方法對試驗(yàn)數(shù)據(jù)質(zhì)量進(jìn)行分析評價(jià)。首先研究了裝備試驗(yàn)質(zhì)量的內(nèi)容和特點(diǎn),并構(gòu)建了試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo),在此基礎(chǔ)上,利用云模型理論生成了數(shù)據(jù)質(zhì)量評價(jià)等級云和評價(jià)結(jié)果綜合云,然后通過計(jì)算評價(jià)結(jié)果綜合云與各評價(jià)等級云之間的相似性,確定試驗(yàn)數(shù)據(jù)所隸屬的質(zhì)量評價(jià)等級,最后通過實(shí)驗(yàn)驗(yàn)證了所提方法的可行性和有效性。
從試驗(yàn)對象角度劃分,裝備試驗(yàn)數(shù)據(jù)可以分為三大類,1)裝備自身的效能數(shù)據(jù),如戰(zhàn)術(shù)技術(shù)性能指標(biāo)數(shù)據(jù);2)影響裝備效能發(fā)揮的數(shù)據(jù),如戰(zhàn)場環(huán)境數(shù)據(jù)、電磁環(huán)境數(shù)據(jù)等;3)試驗(yàn)勤務(wù)保障數(shù)據(jù),如試驗(yàn)人員、車輛、陪試裝備等。從試驗(yàn)階段角度劃分,裝備試驗(yàn)數(shù)據(jù)又可以分為性能驗(yàn)證試驗(yàn)數(shù)據(jù)、性能鑒定(基地)試驗(yàn)數(shù)據(jù)、作戰(zhàn)試驗(yàn)數(shù)據(jù)和在役考核試驗(yàn)數(shù)據(jù)等,這些不同階段的試驗(yàn)數(shù)據(jù)按照數(shù)據(jù)類型劃分,又可以分為音視頻數(shù)據(jù)、非結(jié)構(gòu)化文本數(shù)據(jù)、結(jié)構(gòu)化文本數(shù)據(jù)、各軟硬件系統(tǒng)接口數(shù)據(jù)、圖片、文檔數(shù)據(jù)、裝備模型數(shù)據(jù)等。
根據(jù)分析可以發(fā)現(xiàn),裝備試驗(yàn)數(shù)據(jù)具有來源多樣、格式多樣、內(nèi)容豐富、時(shí)效性要求高等特點(diǎn),并且數(shù)據(jù)模式、精度、表現(xiàn)形式存在較大差異。
隨著研究的不斷深入,裝備試驗(yàn)數(shù)據(jù)質(zhì)量的內(nèi)涵經(jīng)歷了由單一到綜合、由局部到全面的變化。作為一個(gè)相對的概念,裝備試驗(yàn)數(shù)據(jù)質(zhì)量是一個(gè)內(nèi)涵豐富、具有多重維度的綜合性概念,其具有較強(qiáng)的主觀性,在不同的背景有不同的定義,對不同的用戶對象有不同的評價(jià)準(zhǔn)則,對其評價(jià)也應(yīng)該根據(jù)系統(tǒng)的需求和數(shù)據(jù)特征來決定。從支撐和服務(wù)試驗(yàn)評估的角度來看,裝備試驗(yàn)數(shù)據(jù)質(zhì)量不僅需要考慮數(shù)據(jù)自身的準(zhǔn)確性、完整性等指標(biāo)要素,還要充分考慮對試驗(yàn)評估(即用戶方)的滿足度,如試驗(yàn)評估人員對數(shù)據(jù)的可理解性和時(shí)效性等有著嚴(yán)格的要求?;诖?,本文認(rèn)為裝備試驗(yàn)數(shù)據(jù)質(zhì)量可以定義為:裝備試驗(yàn)數(shù)據(jù)能否準(zhǔn)確反映裝備試驗(yàn)活動(dòng)及滿足試驗(yàn)評估任務(wù)需求的程度。
裝備試驗(yàn)數(shù)據(jù)質(zhì)量的好壞一般難以通過精確測量的方式獲得,只能通過分析數(shù)據(jù)的構(gòu)成、特點(diǎn)和應(yīng)用需求等,建立裝備試驗(yàn)數(shù)據(jù)質(zhì)量與評價(jià)指標(biāo)要素之間的映射關(guān)系,即建立質(zhì)量評價(jià)指標(biāo),然后通過評估的方式獲得評價(jià)結(jié)果。因此,開展裝備試驗(yàn)數(shù)據(jù)質(zhì)量評估工作的一項(xiàng)基礎(chǔ)性工作,就是構(gòu)建科學(xué)合理的評價(jià)指標(biāo)?;谘b備試驗(yàn)數(shù)據(jù)的特點(diǎn)和裝備鑒定定型需求,本文認(rèn)為裝備試驗(yàn)數(shù)據(jù)的質(zhì)量評價(jià)指標(biāo)應(yīng)該包括準(zhǔn)確性、完整性、規(guī)范性、唯一性、有效性、時(shí)效性、可理解性7 個(gè)要素,如圖1 所示。
圖1 裝備試驗(yàn)數(shù)據(jù)數(shù)量評價(jià)指標(biāo)
1)準(zhǔn)確性:主要用于描述試驗(yàn)得到的數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的符合程度。
2)完整性:主要用于描述數(shù)據(jù)的完整程度,是否存在數(shù)據(jù)殘缺和記錄疏漏。
3)規(guī)范性:是指數(shù)據(jù)集中的同一參數(shù)的含義、結(jié)構(gòu)、屬性等是否滿足相關(guān)標(biāo)準(zhǔn)規(guī)范,數(shù)據(jù)記錄和存儲(chǔ)是否按照統(tǒng)一格式。狹義上,規(guī)范性又可以描述為數(shù)據(jù)格式的一致性。
4)唯一性:描述的是數(shù)據(jù)是否被重復(fù)記錄。
5)有效性:是指數(shù)據(jù)的定義、語法規(guī)則等與其對應(yīng)的描述對象相一致的程度,是否符合其定義。
6)時(shí)效性:又可稱為數(shù)據(jù)及時(shí)性,主要用于描述數(shù)據(jù)是否符合更新時(shí)限要求。
7)可理解性:是指數(shù)據(jù)含義明確且易于理解。
因?yàn)橛绊憯?shù)據(jù)質(zhì)量的要素眾多,裝備試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)是一個(gè)隨機(jī)性和模糊性工作共存的問題。一方面,由于評價(jià)指標(biāo)具有不確定性,不同的用戶或應(yīng)用場景,對試驗(yàn)數(shù)據(jù)質(zhì)量關(guān)注點(diǎn)不同,有些用戶會(huì)覺得數(shù)據(jù)的準(zhǔn)確性最重要,但也有些用戶會(huì)覺得數(shù)據(jù)的完整性最重要,這就會(huì)導(dǎo)致同一指標(biāo)的權(quán)重值不同;另一方面,評價(jià)方法上的隨機(jī)性,由于試驗(yàn)數(shù)據(jù)一般較大,不可能對每一個(gè)數(shù)據(jù)進(jìn)行分析處理,通常采用抽樣檢測的方法,以抽樣的結(jié)果作為整體的評價(jià)結(jié)果。因此,最后的結(jié)果不可能完全精確,只是對質(zhì)量狀況的隨機(jī)性表達(dá)。此外,試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo)一般有定性和定量兩種,對于定性指標(biāo)來說,每個(gè)指標(biāo)的定義本質(zhì)上都具有模糊性,不是完全精確的;而對于定量指標(biāo)來說,其評價(jià)值的確定通常受主觀因素的影響,也具有一定程度的模糊性。
為解決數(shù)據(jù)質(zhì)量評價(jià)過程中定性描述和精確數(shù)值之間的相互轉(zhuǎn)換,以及評價(jià)過程中存在的準(zhǔn)確性和不確定性難以有效兼顧的問題,文獻(xiàn)[12]提出了云模型理論,該方法不僅能夠從定性描述中獲得精確定量數(shù)據(jù)和分布規(guī)律,而且可以把精確數(shù)值合理地轉(zhuǎn)化為定性描述,有效保證了評價(jià)結(jié)果的公正客觀。
云模型可以用A(Ex,En,He)表示,其中,期望Ex、熵En 和超熵He 被稱為云A 的數(shù)字特征值,Ex表示模糊信息的中心值,即云的分布中心;En 表示Ex 的不確定性,可以揭示評估結(jié)果的隨機(jī)模糊性;He 表示En 的離散程度和厚度,即云的凝聚度。通過Ex、En 和He 組成云隸屬度函數(shù),可以把定性描述(質(zhì)量評價(jià)等級)的模糊性與隸屬度的隨機(jī)性相結(jié)合,構(gòu)成定性與定量相互間的映射。
本文將數(shù)據(jù)質(zhì)量的評價(jià)等級劃分為“優(yōu)”、“良”、“中”、“差”、“極差”5 個(gè)等級。而對于評價(jià)等級數(shù)值范圍的確定,通常采用的方法為專家打分法。表1 為征求專家意見后得到的評價(jià)等級數(shù)值表。
表1 評價(jià)等級數(shù)值表
假設(shè)共有n 個(gè)數(shù)據(jù)質(zhì)量評價(jià)等級,若每一個(gè)評價(jià)等級的數(shù)值取值范圍為{min,max},則該評價(jià)等級云模型可以表示為E(E,E,H),其中:
通過第2 章的描述可知,當(dāng)H越大時(shí),對應(yīng)的評價(jià)等級云越分散,評價(jià)結(jié)果也越難確定,因此,為了保證評價(jià)效果,本文選取k=0.01。
根據(jù)式(1),可以生成各個(gè)評價(jià)等級對應(yīng)的云模型,具體云模型的數(shù)字特征值如表2 所示。
表2 各評價(jià)等級云模型的數(shù)字特征值
各評價(jià)等級云圖如下頁圖2 所示,由圖2 可知,各信任等級云在區(qū)間上相互分離,且均具有較好的凝聚度。
圖2 評價(jià)等級云
借鑒文獻(xiàn)[10-11]關(guān)于虛擬云的描述,本文生成了評價(jià)結(jié)果綜合云。設(shè)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo)為A={A,A,…,A,…,A},A代表第i 個(gè)評價(jià)指標(biāo),如準(zhǔn)確性、完整性等,N 代表評價(jià)指標(biāo)的個(gè)數(shù)。則待評價(jià)數(shù)據(jù)在評價(jià)指標(biāo)A的評價(jià)結(jié)果云為A(Ex,En,He),由N 個(gè)評價(jià)結(jié)果云合并生成評價(jià)結(jié)果綜合云A(Ex,En,He)。評價(jià)結(jié)果綜合云的合并方法,一般采用以下兩個(gè)步驟進(jìn)行:
1)基于建立的評價(jià)指標(biāo),依次計(jì)算各指標(biāo)評價(jià)結(jié)果,確定各評價(jià)結(jié)果云的數(shù)字特征值(Ex,En,He);
郝桂芹在后面捂著耳朵,變聲變氣地告訴他,這都不知道哇,老土了不是?那幾個(gè)人,今晚一準(zhǔn)中獎(jiǎng)了。放煙花,是在慶賀啊。
2)將各評價(jià)結(jié)果云進(jìn)行合并,生成評價(jià)結(jié)果綜合云A(Ex,En,He),可以表示為:
則評價(jià)結(jié)果綜合云的A(Ex,En,He)的數(shù)值特征可以表示為式(3)~式(5),其中,ω 為不同評價(jià)指標(biāo)的權(quán)重:
本文通過計(jì)算評價(jià)結(jié)果綜合云中的云滴對與各評價(jià)等級云之間的隸屬度,確定評價(jià)結(jié)果綜合云與各評價(jià)等級云之間的相似性,這樣可以有效保證評價(jià)結(jié)果的客觀合理,又能夠保證評價(jià)結(jié)果的模糊性和隨機(jī)性。
設(shè)評價(jià)結(jié)果綜合云為A(Ex,En,He),N 表示評價(jià)指標(biāo)的個(gè)數(shù);評價(jià)等級云為E(Ex,En,He),i=1,2,…,K,K 為評價(jià)等級總數(shù)。則A(Ex,En,He)和E(Ex,En,He)之間的相似性可以按照下面步驟進(jìn)行:
1)以En 為期望,He 為標(biāo)準(zhǔn)差,構(gòu)造正態(tài)隨機(jī)數(shù)En';
2)以Ex 為期望,En'為標(biāo)準(zhǔn)差,構(gòu)造正態(tài)隨機(jī)數(shù)x;
3)以En為期望,He為標(biāo)準(zhǔn)差,構(gòu)造正態(tài)隨機(jī)數(shù)En';
5)重復(fù)1)~4),直至產(chǎn)生N 個(gè)云滴;
若μ越大,表示評價(jià)結(jié)果綜合云中的云滴與評價(jià)等級E之間的隸屬度越大,兩個(gè)云模型也越相關(guān),即評價(jià)等級E最能反映待評價(jià)數(shù)據(jù)的質(zhì)量狀況。
評價(jià)結(jié)果綜合云是由多個(gè)指標(biāo)評價(jià)結(jié)果云合并而成的,對于單個(gè)指標(biāo)評價(jià)結(jié)果云的生成,需要對采集到的實(shí)例數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,分別得到不同評價(jià)指標(biāo)下的分值。由于本文的研究重點(diǎn)不是數(shù)據(jù)處理方法,因此,試驗(yàn)數(shù)據(jù)處理方法不進(jìn)行贅述。
為驗(yàn)證本文所提方法的有效性,選取采集到的某型裝備部分試驗(yàn)數(shù)據(jù)作為研究對象,這些統(tǒng)計(jì)數(shù)據(jù)共包含10 個(gè)指標(biāo),分別用TD1~TD10 表示。表3為經(jīng)處理后的各評價(jià)指標(biāo)評分值。
表3 評價(jià)指標(biāo)分值
根據(jù)表3,利用逆向云發(fā)生器可以得到各個(gè)評價(jià)指標(biāo)的云模型數(shù)值特征值,如表4 所示。
表4 指標(biāo)評價(jià)結(jié)果云的數(shù)字特征值
根據(jù)表4,利用式(3)~式(5)可以求得評價(jià)結(jié)果綜合云的數(shù)字特征值為A(94.083 1,0.809 6,0.213 8),如圖3 所示。
圖3 評價(jià)結(jié)果綜合云
由圖3 可知,評價(jià)結(jié)果綜合云的云滴基本上分布在92~96 之間,當(dāng)評價(jià)結(jié)果值取94.08 時(shí),此時(shí)隸屬度為1,此時(shí)94.08 最能代表數(shù)據(jù)集TD 的質(zhì)量狀況。
評價(jià)指標(biāo)權(quán)重的確定,可以采用常用的層次分析法確定?;诟髟u價(jià)指標(biāo)之間的相對重要性,構(gòu)建判斷矩陣,如表5 所示,其中:總目標(biāo)為A,準(zhǔn)確性(B)、完整性(B)、規(guī)范性(B)、唯一性(B)、有效性(B)、時(shí)效性(B)、可理解性(B)。
表5 判斷矩陣
最終可以求得指標(biāo)權(quán)重向量W 為:
根據(jù)3.3 節(jié)關(guān)于云相似性計(jì)算方法,可以計(jì)算得到評價(jià)結(jié)果綜合云與各評價(jià)等級云的相似性值,具體如表6 所示。
圖4 為評價(jià)結(jié)果綜合云與各評價(jià)等級云的分布圖。
由表6 可知,評價(jià)結(jié)果綜合云在相似性上的排序分別為:優(yōu)>良>中>極差>差。由圖4 也可以直觀看出,評價(jià)結(jié)果綜合云的分布范圍幾乎完全介于評價(jià)等級“優(yōu)”的范圍內(nèi)。因此,可以認(rèn)為實(shí)例數(shù)據(jù)TD 的數(shù)據(jù)質(zhì)量狀況為:優(yōu)。
圖4 評價(jià)結(jié)果綜合云與評價(jià)等級云的分布圖
表6 評價(jià)等級綜合云與評價(jià)等級云的相似性對照表
為了進(jìn)一步驗(yàn)證基于云模型的試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)算法的有效性,本文采用常用的模糊綜合評價(jià)方法對實(shí)例數(shù)據(jù)TD 的數(shù)據(jù)質(zhì)量進(jìn)行評價(jià),并將兩者的結(jié)果進(jìn)行對比分析。
進(jìn)行模糊綜合評價(jià)時(shí),首先需要建立描述模糊集的隸屬度函數(shù),本文采用常用的三角、梯形分布來構(gòu)造隸屬度函數(shù)。由于本文所提的評價(jià)指標(biāo)均為越大越好型,因此,采用隸屬度函數(shù)三角和升半梯形。
用j 表示數(shù)據(jù)質(zhì)量的評價(jià)等級,由評價(jià)等級劃分可知j 分別取1,2,3,4,5,用x表示第i 個(gè)評價(jià)指標(biāo)分值,用S表示第i 個(gè)評價(jià)指標(biāo)的第j 級單項(xiàng)評價(jià)標(biāo)準(zhǔn),用r表示第i 個(gè)評價(jià)指標(biāo)對評價(jià)等級的第j級的隸屬度,則第i 個(gè)評價(jià)指標(biāo)的隸屬度函數(shù)如下:
當(dāng)j=1 時(shí):
當(dāng)j=2,3,4 時(shí):
當(dāng)j=5 時(shí):
根據(jù)表4 中期望值Ex依次帶入上面隸屬度函數(shù)公式中,可以分別求得評價(jià)指標(biāo)隸屬度矩陣。
將4.2 節(jié)所求的評價(jià)指標(biāo)權(quán)重與上面的隸屬度矩陣做模糊運(yùn)算,可以求得模糊綜合評價(jià)的結(jié)果矩陣為:F=W'*R=[0.479 2 0.473 5 0.047 3 0 0],如表7 所示。
表7 基于模糊綜合評價(jià)的數(shù)據(jù)質(zhì)量等級隸屬度
根據(jù)最大隸屬度原則可知,采用模糊綜合評價(jià)方法得到的試驗(yàn)數(shù)據(jù)質(zhì)量狀況為“優(yōu)”。但是仔細(xì)對比可以發(fā)現(xiàn),試驗(yàn)數(shù)據(jù)對應(yīng)評價(jià)等級“優(yōu)”和“良”的隸屬度值十分接近,可以認(rèn)為該評價(jià)結(jié)果較為牽強(qiáng),只能依靠評估人員的經(jīng)驗(yàn)和主觀因素來判定。
與傳統(tǒng)的模糊綜合評價(jià)方法對比,本文提出的基于云模型的數(shù)據(jù)質(zhì)量評價(jià)方法兼顧評價(jià)結(jié)果的模糊性與隨機(jī)性,同時(shí)能夠較好地避免傳統(tǒng)方法的主觀隨意性缺陷,使得評價(jià)結(jié)果更可信。
本文提出了一種基于云模型的裝備試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)方法,通過對裝備試驗(yàn)質(zhì)量的內(nèi)容和特點(diǎn)的分析,構(gòu)建了合理的試驗(yàn)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo);在此基礎(chǔ)上,對質(zhì)量評價(jià)等級云、評價(jià)結(jié)果綜合云和云相似性進(jìn)行了詳細(xì)研究,最后利用實(shí)例分析并與傳統(tǒng)的基于模糊綜合評價(jià)方法進(jìn)行對比分析,證明了所提方法的有效性和可行性,并且評價(jià)結(jié)果可以較好地兼顧模糊性和隨機(jī)性,避免各種人為和主觀因素對最終評價(jià)結(jié)果的影響。