劉艷,于露
(91550部隊(duì),大連 116023)
由于靶場飛行器飛行試驗(yàn)測量數(shù)據(jù)的獲得來之不易,試驗(yàn)數(shù)據(jù)處理和分析成為整個(gè)飛行器飛行試驗(yàn)重要的環(huán)節(jié)之一。在飛行器飛行試驗(yàn)測量中,測量誤差的來源主要包括測量方法誤差、設(shè)備誤差、環(huán)境誤差和人員誤差等。多種原因造成了測量數(shù)據(jù)中包含某些錯(cuò)誤觀測量。工程中通常將測量誤差分為三類,即系統(tǒng)誤差、隨機(jī)誤差和粗大誤差[1]。對于不同的類型誤差,有不同的誤差特性和不同的數(shù)據(jù)特性,采用不同的數(shù)據(jù)處理方法。粗大誤差是指量值比較大的誤差,可能由于某些突發(fā)性異常因素造成,也可能由于人為因素或是其它未知因素造成[2]。粗大誤差的存在顯著歪曲了測量結(jié)果,影響測量結(jié)果的準(zhǔn)確性和可靠性。試驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理目的是剔除粗大誤差[3]。由于到目前為止,還沒有適合靶場各種復(fù)雜條件下統(tǒng)一的粗大誤差判定準(zhǔn)則,急需的實(shí)時(shí)數(shù)據(jù)處理需要快速進(jìn)行粗大誤差的判定,粗大誤差判定準(zhǔn)則如何在靶場數(shù)據(jù)處理中得到應(yīng)用,需要對常用的四種粗大誤差判定準(zhǔn)則應(yīng)用特點(diǎn)進(jìn)行分析。尋求不同數(shù)據(jù)使用要求下粗大誤差的判定方法,旨在利用試驗(yàn)測量數(shù)據(jù)對被試飛行器的性能做出合理的鑒定,為飛行器改進(jìn)設(shè)計(jì)、裝備定型和部隊(duì)使用提供結(jié)論性意見。
試驗(yàn)數(shù)據(jù)測量粗差是指一組試驗(yàn)測量數(shù)據(jù)中,明顯偏離正常值的那些值,通常表現(xiàn)為脫離絕大多數(shù)數(shù)據(jù)點(diǎn),數(shù)值相差懸殊、離散出現(xiàn)、數(shù)量不多,也稱為跳點(diǎn)、野值[4]。粗差會(huì)嚴(yán)重影響測量結(jié)果的真實(shí)性,需要濾除。從工程應(yīng)用的角度,可將粗差分為二類,即粗差單點(diǎn)和粗差群點(diǎn)。試驗(yàn)數(shù)據(jù)預(yù)處理的方法是對某一組試驗(yàn)數(shù)據(jù)進(jìn)行粗差判定,剔除奇異數(shù)據(jù),對相應(yīng)的原始數(shù)據(jù)進(jìn)行內(nèi)插處理和曲線擬合,最終確定參加統(tǒng)計(jì)的試驗(yàn)數(shù)據(jù)[5]。實(shí)際工程應(yīng)用中,粗大誤差的判定與剔除必須慎之又慎。需結(jié)合粗大誤差的判定準(zhǔn)則,認(rèn)真分析可疑數(shù)據(jù)的產(chǎn)生原因,可以通過粗大誤差判定的原則進(jìn)一步初步判定;通過粗大誤差判定的準(zhǔn)則進(jìn)行異常值的剔除。
粗差的判定首先建立在對其正確判別的基礎(chǔ)上。要求對測量方法、測量過程有較好的了解和認(rèn)識(shí),應(yīng)掌握與被判別參數(shù)有密切聯(lián)系、發(fā)生關(guān)聯(lián)動(dòng)作和變化的其它參數(shù)的情況[6]。在判斷是否為粗差時(shí)應(yīng)該遵循以下原則:
a.明顯偏離其它測量值的那個(gè)值可能僅僅是數(shù)據(jù)中固有的隨機(jī)變異性的極端表現(xiàn),若此值與其它屬于同一個(gè)總體,不是異常值,若此值與其它不屬于同一個(gè)總體,則該值是異常值,確定為粗差。
b.當(dāng)試驗(yàn)者清楚地知道試驗(yàn)條件已經(jīng)變化,不管它是否與其它測量值一致都屬于異常值,確定為粗差。
c.當(dāng)清楚地知道該值是在不同的固有因素作用下發(fā)生的,如果能夠確信可疑數(shù)據(jù)屬于物理或技術(shù)操作等因素引起的粗大誤差,則可以將其直接剔除不用,則按異常值剔除。
d.當(dāng)在試驗(yàn)條件下,明顯偏離其它值的原因不清楚時(shí),必須使用判定準(zhǔn)則進(jìn)行推斷。粗差的判定關(guān)鍵是構(gòu)造合適的統(tǒng)計(jì)量,并求出它的分布。
常用的四種對正態(tài)或近似正態(tài)分布的樣本重復(fù)測量數(shù)據(jù)異常值判定準(zhǔn)則有拉依達(dá)準(zhǔn)則(3б準(zhǔn)則)、格拉布斯準(zhǔn)則(極值偏差法)、狄克遜準(zhǔn)則(極差比法)、肖維勒準(zhǔn)則[7]。常采用3б(б—標(biāo)準(zhǔn)偏差)準(zhǔn)則或根據(jù)誤差曲線直觀判定某一數(shù)據(jù)是否為異常值,還可采用極值偏差法和極差比法。
1.2.1 拉依達(dá)準(zhǔn)則
拉依達(dá)準(zhǔn)則又稱3б準(zhǔn)則,以測量次數(shù)充分大為前提。在樣本n≤10的情形下,用3б準(zhǔn)則剔除異常值是失效的[8]。假設(shè)某一測量參數(shù)有N個(gè)測量值為xi:i=1,2,3…N,其均值和方差分別為μ,б2,若Xd滿足(1)式,判定Xd為粗差。
其中:μ—均值;σ—標(biāo)準(zhǔn)偏差;Xd—粗差可疑數(shù)據(jù)。
1.2.2 格拉布斯準(zhǔn)則
格拉布斯準(zhǔn)則又稱極值偏差法,以小子樣為前提。
a.在σ和μ(μ—均值)未知的條件下,判定可疑結(jié)果的觀測值是否為異常值。已知樣本值X1、X2、…、Xn及總體標(biāo)準(zhǔn)差σ,將樣本值按從小到大的順序排列得X(1)≤X(2)≤…≤X(n),視X(n)(或X(1))為可疑,構(gòu)造統(tǒng)計(jì)量Gn(G1)的值:
其中:μ—均值;σ—標(biāo)準(zhǔn)偏差;X(n)或X(1)—粗差可疑數(shù)據(jù)
b.給出顯著水平,顯著性水平一般取0.01或0.05,由α和樣本數(shù)n查格拉布斯準(zhǔn)則判據(jù)取值表T(n,α)如表1所示。若Gn>T(n,α),則判定xn為異常值;若G1>T(n,α),則判定x1為異常值。
表1 格拉布斯準(zhǔn)則判據(jù)取值表T(n,α)
1.2.3 狄克遜準(zhǔn)則
狄克遜準(zhǔn)則又稱極差比法。已知樣本值x1、x2、…、xn,將樣本值按從小到大的順序排列得x(1)≤x(2)≤…≤x(n),計(jì)算統(tǒng)計(jì)量(Dixon統(tǒng)計(jì)量)rij的值,此種統(tǒng)計(jì)量有以下四個(gè):
根據(jù)隨機(jī)模擬結(jié)果,一般認(rèn)為:3≤n≤7時(shí)以使用r10為佳;8≤n≤10時(shí)以使用r11佳;11≤n≤13時(shí)以使用r21為佳;14≤n≤30時(shí)以使用r22為佳;給出顯著水平α,查狄克遜準(zhǔn)則判據(jù)取值表D(n,α)表,如表2所示。若rij>D(n,α),則認(rèn)為x(n)(或x(1))為異常值,應(yīng)予于剔除。若rij≤D(n,α),則無理由認(rèn)為x(n)(或x(1))為異常值,應(yīng)予以保留。
表2 狄克遜準(zhǔn)則判據(jù)取值表D(n,α)
1.2.4 肖維勒準(zhǔn)則
肖維勒準(zhǔn)則以正態(tài)分布為前提。假設(shè)某一測量參數(shù)n個(gè)測量值為Xi:i=1,2,3…N,其均值和方差分別為μ,σ2,若Xd滿足(4)式,判定Xd為粗差。
其中:μ—均值;Xd—粗差可疑數(shù)據(jù);σ—標(biāo)準(zhǔn)偏差;ks—肖維勒判據(jù)。肖維勒準(zhǔn)則判據(jù)取值表如表3所示。
表3 肖維勒準(zhǔn)則判據(jù)取值表
在實(shí)際的數(shù)據(jù)處理工作中,為了便于說明,以粗差的單點(diǎn)處理方法進(jìn)行計(jì)算分析。為了進(jìn)一步說明各種粗差判定準(zhǔn)則的特點(diǎn)及應(yīng)用時(shí)機(jī),以某型飛行器距離跟蹤精度試驗(yàn)測量分量為例,3000個(gè)子樣測量計(jì)算均值為0.929m;測量標(biāo)準(zhǔn)偏差為3.025m。測量精度指標(biāo)為1m,取其中25個(gè)樣本小段測量數(shù)據(jù),進(jìn)行異常值判定分析。分別用四種粗大誤差判定準(zhǔn)則進(jìn)行計(jì)算分析。
在某型飛行器某次飛行試驗(yàn)中,按樣本的數(shù)從小到大的順序排列,測量殘差數(shù)據(jù)表如表4所示,其中n為樣本數(shù),Δ(m)為測量殘差。
表4 測量殘差數(shù)據(jù)表
從測量數(shù)據(jù)表4中可知n=25時(shí),X(25)=10m,殘差最大,可能為異常值,分別用四種方法進(jìn)行判別。
2.1.1 拉依達(dá)準(zhǔn)則法
由于測量均值μ為0.929m,標(biāo)準(zhǔn)偏差σ為3.025m。根據(jù)公式(1)計(jì)算10m>3σ=9.075m,由拉依達(dá)準(zhǔn)則,可判斷其為異常值,應(yīng)予以剔除。
2.1.2 格拉布斯準(zhǔn)則法
根據(jù)公式(2)計(jì)算G(25)=2.999。給出顯著水平α=0.01,n=25查表1,格拉布斯準(zhǔn)則判據(jù)取值T(0.01,25)=3.01因?yàn)镚(25)<T(0.01,25),不能判定X(25)=10為異常值,應(yīng)予以保留。
2.1.3 狄克遜準(zhǔn)則法
當(dāng)n=25,使用r22為佳。根據(jù)公式(3)計(jì)算r22為0.473。給出顯著水平α=0.01,n=25查表2,狄克遜準(zhǔn)則判據(jù)取值臨界值D(n,α)=0.489,r22<rα,無理由認(rèn)為X(25)為異常值,應(yīng)予以保留。
2.1.4 肖維勒準(zhǔn)則法
當(dāng)n=25,查表3,肖維涅判據(jù)取值ks為2.39,標(biāo)準(zhǔn)偏差σ為3.025,誤差值X(25)=10,根據(jù)公式(4),滿足公式要求,確定此值為粗差,應(yīng)予以剔除。
從以上四種檢驗(yàn)方法計(jì)算中可以看出:對于這組數(shù)據(jù)中的最大值是否為異常值的判定,用拉依達(dá)準(zhǔn)則法和肖維勒準(zhǔn)則法可以檢查出其為異常值,而格拉布斯準(zhǔn)則法和狄克遜準(zhǔn)則法未能檢驗(yàn)出為異常值。如表5所示。
表5 四種檢驗(yàn)方法分析表
通過檢驗(yàn)方法的分析,可以看到:
所有的異常值判別準(zhǔn)則都是以數(shù)據(jù)正態(tài)分布為前提,因此它們的應(yīng)用也有其局限性,大樣本用拉依達(dá)準(zhǔn)則最為簡單;肖維勒準(zhǔn)則法計(jì)算比較簡單,計(jì)算的準(zhǔn)確度有些粗糙,適合快速判定。小樣本用拉依達(dá)準(zhǔn)則通常是失效的。格拉布斯準(zhǔn)則和狄克遜準(zhǔn)則都能得出嚴(yán)格的結(jié)果,格拉布斯準(zhǔn)則適用于剔除一個(gè)異常值;狄克遜準(zhǔn)則適用于剔除多個(gè)異常值。在靶場的試驗(yàn)數(shù)據(jù)預(yù)處理過程中,由于存在實(shí)時(shí)和事后數(shù)據(jù)預(yù)處理工作,實(shí)時(shí)數(shù)據(jù)預(yù)處理要求提供快速判定數(shù)據(jù),因此,對靶場數(shù)據(jù)預(yù)處理工作應(yīng)遵循以下原則:
(1)由于3σ計(jì)算簡便易行,應(yīng)首先采用3σ法對給定的數(shù)據(jù)進(jìn)行第一次異常值的判定及剔除;肖維勒法簡單直接,計(jì)算簡單,可用于現(xiàn)場判斷,但方法粗糙,可結(jié)合3σ法綜合判定。
(2)狄克遜準(zhǔn)則無需計(jì)算算術(shù)平均值和標(biāo)準(zhǔn)差,方法比較簡單,該準(zhǔn)則當(dāng)目測估計(jì)有多個(gè)異常值時(shí),建議使用狄克遜準(zhǔn)則。狄克遜準(zhǔn)則法只使用部分?jǐn)?shù)據(jù),可用于現(xiàn)場判斷。采用的信息越多,異常值的判定就越準(zhǔn)確。
(3)格拉布斯準(zhǔn)則法比較精確地計(jì)算出某一懷疑值為異常值,由于受到n的限制,因此,在小樣本情況,可對數(shù)據(jù)進(jìn)行第二次異常值的判定及剔除。
靶場試驗(yàn)數(shù)據(jù)的預(yù)處理是對單套測量設(shè)備的測量數(shù)據(jù)進(jìn)行單獨(dú)加工處理的過程。粗大誤差的判定不能單獨(dú)使用一種判定準(zhǔn)則進(jìn)行異常值剔除,整個(gè)處理過程是一個(gè)反復(fù)加工的過程,需要根據(jù)靶場實(shí)時(shí)和事后數(shù)據(jù)處理要求綜合四種判定準(zhǔn)則聯(lián)合應(yīng)用。通過對試驗(yàn)數(shù)據(jù)預(yù)處理方法的分析,采用合理的粗差判定方法,鑒別和剔除異常值,利用模型和插值方法對剔除點(diǎn)進(jìn)行補(bǔ)點(diǎn)。使有限的外場試驗(yàn)數(shù)據(jù),得到更加充分、合理地利用。在某次動(dòng)態(tài)飛行試驗(yàn)數(shù)據(jù)處理中,應(yīng)用該數(shù)據(jù)預(yù)處理分析方法,對試驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理分析,減少了測量誤差,用實(shí)例驗(yàn)證了靶場試驗(yàn)數(shù)據(jù)預(yù)處理四種準(zhǔn)則應(yīng)用的合理性和有效性??茖W(xué)、有效地對飛行試驗(yàn)的測量結(jié)果進(jìn)行了數(shù)據(jù)處理和分析。試驗(yàn)數(shù)據(jù)預(yù)處理方法的研究,進(jìn)一步完善靶場試驗(yàn)數(shù)據(jù)處理的方法,保證最終結(jié)論的準(zhǔn)確性。
[1]于曉峰.裝備試驗(yàn)數(shù)據(jù)處理[M].北京;國防工業(yè)出版社,2010:1-15.
[2]劉小會(huì).正態(tài)分布積分的高精度算法[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(03):179-181.
[3]肖洋,李平,王鵬,等.基于最小方差的自適應(yīng)K-均值初始化方法[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015,38(05):140-144+149.
[4]王鵬,王健安,郭暢,等.基于云計(jì)算及數(shù)據(jù)挖掘技術(shù)的海量數(shù)據(jù)處理研究[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2013,36(06):157-160.
[5]沈凱,吳勝昔,彭竹,等.基于改進(jìn)殘差的顯著誤差檢測方法[J].華東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2014,40(06):730-734.
[6]洪進(jìn),張立中,王霞.動(dòng)態(tài)靶標(biāo)誤差建模分析[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2014,37(05):69-72.
[7]歐陽琳男.粗大誤差判斷準(zhǔn)則運(yùn)用條件的相關(guān)分析[J].中國計(jì)量,2017(11):106-107.
[8]韓旭,王建宇,祖先鋒.基于時(shí)間序列模型的系統(tǒng)最大值指標(biāo)評定方法[J].系統(tǒng)工程與電子技術(shù),2012,34(04):839-645.