李陽 孔毅 趙現(xiàn)斌
摘要::針對氣象無人機探測數(shù)據(jù)量大、野值剔除和數(shù)據(jù)補償困難、準確率低等問題,提出了一種自適應(yīng)閾值的野值識別和基于探空數(shù)據(jù)經(jīng)驗?zāi)P偷囊爸笛a償算法。仿真結(jié)果表明:該算法簡單、野值處理效果明顯,能夠滿足探空的實際應(yīng)用要求,很大程度上消除了野值對測量精度的影響。
關(guān)鍵詞關(guān)鍵詞:無人機;野值剔除;數(shù)據(jù)補償;仿真研究
DOIDOI:10.11907/rjdk.143791
中圖分類號:TP391
文獻標識碼:A文章編號文章編號:16727800(2015)002014903
作者簡介作者簡介:李陽(1987-),男,江蘇東臺人,解放軍理工大學氣象海洋學院碩士研究生,研究方向為大氣海洋遙感;孔毅(1954-),男,遼寧大連人,解放軍理工大學氣象海洋學院教授,研究方向為軍事信息系統(tǒng)工程;趙現(xiàn)斌(1986-),男,陜西渭南人,解放軍理工大學氣象海洋學院博士研究生,研究方向為大氣海洋遙感。
0引言
隨著無人機制造、氣象測量傳感器等技術(shù)的快速發(fā)展,無人機氣象探測技術(shù)取得了長足進步,逐漸從成熟走向應(yīng)用。這種大區(qū)域、長時間、連續(xù)氣象探測方法在航天器發(fā)射與返回、重要武器試驗、戰(zhàn)場氣象測量、惡劣天氣監(jiān)測、龍卷風近距環(huán)境探測監(jiān)視等應(yīng)用中具有獨特的作用和優(yōu)勢。氣象無人機探測數(shù)據(jù)主要包括溫度、壓強等氣象參數(shù),其探測精度對氣象預(yù)報、環(huán)境監(jiān)控具有重要意義。而在傳感器量測過程中,由于受傳感器工作狀態(tài)、環(huán)境雜波等因素影響,量測數(shù)據(jù)經(jīng)常存在一些異常跳點,這種偏離被測信號變化規(guī)律的數(shù)據(jù)點稱為野值\[1\]。如果在數(shù)據(jù)預(yù)處理階段不對這些野值進行處理,那么目標預(yù)測精度在野值出現(xiàn)時將產(chǎn)生突變,甚至會導(dǎo)致目標預(yù)測發(fā)散\[2\]。因此,在使用探測數(shù)據(jù)前,必須對測量序列中可疑數(shù)據(jù)進行正確判斷與處理,剔除野值,補償缺失數(shù)據(jù)。
由于無人機探測數(shù)據(jù)量大,采用人工檢測方法剔除野值和補償缺失,工作量巨大,不利于實時給出探測信息,同時人為的主觀因素也會影響到測量精度。因此,使用智能軟件對無人機探測數(shù)據(jù)進行判讀,可有效提高工作效率和判讀精度。軟件判讀的前提是找出一個合適的算法對數(shù)據(jù)進行野值剔除和缺失補償?;诖?,本文提出了一種自適應(yīng)閾值的野值識別和基于探空經(jīng)驗?zāi)P偷囊爸笛a償算法。
1常規(guī)野值處理方法
1.1插值法基本理論
插值法\[3\]是近似計算和逼近函數(shù)的有效方法,常用的插值法包括:Lagrange插值法、Aiken插值法、Newton插值法。Lagrange插值法便于理論推導(dǎo)和形式地描述算法,但不便于計算函數(shù)值,當需要多加進去一個節(jié)點時,需重新推導(dǎo)基本多項式,工程量較大;Aiken插值法的優(yōu)點是能夠有效地計算任何給定點的函數(shù)值,不需要寫出插值多項式表達式,但如果解決某個問題需要用到插值多項式表達式時,這個優(yōu)點也就成了它的缺點。上述兩種方法存在的缺點,限制了其在軟件功能實現(xiàn)方面的應(yīng)用。因此,多數(shù)情況下采用Newton插值法。Newton插值法是在Lagrange插值的基礎(chǔ)上組合已知計算值,不僅具有Lagrange插值公式適合理論分析的優(yōu)點,又具有Aiken算法的承襲性,便于寫出插值多項式表達式,也便于計算多個插值點處的函數(shù)值,大大減少了計算量,從而提高了插值效率。Newton插值多項式為:
Nn(x)=f[x0]+f[x0x1](x-x0)+f[x0x1x2](x-x0)(x-x1)+…+f[x0x1···xn](x-x0)(x-x1)···(x-xn)(1)
式中:
f[xk]=f(xk)=ykf[xkxk+1]=f[xk+1]-f[xk]xk+1-xkf[xkxk+1xk+2]=f[xk+1xk+2]-f[xkxk+1]xk+2-xkf[xkxk+1xk+2xk+3]=f[xk+1xk+2xk+3]-f[xkxk+1xk+2]xk+3-xk (2)等等。這些是關(guān)于數(shù)據(jù)點的插值多項式系數(shù)。
當x0=0,xk+1-xk=1,n=6時,求解多項式系數(shù):
f[x0]=y0f[x0x1]=y1-y0f[x0x1x2]=(y2-2y1+y0)/2f[x0x1x2x3]=(y3-3y2+3y1-y0)/6f[x0x1x2x3x4]=(y4-4y3+6y2-4y1+y0)/24f[x0x1x2x3x4x5]=(y5-5y4+10y3-10y2+5y1-y0)/120f[x0x1x2x3x4x5x6]=(y6-6y5+15y4-20y3+15y2-6y1+y0)/720 (3)
于是,Newton插值六次多項式為:
N6(x)=y0+(y1-y0)x+y2-2y1+y02(x-1)x+y3-3y2+3y1-y06(x-2)(x-1)x+y4-4y3+6y2-4y1+y024(x-3)(x-2)(x-1)x+y5-5y4+10y3-10y2+5y1-y0120(x-4)(x-3)(x-2)(x-1)x+y6-6y5+15y4-20y3+15y2-6y1+y0720(x-5)(x-4)(x-3)(x-2)(x-1)x(4)
1.2探測數(shù)據(jù)野值剔除與補償
Newton插值法用一個高次多項式將探測數(shù)據(jù)擬合,包括前推插值法、后推插值法和中心插值法。前推插值法利用的數(shù)據(jù)是經(jīng)過處理過的可靠數(shù)據(jù),為避免后續(xù)的野值傳遞,通常采用前推插值法。通過這些點擬合后續(xù)點數(shù)據(jù),能保證后續(xù)點數(shù)據(jù)的準確性。
本文以第8點數(shù)據(jù)為例,判斷其是否為野值。假設(shè)前7個點的數(shù)據(jù)已判斷為正確數(shù)據(jù)。yi是原始數(shù)據(jù),yi為插值數(shù)據(jù)。令x=7,帶入公式(4),計算第8個點的插值:
y7=y0-7y1+21y2-35y3+35y4-21y5+7y6(5)
殘差計算公式:
=17∑6i=0yi(6)7=|y7-|(7)
式中,為前7個數(shù)據(jù)的算術(shù)平均值,7為y7的殘差。
殘差序列的標準差計算公式:
σ=∑6i=0(yi-)2/6(8)
式中,σ為殘差序列標準差。
根據(jù)高斯誤差理論,當測量值服從正態(tài)分布時,殘差落在[-3σ,3σ] 區(qū)間的概率超過99.7%,落在此區(qū)間外的概率只有不到0.3%,因此,可以認為殘差落于該區(qū)域之外的測量值為野值,這就是萊特準則,即3σ準則。此例中,根據(jù)該野值判定方法,若y7的殘差小于3倍標準差,則所對應(yīng)的數(shù)據(jù)被認為是正常值;若y7的殘差大于3倍標準差,則所對應(yīng)的數(shù)據(jù)被認為是野值,應(yīng)予以剔除,并用牛頓插值法求出的修正值y7來替換。
2常規(guī)野值處理方法的局限性
利用常規(guī)的野值處理方法對無人機氣象探測數(shù)據(jù)進行野值剔除和補償時,存在如下幾點不足:
(1)在無人機氣象探測過程中,由于無人機飛行狀態(tài)的改變,數(shù)據(jù)的波動性較大,若使用牛頓插值法對探測值進行預(yù)判,其結(jié)果帶有主觀性、趨向性,可靠性較低,可引入經(jīng)驗?zāi)P蛯庀筇綔y值進行預(yù)估計,降低正常值誤剔除和野值漏剔除的風險。
(2)萊特準則往往應(yīng)用于靜態(tài)觀測,對觀測狀態(tài)進行多次重復(fù)測量,滿足正態(tài)分布要求。而在無人機運動過程中,目標狀態(tài)不斷變化,屬于動態(tài)測量,每個狀態(tài)都是單次測量,隨著目標的運動,測量的環(huán)境和精度也在發(fā)生變化[45],無人機探測值總體上不服從正態(tài)分布。由于探測值僅與高度有關(guān),且任意10m高層都可接收幾十組探空數(shù)據(jù),可選取相鄰的7組數(shù)據(jù),默認其為同一高層的多次測量結(jié)果,滿足正態(tài)分布要求。因此,對于動態(tài)探測過程,可利用萊特準則分區(qū)域?qū)y量數(shù)據(jù)進行野值檢測。
(3)無人機探測的溫度和壓強變化幅度差異較大,如氣溫值為十幾度,氣壓值為幾百帕,是氣溫值的幾十上百倍,且兩個測量值的變化幅度也有差異,氣溫值始終較為平穩(wěn),變化緩慢,而氣壓值的變化幅度是氣溫的數(shù)十倍,所以殘差落在3倍方差即[-3σ,3σ]區(qū)間的概率也不一樣。可根據(jù)具體參數(shù)來設(shè)置標準差的倍數(shù),以解決上述問題。
3氣象探測數(shù)據(jù)野值處理方法
針對氣象無人機探測數(shù)據(jù)的特點,以及萊特準則的適用范圍,通過引入經(jīng)驗?zāi)P?、劃分?shù)據(jù)預(yù)處理區(qū)域、自定義閾值等措施對現(xiàn)有數(shù)據(jù)處理方法進行改進。
3.1探測數(shù)值預(yù)測
對于標準大氣,壓強和溫度只與海拔高度有關(guān)。通常在無人機測風的海拔高度范圍內(nèi),壓強和溫度可用下面的模型近似求得:
P=P0exp(-g0HRT)(9)T=T0-6.51000H(10)
式中:P0、T0和g0分別是海平面上的靜壓、靜溫和重力加速度,H是海拔高度。利用上述經(jīng)驗?zāi)P涂梢灶A(yù)測無人機任意時刻、任意高度的探測數(shù)據(jù),相較于牛頓插值法的估算值可靠性更高。
3.2探測區(qū)域劃分
選取探測值相鄰的7組數(shù)據(jù)yi、yi+1、yi+2、yi+3、yi+4、yi+5、yi+6,默認為靜態(tài)探測值,服從正態(tài)分布要求,利用公式(11)、(12)、(13)分別求出所選探測值的算術(shù)平均值、yi+7的殘差以及殘差標準差。
i=yi+yi+1+yi+2+yi+3+yi+4+yi+5+yi+67(11)yi+7=|yi+7-|(12)σi=(yi-i)2+(yi+1-i)2+···+(yi+5-i)2+(yi+6-i)26(13)
3.3閾值修正
針對氣象探測數(shù)據(jù)變化幅值的不同,根據(jù)具體參數(shù)來設(shè)置不同測量值的標準差倍數(shù),以達到所有參數(shù)落在某變化區(qū)域的概率值相似或相等的目的。
若yi+7的殘差大于k倍標準差,則所對應(yīng)的數(shù)據(jù)被認為是野值,應(yīng)予以剔除,表示如下:
yi+7=|yi+7-i|>kσi(14)
式中,0.5≤k≤4,kσi為閾值。
如果yi+7滿足下式:
yi + 7 ,= |yi + 7-yi + 7 | > kσi (15)
則yi+7也為野值。其中yi+7為利用經(jīng)驗?zāi)P颓蟮玫念A(yù)測值,yi + 7 ,為yi+7與其預(yù)測值的殘差。
由于氣壓、溫度的變化是隨高度變化持續(xù)穩(wěn)定的過程,因此,無人機的探測值不存在階躍現(xiàn)象。將式(14)、式(15)合并:
yi + 7 = |yi + 7 -i | > kσi yi + 7 ,= |yi + 7-yi + 7 | > kσi (16)
式(16)為無人機探測數(shù)據(jù)的野值判別公式。
識別出野值,需對野值進行修正,以保證數(shù)據(jù)的準確性。本文采用溫壓經(jīng)驗?zāi)P颓蟪鲂拚祦硖鎿Q野值,即:
yi+7=yi+7(17)
野值識別和修正流程如圖1所示。
圖1野值識別與修正流程
4仿真研究
采用Matlab對上述方法進行仿真,其中:k值根據(jù)參數(shù)類型、大小和變化情況作了相應(yīng)的調(diào)整,“壓強”參數(shù)k取值2.4,“溫度”參數(shù)k取值1.8。采用探空經(jīng)驗?zāi)P秃透倪M的萊特準則檢測方法,保證數(shù)據(jù)預(yù)處理后的完整性以及準確性。無論在數(shù)據(jù)幅值較低區(qū)域,還是在數(shù)據(jù)幅值較高區(qū)域,該方法都有較好的檢測效果。
以氣象無人機探測的壓強為例。為了方便比較,截取某一時間段的氣壓值,構(gòu)建曲線如圖2所示。圖中含有孤立野值、連續(xù)野值及鋸形野值等。
5結(jié)語
本文提出了自適應(yīng)閾值的野值識別方法和基于經(jīng)驗?zāi)P偷臄?shù)據(jù)補償方法,相對于常規(guī)數(shù)據(jù)預(yù)處理方法,準確性更高。在某型氣象無人機探測軟件開發(fā)中進行了應(yīng)用,證明了該方法的有效性。
參考文獻參考文獻:
\[1\]費業(yè)泰.誤差理論與數(shù)據(jù)處理\[M\].北京:機械工業(yè)出版社,2004.
\[2\]徐萃薇,孫繩武.計算方法引論\[M\].北京:高等教育出版社,2002.
\[3\]李慶揚,王能超,易大義.數(shù)值分析\[M\].武漢:華中科技大學出版社,1982.
\[4\]權(quán)太犯.目標跟蹤新理論與技術(shù)\[M\].北京:國防工業(yè)出版社,2009.
\[5\]王中宇,劉智敏,夏新濤,等.測量誤差與不確定度評定\[M\].北京:科學出版社,2008.
責任編輯(責任編輯:杜能鋼)