康博識,苗傳海,侯暢,李宏碩,鄭宇
(1.遼寧省氣象裝備保障中心,遼寧 沈陽 110166;2. 中國氣象科學(xué)研究院 大氣成分與環(huán)境氣象研究所,北京 100081)
無人機(jī)作業(yè)特點(diǎn)是快速、靈活,尤其是在一些惡劣的環(huán)境和條件下,比如獲取海洋、高原、無人區(qū)的氣象資料,無人機(jī)的優(yōu)勢就比較突出[1-2]。無人機(jī)飛行控制技術(shù),能夠在較高的探測精度下連續(xù)工作,直接、有效地進(jìn)行高空氣象數(shù)據(jù)的采集和傳輸,當(dāng)前針對無人機(jī)氣象探測數(shù)據(jù)進(jìn)行處理的研究,具有較好應(yīng)用前景。
張宏偉等[3]軟件定義數(shù)據(jù)中心(SDDC)技術(shù)應(yīng)用到民航氣象數(shù)據(jù)庫系統(tǒng),改進(jìn)民航氣象數(shù)據(jù)庫系統(tǒng)在傳統(tǒng)數(shù)據(jù)中心運(yùn)行中的不足,運(yùn)用虛擬化技術(shù)對本地區(qū)亞洲危險天氣咨詢系統(tǒng)進(jìn)行改造,但該方法整體結(jié)構(gòu)較簡單,研究深度不夠,考慮因素不足,影響其準(zhǔn)確性;陳沖等[4]對氣象環(huán)境歷史數(shù)據(jù)進(jìn)行處理,提出一種基于歷史數(shù)據(jù)挖掘的未來戰(zhàn)場氣象環(huán)境數(shù)據(jù)模糊預(yù)測的算法,通過模糊時間序列算法預(yù)測得出的是一個可能性區(qū)間,在該合理區(qū)間內(nèi)進(jìn)行預(yù)測擬合曲線的自定義,對氣象環(huán)境進(jìn)行合理的干預(yù)調(diào)理,但該方法未考慮數(shù)據(jù)間的關(guān)聯(lián)性,使所得結(jié)果較單調(diào),未突出氣象數(shù)據(jù)中的有效的信息。
以上述分析為基礎(chǔ),研究了在環(huán)境特征下的無人機(jī)氣象探測數(shù)據(jù),關(guān)聯(lián)規(guī)則的挖掘方法,在大量數(shù)據(jù)的分類對比下,實現(xiàn)氣象預(yù)測和報告等功能。
在無人機(jī)空域內(nèi),無人機(jī)航測高程不同,則氣象探測環(huán)境不同,為了獲取最優(yōu)航測高程,需要根據(jù)無人機(jī)的機(jī)翼類型和發(fā)動機(jī)性能,計算最大爬升梯度[5]。
首先,在不同的飛行高度下,獲取極限爬升角度,通常為仰視角,在出發(fā)航線點(diǎn)到終止航線點(diǎn)的爬升梯度,受到仰視角大小的影響,夾角公式為:
(1)
(2)
式(1)和式(2)中:爬升過程中的最大角度用q表示;航線起點(diǎn)用w表示;航線終點(diǎn)用e表示;兩個坐標(biāo)點(diǎn)之間的距離用t(e-w)表示[6]。
設(shè)置出發(fā)航線點(diǎn)到終止航線點(diǎn),均位于空間坐標(biāo)系中,起點(diǎn)航線點(diǎn)用w(xw,yw,zw)表示,終止航線點(diǎn)用e(xe,ye,ze)表示;其中w=1,2,…,r;e=1,2,…,r。
其次,計算探測航線方向。由于慣性作用力,改變飛行航線需要一定時間緩沖,需要在調(diào)整舵角基礎(chǔ)上考慮無人機(jī)的轉(zhuǎn)彎半徑[7]。在平面狀態(tài)下,通過直線段和圓弧段組合而成的復(fù)合路徑,約束無人機(jī)探測路程的最短路線,使其滿足無人機(jī)飛行的最小轉(zhuǎn)彎半徑,約束條件為:
ui≥umin
(3)
式(3)中:無人機(jī)最小的轉(zhuǎn)彎半徑用umin表示;半徑的約束條件用ui表示。在二維平面的模型板塊設(shè)定內(nèi),以轉(zhuǎn)彎半徑作為探測線路的曲率半徑,能夠保證在平面中進(jìn)行矢量轉(zhuǎn)動。
最后,無人機(jī)的飛行軌跡路線上的每一個點(diǎn),均要滿足曲率半徑大于最小轉(zhuǎn)彎半徑后,確認(rèn)最優(yōu)的氣象探測環(huán)境。
不同氣象探測環(huán)境參數(shù)特征與無人機(jī)氣象探測數(shù)據(jù)關(guān)聯(lián),但是關(guān)聯(lián)度不一,例如在夏季和冬季的極端環(huán)境下,空氣中的溫度、濕度等數(shù)據(jù)變化會受到空氣氣流的影響,產(chǎn)生分層效應(yīng)[8]。
設(shè)置夏季氣流可流通的高度界線,用p表示,在p點(diǎn)高度以上的流體氣流為冷空氣,在p點(diǎn)高度以下的流體氣流為暖空氣,瞬時氣流會接近于兩點(diǎn)之間的平均溫度,表達(dá)式為:
(4)
式(4)中:在最優(yōu)的氣象探測環(huán)境內(nèi),能夠與瞬時氣流相關(guān)的因素,分別為區(qū)域的浮力以及高程,用hf和pf表示,單位為m/s2和m;該區(qū)域內(nèi)的瞬時溫度用s表示,單位為℃。
以氣象特征為關(guān)聯(lián)指標(biāo),在不同的氣流轉(zhuǎn)換下對氣象數(shù)據(jù)進(jìn)行預(yù)測。在無人機(jī)探測完畢的空域面積內(nèi),圈定出需要關(guān)聯(lián)的氣象數(shù)據(jù),例如氣壓、相對濕度等,此時空域大小用d表示,單位為m3,確認(rèn)尚未探測完畢的探測面積,挖掘空域內(nèi)所有氣象參數(shù)特征,數(shù)據(jù)挖掘模型表達(dá)式為:
(5)
式(5)中:選定區(qū)域內(nèi)的氣流系數(shù)用v表示;在頂部的氣流系數(shù)為v1,在區(qū)域底部的氣流系數(shù)為vk;兩個位置所在的局部面積[9],分別用d1和dk表示[10]。
無人機(jī)飛行軌跡具有靈動性,在進(jìn)行氣象探測時,受氣象條件影響較大,需要在其執(zhí)行探測任務(wù)時保證安全飛行,即以數(shù)據(jù)挖掘模型為同步操作,保持?jǐn)?shù)據(jù)采集時間節(jié)點(diǎn)的一致性,分析氣象探測環(huán)境參數(shù)特征與無人機(jī)氣象探測數(shù)據(jù)關(guān)聯(lián)度。
根據(jù)無人機(jī)的飛行性能以及空域條件,按照飛行計劃,在探測過程中同步建立數(shù)據(jù)挖掘模型,不間斷地進(jìn)行氣象探測數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘[11],對氣象探測過程中的數(shù)據(jù)進(jìn)行挖掘[12],以此確定不同高程下氣象數(shù)據(jù)的變化規(guī)律,并進(jìn)行氣象環(huán)境的靜態(tài)驗證。
對時間序列中隱藏的環(huán)境因素進(jìn)行挖掘[13],標(biāo)準(zhǔn)化處理無人機(jī)氣象探測數(shù)據(jù),表達(dá)式為:
(6)
采用關(guān)聯(lián)規(guī)則中的奇異值分解方法,提取時間序列中的極端特征,達(dá)到消除極端影響因子的目的,表達(dá)式為:
(7)
當(dāng)數(shù)據(jù)被分成多個小組后,能夠?qū)⒆顑?yōu)的氣象探測環(huán)境特征參數(shù)歸類到所屬數(shù)據(jù)集合,對不同氣象類型進(jìn)行判斷[14]。基于環(huán)境特征關(guān)聯(lián)氣象數(shù)據(jù),對照高程變化規(guī)律,靜態(tài)驗證氣象環(huán)境,完成考慮環(huán)境特征的無人機(jī)氣象探測數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘方法設(shè)計。
將本文方法作為實驗組測試對象,選擇三組傳統(tǒng)挖掘方法作為對照組,分別為K均值聚類挖掘方法和模糊聚類挖掘方法,以及C均值聚類挖掘方法。將三組方法進(jìn)行多輪對照實驗測試,比較不同方法下對氣象數(shù)據(jù)的挖掘準(zhǔn)確率。
氣象數(shù)據(jù)可以反映天氣情況,包含天氣資料和氣候資料兩個類型,其中氣候資料主要指的是,采用氣象儀器探測到的原始資料,氣候資料是進(jìn)行天氣分析和預(yù)報的資料,兩者具備極強(qiáng)的時效性。因此,在極短的時間內(nèi),若氣象數(shù)據(jù)發(fā)生變化后沒有對其進(jìn)行準(zhǔn)確的分析,則會影響后續(xù)的天氣預(yù)報結(jié)果。
現(xiàn)階段我國在各地均具備氣象觀測站,此次利用無人機(jī)技術(shù)對某省的氣象數(shù)據(jù)進(jìn)行采集,以持續(xù)續(xù)航20 h的標(biāo)準(zhǔn)對該地區(qū)的氣象數(shù)據(jù)進(jìn)行采集,將其作為此次實驗測試的樣本數(shù)據(jù),具體如表1所示。
表1 無人機(jī)20 h內(nèi)氣象探測數(shù)據(jù)示例
根據(jù)表1所示內(nèi)容,無人機(jī)在設(shè)定的時間內(nèi),以每隔1 h為探測階段,對該區(qū)域內(nèi)的氣象數(shù)據(jù)進(jìn)行采集。探測的氣象數(shù)據(jù)主要包含三個內(nèi)容,分別為氣壓和相對濕度以及時總雨量,其中時總雨量表示該時段內(nèi)的降雨量。數(shù)據(jù)中該城市在探測期間的降雨量基本為0,表示在該時段內(nèi)為非雨天,說明該城市在探測日當(dāng)天的天氣為晴天。
通過無人機(jī)探測到的氣象數(shù)據(jù),能夠清晰地看出該城市一天內(nèi)的基本天氣變化情況,符合數(shù)據(jù)挖掘的要求,能夠進(jìn)行數(shù)據(jù)關(guān)聯(lián)測試。將選擇的樣本數(shù)據(jù)上傳到MATLAB測試平臺中,分別連接四組挖掘方法,對選擇的數(shù)據(jù)樣本進(jìn)行關(guān)聯(lián)測試。
數(shù)據(jù)挖掘的過程主要是在海量的數(shù)據(jù)中對有效信息進(jìn)行提取和分析,為保證本文方法具有有效性,此次實驗測試分為兩個階段。
首先進(jìn)行第一部分測試,對選擇的數(shù)據(jù)進(jìn)行運(yùn)行時間測試,即在不同的探測時段內(nèi),四組方法對所得數(shù)據(jù)的挖掘時間,是否能夠保證在氣象數(shù)據(jù)發(fā)生變化時滿足時效性的需求。將所有探測到的數(shù)據(jù)導(dǎo)入測試平臺后,能夠直接對樣本數(shù)據(jù)的大小進(jìn)行統(tǒng)計。
為減少此次實驗的測試時間,以5 h為一個時間間隔,對上述數(shù)據(jù)進(jìn)行打包處理。統(tǒng)計完畢后對氣象數(shù)據(jù)包進(jìn)行標(biāo)記,其中A1組為4:00-8:00的數(shù)據(jù),共含有數(shù)據(jù)12000條;A2組為9:00-13:00的數(shù)據(jù),共含有數(shù)據(jù)14000條;A3組為14:00-18:00的數(shù)據(jù),共含有數(shù)據(jù)16000條;A4組為19:00-23:00的數(shù)據(jù),共含有數(shù)據(jù)20000條。四組方法的具體挖掘時間,如圖1所示。
(a)本文方法
(b)K均值聚類挖掘方法
(c)模糊聚類挖掘方法
(d)C均值聚類挖掘方法
根據(jù)圖1所示內(nèi)容,四組數(shù)據(jù)的詞條數(shù)量是逐漸增加的,在本文方法下對不同大小的氣象數(shù)據(jù),均能將挖掘時間保持在4.80s之內(nèi),快速地完成數(shù)據(jù)的關(guān)聯(lián)。而兩組傳統(tǒng)方法的挖掘時間會隨著樣本數(shù)據(jù)的詞條數(shù)據(jù)增加,挖掘的時間也會隨著增加,其中在K均值聚類挖掘方法和C均值聚類挖掘方法下,所用的挖掘時間大幅度增長。
綜合實驗結(jié)果可知:本文方法能夠在較短時間內(nèi)完成數(shù)據(jù)關(guān)聯(lián),對氣象數(shù)據(jù)挖掘的時間越短,才能夠在氣象數(shù)據(jù)變化中保證預(yù)測的時效性。
在對比不同方法的挖掘時間下,能夠看出本文方法的有效性,以此進(jìn)行實驗測試的第二階段,即氣象探測數(shù)據(jù)的挖掘效果對比。將20 h內(nèi)的相對濕度變化進(jìn)行繪制,在不同的挖掘方法下進(jìn)行數(shù)據(jù)對比,每組數(shù)據(jù)的挖掘時間控制在10s之內(nèi),具體情況如圖2所示。
(a)原始數(shù)據(jù)
(b)本文方法與K均值聚類挖掘方法
(c)模糊聚類挖掘方法與C均值聚類挖掘方法
根據(jù)圖2所示內(nèi)容,在本文方法下挖掘到的數(shù)據(jù)結(jié)果,能夠與實際的相對濕度數(shù)值相匹配,而三組傳統(tǒng)方法的關(guān)聯(lián)結(jié)果,與實際數(shù)據(jù)值存在一定差距,其中仍以K均值聚類挖掘方法和C均值聚類挖掘方法的差距較大。綜合實驗結(jié)果可知:本文方法無論是從挖掘時間還是挖掘效果上,都能夠優(yōu)于傳統(tǒng)方法,具備實際應(yīng)用價值。
在分析環(huán)境特征的基礎(chǔ)上,重新設(shè)計了一個氣象數(shù)據(jù)的挖掘方法,對無人機(jī)的氣象探測數(shù)據(jù)進(jìn)行有效關(guān)聯(lián)規(guī)則挖掘,隨著氣象數(shù)據(jù)包的含量增加,均能夠?qū)r間控制在4.8 s以內(nèi),能夠保證氣象數(shù)據(jù)變化的時效性。