盧俊鋼,張世榮,梁少軍,楊 毅
(1.武漢大學(xué) 電氣與自動化學(xué)院, 武漢 430072;2.陸軍工程大學(xué) 軍械士官學(xué)校, 武漢 430075)
無人機具有易開發(fā)、成本低、靈活性強等特點,近年來在軍事、民用領(lǐng)域得到了長足發(fā)展和廣泛應(yīng)用。其中,固定翼無人機(Fixed-Wing Unmanned Aerial Vehicles,F(xiàn)W-UAVs)集成技術(shù)先進、造價高、系統(tǒng)復(fù)雜,一般應(yīng)用于速度快、距離遠和續(xù)航久的場景。FW-UAV的性能會隨著運行時間增加逐漸衰退,導(dǎo)致故障發(fā)生率增高。FW-UAV一旦因故障墜毀會導(dǎo)致較大的經(jīng)濟損失甚至引發(fā)軍事、政治和社會影響。故使用故障預(yù)測和健康管理技術(shù)提升無人機設(shè)備的可靠性與可用性具有重要意義,眾多學(xué)者圍繞此問題進行了大量深入研究。
FW-UAV的設(shè)備復(fù)雜性、任務(wù)規(guī)劃多變性和環(huán)境多樣性導(dǎo)致其工作狀態(tài)反復(fù)切換,呈現(xiàn)多工況特征,這給基于數(shù)據(jù)的故障預(yù)測和健康管理帶來諸多挑戰(zhàn)。因此,有必要對無人機的多工況問題進行研究。從數(shù)據(jù)挖掘角度看,F(xiàn)W-UAV的多工況分析是典型的數(shù)據(jù)分組問題,可以使用聚類算法解決,在線數(shù)據(jù)分類則屬于模式識別問題。常見的聚類算法有層次聚類、密度聚類和譜聚類等。目前已經(jīng)出現(xiàn)了基于相似性(距離)、基于神經(jīng)網(wǎng)絡(luò)和基于機器學(xué)習(xí)等方法的模式識別,并被廣泛應(yīng)用于工業(yè)、軍事等領(lǐng)域。例如,張俊楠等將支持向量機與二叉樹結(jié)構(gòu)相結(jié)合對分布式光纖擾動傳感系統(tǒng)的擾動模式進行了有效識別。別鋒鋒等利用ICEEMDAN算法提取了往復(fù)泵的故障特征,并使用GRNN神經(jīng)網(wǎng)絡(luò)進行故障識別,有效提高了識別準確度。王爍等基于反向傳播神經(jīng)網(wǎng)絡(luò)對多因素作用下破片對靶板的侵徹毀傷模式進行了有效識別。劉凡等利用小波包分解提取了電力變壓器的多維度能量特征,進而使用近鄰算法實現(xiàn)局部放電超高頻信號的模式識別。張陽陽等使用概率神經(jīng)網(wǎng)絡(luò)對齒輪箱典型故障進行了有效識別。
以上方法在不同領(lǐng)域應(yīng)用收到了較好效果,但無法直接應(yīng)用于FW-UAV工況分析。主要原因在于:含類標的FW-UAV數(shù)據(jù)很難獲取,導(dǎo)致監(jiān)督模式識別算法無法應(yīng)用;FW-UAV數(shù)據(jù)鏈傳輸速率快,在線數(shù)據(jù)量大,對工況識別算法時效性要求高。為解決以上問題,本文將聚類分析與模式識別算法相結(jié)合,采用組合算法來實現(xiàn)無人機多工況的高效分析。擬提出一種基于分組的非監(jiān)督密度聚類(Group-based DBSCAN,G-DBSCAN)算法,在不依賴數(shù)據(jù)工況類標基礎(chǔ)上實現(xiàn)多工況分析;并將提出一種基于多維度分解的快速工況識別算法(Pattern Recognition based on Dimensional Decomposition,PRDD),PRDD將進一步與聚類算法深度融合以實現(xiàn)FW-UAV在線數(shù)據(jù)工況識別的快速性和準確性。
FW-UAV執(zhí)行任務(wù)的全流程包含起飛、巡航、遂行任務(wù)、返航、回收等多個階段,屬于典型的多工況過程,若將其簡單處理為一個工況,則會因模型失配降低故障預(yù)測、故障診斷、剩余壽命預(yù)測等數(shù)據(jù)驅(qū)動算法的準確率。
這里以某FW-UAV實際飛行數(shù)據(jù)集中縱向控制回路與速度控制回路相關(guān)數(shù)據(jù)為例,展示其多工況特征并說明工況分析的必要性。FW-UAV縱向控制回路與速度控制回路均是閉環(huán)反饋回路,相關(guān)的變量包括俯仰角、升降舵偏角、發(fā)動機缸溫、發(fā)動機轉(zhuǎn)速和高度共5維數(shù)據(jù)。圖1為某飛行時間段該5維數(shù)據(jù)歸一化后的飛行曲線。從圖1可以看出,隨著時間推移曲線幅值波動較大且各維度數(shù)據(jù)呈現(xiàn)非線性關(guān)系,無法從直觀角度辨識工況。為進一步分析無人機工況特征,下一節(jié)將基于數(shù)據(jù)分布特征,提出一種密度聚類算法對其進行多工況分析。
圖1 FW-UAVs某飛行時間段飛行曲線
DBSCAN作為基于密度的聚類算法,能夠在數(shù)據(jù)集中找出具有不同大小和形狀的簇,對噪聲有較強的魯棒性,能基于數(shù)據(jù)自主推測聚類個數(shù)。DBSCAN的主要參數(shù)為掃描半徑和核心點最小數(shù)據(jù)量Min,算法將數(shù)據(jù)集中的樣本點分為核心點、邊界點和離群點3類。在DBSCAN算法中定義了兩點之間3種特殊關(guān)系:直接密度可達、密度可達以及密度相連。經(jīng)典DBSCAN算法將原始數(shù)據(jù)集中的所有樣本點視為潛在的核心點逐個掃描,若確認為核心點則將與其密度相連的所有數(shù)據(jù)點視為同一類。以下提出了一種基于分組的DBSCAN算法,它將數(shù)據(jù)分布特性融入經(jīng)典DBSCAN算法,旨在提高算法的效率。
對于數(shù)據(jù)集中的給定點,∈,令,表示點和之間的距離,,()表示點到其第個最近鄰點()的距離。在距離基礎(chǔ)上進一步定義分組核心點、分組離群點和分組待定點。
1) 分組核心點:對于給定點∈,若,(Min)≤,則將該點標記為分組核心點。這就意味著點與其第Min個最近鄰點的距離小于。
2) 分組離群點:對于給定點∈,若,(Min)>2,則將該點標記為分組離群點。
3) 分組待定點:給定點∈,當<,(Min)≤2時,將其標記為分組待定點。顯然,邊界點以及離群點都有可能是待定點,因此還需進一步采取策略進行識別。
使用基于KD樹的最近鄰搜索算法獲取數(shù)據(jù)集中的每個點到其第Min個最近鄰點的距離,并將得到的距離值以升序進行排序,就可以得到距離曲線(Min-th distance Curve,MC),如圖2所示。
圖2 樣本點到其第MinPts個最近鄰點的距離曲線
令、、分別表示分組核心點、分組待定點以及分組離群點。以圖3(a)為例,此時Min=3,所有核心點、、、、均屬于。因為,(3)=,>2,故點屬于,而另外2個真實離群點與被臨時收集在中。此例說明包含了所有的核心點,包含了部分的真實離群點,而包含了邊界點和離群點。其中中的離群點并不參與最終的聚類結(jié)果,因此可以被直接剔除以提高算法效率。由于核心點將決定最終聚類的形狀、大小以及數(shù)量,因此可以對使用經(jīng)典DBSCAN算法,并設(shè)置Min=1,以獲得聚類結(jié)果,如圖3(b)所示。由于已經(jīng)獲得了數(shù)據(jù)間的距離矩陣,聚類結(jié)果獲取時可直接調(diào)用該矩陣以進一步提高算法效率。
圖3 2種方法的聚類結(jié)果示意圖
(1)
輸入:
(1):原始數(shù)據(jù)集
(2):掃描半徑
(3) Min:核心點最小數(shù)據(jù)量
輸出:
(1)、、:分組核心點、待定點、離群點類標
方法:
(1) 初始化=,=,=
(2) 使用基于KD樹的最近鄰搜索獲取MC曲線及距離矩陣
(3) for中每個點
if≤then=∪
else if<≤2then=∪
else=∪
end if
end for
(4) 將中的所有點都標記為噪聲
(5) 執(zhí)行DBSCAN算法(,,1)來獲得每個核心點的簇ID
end if
end for
前一節(jié)使用G-DBSCAN算法對FW-UAV原始數(shù)據(jù)完成聚類分析后,會將原始數(shù)據(jù)集分為若干個簇,并標以不用的類標,即完成數(shù)據(jù)分組。本文將密度聚類算法與工況識別深度結(jié)合,充分利用已完成聚類的核心點信息,融合主成分分析法,提出一種基于多維度分解的模式識別算法(PRDD),完成新數(shù)據(jù)的聚類類標模式識別。
該算法首先將聚類獲得的核心點數(shù)據(jù)以及新數(shù)據(jù)使用主成分分析法(principal component analysis,PCA)降維,以提高運算效率,進而對兩類數(shù)據(jù)進行維度分解,通過判斷各個維度上新數(shù)據(jù)一定鄰域內(nèi)核心點數(shù)據(jù)的分布情況,結(jié)合邏輯運算粗略推定新數(shù)據(jù)周邊有無核心點。之后根據(jù)核心點數(shù)量以及與新數(shù)據(jù)的真實距離準確識別測試數(shù)據(jù)的類標。
輸入:
(1): G-DBSCAN中的核心點矩陣
(2): G-DBSCAN中的核心點類標矩陣
(3): 測試數(shù)據(jù),即新數(shù)據(jù)
(4): G-DBSCAN算法中鄰域半徑
輸出:
(1):新數(shù)據(jù)的多工況識別類標
方法:
(1) 基于實現(xiàn)、的降維
(2) 初始化類標矩陣
(3) for中每個點do
創(chuàng)建的鄰近點集合,并初始化
for中每個點do
將加入鄰近點集合
end if
end for
end for
if=then
標記為噪聲點
else if()==1 then僅一個核心點
if ‖-‖≤then‖·‖為二范數(shù)計算
else 標記為噪聲點
end if
else 從中剔除與距離大于的核心點
if=then
標記為噪聲點
else if()==1 then
else if()>1 then
if中所有核心點類標相同 then
end if
end if
end if
end for
以上算法相比較于傳統(tǒng)模式識別算法具有以下優(yōu)勢:
1) 無額外參數(shù)。該算法僅需輸入G-DBSCAN算法(或是其他以密度聚類為核心的算法)的掃描半徑,因此可擺脫部分機器學(xué)習(xí)算法中所存在的超參數(shù)調(diào)節(jié)困擾;
2) 無需建模。該算法在深度研究密度聚類算法的基礎(chǔ)上,從維度分解以及數(shù)學(xué)規(guī)律層面對新數(shù)據(jù)進行工況識別,無需依靠訓(xùn)練數(shù)據(jù)進行建模,故也不存在模型過擬合、欠擬合以及陷入局部最優(yōu)的問題;3) 開銷小。該算法充分利用維度分解的便利性,在各個維度上分別執(zhí)行查找運算,之后通過邏輯判斷將待處理范圍縮小后再運行計算開銷較大的距離運算。與其他基于相似性/距離、基于神經(jīng)網(wǎng)絡(luò)和基于機器學(xué)習(xí)的模式識別方法相比,本算法具有顯著的計算優(yōu)勢。
工況聚類和在線工況識別是無人機故障診斷和健康管理的前提,多工況分析平臺設(shè)計如圖4所示,該平臺可進一步服務(wù)于無人機故障診斷和健康管理系統(tǒng)。圖4中,機載飛行控制計算機采集飛機俯仰角、升降舵偏角、高度、發(fā)動機缸溫和轉(zhuǎn)速狀態(tài)信息,并編碼形成遙測數(shù)據(jù)通過數(shù)據(jù)鏈發(fā)送至地面設(shè)備。地面設(shè)備接收并處理遙測信息,在對遙測數(shù)據(jù)清洗和采樣后存入歷史飛行數(shù)據(jù)庫。終端設(shè)備封裝了G-DBSCAN算法以及PRDD工況識別算法,執(zhí)行多工況聚類與識別算法運算。以下首先以獲得的實飛數(shù)據(jù)為例進行算法驗證。
圖4 無人機多工況分析平臺框圖
利用圖4所示分析平臺獲取了FW-UAV的實飛數(shù)據(jù)集,以下取某次飛行數(shù)據(jù)用于算法驗證。從數(shù)據(jù)集中選取數(shù)據(jù)量=500的數(shù)據(jù)樣本,數(shù)據(jù)維度=5(飛行數(shù)據(jù)曲線見圖1)。首先使用PCA算法降至二維,并設(shè)置G-DBSCAN算法參數(shù)Min=8,=007,算法首先得到飛行采樣數(shù)據(jù)MC曲線。根據(jù)MC曲線縱軸距離值與的關(guān)系可將飛行采樣數(shù)據(jù)劃分為分組核心點、分組待定點和分組離群點。如圖5所示,圖中縱軸距離值小于等于的區(qū)間聚集了所有的分組核心點,在與2區(qū)間聚集了待定點數(shù)據(jù),在大于2的區(qū)間收集了分組離群點,這一結(jié)果與3.1算法描述一致。
本文算法測試環(huán)境為Matlab 2020b,終端設(shè)備配置為主頻2.2 GHz,內(nèi)存16 G。根據(jù)G-DBSCAN算法步驟,圖6(a)、圖6(b)和圖6(c)為使用分組策略所獲取的3種不同數(shù)據(jù)的聚類結(jié)果。圖6(a)為算法篩選出的離群數(shù)據(jù)。圖6(b)為篩選得到的分組核心點數(shù)據(jù)在重新設(shè)定Min=1之后執(zhí)行經(jīng)典DBSCAN算法所獲得的聚類結(jié)果,從圖中可以看出分組核心點被聚為5類,由于分組核心點聚類結(jié)果表征了聚類的大致分布結(jié)構(gòu),因此可以斷定最終聚類結(jié)果將被分為5類,且邊界點將分布在此5類核心點數(shù)據(jù)簇的邊緣。在圖6(c)中,分組待定點中的邊界點被劃分到各核心點組成的簇中,而離群點被單獨標記。此過程將針對分組待定點的聚類分析過程轉(zhuǎn)化為了聚類類標識別過程,提升了算法效率。匯總以上結(jié)果即可得到算法最終聚類結(jié)果,如圖6(d)所示。圖6(e)為傳統(tǒng)DBSCAN算法聚類結(jié)果,對比G-DBSCAN算法,后者在保證了不影響原有聚類效果的前提下,平均運行時間從0.021 27 s減少到0.006 3 s,有效提高了算法的效率。
圖5 無人機飛行數(shù)據(jù)的MC曲線
圖6 FW-UAVs飛行數(shù)據(jù)聚類結(jié)果示意圖
綜上,G-DBSCAN算法能更快獲取到聚類核心點,無需重復(fù)遍歷原始數(shù)據(jù)集,結(jié)合后續(xù)模式識別算法將有效提高整體技術(shù)路線運行效率。
從已完成聚類分析的數(shù)據(jù)集中提取核心點矩陣及其對應(yīng)的類標矩陣,同時從該數(shù)據(jù)集中分別隨機選取20、35、50的數(shù)據(jù)制成測試數(shù)據(jù)20、35、50用于PRDD工況識別算法的驗證。首先使用PCA算法將核心點矩陣及3組測試數(shù)據(jù)降至2維,并將降維后的、20、35、50以及參數(shù)(聚類時設(shè)置的參數(shù))輸入PRDD算法,結(jié)果如圖7所示。該算法在3種測試數(shù)據(jù)集下的識別率均達到100%。
圖7 3種測試數(shù)據(jù)集下的識別結(jié)果示意圖
為了進一步檢驗該算法的優(yōu)劣,選取了幾類常見的模式識別算法進行比較:加權(quán)近鄰算法(weighted-nearest neighbor,WKNN)、反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)、概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)以及支持向量機(support vector machine,SVM)。從數(shù)據(jù)集中隨機選取80%作為上述算法的訓(xùn)練數(shù)據(jù),剩余20%作為測試數(shù)據(jù),使用上述算法分別對無人機工況進行識別,并將識別結(jié)果與PRDD算法的結(jié)果列表。如表1所示。
表1 不同模式識別算法的識別結(jié)果
由表1可知:文章所提算法在識別準確率和運行時間方面較其他算法具有明顯優(yōu)勢,進一步驗證了算法的有效性和實用性。
提出了“聚類分析-模式識別”相結(jié)合的多工況識別技術(shù)路線。聚類分析階段從數(shù)據(jù)挖掘角度分析FW-UAV飛行數(shù)據(jù),使用非監(jiān)督改進型密度聚類算法G-DBSCAN解決了FW-UAV工況劃分難題,與工況識別緊密結(jié)合,融合主成分分析法,提出了基于多維度分解的快速工況識別算法。在已有聚類核心點類標的基礎(chǔ)上,充分利用維度分解的計算便利性,通過執(zhí)行查找和組合邏輯運算減小了計算開銷,并進一步進行精確識別。相比較于傳統(tǒng)模式識別算法,能夠在保持較高工況識別準確率的同時有效提高算法效率。