国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的航空安全因果預(yù)測(cè)新方法

2023-03-09 02:54岳珠峰崔利杰
關(guān)鍵詞:航空安全安全事件重要性

任 博, 岳珠峰, 司 勇, 崔利杰, 曾 航

(1. 空軍工程大學(xué)裝備管理與無人機(jī)工程學(xué)院, 陜西 西安 710052; 2. 西北工業(yè)大學(xué)力學(xué)與土木建筑學(xué)院,陜西 西安 710129; 3. 中國(guó)人民解放軍913129部隊(duì), 北京 100076)

0 引 言

通過研究航空事故與因果因素的內(nèi)在關(guān)系,預(yù)測(cè)航空安全,確定事故規(guī)則,能實(shí)現(xiàn)對(duì)未來飛行安全趨勢(shì)的預(yù)測(cè)[1]。精確航空安全預(yù)測(cè)模型對(duì)于實(shí)現(xiàn)航空安全智能管理、事前決策及應(yīng)急管理等具有重要意義[2]。多家航空公司已經(jīng)充分認(rèn)識(shí)到數(shù)據(jù)對(duì)安全管理的重要性,數(shù)據(jù)分析結(jié)果(超限事件、免責(zé)信息分析、安全監(jiān)控等)已經(jīng)初步應(yīng)用于航空安全管理中,提升了管理安全效率,減少了事故損失[3-4]。

然而,航空事故發(fā)生是由各種因素相互交織影響所造成的,包含飛機(jī)因素、管理因素、環(huán)境因素、人為因素、外在因素等諸多不確定性因素。航空事故誘因復(fù)雜,具有低頻性、隨機(jī)性、時(shí)變性和高維性等特點(diǎn),預(yù)測(cè)建模難度大。目前,航空安全預(yù)測(cè)主要是時(shí)間序列預(yù)測(cè),大多采用參數(shù)、非參數(shù)、貝葉斯網(wǎng)絡(luò)、人工智能[5-7]等方法建立航空安全時(shí)間序列開展預(yù)測(cè)。王衍洋等[8]用樣條插值函數(shù)對(duì)航空安全綜合指數(shù)進(jìn)行預(yù)測(cè)分析,研究人為因素與航空安全的影響關(guān)系,提高了對(duì)非線性數(shù)據(jù)的適用性。甘旭升、丁松濱、呂雪梅等[9-11]利用誤差反饋神經(jīng)網(wǎng)絡(luò)、自回歸移動(dòng)平均等方法對(duì)飛行事故進(jìn)行研究。然而,上述模型都屬于“黑箱”[12]模型,輸入和輸出內(nèi)部機(jī)理未知,輸入對(duì)輸出影響難以確定,預(yù)測(cè)變量解釋不清晰,無法實(shí)現(xiàn)根據(jù)輸出預(yù)測(cè)結(jié)果的逆向分配,支持航空安全管理力度有限。

隨機(jī)森林(random forest, RF)模型是以分類樹[13-14]為支撐的機(jī)器學(xué)習(xí)算法,具有分類、回歸、預(yù)測(cè)等功能,且該模型廣泛應(yīng)用于參數(shù)優(yōu)化、變量排序及分析解釋方面。目前,該方法在生態(tài)、氣象、電力及農(nóng)業(yè)預(yù)測(cè)等方面成功應(yīng)用,然而,RF方法在航空安全預(yù)測(cè)的能力尚未得到充分認(rèn)識(shí),相應(yīng)參考文獻(xiàn)較為缺乏。

本文針對(duì)航空安全態(tài)勢(shì)感知、智能管理[15]的迫切需求,構(gòu)建RF模型,以某航空公司2017~2019年安全數(shù)據(jù)為對(duì)象,研究航空安全態(tài)勢(shì)預(yù)模型構(gòu)建、預(yù)測(cè)變量貢獻(xiàn)度量以及航空安全中飛機(jī)、管理、環(huán)境、人為、外在等因素對(duì)航空不安全事件的影響關(guān)系,為航空安全預(yù)測(cè)、預(yù)警及事故預(yù)防提供了理論依據(jù)。

1 航空安全因果預(yù)測(cè)

1.1 航空安全因果關(guān)系定義

航空安全因果預(yù)測(cè)[16]基于事故致因理論,建立致因因素與事故后果之間的因果對(duì)應(yīng)關(guān)系,在一定樣本基礎(chǔ)上,用參數(shù)、非參數(shù)、貝葉斯網(wǎng)絡(luò)、人工智能等方法建立事件后果和致因因素之間的替代模型,進(jìn)而研究輸入和輸出的映射關(guān)系,完成航空安全預(yù)測(cè)。模型定義為

Y=G(X)

(1)

式中:Y=(Y1,Y2,…,Yn)表示n種不同類型航空安全不安全事件,如Y1為一等飛行事故,Y2為二等飛行事故,Y3為航空事故癥候;X=(X1,X2,…,Xm)表示導(dǎo)致航空不安全事件發(fā)生的致因因素,如X1為外來影響事件、X2為設(shè)施設(shè)備不安全事件、X3為環(huán)境因素,X4為管理因素,X5為人為因素(飛行和地面人員)等。此外,Y和X是時(shí)間的函數(shù)。

1.2 基于Bow-tie模型的航空安全致因變量關(guān)聯(lián)辨識(shí)

Bow-tie模型[17]是結(jié)合故障樹及事件樹,綜合考慮事故起因、后果、防控措施等建立的事故前后、基本事件和后果的關(guān)系。Bow-tie模型示意圖如圖1所示。其中,BE:基本事件;IE:中間事件;CE:頂事件;SE:控制事件;OE:后果事件。

圖1 Bow-tie模型示意圖Fig.1 Schematic diagram of Bow-tie model

(2)

(3)

基于Bow-tie模型開展航空事故機(jī)理的致因分析,可以得到確定航空安全的事故致因變量,結(jié)合某航空公司安全監(jiān)察數(shù)據(jù),如表1所示。由此可見,在Bow-tie模型基礎(chǔ)上構(gòu)建航空安全預(yù)測(cè)模型,難點(diǎn)在于:① 航空事故致因因素多,高維建模難;② 事故樣本少,量化難;③ 致因因素受環(huán)境影響大,具有復(fù)雜高維非線性關(guān)系,建模難度大。值得注意的是,航空安全分析、因果預(yù)測(cè)的基礎(chǔ)在于數(shù)據(jù)變量的甄選[18]??紤]較多變量會(huì)造成數(shù)據(jù)冗余,從而降低預(yù)測(cè)效率,疏忽關(guān)鍵變量則會(huì)造成預(yù)測(cè)精度降低。文獻(xiàn)[19]指出,RF方法在參數(shù)優(yōu)化、變量排序以及后續(xù)變量分析解釋等方面優(yōu)勢(shì)明顯,能將航空致因變量特征集進(jìn)行袋外求解,計(jì)算每個(gè)特征重要性,按照重要性降序排列,完成重要變量的確定和冗余變量的剔除,確定核心的關(guān)鍵“安全數(shù)據(jù)”。

表1 基于Bow-Tie模型的航空安全關(guān)鍵風(fēng)險(xiǎn)及危險(xiǎn)源分析

2 數(shù)據(jù)與方法

2.1 研究數(shù)據(jù)

本文數(shù)據(jù)來源于某航空公司質(zhì)量安全監(jiān)察數(shù)據(jù)庫(kù)?;贐ow-tie模型分析結(jié)果,建立航空安全數(shù)據(jù)清單,統(tǒng)計(jì)航空公司2017~2019年不安全事件數(shù)據(jù),如表1所示。本文將部分?jǐn)?shù)據(jù)作為訓(xùn)練樣本,另外部分作為測(cè)試數(shù)據(jù),驗(yàn)證算法精準(zhǔn)度和效率。選取5個(gè)航空安全致因因素來說明對(duì)航空安全影響,如表2所示。

表2 變量指標(biāo)

訓(xùn)練和驗(yàn)證的數(shù)據(jù)分布如圖2所示,其中散點(diǎn)表示樣本中參數(shù)的值,箱線圖中有樣本均值、最大值、最小值、中位數(shù)等分布信息。

圖2 訓(xùn)練和驗(yàn)證數(shù)據(jù)庫(kù)樣本分布Fig.2 Database sample distribution in training and validation

圖2橫軸為航空安全致因因素輸入變量Xi及輸出變量Y,縱軸用箱線圖表示各輸入變量Xi及輸出變量Y的樣本分布。由于不同類型航空不安全事件具有不同量綱,所有變量進(jìn)行無量綱化,具體方法如下:

(4)

式中:xj為歸一化后數(shù)據(jù);xj.max,xj.min分別為最大值和最小值。

RF是一種機(jī)器學(xué)習(xí)方法,可用于樣本分類,模型生成決策樹數(shù)目(Ntree)和選擇分裂屬性個(gè)數(shù)(Mtry),在樣本分類中起著關(guān)鍵作用,影響結(jié)果準(zhǔn)確性。RF回歸對(duì)噪聲數(shù)據(jù)容忍度較高,對(duì)高維數(shù)據(jù)具有良好預(yù)測(cè)能力[20-21]。由一組無關(guān)回歸決策樹{h(x,θk),k=1,2,…,K}構(gòu)成K棵集成決策樹,表示為

(5)

式中:X為安全致因因素;k為決策樹數(shù)量;θk為獨(dú)立同分布隨機(jī)向量。

2.2 模型構(gòu)建

基于RF的航空安全預(yù)測(cè)模型為提高模型的預(yù)測(cè)精度,結(jié)合袋裝法和隨機(jī)子空間法對(duì)模型進(jìn)行了構(gòu)建[20-22]。

(1) 袋裝法:從樣本集中多次放回采樣大小為N的K個(gè)訓(xùn)練集,對(duì)于每個(gè)訓(xùn)練集建立回歸模型。假設(shè)樣本容量為N,則每次放回抽樣,每個(gè)樣本不被抽中的概率為(1-1/N)N,未被選中的樣本稱為袋外數(shù)據(jù)(out of bag, OOB)。同時(shí),由于訓(xùn)練樣本集元素各不相同,這就保證了回歸樹模型的差異性。

(2) 隨機(jī)子空間法:對(duì)生成的回歸樹進(jìn)行節(jié)點(diǎn)分裂,選取Mtry個(gè)變量作為當(dāng)前節(jié)點(diǎn)分裂子集,根據(jù)決策樹方法選擇最優(yōu)的分裂方式進(jìn)行回歸樹的構(gòu)建,該方法降低了各回歸樹之間的相關(guān)性,增加了其構(gòu)建時(shí)的隨機(jī)性。

本文構(gòu)建航空不安全事件RF的流程如圖3所示。

圖3 基于RF的回歸航空安全態(tài)勢(shì)預(yù)測(cè)流程圖Fig.3 Flow cart for regression aviation security posture prediction based on RF

(3) RF回歸模型不但能精確地估測(cè)航空安全態(tài)勢(shì),而且還可給出各個(gè)變量的重要性評(píng)分、輸入對(duì)輸出影響程度。基于基尼系數(shù)和基于OOB誤差是常用的變量重要性評(píng)分統(tǒng)計(jì)量,本文中基于OOB誤差得到各變量的重要性。若xj(j=1,2,3,4)為輸入變量,則在第k棵樹上的重要性Ik為隨機(jī)置換變量前后OOB估測(cè)誤差的差值[23]。其計(jì)算公式為

(6)

變量xi在整個(gè)隨機(jī)森林中的重要性得分為

(7)

考慮預(yù)測(cè)模型具有隨機(jī)性,每次預(yù)測(cè)的I(xi)具有一定差異性,通過對(duì)20次計(jì)算結(jié)果取均值即為各變量權(quán)重。

2.3 模型檢驗(yàn)

本文綜合考慮采用決定系數(shù)、均方根誤差、相對(duì)均方根誤差來評(píng)估模型的預(yù)測(cè)能力,同時(shí)繪制預(yù)測(cè)值和實(shí)測(cè)值間的1∶1關(guān)系圖,相關(guān)指標(biāo)表達(dá)式如下所示。

決定系數(shù):

(8)

均方根誤差:

(9)

相對(duì)均方根誤差:

(10)

式中:mean表示樣本均值;X(i)表示數(shù)據(jù)集中第第i個(gè)樣本;X(i)P表示X(i)所對(duì)應(yīng)的預(yù)測(cè)樣本點(diǎn)(i=1,2,…,n)。

3 結(jié)果與討論

3.1 回歸模型參數(shù)優(yōu)化

在回歸樹模型中,采用的是決策樹方法對(duì)節(jié)點(diǎn)自上向下進(jìn)行隨機(jī)分裂,直到分支到葉節(jié)點(diǎn),預(yù)測(cè)值由葉節(jié)點(diǎn)輸出,RF模型由所有回歸樹構(gòu)成。根據(jù)模型輸出的航空安全態(tài)勢(shì)預(yù)測(cè)值求平均值即得到最終航空安全預(yù)測(cè)結(jié)果。以某航空公司2017~2019年航空安全數(shù)據(jù)為研究對(duì)象,基于RF構(gòu)建航空安全預(yù)測(cè)模型,如圖4所示。

圖4 航空安全RF模型圖Fig.4 RF model diagram of aviation safety

RF使用默認(rèn)參數(shù)即可得到不錯(cuò)結(jié)果,其調(diào)參過程是確定決策樹個(gè)數(shù)Ntrees和每棵樹分裂時(shí)最大特征數(shù)Leaf,優(yōu)化算法可搜索參數(shù)全域來確定算法最優(yōu)參數(shù)。本文對(duì)RF模型參數(shù)的優(yōu)化過程及結(jié)果如圖5所示。

圖5 RF模型參數(shù)優(yōu)化結(jié)果Fig.5 RF model parameter optimization results

圖6 航空安全RF模型的誤差估計(jì)圖Fig.6 Error estimation plot for aviation safety RF model

圖6橫軸為隨機(jī)森林樹個(gè)數(shù),縱軸為模型均方誤差。隨著樹數(shù)量增加,模型誤差逐漸遞減,可以看出當(dāng)K為150時(shí),OOB誤差趨于平穩(wěn),故將K設(shè)為150。因此,本文航空安全預(yù)測(cè)模型樹數(shù)量確定為150。

3.2 航空安全預(yù)測(cè)模型變量篩選

RF預(yù)測(cè)模型變量篩選的主要指標(biāo)是變量對(duì)提高模型預(yù)測(cè)精度的貢獻(xiàn)能力,通過對(duì)指標(biāo)進(jìn)行排序,從而獲得各變量的重要性排序,指標(biāo)值越大,則變量越重要。針對(duì)本文航空安全預(yù)測(cè)模型變量進(jìn)行重要性排序,排序結(jié)果如圖7所示。

圖7 RF回歸模型變量篩選Fig.7 RF regression model variable screening

圖7橫軸為針對(duì)影響航空安全的輸入變量,縱軸為預(yù)測(cè)輸入變量的重要性。由圖7可知,本文對(duì)“X1為外來影響事件、X2為設(shè)施設(shè)備不安全事件、X3為環(huán)境因素、X4為管理因素、X5為人為因素(飛行和地面人員)”等變量對(duì)航空安全影響的重要性進(jìn)行度量。圖7中,環(huán)境因素對(duì)航空安全的影響最大,需要重點(diǎn)監(jiān)控,比如需增加驅(qū)鳥頻次,降低鳥撞因素對(duì)航空安全影響,加強(qiáng)惡劣天氣環(huán)境的預(yù)報(bào)預(yù)測(cè),及時(shí)告知飛行人員做出應(yīng)對(duì),建議指揮員變更計(jì)劃,要求機(jī)務(wù)人員采取特殊天氣環(huán)境的飛機(jī)適應(yīng)性措施(除冰,防沙塵等);人為因素和設(shè)施設(shè)備對(duì)航空安全影響的重要性次之,且兩者影響程度相當(dāng);管理因素對(duì)航空安全預(yù)測(cè)結(jié)果影響較小,為降低模型復(fù)雜度和提高計(jì)算效率可忽略。

3.3 航空安全預(yù)測(cè)精度分析

基于隨機(jī)RF進(jìn)行變量選擇,分別按飛機(jī)因素、管理因素、環(huán)境因素、人為因素、外在因素等開展訓(xùn)練。圖8為由RF方法預(yù)測(cè)航空安全與實(shí)際值間的散點(diǎn)關(guān)系圖。圖8橫軸為航空不安全事件(X1為外來影響事件、X2為設(shè)施設(shè)備不安全事件、X3為環(huán)境因素、X4為管理因素、X5為人為因素(飛行和地面人員))實(shí)測(cè)值,縱軸為基于RF模型航空不安全事件的預(yù)測(cè)值。結(jié)果表明,由本文預(yù)測(cè)模型得到的預(yù)測(cè)值和實(shí)際值相關(guān)性較高,其中決定系數(shù)、均方根誤差、相對(duì)均方根誤差等指標(biāo)也較為理想,這表明利用RF來預(yù)測(cè)航空安全態(tài)勢(shì)是可行的。

圖8 基于RF模型航空安全預(yù)測(cè)估算情況Fig.8 Prediction and estimation of aviation safety based on RF model

3.4 航空安全RF預(yù)測(cè)優(yōu)勢(shì)

航空安全預(yù)測(cè)中,采用預(yù)測(cè)響應(yīng)變量與致因輸入變量間的關(guān)系來闡述航空安全的影響機(jī)理以及實(shí)現(xiàn)航空安全在空間或時(shí)間維度上的預(yù)測(cè),如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等被用于航空安全預(yù)測(cè)。然而,航空安全變化規(guī)律受多種不確定性的影響,各變量之間表現(xiàn)為較為繁雜高維的非線性關(guān)系,預(yù)測(cè)建模難。以該航空公司為研究對(duì)象,本文又基于神經(jīng)網(wǎng)絡(luò)[25]、相關(guān)向量機(jī)[26]開展預(yù)測(cè),并和RF方法進(jìn)行了對(duì)比,結(jié)果如表3所示。

表3 3種預(yù)測(cè)模型效果對(duì)比

如表3所示,在相同樣本規(guī)模情況下,RF模型不論是決定系數(shù)還是預(yù)測(cè)效果都比較好,決定系數(shù)達(dá)到0.91,均方根誤差達(dá)到9.7%。比相關(guān)向量機(jī)和神經(jīng)網(wǎng)絡(luò)更適合建立航空安全預(yù)測(cè)模型。神經(jīng)網(wǎng)絡(luò)和相關(guān)向量機(jī)在建模方面的弊端主要表現(xiàn)在難以解釋航空安全內(nèi)部的實(shí)際影響機(jī)理,也無法知道輸入致因變量對(duì)航空安全總體的重要性大小。相反,RF模型具有篩選重要性變量的能力,同時(shí)為防止過度擬合,引入了兩個(gè)隨機(jī)參數(shù)(k,m)。因此,在航空安全態(tài)勢(shì)預(yù)測(cè)中,可考慮引入航空安全度量指標(biāo)(強(qiáng)制不安全事件)為劃分依據(jù)的RF模型。

4 結(jié) 論

機(jī)器學(xué)習(xí)是開展航空智能管理及輔助決策的重要手段。在諸多機(jī)器學(xué)習(xí)算法中,RF模型相對(duì)于神經(jīng)網(wǎng)絡(luò)、相關(guān)向量機(jī)模型具有較為明顯的優(yōu)勢(shì),更適用于航空安全趨勢(shì)及致因因素預(yù)測(cè)。

(1) 基于Bow-tie模型組合的RF算法用于航空安全因果預(yù)測(cè)能有效預(yù)測(cè)航空安全關(guān)鍵因素及航空安全態(tài)勢(shì)的變化趨勢(shì)。預(yù)測(cè)精度達(dá)到90%以上,表明RF能夠很好地描述航空安全致因變量與航空安全之間的非線性關(guān)系。

(2) 本文所提航空安全因果預(yù)測(cè)通過研究致因因素(飛機(jī)因素、管理因素、環(huán)境因素、人為因素、外在因素)變化關(guān)系,進(jìn)而研究事故變化規(guī)律,解決了事故樣本少、難于度量的問題。需要說明是,本文收集樣本數(shù)量有限,在后續(xù)工作中將增加致因因素模型維數(shù)(>20),收集更多樣本,進(jìn)一步驗(yàn)證和提高RF預(yù)測(cè)航空安全的能力。

(3) 航空安全變量重要性分析結(jié)果顯示,環(huán)境因素對(duì)2017~2019年航空安全影響最大,需要重點(diǎn)管控;反之,管理因素對(duì)于航空安全影響最小,可忽略。

猜你喜歡
航空安全安全事件重要性
“0”的重要性
2020年度區(qū)塊鏈領(lǐng)域安全事件達(dá)555起
論七分飽之重要性
考慮誤差不確定性的航空安全預(yù)測(cè)新方法
幼兒教育中閱讀的重要性
在世界各地,航空安全問題變成了美國(guó)領(lǐng)導(dǎo)地位問題
加拿大嚴(yán)格立法保障航空安全
ANOTHER YEAR OF SAFE FLIGHT OPERATIONS
讀《邊疆的重要性》有感
食品安全事件的價(jià)格沖擊效應(yīng)
扎兰屯市| 龙江县| 锡林浩特市| 农安县| 宁河县| 博罗县| 米泉市| 新营市| 雷州市| 巴马| 诸暨市| 泸定县| 郁南县| 碌曲县| 朝阳区| 射阳县| 通榆县| 石首市| 罗山县| 新民市| 铁岭县| 克拉玛依市| 陵水| 武胜县| 宁波市| 印江| 鄄城县| 阿拉善左旗| 平凉市| 长春市| 北碚区| 本溪市| 赤壁市| 瓮安县| 买车| 奉化市| 兴山县| 大渡口区| 隆子县| 南木林县| 江安县|