鄧曉政,葉 冰
(中國(guó)飛行試驗(yàn)研究院,陜西 西安 710089)
目前,機(jī)載嵌入式訓(xùn)練系統(tǒng)受到航空裝備領(lǐng)域?qū)<业膹V泛關(guān)注,該系統(tǒng)是將來航空兵訓(xùn)練技術(shù)發(fā)展的新趨勢(shì),其原理是用虛擬目標(biāo)、虛擬傳感器和虛擬武器與飛機(jī)平臺(tái)進(jìn)行交互仿真,仿真信息通過解算后在顯示器上顯示,從而支撐飛行員完成對(duì)抗訓(xùn)練任務(wù)。它克服了實(shí)裝訓(xùn)練存在的風(fēng)險(xiǎn)大、組織難、費(fèi)用高的缺點(diǎn),以及使用地面模擬器訓(xùn)練存在的體驗(yàn)度差的不足。
通常認(rèn)為,效能是指“在規(guī)定條件下達(dá)到規(guī)定使用目標(biāo)的能力”[1]。效能評(píng)估可為被評(píng)裝備的論證、設(shè)計(jì)、生產(chǎn)、鑒定及使用提供科學(xué)定量的依據(jù),促進(jìn)裝備的發(fā)展。
傳統(tǒng)的效能評(píng)估方法有專家打分法[2]、層次分析法[3-4]、解析計(jì)算法[5]、統(tǒng)計(jì)試驗(yàn)法[6]等。但是專家打分法與層次分析法存在主觀因素占比過大的缺點(diǎn),解析計(jì)算法考慮因素較少,統(tǒng)計(jì)試驗(yàn)法則需要事先獲取大量的實(shí)戰(zhàn)和演習(xí)數(shù)據(jù)。最近,很多專家學(xué)者提出了BP神經(jīng)網(wǎng)絡(luò)的效能評(píng)估方法[7-8],因?yàn)槠渚哂袕拇罅繑?shù)據(jù)中找出數(shù)據(jù)的趨勢(shì)性和規(guī)律性的能力。但是BP神經(jīng)網(wǎng)絡(luò)算法由于使用梯度下降法求解網(wǎng)絡(luò)權(quán)值,極易陷入局部極值[9]。而免疫克隆優(yōu)化算法[10-11]是模仿自然免疫系統(tǒng)功能的一種新的智能優(yōu)化方法,具有很強(qiáng)的全局搜索能力,是人工智能領(lǐng)域的研究熱點(diǎn)之一。
在這樣的背景下,文中提出一種基于免疫BP網(wǎng)絡(luò)的機(jī)載嵌入式訓(xùn)練系統(tǒng)效能評(píng)估方法。綜合利用免疫克隆優(yōu)化算法的全局搜索能力以及BP神經(jīng)網(wǎng)絡(luò)算法的局部搜索能力和非線性函數(shù)擬合能力,同時(shí)構(gòu)建了簡(jiǎn)潔實(shí)用的評(píng)估指標(biāo)體系。仿真實(shí)驗(yàn)結(jié)果表明,該方法可有效對(duì)機(jī)載嵌入式訓(xùn)練系統(tǒng)進(jìn)行效能評(píng)估。
人工免疫系統(tǒng)因?yàn)榻梃b了生物免疫系統(tǒng)的信息處理機(jī)制,從而可為解決復(fù)雜工程問題提供新的思路。其中,免疫克隆選擇算法[12-13]是人工免疫系統(tǒng)最具代表性的算法,其具有全局尋優(yōu)能力,在搜索中不易陷入局部極值。
(1)
具體的:
(2)
(3)
其中,Yi(k)=[Ai1(k),Ai2(k),…,Aiqi(k)],Aij(k)=Ai(k)。
(4)
該操作主要包括交叉和變異兩種子操作,根據(jù)免疫學(xué)理論,抗體多樣性的形成以及親和度的成熟主要依靠高頻變異,所以文中免疫基因操作主要指變異操作。
Bi(k)={Zij(k)|maxf(Zij(k)),j=1,2,…,qi}
(5)
(6)
其中α>0,取值越大,則抗體種群多樣性越好。
可以看出,免疫克隆選擇算法通過解空間的擴(kuò)張與壓縮,利用全局搜索能力實(shí)現(xiàn)問題的精確求解。
BP(back propagation,反向傳播)神經(jīng)網(wǎng)絡(luò)算法是一種按照誤差反向傳播的訓(xùn)練多層感知器的方法,也是目前較為流行的神經(jīng)網(wǎng)絡(luò)算法。其具有較好的泛化能力和局部搜索能力,可以逼近評(píng)估指標(biāo)和效能數(shù)值之間的復(fù)雜非線性映射關(guān)系。算法主要包括兩個(gè)階段:前向階段和后向階段。
(1)前向階段。
在神經(jīng)元j輸出端的激活函數(shù)值為:
yj(n)=φ(vj(n))
(7)
其中,vj(n)是神經(jīng)元j輸入端的激活函數(shù)誘導(dǎo)局部域。
(8)
其中,m是神經(jīng)元j的輸入向量的維數(shù);wji(n)是連接神經(jīng)元i和j的突觸權(quán)值;yi(n)是神經(jīng)元i輸出端的激活函數(shù)值。
如果神經(jīng)元j在第一隱藏層,則yi(n)=xi(n);如果神經(jīng)元j在輸出層,則誤差信號(hào)定義為:
ej(n)=dj(n)-yj(n)
(9)
因此,前向階段以訓(xùn)練向量輸入開始,以計(jì)算輸出層每個(gè)神經(jīng)元的誤差信號(hào)結(jié)束。
(2)后向階段。
在后向階段,誤差信號(hào)從輸出層開始向左一層一層傳播,突觸權(quán)值通過遞歸計(jì)算進(jìn)行調(diào)整。
突觸權(quán)值按照下式進(jìn)行調(diào)整:
wji(n+1)=wji(n)+α×wji(n-1)+
η×δj(n)×yi(n)
(10)
其中,α為動(dòng)量常數(shù);η為學(xué)習(xí)率參數(shù);δj(n)為神經(jīng)元j的局域梯度,如果j在隱藏層,則:
(11)
如果j在輸出層,則:
δj(n)=φ'(vj(n))ej(n)
(12)
機(jī)載嵌入式訓(xùn)練系統(tǒng)由飛行任務(wù)訓(xùn)練計(jì)算機(jī)、數(shù)據(jù)鏈、地面監(jiān)控系統(tǒng)構(gòu)成。整個(gè)系統(tǒng)由訓(xùn)練能力和可靠度組成。共設(shè)計(jì)10個(gè)指標(biāo),分別由E1,E2,…,E10表示,訓(xùn)練能力由9個(gè)指標(biāo)體現(xiàn),分別是虛擬目標(biāo)個(gè)數(shù)、虛擬目標(biāo)機(jī)動(dòng)類別數(shù)、虛擬雷達(dá)模式類別數(shù)、虛擬雷達(dá)逼真度、虛擬武器類別數(shù)、虛擬武器逼真度、空地傳輸距離、空空傳輸距離、地面態(tài)勢(shì)感知能力;可靠度由平均故障間隔時(shí)間來表示。設(shè)計(jì)的效能評(píng)估指標(biāo)如圖1所示。除虛擬雷達(dá)逼真度、虛擬武器逼真度、地面態(tài)勢(shì)感知能力的指標(biāo)值由領(lǐng)域?qū)<乙园俜种拼蚍纸o出外,其他指標(biāo)值均為實(shí)際物理值。
圖1 效能評(píng)估指標(biāo)體系
算法流程如下:
Step1:選取算法初始參數(shù)。免疫克隆選擇算法的參數(shù)有:親和度函數(shù)設(shè)計(jì),抗體編碼方式,種群規(guī)模,克隆規(guī)模,變異概率,選擇概率,算法終止條件。BP神經(jīng)網(wǎng)絡(luò)的參數(shù)有:網(wǎng)絡(luò)層數(shù)及神經(jīng)元個(gè)數(shù),激活函數(shù),動(dòng)量常數(shù),學(xué)習(xí)率,算法終止條件。
Step2:產(chǎn)生初始抗體種群。文中將免疫克隆選擇算法的最優(yōu)解作為神經(jīng)網(wǎng)絡(luò)的初始突觸權(quán)值,從而避免BP神經(jīng)網(wǎng)絡(luò)算法陷入局部最優(yōu),所以抗體采用實(shí)數(shù)編碼方式,每個(gè)抗體代表網(wǎng)絡(luò)所有突觸權(quán)值的串行級(jí)聯(lián)。
Step3:克隆操作。對(duì)所有抗體分別進(jìn)行克隆操作。
Step5:克隆選擇操作。按照每個(gè)抗體的親和度函數(shù)值,依概率選擇進(jìn)入新一代種群。親和度函數(shù)定義為:
(13)
其中,親和度函數(shù)的分母表示網(wǎng)絡(luò)的誤差能量函數(shù),誤差能量值越小,親和度函數(shù)值越大,表示抗體越成熟。
Step6:判斷種群進(jìn)化終止條件。如果滿足條件,則轉(zhuǎn)Step7,否則,轉(zhuǎn)Step3。
Step7:產(chǎn)生神經(jīng)網(wǎng)絡(luò)初始突觸權(quán)值。對(duì)種群最優(yōu)抗體解碼,作為初始突觸權(quán)值。
Step8:呈現(xiàn)訓(xùn)練樣本。將所有的訓(xùn)練樣本隨機(jī)排序,形成一個(gè)回合,對(duì)每個(gè)樣本依次執(zhí)行Step9和Step10。
Step9:前向計(jì)算。使用式9計(jì)算輸出層的誤差信號(hào)。
Step10:后向計(jì)算。使用式10計(jì)算新的突觸權(quán)值。
Step11:判斷效能評(píng)估算法終止條件。如果滿足條件,則轉(zhuǎn)Step12,否則,轉(zhuǎn)Step8。
Step12:開展效能評(píng)估。利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行效能評(píng)估。
采用的樣本數(shù)據(jù)集共160組,指標(biāo)值由實(shí)際數(shù)據(jù)和仿真數(shù)據(jù)共同構(gòu)成,期望效能值由對(duì)數(shù)法[14]給出。表1顯示的是其中20組樣本,后4組樣本(樣本17-樣本20)用于測(cè)試,其余樣本用于訓(xùn)練網(wǎng)絡(luò)。
對(duì)比算法為經(jīng)典的BP算法[7]和遺傳BP算法(GABP)[15]。文中算法參數(shù)設(shè)計(jì)為:種群規(guī)模為50,克隆規(guī)模為5,變異概率為0.7,種群進(jìn)化終止條件為500次進(jìn)化,網(wǎng)絡(luò)層數(shù)為3,輸入層節(jié)點(diǎn)數(shù)為10,隱藏層節(jié)點(diǎn)數(shù)為9,輸出層節(jié)點(diǎn)數(shù)為1,激活函數(shù)取sigmoid函數(shù),動(dòng)量常數(shù)為0.1,學(xué)習(xí)率設(shè)計(jì)為0.5×exp(-num/50)(隨著算法逐步收斂,學(xué)習(xí)率下降,num為當(dāng)前迭代次數(shù)),效能評(píng)估算法的終止條件為1 000回合訓(xùn)練;BP算法參數(shù)與文中參數(shù)設(shè)置一致;GABP算法參數(shù)為:染色體種群大小為100,交叉概率為0.15,變異概率為0.01,最大遺傳進(jìn)化代數(shù)為500,其余參數(shù)與文中參數(shù)設(shè)置一致。
樣本數(shù)據(jù)集見表1。
表1 樣本數(shù)據(jù)集
各算法獨(dú)立運(yùn)行10次。表2是對(duì)測(cè)試樣本1的評(píng)估結(jié)果,文中算法的均值為0.080 9,標(biāo)準(zhǔn)差為0.001 1,均為最優(yōu),而GABP算法優(yōu)于BP算法。表3是對(duì)測(cè)試樣本2的評(píng)估結(jié)果,文中算法的均值為0.226 5,標(biāo)準(zhǔn)差為0.003 7,均為最優(yōu),而GABP算法優(yōu)于BP算法。表4是對(duì)測(cè)試樣本3的評(píng)估結(jié)果,文中算法的均值為0.455 1,標(biāo)準(zhǔn)差為0.003 3,均為最優(yōu),而GABP算法均值略差于BP算法,但標(biāo)準(zhǔn)差優(yōu)于BP算法。表5是對(duì)測(cè)試樣本4的評(píng)估結(jié)果,文中算法的均值為0.577 2,標(biāo)準(zhǔn)差為0.001 0,均為最優(yōu),而GABP算法優(yōu)于BP算法。
通過以上4組實(shí)驗(yàn)結(jié)果可知,GABP算法除了對(duì)第3個(gè)樣本的評(píng)估均值略差于BP算法外,在其他樣本的評(píng)估均值和標(biāo)準(zhǔn)差均優(yōu)于BP算法,這表示遺傳算法的全局搜索能力優(yōu)于傳統(tǒng)的BP算法;而文中算法在所有測(cè)試樣本的評(píng)估均值和標(biāo)準(zhǔn)差均是最優(yōu),表明該算法結(jié)合了免疫克隆選擇算法和BP算法的優(yōu)點(diǎn),全局搜索能力強(qiáng)于遺傳算法,又兼顧局部尋優(yōu)能力,所以評(píng)估結(jié)果精度較高,且算法運(yùn)行穩(wěn)定。
表2 測(cè)試樣本1效能評(píng)估結(jié)果對(duì)比
表3 測(cè)試樣本2效能評(píng)估結(jié)果對(duì)比
表4 測(cè)試樣本3效能評(píng)估結(jié)果對(duì)比
表5 測(cè)試樣本4效能評(píng)估結(jié)果對(duì)比
提出了一種基于免疫BP網(wǎng)絡(luò)的機(jī)載嵌入式訓(xùn)練系統(tǒng)效能評(píng)估方法。該方法由于綜合利用免疫克隆選擇算法的全局搜索能力、BP神經(jīng)網(wǎng)絡(luò)算法的局部搜索能力和非線性函數(shù)擬合能力,具有尋優(yōu)精確、運(yùn)行穩(wěn)定的特點(diǎn)。同時(shí),設(shè)計(jì)了簡(jiǎn)潔實(shí)用的機(jī)載嵌入式訓(xùn)練系統(tǒng)評(píng)估指標(biāo)體系。實(shí)驗(yàn)結(jié)果表明,該方法可有效解決機(jī)載嵌入式訓(xùn)練系統(tǒng)效能評(píng)估工程問題,并且具備一定的推廣價(jià)值。