翟龍飛 陳迎春 楊沖 閆心寶
摘 要: 輸入神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)的優(yōu)劣直接關(guān)系著網(wǎng)絡(luò)訓(xùn)練結(jié)果,因此訓(xùn)練數(shù)據(jù)的預(yù)處理在整個(gè)系統(tǒng)模型設(shè)計(jì)中具有十分重要的意義。本文以短波測(cè)量數(shù)據(jù)為初始樣本訓(xùn)練集進(jìn)行預(yù)處理研究。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) 歸一化處理 降維處理
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082(2016)03-0008-01
BP神經(jīng)網(wǎng)絡(luò)是基于訓(xùn)練數(shù)據(jù)的建模,因此由神經(jīng)網(wǎng)絡(luò)建立起的模型能夠精確反映實(shí)際預(yù)測(cè)情況[1]。本短波場(chǎng)強(qiáng)預(yù)測(cè)系統(tǒng)的測(cè)試訓(xùn)練數(shù)據(jù)是建立在已有短波資源仿真調(diào)度系統(tǒng)生成數(shù)據(jù)集基礎(chǔ)上,因此,可對(duì)比網(wǎng)絡(luò)學(xué)習(xí)模型預(yù)測(cè)輸出值與期望輸出值來(lái)判斷網(wǎng)絡(luò)適應(yīng)能力。
一、輸入輸出變量的選擇
由于BP神經(jīng)網(wǎng)絡(luò)的靈活擴(kuò)展性以及快速自適應(yīng)能力,使得其應(yīng)用廣泛。在最適網(wǎng)絡(luò)選取階段,根據(jù)模型傳輸損耗影響因素, 做到相關(guān)性小甚至不相關(guān),結(jié)合數(shù)據(jù)庫(kù)提供數(shù)據(jù),訓(xùn)練輸入變量選取為:偵收位置(經(jīng)緯度),信號(hào)位置(經(jīng)緯度),信號(hào)功率,信號(hào)頻率,偵收任務(wù)時(shí)間(月、日、時(shí)、分)。輸出量即期望值為:場(chǎng)強(qiáng)中值,傳輸損耗。
二、歸一化處理
1.基于最大最小樣本值的線性歸一化處理
該歸一化數(shù)據(jù)處理方式是將相同輸入變量(輸出量)的樣本進(jìn)行預(yù)處理。其數(shù)學(xué)關(guān)系為: (1)
針對(duì)短波場(chǎng)強(qiáng)樣本訓(xùn)練集,在原始數(shù)據(jù)的基礎(chǔ)上進(jìn)行線性歸一化處理,而后進(jìn)入網(wǎng)絡(luò)仿真學(xué)習(xí)。本學(xué)習(xí)運(yùn)算是在Matlab中運(yùn)行采用標(biāo)準(zhǔn)梯度學(xué)習(xí)算法并以均方誤差MSE作為性能參考。
2.基于標(biāo)準(zhǔn)差的歸一化處理
因此歸一化數(shù)據(jù) 的數(shù)據(jù)區(qū)間大于[-1,1]。從而使得訓(xùn)練網(wǎng)絡(luò)得到的性能參數(shù)MSE較大。為了能夠得到適用于本系統(tǒng)的性能參數(shù)參考值,采取兩者結(jié)合的歸一化方法。
3.混合的歸一化處理方法
該方法是在數(shù)據(jù)訓(xùn)練前期進(jìn)行最大最小值線性歸一化處理,將輸入變量壓縮至[-1,1]區(qū)間,而后在網(wǎng)絡(luò)訓(xùn)練階段采用標(biāo)準(zhǔn)差法處理數(shù)據(jù)。由MSE平均值可知,在網(wǎng)絡(luò)內(nèi)部運(yùn)用標(biāo)準(zhǔn)差歸一化法處理數(shù)據(jù)可以使訓(xùn)練時(shí)更加規(guī)整從而利于訓(xùn)練。
4.歸一化方法分析比較
通過(guò)仿真實(shí)驗(yàn),比較三種歸一化方法的MSE,如表1:
在相同訓(xùn)練數(shù)據(jù)的情況下,以混合的歸一化處理方法處理訓(xùn)練樣本數(shù)據(jù)得到的MSE最小,因此在系統(tǒng)設(shè)計(jì)應(yīng)用中選取混合歸一化處理方法,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。
三、降維處理
分析樣本產(chǎn)生、樣本變量因素(特別是時(shí)間因素)以及神經(jīng)網(wǎng)絡(luò)運(yùn)算效率,若對(duì)短波傳播損耗模型進(jìn)行完全學(xué)習(xí),由于樣本集的過(guò)大導(dǎo)致學(xué)習(xí)過(guò)慢,訓(xùn)練精度也可能無(wú)法保證。因此提出對(duì)訓(xùn)練集的單個(gè)月份學(xué)習(xí),模型預(yù)測(cè)針對(duì)網(wǎng)絡(luò)學(xué)習(xí)所在月份任務(wù)進(jìn)行預(yù)測(cè)。因此,選取訓(xùn)練樣本集較完備的5月份進(jìn)行訓(xùn)練學(xué)習(xí)。根據(jù)短波損耗模型,短波傳播主要受電離層影響,而電離層區(qū)別主要存在于白天與黑夜的區(qū)分[2],因此對(duì)時(shí)、分輸入變量進(jìn)行降維處理僅區(qū)分白天與黑夜。在神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)實(shí)驗(yàn)中,對(duì)訓(xùn)練數(shù)據(jù)分析而后進(jìn)行數(shù)據(jù)的概略區(qū)分,選取6:00至19:00為白天數(shù)據(jù),以“1”表示,19:00至次日6:00為黑夜數(shù)據(jù),以“2”表示。
在訓(xùn)練集經(jīng)過(guò)歸一化以及篩選降維處理后,對(duì)其進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),并分析其訓(xùn)練性能參數(shù),以及其預(yù)測(cè)結(jié)果。下面針對(duì)5月份數(shù)據(jù)進(jìn)行預(yù)測(cè)并與期望值進(jìn)行對(duì)比,如表2:
通過(guò)對(duì)比可知,神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),完備數(shù)據(jù)集是網(wǎng)絡(luò)學(xué)習(xí)的關(guān)鍵,通過(guò)分析輸入變量,進(jìn)行合理性降維對(duì)提高網(wǎng)絡(luò)訓(xùn)練效率提高訓(xùn)練精度也十分重要。
參考文獻(xiàn)
[1] 朱凱,王正林等. 精通MATLAB神經(jīng)網(wǎng)絡(luò)[M] 北京: 電子工業(yè)出版社, 2010.1.
[2] 羅佳,張文明,王雪松. 通信對(duì)抗中短波天波傳輸損耗的仿真建模[J],計(jì)算機(jī)仿真,2007,8(24).