朱菊香, 谷 衛(wèi), 羅丹悅, 潘 斐, 張趙良
(1. 無錫學(xué)院軌道交通學(xué)院,江蘇 無錫 214105; 2. 南京信息工程大學(xué)自動(dòng)化學(xué)院,江蘇 南京 210000)
隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,人們?cè)絹碓街匾暿覂?nèi)環(huán)境質(zhì)量。傳統(tǒng)的室內(nèi)環(huán)境質(zhì)量監(jiān)測(cè)依然局限于單一傳感器采集室內(nèi)環(huán)境參數(shù),而傳感器易受環(huán)境因素以及傳感器自身品質(zhì)的影響,導(dǎo)致測(cè)量精度低、可靠性差[1]。為了突破單一傳感器監(jiān)測(cè)環(huán)境的簡(jiǎn)單性和局限性以及避免單一傳感器信息盲區(qū)的問題,提高檢測(cè)精度,本設(shè)計(jì)通過使用多傳感器數(shù)據(jù)融合技術(shù)對(duì)目標(biāo)進(jìn)行檢測(cè)并對(duì)采集到的環(huán)境數(shù)據(jù)進(jìn)行融合[2]。
張邦成等提出基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法,融合精度較高,但是算法運(yùn)行時(shí)間較長(zhǎng)且抗干擾能力較差[3];張珂在異步數(shù)據(jù)融合算法中雖然可以在一定程度上有效解決跟蹤性能,但是融合精度較低[4];Pau Ferrer-Cid通過貝葉斯算法對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,減少了數(shù)據(jù)的波動(dòng),并且對(duì)加權(quán)平均算法進(jìn)行了優(yōu)化,縮短了算法的運(yùn)行時(shí)間,但是這種方法在運(yùn)算時(shí)占用的存儲(chǔ)空間較大[5];郭連進(jìn)提出了自適應(yīng)加權(quán)和模糊集合融合算法,抗干擾能力差,融合精度較低[6]。
針對(duì)上述問題,本文提出了基于粒子群(particle swarm optimization,PSO)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的多傳感器數(shù)據(jù)融合算法,提高測(cè)量數(shù)據(jù)的可靠性和融合精度。首先使用防脈沖干擾平均濾波算法對(duì)測(cè)量數(shù)據(jù)進(jìn)行預(yù)處理,剔除傳感器測(cè)量數(shù)據(jù)中的異常值提高抗干擾能力。然后,結(jié)合卡爾曼濾波算法和PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行融合,得到最佳融合數(shù)據(jù)。最后,用實(shí)驗(yàn)數(shù)據(jù)來驗(yàn)證該融合算法的有效性。
數(shù)據(jù)融合,又稱為信息融合或多傳感器數(shù)據(jù)融合,是將各個(gè)地方的傳感器收集的信號(hào)有機(jī)地結(jié)合起來,使物體得到更清晰的識(shí)別[7]。多傳感器數(shù)據(jù)融合可以提高信息的可靠性和目標(biāo)的可探測(cè)性;可以獲得單一傳感器所不能獲得的全面、準(zhǔn)確信息;可以通過整合各種傳感器采集的多個(gè)數(shù)據(jù)而不是單個(gè)數(shù)據(jù)來獲取更多信息[8]。這是協(xié)同效應(yīng)的結(jié)果,即多傳感器的綜合效應(yīng),使系統(tǒng)的可靠性得到增強(qiáng)。多傳感器數(shù)據(jù)融合是解決單一傳感器測(cè)量數(shù)據(jù)精度低、穩(wěn)定性差的關(guān)鍵技術(shù)。從不同時(shí)空的多源數(shù)據(jù)中,消除冗余信息,減少數(shù)據(jù)傳輸,從而達(dá)到提高信息采集的精度、增強(qiáng)系統(tǒng)穩(wěn)定性的目的[9]。
根據(jù)室內(nèi)環(huán)境監(jiān)測(cè)的特點(diǎn),在室內(nèi)的各個(gè)房間的不同位置布置傳感器,系統(tǒng)需要多種傳感器采集多種環(huán)境參數(shù),即使對(duì)同一環(huán)境參數(shù),也需要多個(gè)同類傳感器布置在多個(gè)位置進(jìn)行多點(diǎn)采集。采集同一環(huán)境參數(shù)的傳感器為同質(zhì)傳感器,采集不同環(huán)境參數(shù)的傳感器為異質(zhì)傳感器,該文采用同類傳感器數(shù)據(jù)級(jí)融合和異類傳感器決策級(jí)融合相結(jié)合的融合方式[10]。該文融合算法模型如圖1所示。
圖1 融合算法模型
在實(shí)際檢測(cè)系統(tǒng)中,檢測(cè)空間的大小直接導(dǎo)致了采集環(huán)境數(shù)據(jù)量的變化,檢測(cè)環(huán)境和傳感器的性能參數(shù)也會(huì)影響采集數(shù)據(jù)的有效性。鑒于上述分析,本文采用了防脈沖干擾平均濾波算法和卡爾曼濾波融合算法相結(jié)合的方法構(gòu)成一級(jí)數(shù)據(jù)融合。該方法將測(cè)量值放入融合算法模型中,利用一定的規(guī)則獲得更科學(xué)、全面的環(huán)境信息。
本文將采集室內(nèi)五個(gè)環(huán)境參數(shù),包括溫度、濕度、甲醛、PM2.5以及揮發(fā)性有機(jī)化合物(volatile organic compounds, VOC)。由于傳感器易受到偶然因素影響,引起一定脈沖干擾,故本文在環(huán)境參數(shù)采集終端植入相應(yīng)的限幅濾波算法,該算法能有效克服因偶然因素引起的脈沖干擾。算法的計(jì)算過程為:對(duì)于每個(gè)采樣值,判斷采樣值與上次采樣值之間的絕對(duì)值差,如果小于或等于范圍值,則采樣值有效;如果大于或等于范圍值,則使用上次采樣值。但該算法的平滑度較差,不能抑制周期性干擾。因此,在環(huán)境參數(shù)采集終端中使用的限幅濾波算法,在此基礎(chǔ)上添加中位值平均濾波算法簡(jiǎn)稱防脈沖干擾平均濾波算法,該算法結(jié)合中位值濾波算法和算術(shù)平均濾波算法,可以克服上述兩種算法的不足。該算法的原理是:對(duì)于連續(xù)的個(gè)數(shù)據(jù)進(jìn)行排列,刪除最大和最小的兩個(gè)數(shù)據(jù),計(jì)算個(gè)數(shù)據(jù)的算術(shù)平均值。采集室內(nèi)甲醛含量,發(fā)現(xiàn)甲醛值會(huì)跳變。防脈沖干擾平均濾波算法的應(yīng)用可以很好地過濾除這些干擾(限幅閾值為0.05 mg/m3),如圖2所示。
圖2 算法對(duì)比圖
預(yù)處理后的數(shù)據(jù)仍然混有測(cè)量噪聲和各種干擾信號(hào)。為了有效控制噪聲對(duì)數(shù)據(jù)融合的影響,采用卡爾曼濾波算法對(duì)預(yù)處理后的環(huán)境數(shù)據(jù)進(jìn)行優(yōu)化,使之更接近真實(shí)值,成為最優(yōu)數(shù)據(jù)集。
卡爾曼濾波是以最小均方誤差為準(zhǔn)則的遞推無偏估計(jì)算法,該算法容錯(cuò)性強(qiáng),主要用于融合底層實(shí)時(shí)動(dòng)態(tài)多傳感器冗余數(shù)據(jù)。該方法利用測(cè)量模型的統(tǒng)計(jì)特性,迭代確定統(tǒng)計(jì)意義上的最佳融合和數(shù)據(jù)估計(jì)[11]。降低了同類傳感器數(shù)據(jù)采集過程中由于傳感器自身干擾和部件老化造成的隨機(jī)測(cè)量誤差以及傳感器受到環(huán)境(溫度、濕度、氣壓、風(fēng)速、光照)等外部因素對(duì)傳感器的造成的噪聲污染問題,卡爾曼濾波可以充分抑制噪聲對(duì)真實(shí)數(shù)據(jù)的干擾,為二級(jí)數(shù)據(jù)融合提供統(tǒng)計(jì)上準(zhǔn)確有效的數(shù)據(jù)。因此,第一級(jí)融合將采用卡爾曼濾波算法??柭鼮V波算法的流程圖如圖3所示。
圖3 Kalman算法流程圖
卡爾曼濾波算法主要步驟如下:
5)為了使卡爾曼濾波算法可以不斷運(yùn)行迭代下去,還需要每次迭代過程中更新當(dāng)前時(shí)刻下的協(xié)方差。
根據(jù)上述方程式的描述,可以將卡爾曼濾波分為預(yù)測(cè)過程和修正過程。預(yù)測(cè)過程是根據(jù)前一時(shí)刻的估計(jì)值來預(yù)測(cè)當(dāng)前狀態(tài);修正過程是結(jié)合當(dāng)前時(shí)刻的觀測(cè)值和估計(jì)值,得到更接近真實(shí)值的最優(yōu)估計(jì)值。該算法按照上述過程繼續(xù)迭代,只需要保存前一時(shí)刻的計(jì)算參數(shù),不需要占用大量的儲(chǔ)存空間,提高算法運(yùn)行的效率。為了更好地體現(xiàn)卡爾曼濾波的性能,用Matlab仿真溫度在24 ℃情況下的輸出結(jié)果,如圖4所示。
圖4 Matlab仿真24 ℃示意圖
從圖中可以看出,傳感器的測(cè)量值與真實(shí)值24 ℃相比誤差較大,導(dǎo)致誤差較大的主要原因是傳感器受自身品質(zhì)影響以及環(huán)境因素的干擾,測(cè)量偏差較大,而卡爾曼濾波算法可以很好地抑制噪聲和環(huán)境干擾,使得測(cè)量值更接近真實(shí)值。
為了更好地顯示出卡爾曼濾波算法的優(yōu)越性,通過對(duì)采集的36組環(huán)境數(shù)據(jù)分別進(jìn)行卡爾曼濾波和加權(quán)平均,結(jié)果如圖5所示,誤差對(duì)比結(jié)果見圖6。
圖5 溫度傳感器的卡爾曼濾波和加權(quán)平均對(duì)比圖
圖6 溫度誤差對(duì)比圖
通過計(jì)算得出,同質(zhì)傳感器經(jīng)過卡爾曼濾波算法處理后的值為24.08 ℃,而36組數(shù)據(jù)的平均值為24.61 ℃,經(jīng)過加權(quán)平均算法處理后溫度傳感器測(cè)量值為24.15 ℃。用標(biāo)準(zhǔn)值24 ℃來對(duì)比卡爾曼濾波算法和加權(quán)平均算法的精確度,由圖4可以看出經(jīng)過卡爾曼濾波算法處理后的測(cè)量值更接近真實(shí)值,由此可以得出卡爾曼濾波算法的優(yōu)越性與準(zhǔn)確度。
圖6為卡爾曼濾波和加權(quán)平均處理后的誤差結(jié)果比對(duì)圖,通過計(jì)算得出卡爾曼濾波的誤差為0.335%,測(cè)量誤差為 2.51%,加權(quán)平均誤差為0.636%,顯示了卡爾曼濾波算法處理數(shù)據(jù)的能力,經(jīng)過卡爾曼濾波后的誤差相對(duì)于測(cè)量誤差和加權(quán)平均誤差都較小,這表明卡爾曼濾波算法滿足同質(zhì)傳感器融合過程中對(duì)數(shù)據(jù)處理的要求。
單一傳感器獲得的僅是環(huán)境特征的局部、片面的信息,它的信息量是非常有限的。而且每個(gè)傳感器還受到自身品質(zhì)、性能及噪聲的影響,采集到的信息往往是不完善的,具有較大的不確定性。因此,通過不同傳感器采集的環(huán)境信息進(jìn)行融合可以獲取更加豐富且有效的環(huán)境信息,消除了單因子傳感器對(duì)環(huán)境監(jiān)測(cè)的簡(jiǎn)單性和局限性,提高整體環(huán)境監(jiān)測(cè)的可靠性和準(zhǔn)確性。
BP網(wǎng)絡(luò)又稱反向傳播神經(jīng)網(wǎng)絡(luò),通過對(duì)數(shù)據(jù)樣本的訓(xùn)練,不斷修正網(wǎng)絡(luò)的權(quán)值和閾值使誤差函數(shù)沿著負(fù)梯度方向下降,逼近期望輸出。在運(yùn)用過程中網(wǎng)絡(luò)也存在著不足,如網(wǎng)絡(luò)的收斂速度較慢,訓(xùn)練易陷入癱瘓,不具有全局搜索能力,容易出現(xiàn)局部極小值[12]。此時(shí)引入具備運(yùn)行速度較快、全局尋優(yōu)能力較好的粒子群算法(PSO)來解決傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)易陷入收斂速度較慢,訓(xùn)練易陷入癱瘓以及容易出現(xiàn)局部極小值的問題[13]。
建立室內(nèi)環(huán)境多傳感器數(shù)據(jù)監(jiān)測(cè)的BP神經(jīng)網(wǎng)絡(luò)模型,輸入層為4種傳感器采集的5種環(huán)境數(shù)據(jù)參數(shù),隱含層神經(jīng)元節(jié)點(diǎn)數(shù)可以根據(jù)經(jīng)驗(yàn)公式(6)來確定數(shù)量范圍,輸出層為5種環(huán)境參數(shù)的真實(shí)值。3層BP神經(jīng)網(wǎng)絡(luò)如圖7所示。
圖7 設(shè)定的3層BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)中隱含層的激活函數(shù)為sigmoid,輸出層的傳遞函數(shù)為purelin,用下兩式表示:
通過采集室內(nèi)環(huán)境參數(shù)進(jìn)行BP神經(jīng)網(wǎng)絡(luò)的模式訓(xùn)練,共采集800個(gè)數(shù)據(jù)樣本,隨機(jī)選擇500個(gè)作為訓(xùn)練樣本,剩余300個(gè)數(shù)據(jù)作為測(cè)試樣本。根據(jù)式(6)來采用試錯(cuò)法確定隱含層神經(jīng)元個(gè)數(shù),其平均相對(duì)誤差對(duì)比結(jié)果如表1所示。結(jié)果表明,神經(jīng)元個(gè)數(shù)為10時(shí),3種氣體的平均相對(duì)誤差最小。最終選取隱含層神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)為10。
表1 不同隱含層神經(jīng)元數(shù)的神經(jīng)網(wǎng)絡(luò)輸出值和與真實(shí)值的平均相對(duì)誤差 %
粒子群(particle swarm optimization,PSO)算法是模擬鳥類覓食行為的一種新的進(jìn)化計(jì)算方法。PSO是基于粒子迭代尋找空間的最優(yōu)解的一種全局動(dòng)態(tài)尋優(yōu)計(jì)算方法,通過在每次迭代過程中尋求全局最優(yōu)和個(gè)體極值來不斷調(diào)整自己的位置和速度[14]。其迭代公式為:
經(jīng)過多次實(shí)驗(yàn)訓(xùn)練,設(shè)置粒子最大迭代次數(shù)為150,種群規(guī)模設(shè)置為40,慣性因子設(shè)置為0.8,學(xué)習(xí)因子和均為2。由圖8可知,PSO-BP神經(jīng)網(wǎng)絡(luò)在迭代次數(shù)為100時(shí)達(dá)到最優(yōu)。
圖8 適應(yīng)度曲線
BP神經(jīng)網(wǎng)絡(luò)會(huì)由于初始值閾值和權(quán)值選取的不合理,導(dǎo)致收斂速度較慢,訓(xùn)練易陷入癱瘓,不具有全局搜索能力,容易出現(xiàn)局部極小值,同時(shí)進(jìn)行大量的網(wǎng)絡(luò)訓(xùn)練,易造成過度擬合針。利用PSO算法對(duì)BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)進(jìn)行優(yōu)化,解決BP神經(jīng)網(wǎng)絡(luò)的不足,經(jīng)過反復(fù)多次的實(shí)驗(yàn)最終確定BP神經(jīng)網(wǎng)絡(luò)的閾值和權(quán)值。PSO-BP神經(jīng)網(wǎng)絡(luò)算法流程圖如圖9所示。
圖9 PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法流程圖
為了評(píng)估BP神經(jīng)網(wǎng)絡(luò)模型、PSO-BP神經(jīng)網(wǎng)絡(luò)模型和AW-BP神經(jīng)網(wǎng)絡(luò)模型的性能,本文采用平均絕對(duì)百分比誤差(MAPE)和擬合度(r2)對(duì)算法模型進(jìn)行評(píng)價(jià)。其計(jì)算公式如下:
在室內(nèi)各個(gè)房間布置傳感器,傳感器每隔2 min采集一次環(huán)境信息,為了將經(jīng)過多傳感器融合算法處理后的值和環(huán)境氣體真實(shí)值做對(duì)比,采用德國(guó)進(jìn)口元特SHY-6000型精密手持測(cè)量?jī)x對(duì)室內(nèi)各個(gè)房間進(jìn)行環(huán)境數(shù)據(jù)采集,將手持儀采集到的數(shù)據(jù)作為室內(nèi)環(huán)境的真實(shí)值。傳感器共采集室內(nèi)環(huán)境數(shù)據(jù)800個(gè),分別用BP神經(jīng)網(wǎng)絡(luò)模型、粒子群(PSO)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型以及自適應(yīng)加權(quán)(AW)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型對(duì)500個(gè)數(shù)據(jù)樣本進(jìn)行訓(xùn)練,經(jīng)過反復(fù)的訓(xùn)練以及調(diào)整參數(shù)完成上述三種算法網(wǎng)絡(luò)模型的訓(xùn)練,保存網(wǎng)絡(luò)并對(duì)剩下的300個(gè)測(cè)試樣本數(shù)據(jù)進(jìn)行測(cè)試。為了能夠在圖中清晰的展示結(jié)果,隨機(jī)選取20個(gè)樣本數(shù)據(jù)作圖,測(cè)試結(jié)果如圖10~圖12所示。
圖10 甲醛對(duì)比圖
圖11 PM2.5對(duì)比圖
圖12 VOC對(duì)比圖
由圖可知,自適應(yīng)加權(quán)(AW)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型處理后的數(shù)據(jù)比BP神經(jīng)網(wǎng)絡(luò)模型處理后的數(shù)據(jù)更接近真實(shí)值,用PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型處理后的數(shù)據(jù)比自適應(yīng)加權(quán)(AW)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型處理后的數(shù)據(jù)更接近真實(shí)值,證明了本文所提出PSO-BP神經(jīng)網(wǎng)絡(luò)算法具有更高的融合精度。
使用Matlab的profiler計(jì)算三種算法運(yùn)行150次的平均運(yùn)行時(shí)間,結(jié)果如表2所示。
表2 三種算法平均運(yùn)行時(shí)間
從表2可以看出,PSO-BP算法的平均運(yùn)行時(shí)間比BP算法短69.31%,比AW-BP算法短50.36%,大大提高了算法的性能,能夠有效降低傳感器節(jié)點(diǎn)的能耗,延長(zhǎng)傳感器壽命。
為了進(jìn)一步分析和比較不同融合算法的融合性能,本文以平均絕對(duì)百分比誤差(MAPE)和擬合度r2對(duì)算法模型進(jìn)行對(duì)比分析。表3為三種算法模型對(duì)300組測(cè)試樣本進(jìn)行測(cè)試下MAPE和r2結(jié)果,由表3可知:PSO-BP算法模型在平均相對(duì)誤差和擬合度兩種性能指標(biāo)上均優(yōu)于BP算法模型和自適應(yīng)加權(quán)(AW)優(yōu)化BP算法模型。經(jīng)過PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)后甲醛、PM2.5、VOC的平均絕對(duì)百分比誤差為4.13%、3.41%、3.25%,具有良好的優(yōu)化效果。
表3 三種算法模型的性能比較
針對(duì)多傳感器數(shù)據(jù)融合精度低、穩(wěn)定性差的問題,提出了一種基于PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)多傳感器數(shù)據(jù)融合算法。從實(shí)驗(yàn)數(shù)據(jù)分析發(fā)現(xiàn):1)經(jīng)過防脈沖干擾平均濾波算法的數(shù)據(jù)預(yù)處理和卡爾曼濾波算法的同質(zhì)傳感器數(shù)據(jù)融合,可以有效地減少數(shù)據(jù)波動(dòng),得到最優(yōu)數(shù)據(jù)集,提高了系統(tǒng)的穩(wěn)定性。2)與BP神經(jīng)網(wǎng)絡(luò)和自適應(yīng)加權(quán)(AW)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法相比,基于PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)融合算法具有更短的平均運(yùn)行時(shí)間和更高的數(shù)據(jù)融合精度。綜上所述,本文提出的數(shù)據(jù)融合算法具有良好的適用性,能夠滿足室內(nèi)環(huán)境監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)融合要求。