陳任秋,劉 軍
(武警工程大學(xué),陜西 西安710086)
無線傳感器網(wǎng)絡(luò)(WSNs)通過布設(shè)眾多的傳感器節(jié)點(diǎn)對觀測環(huán)境或者對象進(jìn)行觀測、感知以及信息的處理,得到觀測者想要得到的有用信息。但是,由于傳感器節(jié)點(diǎn)的覆蓋范圍往往重疊[1],同一個(gè)節(jié)點(diǎn)的數(shù)據(jù)可能會(huì)由多個(gè)傳感器同時(shí)捕捉到,并進(jìn)行傳輸,從而導(dǎo)致了數(shù)據(jù)的冗余。而在WSNs 中,節(jié)點(diǎn)能量、存儲空間和計(jì)算能力都是有限的,冗余信息的傳輸和處理會(huì)耗費(fèi)一部分能量而導(dǎo)致WSNs 的使用壽命縮短。這就需要一種相對簡單和有效的數(shù)據(jù)融合的方法。
在WSNs 中,通信中的能耗常常比計(jì)算機(jī)計(jì)算的能耗要高上好幾個(gè)數(shù)量級,所以,在傳感器節(jié)點(diǎn)能量一定的情況下,減少數(shù)據(jù)傳輸上不必要的能耗能明顯地延長WSNs 的使用壽命[2]。在減少通信能耗的同時(shí)也要確保所獲取的數(shù)據(jù)具有代表性和準(zhǔn)確性的特點(diǎn),所以,本文采用基于格拉布斯準(zhǔn)則的Dempster-Shafer(DS)證據(jù)理論的方法對WSNs所測得的數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,在確保能得到所需的測量數(shù)據(jù)的前提下減小傳輸?shù)臄?shù)據(jù)量[3]。
對于任何一個(gè)測量過程來說,傳感器與傳感器之間存在著一定的差距,同樣的環(huán)境中測量的同組數(shù)據(jù)中仍有個(gè)別偏差較大的數(shù)據(jù)存在,對于同一組測量數(shù)據(jù)來說,在測量的數(shù)據(jù)量一定的情況下,數(shù)據(jù)點(diǎn)基本符合正態(tài)分布。而對于不滿足此規(guī)律的粗大誤差數(shù)據(jù)應(yīng)進(jìn)行剔除,否則,這類異常數(shù)據(jù)會(huì)直接引起DS 證據(jù)融合過程中出現(xiàn)錯(cuò)誤。
格拉布斯準(zhǔn)則是一種從多次等精度獨(dú)立測量過程中剔除粗大誤差的方法。而這種方法只適用于剔除粗大誤差數(shù)據(jù),對于數(shù)據(jù)壓縮和融合的能力有限。具體過程如下:
假設(shè)在WSNs 中對溫度進(jìn)行測量,得x1x2x3…xn。
將xi按大小順序排列成順序統(tǒng)計(jì)量x(i),即x(1)≤x(2)≤…x(i)。當(dāng)x(i)服從正態(tài)分布時(shí),計(jì)算
然而,利用格拉布斯準(zhǔn)則每次只能剔除一個(gè)可疑值,因而,需要重復(fù)進(jìn)行判別,直到確定無疏失數(shù)據(jù),余下的全部為有效數(shù)據(jù)。又由于WSNs 中傳感器的個(gè)數(shù)有限,同一組測量數(shù)據(jù)的個(gè)數(shù)也是一定的,因此,利用格拉布斯準(zhǔn)則剔除可疑數(shù)據(jù)是一種比較好的選擇。
以單因素試驗(yàn)為基礎(chǔ),利用Box-Behnken設(shè)計(jì)建立數(shù)學(xué)模型。對影響羊肚菌SDF得率的4個(gè)因素,即料液比(X1)、浸提液濃度(X2)、提取溫度(X3)、提取時(shí)間(X4)進(jìn)行考察,設(shè)計(jì)因素水平表,見表1。所得試驗(yàn)結(jié)果采用Design-Expert 8.0.6軟件進(jìn)行分析。
DS 證據(jù)提供了一種基于信任度的合成方法,能夠?qū)Χ鄠€(gè)傳感器所測得的特征數(shù)據(jù)進(jìn)行融合處理,從眾多基本數(shù)據(jù)中得到所觀測事物的基本特征數(shù)據(jù)。它的基本原理如下:
假設(shè)U 為一個(gè)識別框架,則函數(shù)m:2u→[0,1],在滿足時(shí),稱m(A)為A 的基本概率賦值,m(A)表示對命題A 的精確信任程度,表示對A 的支持,則Bel 為一個(gè)信任函數(shù)[5]
表示A 的所有子集的可能性度量之和,即表示對A 的總信任,從而可知Bel(Φ)=0,Bel(U)=1。而A 的不知道的信息用的信任度表示。
m1,…,mn是2u上的n 個(gè)相互獨(dú)立的基本概率賦值,設(shè)Bel1,…,Beln是同一個(gè)便是框架上的n 個(gè)信任函數(shù),又設(shè)
雖然證據(jù)理論具有較強(qiáng)的理論基礎(chǔ),既能處理在實(shí)驗(yàn)過程中隨機(jī)產(chǎn)生的不確定性,又可以處理由于模糊性處理所導(dǎo)致的不確定性。可以通過長期的數(shù)據(jù)積累而使得證據(jù)理論判斷越來越準(zhǔn)確的能力,并且在使用過程中不需要先驗(yàn)概率和條件概率。但是在數(shù)據(jù)處理過程中,往往不直接使用DS 證據(jù)理論的基本模型,而是使用改進(jìn)后的DS 證據(jù)理論進(jìn)行數(shù)據(jù)處理。但是,在處理過程依然存在“一票否決”的現(xiàn)象存在,所以,本文采用格拉布斯準(zhǔn)則從初始數(shù)據(jù)中先剔除易引起“一票否決”現(xiàn)象出現(xiàn)的粗大誤差數(shù)據(jù),而本文采用的DS 證據(jù)理論為加權(quán)形式組合后的DS 證據(jù)理論[6]。
加權(quán)DS 證據(jù)理論在原始的DS 證據(jù)理論上引入沖突程度函數(shù)K,證據(jù)可信度參數(shù)ε 和證據(jù)的平均支持度q(A)。這是一種當(dāng)可信度發(fā)生沖突時(shí)對可信度再進(jìn)行分配的一種方法。因此,提出如下合成公式
該數(shù)據(jù)處理結(jié)構(gòu)為簇首對傳感器節(jié)點(diǎn)傳輸過來的某個(gè)或者多個(gè)特征數(shù)據(jù)進(jìn)行處理,具體步驟如下:
1)對傳感器節(jié)點(diǎn)傳輸?shù)酱厥椎臄?shù)據(jù)使用基于格拉布斯準(zhǔn)則的預(yù)處理,主要去除數(shù)據(jù)中由于各種不可預(yù)因素引起的一小部分粗大誤差數(shù)據(jù),并且通過緩存器對初步處理后的數(shù)據(jù)進(jìn)行保存。
2)在做DS 證據(jù)理論融合之前,首先必須對節(jié)點(diǎn)傳送的特征數(shù)據(jù)數(shù)據(jù)進(jìn)行歸一化處理。
圖1 改進(jìn)后的數(shù)學(xué)模型結(jié)構(gòu)圖Fig 1 Structure diagram of improved mathematical model
3)使用改進(jìn)后的DS 證據(jù)理論數(shù)據(jù)融合。
4)由于融合后各個(gè)特征數(shù)據(jù)是以概率的形式存在,不能直接傳輸概率數(shù)據(jù),所以,還必須從緩存器中取出數(shù)據(jù),并將其與DS 證據(jù)理論融合后的結(jié)果進(jìn)行加權(quán)求和。最終得出最終的向基站傳輸?shù)娜诤蠑?shù)據(jù)。最后的加權(quán)公式為
本文選用Matlab 仿真工具對實(shí)驗(yàn)環(huán)境進(jìn)行模擬。假設(shè)傳感器節(jié)點(diǎn)的觀測量為某一地區(qū)的溫度,并且對其進(jìn)行長期觀測,以觀察該地區(qū)的物候。然后在簇首經(jīng)過數(shù)據(jù)融合和處理由簇首節(jié)點(diǎn)向匯聚節(jié)點(diǎn)或者基站傳輸。
本文算法的主要性能通過數(shù)據(jù)的偏差度和融合效率兩個(gè)方面進(jìn)行評估。為檢驗(yàn)算法對不同大小規(guī)模的WSNs 的適用性,實(shí)驗(yàn)選擇了四種不同規(guī)模的WSNs,它們具有不同的節(jié)點(diǎn)密度、不同節(jié)點(diǎn)數(shù)量和相同的測量范圍。實(shí)驗(yàn)分別設(shè)置50,100,150,200 個(gè)傳感器節(jié)點(diǎn)隨機(jī)分布在100 m×100 m 的區(qū)域內(nèi)。為使算法有一個(gè)直觀的比較,將其與LEACH 算法進(jìn)行性能對比。
圖2 為進(jìn)行DS 證據(jù)理論數(shù)據(jù)融合后和真實(shí)值進(jìn)行的偏差度的比較。實(shí)驗(yàn)選取4 個(gè)節(jié)點(diǎn)數(shù)相同面積相同的區(qū)域的溫度進(jìn)行比較,得出各自的平均偏差度和方差。如圖2可知,當(dāng)測量次數(shù)較少的時(shí)候,測量值和真實(shí)值之間存在著一定的偏差。隨著測量次數(shù)的增多,測量值與真實(shí)值越來越接近。
圖2 測量值與真實(shí)值比較Fig 2 Comparision of measured value and real value
圖3 是通過運(yùn)用本文算法和Leach 算法[7]進(jìn)行數(shù)據(jù)處理后,對傳輸?shù)交緮?shù)據(jù)量的大小進(jìn)行比較。由圖3 可以觀察到,對于不同規(guī)模的網(wǎng)絡(luò)兩種算法傳輸?shù)臄?shù)據(jù)量截然不同。當(dāng)WSNs 的規(guī)模不斷地?cái)U(kuò)大的時(shí)候,本文所采用的算法對數(shù)據(jù)量的壓縮相對穩(wěn)定,當(dāng)WSNs 的規(guī)模較小的時(shí)候,為確保所傳輸?shù)男畔⒘康姆€(wěn)定性,在對不同數(shù)據(jù)分組映射的過程中采取分組一定,減少每組數(shù)據(jù)個(gè)數(shù)的辦法,確保了基站所需求的數(shù)據(jù)量;當(dāng)WSNs 的規(guī)模不斷增大的過程中,由于各個(gè)分組數(shù)量不變或者少量增加,每組處理的數(shù)據(jù)可以明顯增多,所以,當(dāng)節(jié)點(diǎn)個(gè)數(shù)增多時(shí)本文算法體現(xiàn)出較強(qiáng)的數(shù)據(jù)壓縮能力和對數(shù)據(jù)較好的優(yōu)化處理作用。
圖3 DS 與LEACH 融合結(jié)果比較Fig 3 Comparision of DS evidence theory and LEACH fusion results
本文旨在確保WSNs 傳輸準(zhǔn)確的前提下,采用格拉布斯準(zhǔn)則、改進(jìn)的DS 證據(jù)理論和加權(quán)的方式對特征層數(shù)據(jù)進(jìn)行壓縮。在一定范圍內(nèi)與Leach 算法相比較,對于一般規(guī)模和較大規(guī)模的WSNs,本文算法對向基站傳輸?shù)臄?shù)據(jù)有明顯的壓縮能力,并且在計(jì)算過程中算法的復(fù)雜度較低,能在一定程度節(jié)省傳輸耗能,延長網(wǎng)絡(luò)使用壽命。下一步將對數(shù)據(jù)融合的周期性、數(shù)據(jù)的優(yōu)化和短期數(shù)據(jù)觀測的準(zhǔn)確性進(jìn)行近一步研究。
[1] 何學(xué)文,鄭樂平,孫 汗.無線傳感器網(wǎng)絡(luò)簇內(nèi)多傳感器數(shù)據(jù)融合算法[J].傳感器與微系統(tǒng),2013,33(1):147-160.
[2] 張大蹤,楊 濤,魏東梅.無線傳感器網(wǎng)絡(luò)低功耗設(shè)計(jì)綜述[J].傳感器與微系統(tǒng),2006,25(5):10-14.
[3] 趙繼軍,劉云飛,趙 欣.無線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合體系結(jié)構(gòu)綜述[J].傳感器與微系統(tǒng),2009,28(10):1-4.
[4] 吳石林,張 玘.誤差分析與數(shù)據(jù)處理[M].北京:清華大學(xué)出版社,2010:90-92.
[5] Tian Zhihong,Jiang Wei,Li Yang,et al.A digital evidence fusion method in network forensics systems with Dempster-Shafer theory[J].Network Technology and Application,2014,3:91-97.
[6] 崔志軍.基于DS 證據(jù)理論的多傳感器數(shù)據(jù)融合[J].現(xiàn)代電子技術(shù),2011,34(12):201-204.
[7] 王 盛.基于NSZ 的無線傳感器網(wǎng)絡(luò)LEACH 協(xié)議的改進(jìn)仿真研究[D].武漢:武漢理工大學(xué),2010.