摘 要 隨著無線傳感器網(wǎng)絡(luò)在各領(lǐng)域得到廣泛的應(yīng)用,對(duì)網(wǎng)絡(luò)異常檢測(cè)的效率和可靠性提出了更高的要求。本文分析了無線傳感器網(wǎng)絡(luò)異常檢測(cè)的現(xiàn)狀,提出基于直方圖的傳感器數(shù)據(jù)預(yù)處理方法,給出了由節(jié)點(diǎn)內(nèi)異常檢測(cè)和相鄰節(jié)點(diǎn)協(xié)作投票決策構(gòu)成的網(wǎng)絡(luò)異常檢測(cè)方法。
【關(guān)鍵詞】無線傳感器網(wǎng)絡(luò) 異常數(shù)據(jù)檢測(cè) 數(shù)據(jù)預(yù)處理
1 無線傳感器網(wǎng)絡(luò)異常檢測(cè)現(xiàn)狀
無線傳感器網(wǎng)絡(luò)與傳統(tǒng)網(wǎng)絡(luò)的區(qū)別是其網(wǎng)絡(luò)末端為各種類型具有特定功能的傳感器,網(wǎng)絡(luò)中數(shù)據(jù)傳輸采用無線通信的方式。經(jīng)過近年來的飛速發(fā)展,無線傳感器網(wǎng)絡(luò)在社會(huì)生活以及商業(yè)經(jīng)濟(jì)領(lǐng)域得到的廣泛的應(yīng)用,是物聯(lián)網(wǎng)時(shí)代的基礎(chǔ),其研究和應(yīng)用前景廣闊具有很大的發(fā)展空間。目前無線傳感器網(wǎng)絡(luò)主要應(yīng)用在以下領(lǐng)域:軍事領(lǐng)域、環(huán)境監(jiān)測(cè)領(lǐng)域、醫(yī)療健康領(lǐng)域、智能家居領(lǐng)域、現(xiàn)代化農(nóng)業(yè)領(lǐng)域、交通運(yùn)輸管理及控制領(lǐng)域,從這些領(lǐng)域的目前應(yīng)用來看,無線傳感器網(wǎng)絡(luò)異常檢測(cè)分析是確保整個(gè)應(yīng)用系統(tǒng)順利運(yùn)行的保障。
無線傳感器網(wǎng)絡(luò)應(yīng)用的一般形式為:收集應(yīng)用環(huán)境中傳感器感應(yīng)數(shù)據(jù)并進(jìn)行傳輸;對(duì)收集的數(shù)據(jù)進(jìn)行處理,去除過度抖動(dòng)和冗余數(shù)據(jù),得到所需的有效數(shù)據(jù);將數(shù)據(jù)通過特定的邏輯處理,從而實(shí)現(xiàn)特定應(yīng)用領(lǐng)域軟件系統(tǒng)的功能。無線傳感器網(wǎng)絡(luò)異常檢測(cè)分析系統(tǒng)是在各種類型傳感器收集數(shù)據(jù)的基礎(chǔ)之上,識(shí)別出特殊情況下的異常數(shù)據(jù),通過異常數(shù)據(jù)模型進(jìn)行分析,及時(shí)分析判斷異常類別并進(jìn)行異常處理?;跓o線傳感器網(wǎng)絡(luò)系統(tǒng)的一般工作過程,無線傳感器網(wǎng)絡(luò)異常檢測(cè)分析系統(tǒng)應(yīng)該由以下三個(gè)部分構(gòu)成:傳感器數(shù)據(jù)采集及預(yù)處理、網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)、異常分析及結(jié)果呈現(xiàn)。
2 傳感器數(shù)據(jù)采集及預(yù)處理
無線傳感器網(wǎng)絡(luò)異常檢測(cè)及分析的前提是能夠準(zhǔn)確及時(shí)得到網(wǎng)絡(luò)末端眾多傳感器的各種信息,一般情況下,應(yīng)用系統(tǒng)將傳感器檢測(cè)到的環(huán)境模擬信息轉(zhuǎn)換為數(shù)值信息,這些數(shù)據(jù)是無線傳感器網(wǎng)絡(luò)所有應(yīng)用的基礎(chǔ),也是網(wǎng)絡(luò)異常檢測(cè)分析的數(shù)據(jù)來源。為了及時(shí)得到傳感器數(shù)據(jù),無線傳感器間的時(shí)間同步顯得尤為重要。另外,由于無線傳感器本身成本一般較低,且部署和工作環(huán)境一般比較惡劣,比較容易出現(xiàn)故障,硬件的損傷會(huì)造成傳感器的故障,軟件故障會(huì)造成傳感器工作不穩(wěn)定,出現(xiàn)抖動(dòng)數(shù)據(jù)和錯(cuò)誤數(shù)據(jù)信息,因此需要進(jìn)行數(shù)據(jù)的預(yù)處理去除干擾數(shù)據(jù),這樣會(huì)大大提高無線傳感器網(wǎng)絡(luò)應(yīng)用系統(tǒng)的效率。
2.1 傳感器節(jié)點(diǎn)時(shí)間同步
單一的數(shù)據(jù)往往不能反映整個(gè)環(huán)境的狀態(tài),在很多無線傳感器網(wǎng)絡(luò)的實(shí)際應(yīng)用中,傳感器檢測(cè)到環(huán)境數(shù)據(jù)后,會(huì)向鄰居傳感器節(jié)點(diǎn)發(fā)送請(qǐng)求將同一時(shí)刻環(huán)境數(shù)據(jù)發(fā)往主機(jī)系統(tǒng),作為數(shù)據(jù)異常檢測(cè)的最終決策依據(jù)。按照實(shí)現(xiàn)機(jī)制,無線傳感器網(wǎng)絡(luò)時(shí)間同步算法主要有三類:基于pair-wise的同步算法、基于receiver-receiver的同步算法、基于sender-receiver的單向同步算法。這三類算法均具有各自典型的協(xié)議?;趐air-wise的主要有TPSN協(xié)議和LTS協(xié)議,TPSN協(xié)議具有較高的時(shí)間同步準(zhǔn)確性,但是該協(xié)議邏輯計(jì)算復(fù)雜,時(shí)間復(fù)雜度高,且受數(shù)據(jù)包傳輸時(shí)間的影響較為明顯,LTS協(xié)議與TSPN協(xié)議類似,其以適當(dāng)時(shí)間同步準(zhǔn)確性為代價(jià),在一定程度上降低了邏輯運(yùn)算和時(shí)間的復(fù)雜度。基于receiver-receiver的主要有RBS協(xié)議,該協(xié)議去除了傳感器節(jié)點(diǎn)間發(fā)送時(shí)間同步的影響,以及發(fā)送方構(gòu)建數(shù)據(jù)信息包和等待信道對(duì)時(shí)間同步的影響,但是其運(yùn)算復(fù)雜度很高?;趕ender-receiver的DMTS協(xié)議和FSTP協(xié)議,DTMS協(xié)議從能耗上更加適合無線傳感器網(wǎng)絡(luò),但是精度很低,不利于后期數(shù)據(jù)處理,并不適合進(jìn)行異常檢測(cè)。FSTP協(xié)議在DTMS協(xié)議基礎(chǔ)之上進(jìn)行了優(yōu)化,具有DTMS的低能耗特點(diǎn)的同時(shí)比DTMS具有更高的時(shí)間精度,比較適合在無線傳感器網(wǎng)絡(luò)異常檢測(cè)系統(tǒng)中使用。FSTP的主要思路是發(fā)送方傳感器在發(fā)送同步數(shù)據(jù)信息時(shí)將本地時(shí)間一同發(fā)出,接收方收到同步數(shù)據(jù)信息后,根據(jù)發(fā)送方時(shí)間信息調(diào)整自身時(shí)間與發(fā)送方保持一致。發(fā)送方以網(wǎng)絡(luò)廣播的形式發(fā)出信息,如果接收方為鄰居傳感器節(jié)點(diǎn)則進(jìn)行時(shí)間調(diào)整,以便進(jìn)行相關(guān)決策。該協(xié)議在實(shí)現(xiàn)時(shí)間同步的同時(shí),還要將本地時(shí)間放入到鄰居傳感器的請(qǐng)求報(bào)文數(shù)據(jù)中,以此達(dá)到數(shù)據(jù)同步的目的。
2.2 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理的主要作用是去除所收集到大量數(shù)據(jù)中的干擾數(shù)據(jù),這些干擾數(shù)據(jù)往往是由于傳感器不穩(wěn)定引起的噪聲數(shù)據(jù),在預(yù)處理階段將這些干擾數(shù)據(jù)去除,可以有效提高整個(gè)應(yīng)用系統(tǒng)的效率以及異常檢測(cè)分析的有效性。
數(shù)據(jù)的預(yù)處理有多種實(shí)現(xiàn)方法,其主要區(qū)別是用于代表整組數(shù)據(jù)的估值數(shù)據(jù)的計(jì)算方式,傳統(tǒng)的方式是基于平均值數(shù)據(jù)的預(yù)處理方式和基于中位數(shù)的與處理方式?;谄骄档姆绞筋櫭剂x是取一組傳感器數(shù)據(jù)的平均值作為中心數(shù)據(jù)來代表該組數(shù)據(jù),但是當(dāng)環(huán)境劇烈變化出現(xiàn)極端偏離數(shù)據(jù)時(shí),其平均值也會(huì)產(chǎn)生較大偏離,從而造成數(shù)據(jù)失真,影響應(yīng)用系統(tǒng)的準(zhǔn)確性?;谥形粩?shù)的方式,是將一組傳感器數(shù)據(jù)先進(jìn)行排序,取中間數(shù)據(jù)作為該組數(shù)據(jù)的代表數(shù)據(jù),其避免了極端數(shù)據(jù)造成的數(shù)據(jù)偏差,但是這種方式只適用于均勻分布的數(shù)據(jù),受限于傳感器工作環(huán)境的惡劣,中位數(shù)方式在很多實(shí)際應(yīng)用中是不可取的。
基于以上平均值和中位數(shù)兩種方式的不足,我們可以采用直方圖的感應(yīng)數(shù)據(jù)預(yù)處理方法。在特定環(huán)境下部署的傳感器,其采集到的數(shù)據(jù)一般具有一定的規(guī)律,當(dāng)環(huán)境發(fā)生變化時(shí),數(shù)據(jù)也是循序漸進(jìn)發(fā)生變化,且數(shù)據(jù)應(yīng)當(dāng)是連續(xù)的。而干擾數(shù)據(jù)大多具有隨機(jī)性和小概率出現(xiàn)等特征,在進(jìn)行數(shù)據(jù)預(yù)處理時(shí),將一定時(shí)間內(nèi)采集的環(huán)境數(shù)據(jù)傳輸?shù)骄彌_區(qū)中,然后分析整組數(shù)據(jù)的概率分布情況,以此建立該組數(shù)據(jù)的概率直方圖,在緩沖區(qū)中依據(jù)不同傳感器產(chǎn)生噪聲數(shù)據(jù)的概率對(duì)小概率噪聲數(shù)據(jù)進(jìn)行清除,之后對(duì)余下的有效數(shù)據(jù)進(jìn)行計(jì)算平均值,使用該均值作為中心數(shù)據(jù)代表該組數(shù)據(jù)。這種直方圖的數(shù)據(jù)預(yù)處理方式能夠更好的得到感應(yīng)數(shù)據(jù)的趨勢(shì)。
3 無線傳感器網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)
3.1 異常數(shù)據(jù)檢測(cè)范圍
網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)是無線傳感器網(wǎng)絡(luò)在實(shí)際應(yīng)用中的一個(gè)重要組成部分,異常數(shù)據(jù)的檢測(cè)主要是在網(wǎng)絡(luò)末端傳感器采集到的大量數(shù)據(jù)中識(shí)別出具有明顯特點(diǎn)的異常數(shù)據(jù)及邊界數(shù)據(jù),傳感器所處環(huán)境中發(fā)生異常情況時(shí),傳感器收集到的數(shù)據(jù)會(huì)發(fā)生突發(fā)性明顯變化。異常發(fā)生的情況主要有以下兩種:一是外部環(huán)境變化導(dǎo)致的異常數(shù)據(jù)變化,另一種是傳感器節(jié)點(diǎn)自身工作狀態(tài)的變化。在實(shí)際應(yīng)用中,我們更加關(guān)注的是第一種情況,環(huán)境變化產(chǎn)生的異常數(shù)據(jù)是應(yīng)用系統(tǒng)關(guān)注和處理的重點(diǎn)。第二種異常往往是由于傳感器出現(xiàn)故障或者是通信故障產(chǎn)生的,這些是網(wǎng)絡(luò)維護(hù)人員更加關(guān)注的信息。良好的異常檢測(cè)不僅是能夠檢測(cè)出這兩種異常,還應(yīng)當(dāng)能夠?qū)Χ哌M(jìn)行準(zhǔn)確的區(qū)分,并提供給不同的異常處理功能模塊。
無線傳感器網(wǎng)絡(luò)中的傳感器一般具有獨(dú)立的感應(yīng)模塊和數(shù)據(jù)運(yùn)算處理器,以及用于交互的通信模塊。一般情況下,傳感器的部署密度很高,傳感器之間的數(shù)據(jù)具有很高的空間相關(guān)性,傳感器之間相互協(xié)作便可完成比較復(fù)雜的任務(wù)。傳感器網(wǎng)絡(luò)的異常絕不僅僅是判斷出單個(gè)傳感器是否出現(xiàn)異常,還要能夠判斷出節(jié)點(diǎn)的具體工作狀態(tài),以及傳感器是在異常中心區(qū)域還是邊界區(qū)域,以及該傳感器是否是異常產(chǎn)生的源頭。僅僅能夠檢測(cè)出異常是不能滿足實(shí)際應(yīng)用需求的,還要能夠分析出導(dǎo)致異常產(chǎn)生的原因,這樣才能及時(shí)采取應(yīng)對(duì)的措施,保障無線傳感器網(wǎng)絡(luò)應(yīng)用系統(tǒng)的正常有效工作。
3.2 異常數(shù)據(jù)檢測(cè)模型
異常數(shù)據(jù)模型的建立是事件監(jiān)測(cè)和異常數(shù)據(jù)分析的基礎(chǔ),是保證異常事件判斷準(zhǔn)確性的基本前提。異常數(shù)據(jù)關(guān)系模型還要能夠找到并體現(xiàn)出傳感器網(wǎng)絡(luò)中數(shù)據(jù)的傳輸方向和數(shù)據(jù)之間的關(guān)系,這是找到異常源頭的重要依據(jù)。很多研究和應(yīng)用證明圖模型具有能夠描述復(fù)雜的情境,在圖模型之中除了能夠表現(xiàn)出監(jiān)測(cè)數(shù)據(jù)的時(shí)空關(guān)系,還能夠融入地理信息和網(wǎng)絡(luò)拓?fù)湫畔ⅲ@些信息的融合能夠更加充分的展現(xiàn)出異常的特征。常見的圖模型有等值線圖、基于數(shù)據(jù)快照的圖模式等。異常檢測(cè)主要有兩個(gè)部分來構(gòu)成:一是傳感器節(jié)點(diǎn)內(nèi)部的數(shù)據(jù)異常檢測(cè),二是在主機(jī)中,對(duì)之前判定的疑似異常進(jìn)行節(jié)點(diǎn)間投票決策,得出最終的異常集合以及異常范圍和邊界。如圖1所示。
3.3 節(jié)點(diǎn)內(nèi)數(shù)據(jù)異常檢測(cè)
使用傳感器自身的數(shù)據(jù)處理器對(duì)采集到的數(shù)據(jù)進(jìn)行節(jié)點(diǎn)內(nèi)異常檢測(cè),主要是對(duì)超出閾值的數(shù)據(jù)進(jìn)行檢測(cè),如果出現(xiàn)疑似異常事件數(shù)據(jù)或者故障錯(cuò)誤數(shù)據(jù),則由鄰居節(jié)點(diǎn)根據(jù)具有較強(qiáng)關(guān)聯(lián)數(shù)據(jù)之間的相關(guān)性判斷這些數(shù)據(jù)是異常事件數(shù)據(jù)還是設(shè)備故障導(dǎo)致的錯(cuò)誤數(shù)據(jù)。無線傳感器的節(jié)點(diǎn)內(nèi)數(shù)據(jù)檢測(cè)是不斷反復(fù)進(jìn)行的,每次檢測(cè)之后傳感器的狀態(tài)都可能會(huì)發(fā)生變化,傳感器節(jié)點(diǎn)的狀態(tài)包含以下幾種:正常狀態(tài);意思疑似異常狀態(tài):節(jié)點(diǎn)可能出現(xiàn)異常事件,由節(jié)點(diǎn)內(nèi)的本地檢測(cè)產(chǎn)生,后續(xù)需要進(jìn)行節(jié)點(diǎn)間投票決策;疑似故障狀態(tài):節(jié)點(diǎn)可能出現(xiàn)設(shè)備和通信故障,由節(jié)點(diǎn)內(nèi)的本地檢測(cè)產(chǎn)生,需要進(jìn)行節(jié)點(diǎn)間投票決策;異常狀態(tài):節(jié)點(diǎn)監(jiān)測(cè)區(qū)域出現(xiàn)異常事件,由節(jié)點(diǎn)間投票決策產(chǎn)生;故障狀態(tài):節(jié)點(diǎn)發(fā)生設(shè)備或通信故障,由節(jié)點(diǎn)間投票決策產(chǎn)生。
節(jié)點(diǎn)內(nèi)的異常檢測(cè)是根據(jù)基于節(jié)點(diǎn)屬性的相關(guān)性來進(jìn)行的,一般情況下傳感器具有多個(gè)屬性,屬性之間會(huì)存在一定的關(guān)聯(lián),傳感器的不同屬性之間的相關(guān)性在傳感器正常工作期間是保持不變的,出現(xiàn)超過閾值的數(shù)據(jù)時(shí),根據(jù)設(shè)備各屬性的相關(guān)性是否得到保持來判定是異常事件還是設(shè)備故障錯(cuò)誤,如果屬性相關(guān)性得到延續(xù)則可能為異常事件導(dǎo)致的數(shù)據(jù)異常,反之則極有可能為設(shè)備或通信故障導(dǎo)致的數(shù)據(jù)異常。進(jìn)行節(jié)點(diǎn)內(nèi)的異常檢測(cè)判定,主要是為提高后續(xù)節(jié)點(diǎn)間協(xié)作投票決策的效率和準(zhǔn)確性。
3.4 節(jié)點(diǎn)間投票決策
節(jié)點(diǎn)間協(xié)作投票決策要求無線傳感器網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)是清晰明確的,根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)便可得出節(jié)點(diǎn)間數(shù)據(jù)傳輸?shù)姆较?,彼此之間的位置關(guān)系能夠很方便的計(jì)算出來。在此基礎(chǔ)上,依據(jù)傳感器節(jié)點(diǎn)可信度和距離權(quán)重進(jìn)行協(xié)作投票決策,最終得出異常檢測(cè)的判定結(jié)果。
協(xié)作投票決策的過程為:首先,通過計(jì)算得出鄰居傳感器節(jié)點(diǎn)的可信度;之后,利用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)計(jì)算出鄰居節(jié)點(diǎn)相對(duì)于被檢測(cè)節(jié)點(diǎn)的距離權(quán)重;利用距離權(quán)重和鄰居節(jié)點(diǎn)可信度計(jì)算每個(gè)鄰居節(jié)點(diǎn)的投票值,分別統(tǒng)計(jì)得出判定正常和異常的投票總值;按照決策規(guī)則進(jìn)行異常數(shù)據(jù)的最終決策。
節(jié)點(diǎn)可信度的計(jì)算主要根據(jù)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)與歷史檢測(cè)數(shù)據(jù)對(duì)比得到,主要還是依據(jù)當(dāng)前的節(jié)點(diǎn)屬性相關(guān)性和歷史屬性相關(guān)性數(shù)據(jù)的近似程度進(jìn)行衡量計(jì)算。投票權(quán)重?cái)?shù)值的計(jì)算,主要是根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和傳感器之間的舉例進(jìn)行計(jì)算,一般情況下舉例越近的傳感器,其環(huán)境數(shù)據(jù)會(huì)越相似,彼此之間的驗(yàn)證會(huì)具有更高的準(zhǔn)確性,其投票權(quán)重也會(huì)越大,反之,舉例越遠(yuǎn)的數(shù)據(jù)權(quán)重值越小。
在進(jìn)行最終狀態(tài)判定時(shí),如果異常投票值與正常投票值的差大于異常邊界閾值,則判定節(jié)點(diǎn)傳感器處于異常區(qū)域;如果正常投票值與異常投票值的差大于異常邊界閾值,則判定傳感器處于正常區(qū)域;如果差值的絕對(duì)值和總票數(shù)的比例小于閾值,則傳感器處于異常邊界區(qū)域。處在正常區(qū)域的節(jié)點(diǎn)傳感器,其工作狀態(tài)被判定為正常狀態(tài),處于異常邊界區(qū)域和異常區(qū)域的節(jié)點(diǎn)結(jié)合節(jié)點(diǎn)內(nèi)檢測(cè)的結(jié)果便可判定為異常狀態(tài)或者故障狀態(tài),且能夠得到該節(jié)點(diǎn)處在異常區(qū)域的位置。
4 總結(jié)
本文給出了基于直方圖的無線傳感器網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理方法,能夠有效提高異常檢測(cè)的效率,提出的由節(jié)點(diǎn)內(nèi)異常檢測(cè)和相鄰節(jié)點(diǎn)協(xié)作投票決策構(gòu)成的網(wǎng)絡(luò)異常檢測(cè)方法,能夠較為準(zhǔn)確有效地檢測(cè)出無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)的工作狀態(tài)、異常狀況以及在異常區(qū)域中的位置。
參考文獻(xiàn)
[1]翟小超.基于可變閾值的無線傳感網(wǎng)絡(luò)異常值檢測(cè)[J].電子科技,2015(02).
[2]趙章界,劉海峰.無線傳感網(wǎng)中的安全問題[J].計(jì)算機(jī)安全,2010(06).
[3]沈添璽,崔忠鳳,曹雷.無線傳感器網(wǎng)絡(luò)安全技術(shù)研究[J].通訊世界,2016(08).
[4]趙雷,蘇慶剛,羅宜元.一種基于MIB信息熵統(tǒng)計(jì)的網(wǎng)絡(luò)異常檢測(cè)方法[J].上海電機(jī)學(xué)院學(xué)報(bào),2015(02).
作者簡(jiǎn)介
張洋(1982-),男,江蘇省徐州市人。大學(xué)本科學(xué)歷?,F(xiàn)為江蘇聯(lián)合職業(yè)技術(shù)學(xué)院徐州經(jīng)貿(mào)分院講師。
作者單位
江蘇聯(lián)合職業(yè)技術(shù)學(xué)院徐州經(jīng)貿(mào)分院 江蘇省徐州市 221004