朱竹芳,焦 俊,李鄭濤,孟珠李,張政云,楊莎莎
(安徽農(nóng)業(yè)大學(xué) 信息與計(jì)算機(jī)學(xué)院,合肥 230036)
分簇算法與壓縮感知下的農(nóng)田信息處理
朱竹芳,焦 俊,李鄭濤,孟珠李,張政云,楊莎莎
(安徽農(nóng)業(yè)大學(xué) 信息與計(jì)算機(jī)學(xué)院,合肥 230036)
為了減小無線傳感器傳輸數(shù)據(jù)的數(shù)據(jù)量,提出了一種相關(guān)性分簇算法與壓縮感知相結(jié)合的方法。首先,將節(jié)點(diǎn)數(shù)據(jù)顯著相關(guān)性的節(jié)點(diǎn)劃分到一個(gè)簇中;其次,在每個(gè)簇中,根據(jù)節(jié)點(diǎn)間的平均相關(guān)度大小來確定參考節(jié)點(diǎn)與非參考節(jié)點(diǎn),參考點(diǎn)的數(shù)據(jù)結(jié)合壓縮感知進(jìn)行無線網(wǎng)絡(luò)傳輸,而非參考點(diǎn)的數(shù)據(jù)可以根據(jù)與參考節(jié)點(diǎn)的線性回歸系數(shù)計(jì)算出來;最后,對實(shí)測的溫度進(jìn)行仿真實(shí)驗(yàn)。結(jié)果表明,簇中參考節(jié)點(diǎn)的數(shù)據(jù)重構(gòu)誤差在允許范圍內(nèi),對非參考節(jié)點(diǎn)進(jìn)行線性回歸計(jì)算與原始數(shù)據(jù)相比基本吻合。
無線傳感器;分簇;平均相關(guān)度;線性回歸;壓縮感知
無線傳感器網(wǎng)絡(luò)[1](wireless sensor network, 簡稱WSNs)由部署在監(jiān)測區(qū)域內(nèi)大量的廉價(jià)微型傳感器節(jié)點(diǎn)組成,其特點(diǎn)就是部署靈活、規(guī)模大、集成化等,廣泛應(yīng)用于數(shù)據(jù)采集和監(jiān)測。由于傳感器節(jié)點(diǎn)上的能量有限,大量的數(shù)據(jù)傳輸,以及傳統(tǒng)的無線通信采樣傳輸,產(chǎn)生大量的冗余信息會縮短傳感器節(jié)點(diǎn)的使用壽命,所以減少數(shù)據(jù)傳輸采樣量是節(jié)約節(jié)點(diǎn)能耗、延長網(wǎng)絡(luò)生命周期的有效方法[2]。
減小無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)能源消耗的方法有很多,比如太陽能光伏轉(zhuǎn)換,[3]可以為WSN節(jié)點(diǎn)提供充足的能量而延長其壽命,以及延長節(jié)點(diǎn)采集的密度來減少無線模塊發(fā)射的能耗[4]。而本文所說的結(jié)合分簇算法與壓縮感知的方法,首先對節(jié)點(diǎn)數(shù)據(jù)進(jìn)行相關(guān)性分析,將數(shù)據(jù)具有顯著相關(guān)性的節(jié)點(diǎn)分在一個(gè)簇中,然后在每個(gè)簇中確定參考節(jié)點(diǎn)與非參考節(jié)點(diǎn),[5]其次,只需將參考節(jié)點(diǎn)結(jié)合壓縮感知,對信號進(jìn)行稀疏化,選取合適的觀測矩陣,然后將測量值進(jìn)行無線網(wǎng)絡(luò)傳輸,[6]最終在接收端對信號進(jìn)行精確重構(gòu),而非參考節(jié)點(diǎn)數(shù)據(jù)只需根據(jù)線性回歸關(guān)系來計(jì)算,該方法并不需要考慮外界環(huán)境和采集數(shù)據(jù)量等因素,從而有效減少了無線傳感器網(wǎng)絡(luò)傳輸數(shù)據(jù)的數(shù)據(jù)量,也降低了無線網(wǎng)絡(luò)傳輸?shù)哪芰肯腫7]。
在農(nóng)業(yè)領(lǐng)域中,用傳感器節(jié)點(diǎn)采集農(nóng)田信息時(shí),傳感器之間所采集到的相同參數(shù)的數(shù)據(jù)往往存在著很強(qiáng)的相關(guān)性,[8]如果讓所有節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)傳輸,會讓協(xié)調(diào)器長時(shí)間工作,耗電量大而減短無線網(wǎng)絡(luò)的使用壽命[9]。而簇內(nèi)參考節(jié)點(diǎn)結(jié)合壓縮感知進(jìn)行無線傳輸,非參考節(jié)點(diǎn)利用線性回歸進(jìn)行計(jì)算,這樣就減少網(wǎng)絡(luò)傳輸量,進(jìn)而延長了無線網(wǎng)絡(luò)的生命周期。[10]整個(gè)數(shù)據(jù)采集過程如圖1所示,其中協(xié)調(diào)器本身是匯聚節(jié)點(diǎn),上電之后組建Zigbee網(wǎng)絡(luò),同時(shí)協(xié)調(diào)器也是監(jiān)測節(jié)點(diǎn),滿足實(shí)驗(yàn)設(shè)計(jì)要求。
整個(gè)算法的具體設(shè)計(jì)步驟:
圖1 信息處理框圖
(1)獲取無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)的參數(shù)數(shù)據(jù)(溫度,濕度或者ph值),本實(shí)驗(yàn)只針對溫度參數(shù)數(shù)據(jù)進(jìn)行相關(guān)性分析,將節(jié)點(diǎn)分成多個(gè)簇,如圖1中簇1、簇2、簇3所示。每個(gè)簇中根據(jù)平均相關(guān)度的大小將簇中的分點(diǎn)劃分成參考節(jié)點(diǎn)與非參考節(jié)點(diǎn),并且求出參考節(jié)點(diǎn)與非參考節(jié)點(diǎn)的回歸系數(shù)。
(2)將選取的參考節(jié)點(diǎn)的數(shù)據(jù),進(jìn)行稀疏化,選取合適的觀測矩陣,壓縮之后經(jīng)過協(xié)調(diào)器傳輸。
(3)參考節(jié)點(diǎn)在服務(wù)器接收端進(jìn)行數(shù)據(jù)重構(gòu),而非參考節(jié)點(diǎn)根據(jù)參考節(jié)點(diǎn)的線性回歸系數(shù)進(jìn)行估算。
分簇算法的中心思想就是先根據(jù)相關(guān)系數(shù)的大小,找出兩個(gè)最不相關(guān)的節(jié)點(diǎn)分別劃分到兩個(gè)簇中,再根據(jù)平均相關(guān)度的大小依次將其他節(jié)點(diǎn)放在這兩個(gè)簇中。按照上述算法可以劃分更多的簇,直到簇中節(jié)點(diǎn)間的數(shù)據(jù)都顯著相關(guān)。
假設(shè)監(jiān)控區(qū)內(nèi)WSNs節(jié)點(diǎn)有M1個(gè),每個(gè)節(jié)點(diǎn)以相同時(shí)間間隔采樣了N個(gè)數(shù)據(jù),那么將所有節(jié)點(diǎn)所接受的數(shù)據(jù)儲存起來以N*M1的矩陣的形式表示:
(1)
其中,該矩陣每一列表示一個(gè)節(jié)點(diǎn)所采樣到的信號向量,每一行表示所有節(jié)點(diǎn)同一時(shí)間所采樣到的信號向量。
依次求任意列與列之間的相關(guān)系數(shù):
(2)
可以將相關(guān)系數(shù)寫成相關(guān)系數(shù)矩陣形式:
(3)
要判斷節(jié)點(diǎn)x和節(jié)點(diǎn)y是否顯著相關(guān),可利用樣本中的相關(guān)系數(shù)來給定一個(gè)檢測統(tǒng)計(jì)量:
(4)
整個(gè)算法的流程如圖2所示。其中,平均相關(guān)度的定義:
(5)
圖2 分簇算法的整體流程圖
式中k表示簇中節(jié)點(diǎn)的個(gè)數(shù),rijm表示兩節(jié)點(diǎn)間的相關(guān)系數(shù)。分簇結(jié)束后,在每個(gè)簇中,根據(jù)式(5)將節(jié)點(diǎn)的平均相關(guān)度最大的定義為參考節(jié)點(diǎn),而其他的節(jié)點(diǎn)定義為非參考節(jié)點(diǎn)。
3.1 信號的稀疏表示
稀疏基ψ(N*N矩陣)是正交基矩陣,它其實(shí)就是某種正交變換的變換矩陣列向量組成的基。壓縮感知的第一要素就是信號是稀疏的或者進(jìn)行某種變換可以變成稀疏的,所以稀疏基的選取是壓縮感知的關(guān)鍵。
采取的稀疏基是離散傅立葉變換基,式6表示的是離散傅立葉變換的正交變換公式
(6)
3.2 觀測矩陣的設(shè)計(jì)
觀測矩陣的目的就是將信號從高維投影到低維空間上,從而獲得M個(gè)觀測向量y,如式7所示,同時(shí)要確保從得到的觀測矩陣能夠重構(gòu)出長度為N的原始信號。在壓縮感知理論中,為了讓觀測值能夠包含足夠多的重構(gòu)信號的信息,觀測矩陣的設(shè)計(jì)要滿足有限等距性質(zhì)(RIP)如式8表示,
y=φx=φψθ
(7)
(8)
其中,δ為等距約束常數(shù)δ∈(0,1)。
采取的觀測矩陣φ是隨機(jī)高斯測量矩陣,構(gòu)造一個(gè)M*N的觀測矩陣,并且與稀疏基完全不相關(guān),矩陣?yán)锩總€(gè)元素獨(dú)立,且服從均值為0,方差為1/M的高斯分布 。
3.3 重構(gòu)算法
重構(gòu)的算法具體來說就是利用感知矩陣Θ=φψ和測量向量值y得到稀疏表示,從而得到重構(gòu)x。算法的關(guān)鍵是在少量樣本點(diǎn)下,快速、精確地重構(gòu)原信號,信號的重構(gòu)是從長度為M的測量樣本中,重構(gòu)出長度為N的原信號的過程。該過程可歸結(jié)為一個(gè)尋求約束條件下的最優(yōu)解的問題,具體表述如式9所示:
(9)
s.t.φψ-1X=Y
采取的重構(gòu)算法是正交匹配追蹤,算法流程如圖3所示。
3.4 節(jié)點(diǎn)采樣的實(shí)現(xiàn)
圖3 重構(gòu)算法流程圖
3.4.1 參考節(jié)點(diǎn)的壓縮重構(gòu) 在每個(gè)簇中首先選擇根據(jù)節(jié)點(diǎn)間相關(guān)性強(qiáng)弱確定參考節(jié)點(diǎn),其中步驟如下:
(1)選取簇1內(nèi)節(jié)點(diǎn)數(shù)據(jù),將數(shù)據(jù)用矩陣表示,并求出節(jié)點(diǎn)間的相關(guān)系數(shù);
(2)求出相關(guān)系數(shù)的絕對值;
(3)將矩陣斜對角的數(shù)都變?yōu)?;
(4)求出矩陣每行的平均數(shù)即為平均相關(guān)度;
(5)找出平均數(shù)的最大值;
(7)找出所對應(yīng)相關(guān)系數(shù)最小值的位置;
(8)將對應(yīng)的一列賦值到X中,并且X為參考節(jié)點(diǎn)的一列數(shù)據(jù);
(9)除掉了平均值相關(guān)度值最大一列的數(shù)據(jù),剩余為非參考節(jié)點(diǎn)。
將選取好的參考節(jié)點(diǎn)進(jìn)行壓縮再重構(gòu),它的關(guān)鍵步驟如下:
(10)首先選取好合適的稀疏基和觀測矩陣;
(11)傳感矩陣各列與殘差的內(nèi)積;
(12)求出最大內(nèi)積絕對值對應(yīng)列的位置;
(13)最小二乘解;
(14)求出殘差;
(15)得到原始數(shù)據(jù)的稀疏表示;
(16)得到重構(gòu)數(shù)據(jù)。
3.4.2 非參考節(jié)點(diǎn)的計(jì)算 由于參考節(jié)點(diǎn)與非參考節(jié)點(diǎn)之間顯著相關(guān),所以就可以直接求出兩者之間的線性回歸系數(shù),這樣非參考節(jié)點(diǎn)并不需要進(jìn)行傳輸,只需根據(jù)與參考節(jié)點(diǎn)的線性關(guān)系進(jìn)行估算,其中涉及到的關(guān)鍵代碼:
(1)選取一個(gè)非參考節(jié)點(diǎn)數(shù)據(jù);
(2)求出參考節(jié)點(diǎn)與非參考節(jié)點(diǎn)的線性回歸系數(shù);
(3)線性回歸求出非參考節(jié)點(diǎn)的數(shù)據(jù);
(4)進(jìn)行循環(huán)回到第一步,直到計(jì)算所有非參考節(jié)點(diǎn)數(shù)據(jù);
(5)整個(gè)算法結(jié)束。
4.1 分簇仿真
本次實(shí)驗(yàn)選取了27個(gè)傳感器節(jié)點(diǎn)中的溫度數(shù)據(jù),如圖4所示,其中分別將網(wǎng)絡(luò)節(jié)點(diǎn)隨機(jī)分布在一個(gè)100 m* 100m的監(jiān)測區(qū)域內(nèi)。在該傳感器網(wǎng)絡(luò)中,每個(gè)傳感器節(jié)點(diǎn)周期地探測溫度、濕度、光照等信息,現(xiàn)以每個(gè)節(jié)點(diǎn)按1s間隔來采集128個(gè)數(shù)的數(shù)據(jù),該實(shí)驗(yàn)是在Acer Aspire M3910電腦上通過 Matlab 平臺進(jìn)行實(shí)驗(yàn)。運(yùn)用式(1)-(4)將節(jié)點(diǎn)1從節(jié)點(diǎn)27的數(shù)據(jù)分成三個(gè)簇,實(shí)驗(yàn)結(jié)果如圖5、圖6、圖7所示,其中圖5是節(jié)點(diǎn)1,2,4,5, 6,10,11,12,13,14,15,17,18,19,22的數(shù)據(jù),圖6是節(jié)點(diǎn)7,8,16,20,21,22,23,24,25,26,27的數(shù)據(jù),圖7是節(jié)點(diǎn)3,9的數(shù)據(jù)。
圖4 總體數(shù)據(jù)圖
圖5 簇1
圖6 簇2
圖7 簇3
4.2 壓縮感知實(shí)驗(yàn)仿真
本次實(shí)驗(yàn)數(shù)據(jù)采取上面分簇中的簇1里的數(shù)據(jù),對簇1的數(shù)據(jù)進(jìn)行選取參考節(jié)點(diǎn)與非參考節(jié)點(diǎn),從表1可以看出選取節(jié)點(diǎn)11作為參考節(jié)點(diǎn)。參考節(jié)點(diǎn)壓縮重構(gòu)的數(shù)據(jù)結(jié)果如圖8所示,非參考節(jié)點(diǎn)的估算的數(shù)據(jù)如圖9所示。
對圖4、圖9進(jìn)行比較可以看出非參考節(jié)點(diǎn)進(jìn)行估算的精確度比較高,同時(shí)由圖10可以看出非參考節(jié)點(diǎn)的原始數(shù)據(jù)與根據(jù)參考節(jié)點(diǎn)的線性關(guān)系進(jìn)行估算的數(shù)據(jù)最大誤差都保持在0.5~3℃左右,最小誤差基本在0℃左右。從圖11可以看出,隨著采集數(shù)據(jù)長度的增加,兩種數(shù)據(jù)收集方法的網(wǎng)絡(luò)通信能耗都在增加,但由于壓縮感知的數(shù)據(jù)收集方法網(wǎng)絡(luò)能耗增加速度遠(yuǎn)遠(yuǎn)小于傳統(tǒng)采樣的網(wǎng)絡(luò)能耗,并且隨著采集信號長度的增加,能量節(jié)省效果越明顯。
表1 簇內(nèi)節(jié)點(diǎn)的平均相關(guān)度
圖8 參考節(jié)點(diǎn)壓縮前后對比
圖9 非參考節(jié)點(diǎn)的估算圖
圖10 誤差對比圖
圖11 能量消耗對比圖
將分簇算法和壓縮感知結(jié)合起來,首先保證了簇內(nèi)節(jié)點(diǎn)間的數(shù)據(jù)的相關(guān)性,進(jìn)而有利于將參考節(jié)點(diǎn)進(jìn)行無線網(wǎng)絡(luò)傳輸,而非參考節(jié)點(diǎn)只需根據(jù)與參考節(jié)點(diǎn)的線性回歸系數(shù)進(jìn)行估算,這樣減輕了協(xié)調(diào)器的工作量。將壓縮感知運(yùn)用在無線傳輸中,采取壓縮觀測值進(jìn)行傳輸大大減少了網(wǎng)絡(luò)通信數(shù)據(jù)量,進(jìn)而降低了無線傳感器網(wǎng)絡(luò)的能量消耗,延長了整個(gè)無線傳感器網(wǎng)絡(luò)的使用壽命。文中所給出的仿真實(shí)驗(yàn)的結(jié)果表明,分簇算法和壓縮感知結(jié)合的方法具有較高的應(yīng)用價(jià)值。
[1] 王泉,張納溫,張金成,等.壓縮感知在無線傳感器網(wǎng)絡(luò)數(shù)據(jù)采集中的應(yīng)用[J].傳感技術(shù)學(xué)報(bào),2014,(11):1562- 1567.DOI:10.3969/j.issn.1004- 1699.2014.11.022.
[2] 焦俊, 操俊, 潘中,等. 基于物聯(lián)網(wǎng)的農(nóng)田環(huán)境在線監(jiān)測系統(tǒng)[J]. 農(nóng)業(yè)工程, 2014(6):19- 22.
[3] 張波,劉郁林,常博文,等.線性回歸的分布式壓縮采樣算法[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,26(2):207- 213.DOI:10.3979/j.issn.1673- 825X.2014.02.012.
[4] 張金成,呂方旭,王鈺,等.WSNs中的分簇式壓縮感知[J].儀器儀表學(xué)報(bào),2014,35(1):169- 177.
[5] 呂方旭,張金成,石洪君,等.WSN中的分布式壓縮感知[J].傳感技術(shù)學(xué)報(bào),2013,(10):1446- 1452.DOI:10.3969/j.issn.1004- 1699.2013.10.024.
[6] 王天荊,鄭寶玉,楊震,等.基于濾波的壓縮感知信號采集方案[J].儀器儀表學(xué)報(bào),2013,34(3):573- 581.DOI:10.3969/j.issn.0254- 3087.2013.03.014.
[7] 宋欣,王翠榮.基于線性回歸的無線傳感器網(wǎng)絡(luò)分布式數(shù)據(jù)采集優(yōu)化策略[J].計(jì)算機(jī)學(xué)報(bào),2012,35(3):568- 580.DOI:10.3724/SP.J.1016.2012.00568.
[8] 孟南南.壓縮感知算法的FPGA實(shí)現(xiàn)研究[D].青島大學(xué),2013.
[9] 王強(qiáng), 焦俊, 孔文等. 基于NS2的固定和移動節(jié)點(diǎn)的無線傳感網(wǎng)絡(luò)的仿真[J]. 合肥學(xué)院學(xué)報(bào)(自然科學(xué)版), 2015, 25(2):24- 28.
[10] Candes E. Compressive Sampling[M]//Proceedings of International Congress of Mathematicians. Zurich, Switzerlandi European Mathematical Society Publishing House, 2006:1433- 1452.
[責(zé)任編輯:張永軍]
Farmland Information Processing Based on Clustering Algorithm and Compressed Sensing
ZHU Zhu- fang,JIAO Jun,LI Zheng- tao, MENG Zhu- li,ZHANG Zheng- yun,YANG Sha- sha
(School of Information and Computer,Anhui Agriculture University,Hefei 230036,China)
In order to reduce the amount of data of wireless sensor data,this paper propose a method combining with Correlation Clustering Algorithm and compressed sensing.First,the nodes which are significantly correlated with the node data are divided into a cluster.Then, the average correlation degree can determine the reference node and the non reference node in each cluster, and the data of the reference node can transfer for wireless network combining with compressed sensing, while the data of the non reference node can be calculated according to the linear regression coefficient of the reference node. For simulation experiment of the measured temperature, it is proved that the data reconstruction error of the reference node in the cluster is in the allowable range, and the linear regression calculation of the non reference node is basically consistent with the original data.
wireless sensor;clustering algorithm;average correlation degree;linear regression; compressed sensing
2016-11-29
2017-02-25
國家自然基金項(xiàng)目(31671589)資助。
朱竹芳(1992— ),女,安徽安慶人,安徽農(nóng)業(yè)大學(xué)信息與計(jì)算機(jī)學(xué)院2015級碩士研究生。
TN915
A
2096-2371(2017)02-0041-06