晏然
本文針對5G通信時代物聯(lián)網(wǎng)應用的新趨勢和新特點,分析了海量傳感器使用以及相應產(chǎn)生的采集海量數(shù)據(jù)的處理需求,并提出了在本地智能節(jié)點進行數(shù)據(jù)預處理和融合的概念,從而能顯著減輕通信網(wǎng)絡(luò)的負荷,以及云端服務(wù)平臺的處理壓力。本文以智能家居場景為例,分析了利用模糊算法進行數(shù)據(jù)融合的方法,以及該方法在嵌入式平臺下實現(xiàn)的局限性。本文針對性地提出了優(yōu)化算法,并結(jié)合實驗和仿真數(shù)據(jù),驗證了該方法的有效性。
電信技術(shù)迅猛發(fā)展,即將進入5G時代。5G通信最重要的應用之一是基于物聯(lián)網(wǎng)的各種應用場景,比如智能家居,智能工廠,環(huán)境監(jiān)控等等。
各類物聯(lián)網(wǎng)應用的基礎(chǔ)是環(huán)境數(shù)據(jù)的采集,這是靠物聯(lián)網(wǎng)感知層來完成,具體而言,是各類型的傳感器節(jié)點。而物聯(lián)網(wǎng)應用的發(fā)展有以下幾個趨勢:
(一)更大的部署空間:需求的發(fā)展,要求我們在更大的空間范圍內(nèi)實現(xiàn)物聯(lián)網(wǎng)布置,如更大型的智能化工廠,如智能家居應用場景由普通居室向別墅,酒店發(fā)展,等等。而通信技術(shù)的發(fā)展,為更大空間內(nèi)實現(xiàn)節(jié)點互聯(lián)提供了實現(xiàn)的可能性。更大的空間意味著更多的感知節(jié)點,更多的采集數(shù)據(jù)。
(二)更精細的采集頻度:許多需求對實時性要求在提高,如智能駕駛,又如智能家居領(lǐng)域,要獲取更好的控制體驗和控制精度等等。采集頻度的增加必然會帶來數(shù)據(jù)量的增加。
(三)對環(huán)境變化和測量誤差的容忍度要求更高:復雜的應用場景和海量的數(shù)據(jù),必然會帶來大量的測量誤差和噪聲數(shù)據(jù),對這些噪聲數(shù)據(jù)合理平滑將成為重要的技術(shù)難點。
從技術(shù)層面觀察,這些應用發(fā)展趨勢帶給我們的是海量的數(shù)據(jù),以及帶有噪聲的數(shù)據(jù)。如何對這些數(shù)據(jù)進行預處理,減輕節(jié)點通信的壓力,以及集中處理云平臺的壓力,是值得研究的課題。我們通過引進數(shù)據(jù)預處理和數(shù)據(jù)融合模塊來實現(xiàn)這些功能。
以智能家居系統(tǒng)為例,引進數(shù)據(jù)預處理和數(shù)據(jù)融合功能的系統(tǒng)總體架構(gòu)如圖1所示:
為減輕網(wǎng)絡(luò)流量的壓力,數(shù)據(jù)融合模塊將在本地節(jié)點完成??紤]到計算能力和數(shù)據(jù)獲取的方便性,該功能將部署在智能家居網(wǎng)關(guān)設(shè)備上。
數(shù)據(jù)預處理和融合模塊將實現(xiàn)以下功能:
1、對異構(gòu)數(shù)據(jù)進行預處理,統(tǒng)一數(shù)據(jù)格式和封裝。數(shù)據(jù)的異構(gòu)性來源于感知層各類型傳感器的不同。
2、對噪聲數(shù)據(jù)的平滑。噪聲數(shù)據(jù)可能來自于測量精度的影響,環(huán)境的突發(fā)性變化,以及通信過程中產(chǎn)生的傳輸誤差等等。平滑的數(shù)據(jù)將對后續(xù)數(shù)據(jù)處理環(huán)節(jié)的效率產(chǎn)生積極影響。
3、對海量數(shù)據(jù)進行融合,減少有效數(shù)據(jù)量,在不影響感知精度的情況下盡量減少通信網(wǎng)流量壓力和后續(xù)數(shù)據(jù)處理負荷量。
下文將重點分析數(shù)據(jù)融合的實現(xiàn)方法以及在物聯(lián)網(wǎng)環(huán)境下的優(yōu)化實現(xiàn)。
(一)數(shù)據(jù)融合算法簡介
數(shù)據(jù)融合算法是各類數(shù)據(jù)融合技術(shù)的核心研究內(nèi)容。選擇數(shù)據(jù)融合算法,要綜合考慮數(shù)據(jù)的類型,數(shù)據(jù)特征分布,數(shù)據(jù)分析目的等等差異,還要考慮到實現(xiàn)的難度和計算量差異。
常見的數(shù)據(jù)融合算法有以下四種
1、加權(quán)平均算法
加權(quán)平均算法就是對待融合數(shù)據(jù)進行加權(quán)平均,從而得到融合結(jié)果。
假設(shè)對 n 個采集點進行融合,第 i 個節(jié)點數(shù)據(jù)為Ai,權(quán)重為 Wi,i=1…n,則融合結(jié)果如下式1所示:
加權(quán)平均算法是一種簡單直接的融合算法,它要求確切的獲知每個節(jié)點的權(quán)重信息,而在具體物聯(lián)網(wǎng)應用中這往往是很繁瑣的,難以做到的,而且可能是頻繁變化的,因此應用場景有限。
2、D-S 證據(jù)理論算法
證據(jù)理論是Dempster于1967年首先提出,由他的學生Shafer于1976年進一步發(fā)展起來的一種不精確推理理論最早應用于專家系統(tǒng)中,具有處理不確定信息的能力。作為一種不確定推理方法,證據(jù)理論的主要特點是:滿足比貝葉斯概率論更弱的條件;具有直接表達“不確定”和“不知道”的能力。
設(shè)m1和m2是由兩個獨立的證據(jù)源(傳感器)導出的基本概率分配函數(shù),則Dempster組合規(guī)則可以計算這兩個證據(jù)共同作用產(chǎn)生的反映融合信息的新的基本概率分配函數(shù)。
3、神經(jīng)網(wǎng)絡(luò)算法
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)系統(tǒng)是 20 世紀 40 年代后出現(xiàn)的。它是由眾多的神經(jīng)元可調(diào)的連接權(quán)值連接而成,具有大規(guī)模并行處理、分布式信息存儲、良好的自組織自學習能力等特點。
神經(jīng)網(wǎng)絡(luò)規(guī)則建立需要大量數(shù)據(jù)的訓練。由于分布式的特點,對噪聲數(shù)據(jù)具有天然的容忍性。
4、模糊理論算法
模糊理論(Fuzzy Logic)是在美國加州大學伯克利分校電氣工程系的L.A.zadeh(扎德)教授于1965年創(chuàng)立的模糊集合理論的數(shù)學基礎(chǔ)上發(fā)展起來的,其基本精神是接受模糊性現(xiàn)象存在的事實,而以處理概念模糊不確定的事物為其研究目標,并積極的將其嚴密的量化成計算機可以處理的訊息,不主張用繁雜的數(shù)學分析即模型來解決模型。
模糊理論將數(shù)據(jù)概率化,獲取的數(shù)據(jù)理解為某具體值的概率分布,融合過程轉(zhuǎn)化為概率函數(shù)的融合。
以上幾種融合算法中,加權(quán)平均算法簡單直接,但實用性有限;D-S 證據(jù)理論算法和神經(jīng)網(wǎng)絡(luò)算法均存在復雜性較高,計算量大的問題,對嵌入式硬件平臺性能要求比較高。本文將選擇模糊理論算法進行重點研究。
(二)基于模糊理論的數(shù)據(jù)融合算法
模糊理論算法的基本思想是將數(shù)據(jù)模糊化,概率化。
對于傳感器網(wǎng)絡(luò)內(nèi)某個傳感器組合A,其融合值由函數(shù)三元組{ F(A),R(A),M(A) },表達。
其中F(A)為融合函數(shù),它定義了具體的融合算法。常見的融合算法有最大(?。┲捣?,中間值法,均值法等等。
R(A)為容許度函數(shù),它定義了數(shù)據(jù)間的相似程度。R函數(shù)的取值范圍在[0,1]之間,值越接近 1,說明數(shù)據(jù)相似度越高,相似度越高則融合難度越低。
M(A)為模糊測度函數(shù),它代表了融合的傳感器組代表數(shù)據(jù)的可靠度。參與融合的節(jié)點數(shù)占總節(jié)點數(shù)比例越多,則M的值越大,反之則越小。
假設(shè)某個待融合的傳感器網(wǎng)絡(luò)共有n個采集節(jié)點,這些節(jié)點可以任意組合,形成的傳感器組合的數(shù)量為2n-1。根據(jù)模糊算法理論,該傳感器網(wǎng)絡(luò)最終融合輸出為:
其中i的取值為1~2n-1。AND運算為取最小值,OR運算為取最大值。
由上式可見,模糊算法的計算量由節(jié)點數(shù)n來決定,隨著節(jié)點數(shù)n的增加,算法計算量將成指數(shù)級增長,從而對在嵌入式硬件環(huán)境中實現(xiàn)算法增加難度,因此有必要對算法進行優(yōu)化。
(三)針對嵌入式平臺的算法優(yōu)化
嵌入式硬件平臺一般偏重于控制而計算力較弱,對算法優(yōu)化的重點為減少計算量和數(shù)據(jù)存儲量。
根據(jù)上文介紹可知,降低計算量的關(guān)鍵在于參與節(jié)點數(shù)n。如果能夠設(shè)法降低n的值,則能夠大大降低總體計算量,適應嵌入式環(huán)境的要求。在一個固定系統(tǒng)中,物理節(jié)點數(shù)量n一般是固定的,我們的思路是減少有效節(jié)點數(shù)。
一般而言,節(jié)點采集數(shù)據(jù)都存在一定的冗余度,這種冗余度體現(xiàn)在空間分布冗余和時間采樣冗余兩個方面。例如:如果一段時間內(nèi)待監(jiān)測環(huán)境參數(shù)沒有發(fā)生大的波動,可是適當減少采樣的頻度;如果檢測環(huán)境參數(shù)的空間分布有一定的平滑性,可以適當降低有效節(jié)點的分布密度。通過兩個維度對數(shù)據(jù)進行合理丟棄,就等效降低了參與融合的節(jié)點數(shù)。
以智能家居系統(tǒng)的溫度變化監(jiān)控為例:
圖2為背景溫度為8℃,啟動空調(diào)加熱至23℃的溫度變化曲線,在開始兩分鐘以內(nèi),空調(diào)主機處于預熱階段,溫度上升較慢;在13分鐘以后,達到設(shè)定目標溫度,溫度變化率變緩。在上述兩個時間段內(nèi),可以通過合理丟棄采集數(shù)據(jù)的思路,降低數(shù)據(jù)融合的計算量。
對數(shù)據(jù)進行丟棄,需要考慮兩個要點:
1、冗余數(shù)據(jù)丟棄閥值
我們設(shè)定一個空間值:
其中C為上次融合輸出結(jié)果,?為一個設(shè)定常數(shù),代表了被測量值的合理波動,合理選擇?需要對于環(huán)境有一定的先驗知識。T即為衡量數(shù)據(jù)是否冗余的閥值空間。
當待融合數(shù)據(jù)沒有進入上述值空間,代表該數(shù)據(jù)需要進入正常的融合算法過程;當待融合數(shù)據(jù)進入該值空間范圍,則代表該數(shù)據(jù)的冗余度較大,可以考慮丟棄。
2、數(shù)據(jù)權(quán)重值
對每個待融合數(shù)據(jù),賦予其伴隨權(quán)重值記為W。W取值為正整數(shù),初值為1。W表達了與該數(shù)據(jù)相似的數(shù)據(jù)量,W越大,表示該數(shù)據(jù)代表的數(shù)據(jù)量越多;W=1表示該數(shù)據(jù)只代表自己。
當某數(shù)據(jù)落入丟棄閥值空間內(nèi)時,我們將它丟棄;但是丟棄的數(shù)據(jù)量太多時,往往會造成計算精度的下降。因此,通過引進數(shù)據(jù)權(quán)重,我們給定該數(shù)據(jù)一定機會重新參與融合。
對該數(shù)據(jù)賦予重新融合的機會通過修改模糊測度函數(shù)來實現(xiàn)。
(一)仿真試驗場景
仿真實驗場景設(shè)定為某智能家居現(xiàn)場,空間范圍為100m 100m。傳感器節(jié)點類型設(shè)定為溫度傳感器,傳感器感知范圍為20m。
為了方便對比,使用普通的模糊融合算法和基于權(quán)重丟棄的改進算法兩種方法進行數(shù)據(jù)融合實驗,融合次數(shù)設(shè)定為50次。
傳感器節(jié)點位置為隨機均勻分布,如圖4所示:
(二)仿真試驗結(jié)果
基于算法原理分析可知,實際參加融合的有效節(jié)點數(shù)是衡量算法改進效率的重要指標,模擬實驗首先對兩種算法的有效參與節(jié)點數(shù)進行了統(tǒng)計,結(jié)果如圖5:
圖中紅色點線為傳統(tǒng)融合算法參與節(jié)點的數(shù)量,基本在100左右小幅波動;藍色點線為改進后的算法對應的節(jié)點參與數(shù)量,從第三次融合迭代開始,參與節(jié)點數(shù)降低到50個左右,降低了一半。傳統(tǒng)算法中幾乎所有節(jié)點都參與了每次融合過程;而改進后的算法能大大降低參與節(jié)點數(shù),從而能更大程度降低算法的計算量需求。
在達到降低參與節(jié)點數(shù)的設(shè)計目標的同時,我們還要確保算法融合結(jié)果的正確性和精度指標,對此我們對兩種算法的融合結(jié)果值進行了比較,如圖6:
圖中紅藍兩色點線對應的分別是傳統(tǒng)算法和改進算法的融合值擬合曲線,兩者對比可知,改進算法的準確度和精度能達到設(shè)計要求。
本文首先分析了5G通信網(wǎng)背景下物聯(lián)網(wǎng)應用場景新的需求,指出傳感器網(wǎng)絡(luò)擴展和海量數(shù)據(jù)帶來的技術(shù)問題。文章提出了在本地智能節(jié)點進行數(shù)據(jù)預處理和數(shù)據(jù)融合的必要性和重要性。隨后分析比較了常見的幾種數(shù)據(jù)融合算法。本文選擇模糊理論基礎(chǔ)上的數(shù)據(jù)融合算法進行重點研究,并針對嵌入式硬件環(huán)境對算法進行了改進。通過基于閥值和權(quán)重的丟棄處理機制,能降低參與融合計算的有效節(jié)點數(shù)量,從而大大降低計算量和對硬件的要求。仿真模擬實驗結(jié)果證明,改進算法能夠達到傳統(tǒng)模糊算法能達到的準確度和精度,是一種有效的算法。
基金項目:本文系湖南省教育廳科學研究項目《基于智能決策的智能家居系統(tǒng)研究》論文,項目編號:17C1343。