南 楠
(三門峽職業(yè)技術(shù)學(xué)院,河南 三門峽 472000)
?
基于粒子濾波的RFID傳感器網(wǎng)絡(luò)中不確定數(shù)據(jù)清洗算法
南 楠
(三門峽職業(yè)技術(shù)學(xué)院,河南 三門峽 472000)
RFID技術(shù)利用互聯(lián)網(wǎng)將無線射頻識別系統(tǒng)與軟件連接可實現(xiàn)物品對象的跟蹤,具有可追溯性能力,廣泛地應(yīng)用在供應(yīng)鏈管理、資產(chǎn)跟蹤、假冒檢測等方面。然而,RFID閱讀器在大規(guī)模的數(shù)據(jù)識別網(wǎng)絡(luò)中由于環(huán)境和物理特性等所采集原始數(shù)據(jù)具有不確定性,嚴(yán)重影響其應(yīng)用結(jié)果,為獲取更準(zhǔn)確數(shù)據(jù)提出一種可追溯性框架處理不確定性數(shù)據(jù),應(yīng)用粒子濾波技術(shù)采集本地數(shù)據(jù),有效解決原始數(shù)據(jù)漏讀、誤讀問題。實驗結(jié)果表明,該算法可有效提高在大規(guī)模網(wǎng)絡(luò)中采樣的精確度與效率。
RFID;物聯(lián)網(wǎng);不確定數(shù)據(jù);粒子濾波
新一代產(chǎn)品信息網(wǎng)絡(luò)的建立如物聯(lián)網(wǎng)的形成,使RFID技術(shù)得到了廣泛的應(yīng)用,如供應(yīng)鏈管理、制造業(yè)、分銷物流、訪問控制和防偽等。基于互聯(lián)網(wǎng)有效的追蹤產(chǎn)品獲取相關(guān)信息,追溯其位置變化可以檢索歷史信息、存儲位置、時間、改變過程,提高對周圍事物的檢測能力,在無法到達(dá)現(xiàn)場的情況下為決策提供關(guān)鍵性支持。但RFID技術(shù)帶來利益的同時,仍然存在很多問題,由于環(huán)境因素和物理干預(yù)導(dǎo)致RFID讀取數(shù)據(jù)通常是不完整、不準(zhǔn)確,甚至是誤讀[1]。
不確定性數(shù)據(jù)一般分為:多讀、漏讀和重復(fù)讀。通常處理的方法有兩種:一種是從數(shù)據(jù)庫中刪除不確定性數(shù)據(jù),對剩余數(shù)據(jù)進(jìn)行分析處理,但這種方法將導(dǎo)致分析結(jié)果的不準(zhǔn)確與不完整;另一種方法是采用過濾器的方法,基本思想是使用一個滑動窗口預(yù)先設(shè)定閾值,讀數(shù)低于閾值讀數(shù)為假舍棄不用,但這種方法基本以實際經(jīng)驗為基礎(chǔ),缺乏理論基礎(chǔ),不能得到廣泛應(yīng)用[2]。
本文提出了一種基于采樣的粒子濾波技術(shù)來捕獲原始射頻識別數(shù)據(jù),以概率分布為基礎(chǔ)降低識別對象的噪聲和等級,對對象識別數(shù)據(jù)建立節(jié)點獲取數(shù)據(jù)。通過實驗驗證所提出的技術(shù)原型具有較高的有效性。
RFID系統(tǒng)的工作主要是將讀寫器采集數(shù)據(jù)存入后臺關(guān)系數(shù)據(jù)庫中,處理系統(tǒng)直接獲取數(shù)據(jù)進(jìn)行處理分析。但是很多RFID在應(yīng)用中都希望在海量的數(shù)據(jù)中發(fā)現(xiàn)異常數(shù)據(jù)給出提示,傳統(tǒng)的RFID系統(tǒng)只適合于處理已存在于數(shù)據(jù)庫的數(shù)據(jù),不適合對流動的、實時數(shù)據(jù)進(jìn)行查詢。在供應(yīng)鏈管理、生產(chǎn)監(jiān)控等領(lǐng)域,流動性數(shù)據(jù)的處理是目前最廣泛的應(yīng)用,時間和事件發(fā)生位置將成為主要獲取目標(biāo),這就造成了數(shù)據(jù)的不確定性。
在整個RFID構(gòu)成的網(wǎng)絡(luò)中,涉及到多個數(shù)據(jù)源,例如射頻識別器、傳感器和其他分布式數(shù)據(jù)源等,這些數(shù)據(jù)源產(chǎn)生大量的數(shù)據(jù)集包含與標(biāo)記對象相關(guān)聯(lián)的運(yùn)動信息。標(biāo)簽和讀寫器之間的距離,或標(biāo)簽和讀寫器天線間的方向都會使傳感器獲取信息不準(zhǔn)確和不可靠[3]。這些都意味著對象的位置、時間、跟蹤信息成為推斷和估計原始射頻識別數(shù)據(jù)的關(guān)鍵基礎(chǔ)?;谏鲜銮闆r總結(jié)出的射頻識別基本特性如下:
有序數(shù)據(jù)序列:原始的RFID讀取數(shù)據(jù)是以時間點進(jìn)行記錄的,表現(xiàn)形式為r={EPC,ID,Ti},其中EPC為電子產(chǎn)品代碼,ID為讀寫器ID,Ti為標(biāo)簽被檢測獲取數(shù)據(jù)的時間點。這些數(shù)據(jù)流記錄了檢測對象運(yùn)動中所有信息的時間點。
不確定性數(shù)據(jù):RFID觀察到的數(shù)據(jù)是非常雜亂的,受到環(huán)境和標(biāo)簽與讀寫器距離的影響,RFID讀取準(zhǔn)確率往往無法達(dá)到100%,其中有些重要的數(shù)據(jù)都是不精確和不可靠的。
漏讀數(shù)據(jù):當(dāng)被標(biāo)記對象在一個讀寫器的檢測范圍內(nèi)時,若讀寫器無法檢測到標(biāo)記對象則會出現(xiàn)漏讀現(xiàn)象。在這種情況下,讀寫器誤認(rèn)為標(biāo)簽的對象是不存在的,導(dǎo)致射頻識別數(shù)據(jù)的丟失。
誤讀數(shù)據(jù):當(dāng)標(biāo)記的對象超出了讀寫器的檢測范圍時,可能會讀取到一個不可識別的錯誤數(shù)據(jù),這種被稱為假陽性讀數(shù),對確定標(biāo)簽的實際位置影響很大,導(dǎo)致最終分析結(jié)果錯誤。
基于上述分析出的RFID數(shù)據(jù)不確定問題,本文提出一種采用構(gòu)建可追溯性框架來處理不確定數(shù)據(jù)的方法。
2.1整體框架模型
對于RFID在供應(yīng)鏈中的追蹤應(yīng)用,本地應(yīng)用程序管理主要包括數(shù)據(jù)處理、粒子濾波和數(shù)據(jù)模型。在應(yīng)用程序中為了處理大量的原始射頻識別數(shù)據(jù),采用一個以采樣為基礎(chǔ)的推理技術(shù)——粒子濾波技術(shù),它可以捕捉到不確定的原始射頻識別數(shù)據(jù),從動態(tài)和雜亂的原始數(shù)據(jù)中計算對象位置的概率分布情況。采樣計算和位置預(yù)測后,使用一種新的模式數(shù)據(jù)模型生成射頻識別的數(shù)據(jù),一旦所有原始數(shù)據(jù)處理、建模和存儲完成,高層次的追蹤應(yīng)用程序即可從數(shù)據(jù)庫中提取事件,實現(xiàn)數(shù)據(jù)查詢和挖掘。通過整個過程可以完成在可追溯網(wǎng)絡(luò)中對各個節(jié)點的數(shù)據(jù)采集,如圖1即可追溯網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)和功能圖。
2.2不確定數(shù)據(jù)概率模型
基于RFID技術(shù)的跟蹤產(chǎn)品應(yīng)用中獲取的數(shù)據(jù)往往具有不確定和不可靠性,例如產(chǎn)品被盜、被偽造、損壞等。由于捕捉數(shù)據(jù)的不確定性,這里選取一個連續(xù)的隨機(jī)變量來描述數(shù)據(jù),使用概率密度函數(shù)f(x)進(jìn)行描述隨機(jī)變量。對于RFID讀寫去獲取的不確定對象定義為變量x,它的位置信息應(yīng)該遵循設(shè)定的概率密度函數(shù)f(x)。
得出在所有射頻識別數(shù)據(jù)隨機(jī)變量x下的條件密度函數(shù)為[5]:
其中hn=∫Γ(x)f(x)dx是標(biāo)準(zhǔn)化常數(shù)。在這種情況下,位置變量x=(x1,……,xk)由邊緣驗后密度函數(shù)計算而得[6]:
通過貝葉斯規(guī)則可計算出位置變量x,但隨著無線射頻識別數(shù)據(jù)的增加,計算時間復(fù)雜度幾何倍數(shù)增長,這時可引入一個以采樣為基礎(chǔ)的粒子濾波技術(shù)降低時間復(fù)雜度。
2.3粒子濾波處理不確定數(shù)據(jù)
粒子濾波處理不確定數(shù)據(jù)的基本思想是使用一組有限的隨機(jī)樣本近似估算后驗概率密度,這些隨機(jī)樣本被稱為粒子。一個RFID的跟蹤應(yīng)用程序主要任務(wù)有兩個:預(yù)測和更新。預(yù)測階段是構(gòu)建候選粒子集,更新階段是構(gòu)建合格的候選粒子集。粒子濾波技術(shù)可以有效地推斷出觀測數(shù)據(jù)的隱藏狀態(tài)(例如對象的位置)。
預(yù)測更新階段的具體算法描述如下:
輸出:預(yù)測對象樣本位置
步驟:
For?xi∈xdo
樣本xi位置+=運(yùn)動軌跡;
樣本xi位置=擴(kuò)散率*隨機(jī)數(shù);
Endfor
測量概率p(樣本xi位置);
遞歸值計算;
For?xi∈xdo
xi測量概率p/=遞歸值;
計算xi的測量概率p;
Endfor
For?xi∈xdo
R=隨機(jī)數(shù)×給定系數(shù);
如果第一次的p1>=r給G;
將G的值賦給xi;
Endfor
采樣階段算法描述如下:
If漏讀檢測對象數(shù)據(jù)
For?xi∈xdo
搜索最近讀數(shù)(xi);
將最近傳感器位置信息與xi比較并賦值;
將xi于讀寫器距離賦值給d;
Endfor
Else
For?xi∈xdo
計算(xi-讀寫器距離)并賦值給變量d;
Endfor
Endif
實驗以評估捕捉到的不確定性原始射頻識別數(shù)據(jù)采樣為基礎(chǔ),從動態(tài)和低噪聲的低級別射頻識別數(shù)據(jù)中產(chǎn)生符合馬爾科夫的概率分布模型。試驗中采用ST070-016全無源RFID芯片,該芯片工作范圍是860—960MHz,可適用于多種場合,系統(tǒng)主程序通過Java實現(xiàn)。實驗主要目的是檢驗基于粒子濾波方法的準(zhǔn)確性,使跟蹤應(yīng)用具有良好的精度。
實驗環(huán)境設(shè)計為在一個倉庫內(nèi),記錄和處理無線射頻識別數(shù)據(jù)流跟蹤貨物位置信息,初始原始射頻識別讀數(shù)不包括位置信息,針對漏讀、誤讀等現(xiàn)象通過采用粒子濾波方法推斷出真實數(shù)據(jù)信息。具體為模擬兩個不確定數(shù)據(jù):位置不準(zhǔn)確和數(shù)據(jù)不準(zhǔn)確。模擬位置不準(zhǔn)確使用一個隨機(jī)變量表示移動物體的運(yùn)行軌跡,并在RFID數(shù)據(jù)接收上添加2個單位高斯白噪聲標(biāo)準(zhǔn)差;模擬數(shù)據(jù)不準(zhǔn)確將隨機(jī)降低4%讀寫器的讀取數(shù)據(jù)。先將時鐘與數(shù)據(jù)接收系統(tǒng)時間同步,打開系統(tǒng)開始掃描對象標(biāo)簽,實驗對象間隔均勻,設(shè)置每秒3個對象的掃描速度。將原始數(shù)據(jù)采集到系統(tǒng)中,進(jìn)行系統(tǒng)分析、模型建立和查詢處理。整個階段所處理的數(shù)據(jù)以元組R={TR,DR,LRPR}形式存儲在一張表中。通過Java編寫的應(yīng)用程序處理所有數(shù)據(jù)反饋結(jié)果。
實驗中輸入5組數(shù)據(jù),每組100個數(shù)據(jù)記錄,設(shè)定漏讀率不同,每組數(shù)據(jù)運(yùn)行5次取平均數(shù),測試漏讀數(shù)據(jù)對位置準(zhǔn)確性的影響,最終實驗結(jié)果如圖2所示。
圖2中的實驗結(jié)果顯示,隨著漏讀數(shù)的增加位置精確度逐漸下降。當(dāng)漏讀數(shù)目為0時,精確度接近100%;當(dāng)70%的數(shù)據(jù)漏讀時,位置估測的精確度也能達(dá)到75%左右。這表明本文中所提出算法具有良好的預(yù)測效果。
實驗過程中,還測試了優(yōu)化算法對運(yùn)行時間的影響,圖3給出的結(jié)果即為優(yōu)化算法與傳統(tǒng)算法運(yùn)行時間的對比。從圖中可以看出,當(dāng)檢測對象數(shù)達(dá)到200以后,優(yōu)化算法的運(yùn)行時間明顯減緩,優(yōu)化的算法可以減少接近總運(yùn)行時間的一半,與未優(yōu)化的算法相比,表現(xiàn)出卓越的時效性。
在射頻識別跟蹤網(wǎng)絡(luò)對象中管理不確定數(shù)據(jù)仍然是目前拓寬其應(yīng)用的挑戰(zhàn)。本文中,主要針對物聯(lián)網(wǎng)中獲取對象動態(tài)信息,特別是處理獲取不確定的射頻識別數(shù)據(jù)進(jìn)行研究, 設(shè)計一個可追溯性清洗框架, 改進(jìn)現(xiàn)有清洗射頻識別原始數(shù)據(jù)技術(shù),提出一個基于采樣的推理技術(shù)即粒子濾波捕獲原始射頻識別不確定數(shù)據(jù),計算從動態(tài)和雜亂底層RFID數(shù)據(jù)映射對象真實信息的概率分布,將RFID技術(shù)在無線傳感器網(wǎng)絡(luò)中的可追溯應(yīng)用變得更加準(zhǔn)確和高效。
[1]王霞,玄麗娟,夏秀峰.基于時序關(guān)系的RFID不確定數(shù)據(jù)清洗算法[J].遼寧大學(xué)學(xué)報,2012,39(2):174—177.
[2]王同磊,張進(jìn)東.基于粒子濾波的RFID數(shù)據(jù)清洗方法研究[J].電子技術(shù)與軟件工程,2014,(4).
[3]夏秀峰,玄麗娟,李曉明.分流機(jī)制下的RFID不確定數(shù)據(jù)清洗策略[J].計算機(jī)科學(xué),2011,38(10A):22—24.
[4]崔紅娟.基于粒子濾波的RFID事件概率計算方法研究[D].沈陽:遼寧大學(xué),2012:58—79.
[5]王萬良,顧熙仁,趙燕偉.一種基于動態(tài)標(biāo)簽的RFID不確定性數(shù)據(jù)清洗算法[J].計算機(jī)科學(xué),2014,41(6A):383—386.
[6]王妍,宋寶燕,付菡,等.引入卡爾曼濾波的RFID數(shù)據(jù)清洗方法[J].小型微型計算機(jī)系統(tǒng),2011,32(9):1 794—1 799.
[7]谷峪,于戈,李曉靜,等.基于動態(tài)概率路徑事件模型的RFID數(shù)據(jù)填補(bǔ)算法[J].軟件學(xué)報,2010,21(3):438—451.
責(zé)任編輯:柴造坡
10.3969/j.issn.1674-6341.2016.04.014
2016-03-30
南楠(1981—),女,河南洛陽人,碩士,講師。研究方向:計算機(jī)應(yīng)用、自動化控制。
TP311
A
1674-6341(2016)04-0030-03