李志祥, 丁緒星, 陳興盛, 馮友宏, 丁閣文, 周理政
(1.安徽師范大學(xué) 物理與電子信息學(xué)院,安徽 蕪湖 241000,2.安徽華東光電技術(shù)研究所,安徽 蕪湖 241000)
由于機(jī)場(chǎng)、養(yǎng)老院、醫(yī)院、車站等諸多場(chǎng)所對(duì)位置服務(wù)的需求,室內(nèi)定位已經(jīng)滲透到人們生活的方方面面。目前WiFi已經(jīng)覆蓋了生活中大部分的公共區(qū)域及家庭,因此,基于WiFi的室內(nèi)定位算法研究成為國(guó)內(nèi)外的研究熱點(diǎn),也取得了很多成果,如KNN(K-Nearest-Neighbors)算法[1]、WKNN(Weighted K-Nearest Neighbors)算法[2]和K-Means(K-MeansClustering Algorithm)算法[3]等定位算法。WiFi的每個(gè)無(wú)線接入點(diǎn)(Access Point,AP)都有唯一的物理地址,并且在一段時(shí)間內(nèi),無(wú)線接入點(diǎn)(AP)的信號(hào)強(qiáng)度不會(huì)發(fā)生改變,WiFi終端可以持續(xù)掃描和收集周邊AP信號(hào),獲取其信號(hào)強(qiáng)度(Received Signal Strength,RSS),在室內(nèi)WiFi定位場(chǎng)景中,基于位置指紋的定位方法被廣泛研究和采用[4-6]。該方法是在室內(nèi)放入一定數(shù)量的無(wú)線接入點(diǎn),使得整個(gè)室內(nèi)都被WiFi信號(hào)所覆蓋,然后通過(guò)移動(dòng)設(shè)備收集各個(gè)不同位置獲得無(wú)線接入點(diǎn)的RSS和MAC地址,每個(gè)位置獲取的來(lái)自各個(gè)AP的RSS組成一組向量,在不同位置會(huì)產(chǎn)生一個(gè)陣列RSS向量,將這些向量與室內(nèi)位置進(jìn)行匹配存儲(chǔ)在數(shù)據(jù)庫(kù)中。
基于WiFi的位置指紋定位算法一般分為離線和在線兩個(gè)階段[7]。離線階段用于生成數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)用于估計(jì)在線階段的位置。經(jīng)典的算法如KNN,由于其選擇一個(gè)測(cè)量點(diǎn)周圍固定數(shù)量的最近K個(gè)鄰點(diǎn)來(lái)計(jì)算測(cè)量點(diǎn)的位置,從而降低了定位精度,效率也不高。在文獻(xiàn)[8]中,Changgeng Li等人提出了一種改進(jìn)的加權(quán)KNN算法來(lái)計(jì)算測(cè)點(diǎn)的最終定位坐標(biāo),但其在線階段需要與很多的位置指紋數(shù)據(jù)進(jìn)行匹配定位,定位效率也較低。研究者試圖用聚類算法來(lái)提高效率,如ChoRong Park在KNN算法中采用改進(jìn)的K-Means聚類方法進(jìn)行高效準(zhǔn)確的分類[9],H.Wang等人研究了空間聚類、K-Means聚類和親和傳播聚類(SAAP)三種聚類算法的定位性能[10]。這些成果在一定程度上提高了定位精度,降低了消耗,但僅提出單邊方案。也有研究者試圖用機(jī)器學(xué)習(xí)的算法來(lái)提高室內(nèi)定位性能,如貝葉斯分類(Bayes Classification)算法[11]、AdaBoost算法[12]和支持向量機(jī)(Support Vector Machines,SVM)算法[13]等算法都應(yīng)用于室內(nèi)定位。但是對(duì)于這些傳統(tǒng)的機(jī)器學(xué)習(xí)算法,當(dāng)室內(nèi)環(huán)境要求較高時(shí),數(shù)據(jù)的訓(xùn)練效果較差,靈活性不強(qiáng),相應(yīng)的研究成果不多。
針對(duì)以上問(wèn)題,本文提出了一種基于深度神經(jīng)網(wǎng)絡(luò)和泰森多邊形的位置指紋定位算法DV-WKNN(Deep neural networks and Voronoi-WKNN),該算法采用了深度學(xué)習(xí)算法和泰森多邊形結(jié)合的方法來(lái)進(jìn)行定位。利用深度學(xué)習(xí)算法較強(qiáng)的非線性學(xué)習(xí)能力對(duì)環(huán)境參數(shù)的訓(xùn)練、建模,實(shí)現(xiàn)待測(cè)點(diǎn)的物理位置預(yù)測(cè)。再將預(yù)測(cè)的物理位置點(diǎn)作為離散點(diǎn)構(gòu)建泰森多邊形,利用泰森多邊形來(lái)確定定位區(qū)域。在定位區(qū)域內(nèi),通過(guò)計(jì)算已知點(diǎn)的平均環(huán)境偏差值來(lái)改進(jìn)WKNN定位算法,從而實(shí)現(xiàn)了精確定位。
本文的主要貢獻(xiàn)有3個(gè)方面:
1)本文引入了深度學(xué)習(xí)算法,利用其較強(qiáng)的非線性學(xué)習(xí)能力,實(shí)現(xiàn)對(duì)定位空間的信號(hào)強(qiáng)度特征的學(xué)習(xí),及待測(cè)位置的預(yù)估計(jì);
2)遍歷時(shí)間,引入了泰森多邊形,進(jìn)行定位區(qū)域的動(dòng)態(tài)劃分,從而提高定位效率;
3)本文在精確定位時(shí),加入了環(huán)境平均偏差值,在WKNN定位算法的基礎(chǔ)上進(jìn)行位置修正,從而提高了定位的精度。
圖1 基于深度神經(jīng)網(wǎng)絡(luò)的WiFi室內(nèi)定位算法流程圖Fig.1 The process of indoor positioning algorithm for WiFi based on deep neural network
本文提出的定位方法主要通過(guò)神經(jīng)網(wǎng)絡(luò)算法和泰森多邊形結(jié)合的方法來(lái)實(shí)現(xiàn)位置的估計(jì),利用神經(jīng)網(wǎng)絡(luò)對(duì)已建立的指紋數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練,根據(jù)每次測(cè)試集的推理結(jié)果,動(dòng)態(tài)調(diào)整相應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu),以獲得最優(yōu)網(wǎng)絡(luò)參數(shù)。在位置估計(jì)階段,將采集的RSS值,通過(guò)已保存的神經(jīng)網(wǎng)絡(luò)模型,推理得到其對(duì)應(yīng)在數(shù)據(jù)庫(kù)中的物理位置坐標(biāo),將此物理位置坐標(biāo)作為初位置估計(jì)點(diǎn)。為了得到更精確的物理位置,則以初位置估計(jì)點(diǎn)建立泰森多邊形,將整個(gè)定位區(qū)域劃分為若干個(gè)小區(qū)域,再在每個(gè)包含初略位置估計(jì)點(diǎn)的小區(qū)域內(nèi)通過(guò)改進(jìn)的WKNN算法,獲得最終精確的物理坐標(biāo)。具體流程如下:
該方法主要通過(guò)收集無(wú)線接入點(diǎn)(AP)的RSS值來(lái)進(jìn)行當(dāng)前位置的確定,定位的步驟分為線下訓(xùn)練和線上定位兩個(gè)階段。線下訓(xùn)練階段即離線階段,通過(guò)仿真平臺(tái)獲取到RSS值并建立指紋數(shù)據(jù)庫(kù),將指紋進(jìn)行濾波以及預(yù)處理,再將處理的數(shù)據(jù)作為構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行訓(xùn)練。線上定位即在線階段時(shí),系統(tǒng)接收來(lái)自AP的實(shí)時(shí)數(shù)據(jù),通過(guò)定位模型的預(yù)測(cè)坐標(biāo)建立泰森多邊形區(qū)域,在設(shè)定的區(qū)域內(nèi)通過(guò)改進(jìn)的WKNN算法預(yù)測(cè)用戶的位置。算法流程如圖1所示。
本文算法中采用深度神經(jīng)網(wǎng)絡(luò)的主要目的是獲得待測(cè)用戶的初位置估計(jì)點(diǎn),因建立的指紋數(shù)據(jù)庫(kù)中不可能包含待測(cè)區(qū)域中所有的RSS值及其對(duì)應(yīng)的物理坐標(biāo)點(diǎn),故采用采用神經(jīng)網(wǎng)絡(luò)算法,可以快速定位到待測(cè)點(diǎn)所在區(qū)域,為下一步的精確定位增加了可靠性。
相比較傳統(tǒng)的定位算法,本文引用神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),一是提取RSS值的基本特征,二是對(duì)室內(nèi)定位問(wèn)題進(jìn)行回歸?;貧w分析的目的是實(shí)現(xiàn)學(xué)習(xí)本地化功能,使用神經(jīng)網(wǎng)絡(luò)近似指紋映射到該點(diǎn)的估計(jì)位置。與傳統(tǒng)的KNN等定位算法相比,該方法將模式匹配和后處理相結(jié)合,一次定位。另一方面,接收到的RSS值沒(méi)有取平均值,只是歸一化處理作算法的輸入,可以防止在平均處理中造成的信息損失。
圖2 深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練步驟Fig.2 The training model of deep neural network
將處理后的RSS數(shù)據(jù)集,拆分為訓(xùn)練集和測(cè)試集,經(jīng)過(guò)多輪訓(xùn)練,獲得可靠的神經(jīng)網(wǎng)絡(luò)參數(shù)模型,訓(xùn)練步驟如圖2所示。深度神經(jīng)網(wǎng)絡(luò)的模型相關(guān)參數(shù)如表1所示,主要由6層構(gòu)成,其每個(gè)隱藏層的神經(jīng)元由10-20-20-20-20-10構(gòu)成,因本文所使用數(shù)據(jù)集類型較為簡(jiǎn)單,若直接引用現(xiàn)有的成熟網(wǎng)絡(luò)模型,將大大的浪費(fèi)訓(xùn)練開銷。因此,本文根據(jù)RSS數(shù)據(jù)類型設(shè)計(jì)相適應(yīng)的網(wǎng)絡(luò)架構(gòu),經(jīng)過(guò)每次測(cè)試集獲得的推理結(jié)果,調(diào)整網(wǎng)絡(luò)層數(shù)及相應(yīng)層數(shù)的神經(jīng)元數(shù)量,以保證預(yù)測(cè)正確率的同時(shí)減少推理時(shí)間。因數(shù)據(jù)集在進(jìn)行訓(xùn)練之前已歸一化預(yù)處理,故本文在每一層隱藏層之間采用了ReLU(Rectified Linear Unit)激活函數(shù)[15],解決RSS數(shù)據(jù)之間的非線性可分問(wèn)題且防止梯度消失的出現(xiàn)。在每層的優(yōu)化算法上選擇NWM-Adam算法[16],與傳統(tǒng)的優(yōu)化算法相比,其利用非單一的學(xué)習(xí)率來(lái)更新權(quán)重,提升系統(tǒng)的學(xué)習(xí)效率。在輸出層,采用了Softmax函數(shù)[17],實(shí)現(xiàn)多分類效果,保證所有輸出神經(jīng)元的概率之和為1,每個(gè)輸出對(duì)應(yīng)的[0,1]區(qū)間的數(shù)值就是該輸出的概率。在應(yīng)用時(shí)取概率最大的輸出作為最終的預(yù)測(cè),將其預(yù)測(cè)結(jié)果作為初位置估計(jì)點(diǎn)。
經(jīng)過(guò)合適的epoch設(shè)定,調(diào)用Tensorflow的可視化工具tensorboard觀察發(fā)現(xiàn),當(dāng)epoch為1800時(shí),loss函數(shù)達(dá)到收斂的狀態(tài),其預(yù)測(cè)準(zhǔn)確率達(dá)到98.6%,損失率接近于0.038,即得到可靠的深度神經(jīng)網(wǎng)絡(luò)模型,結(jié)果如圖3、4所示。
利用深度學(xué)習(xí)算法獲得的初位置估計(jì)點(diǎn),作為泰森多邊形的離散點(diǎn)進(jìn)行區(qū)域的劃分。泰森多邊形是指在特定的二維空間內(nèi),給定一個(gè)點(diǎn)集,根據(jù)該點(diǎn)集將空間劃分為多個(gè)多邊形集合,在每個(gè)多邊形內(nèi)有且僅有一個(gè)該點(diǎn)集中的點(diǎn),并且多邊形內(nèi)的任何一個(gè)點(diǎn)到相應(yīng)點(diǎn)集中的點(diǎn)的距離最近,該多邊形稱之為該點(diǎn)的Voronoi區(qū)域。本文將深度神經(jīng)網(wǎng)絡(luò)算法模型獲得的預(yù)測(cè)點(diǎn)作為構(gòu)建泰森多邊形的離散點(diǎn),再根據(jù)文獻(xiàn)[18]所述的泰森多邊形的具體實(shí)現(xiàn)步驟,實(shí)現(xiàn)區(qū)域的泰森多邊形分割,結(jié)果如圖5所示。
圖6展示了在20m*20m的定位環(huán)境中,通過(guò)泰森多邊形劃分的定位區(qū)域,以滿足下一步的精確定位。其中,紅色“+”代表參考點(diǎn)RPs,綠色“☆”表示待測(cè)點(diǎn)經(jīng)神經(jīng)網(wǎng)絡(luò)模型獲得的預(yù)測(cè)點(diǎn)TPs,TPs作為構(gòu)建泰森多邊形的離散點(diǎn),藍(lán)色“o”表示無(wú)線接入點(diǎn)Aps。
表1 深度神經(jīng)網(wǎng)絡(luò)相關(guān)參數(shù)Table 1 Related parameters of deep neural network
加權(quán)K近鄰算法是WiFi定位中比較常用的算法,計(jì)算在線采集的RSS向量與指紋數(shù)據(jù)庫(kù)中的RSS向量之間的歐式距離,選擇K個(gè)最近距離的參考點(diǎn)作為定位標(biāo)簽,并根據(jù)距離的權(quán)重作為該標(biāo)簽的權(quán)重值,得到估計(jì)的坐標(biāo)作為結(jié)果[19],如公式(1),公式(2)和公式(3):
(1)
其中,N是AP的數(shù)量,RSSi是第i個(gè)AP中接收到的待測(cè)點(diǎn)的信號(hào)強(qiáng)度,RSSij是第i個(gè)AP接收到的第j個(gè)RP的信號(hào)強(qiáng)度,Dj是待測(cè)點(diǎn)信號(hào)強(qiáng)度與第j個(gè)RP信號(hào)強(qiáng)度之間的歐氏距離。
(2)
(3)
其中,wi為所選第i個(gè)RP的權(quán)值,η為修正系數(shù),(xi,yi)為所選的第i個(gè)RP的位置,(x,y)為測(cè)點(diǎn)位置。
圖3 accuracy的變化曲線
圖4 loss的變化曲線
圖5 基于預(yù)測(cè)點(diǎn)構(gòu)建泰森多邊形圖
圖6 20m*20m的環(huán)境區(qū)域劃分圖
在加權(quán)K近鄰算法中,目標(biāo)標(biāo)簽選擇K個(gè)最近的參考鄰居標(biāo)簽,再根據(jù)距離權(quán)重的比例來(lái)計(jì)算坐標(biāo)位置。在改進(jìn)的加權(quán)K近鄰算法中,本文首先得到具有K個(gè)最近參考鄰居標(biāo)簽的目標(biāo)位置,對(duì)已知位置的K個(gè)參考點(diǎn)進(jìn)行加權(quán)K近鄰計(jì)算,得到他們的定位坐標(biāo),然后計(jì)算原始位置與定位位置之間的誤差,將偏差值相加并取平均值,如公式(4):
(4)
(xi′,yi′)代表參考點(diǎn)的K個(gè)近鄰點(diǎn)通過(guò)WKNN算法計(jì)算的位置坐標(biāo);
(xi,yi)代表參考點(diǎn)的實(shí)際坐標(biāo);
(△x,△y)表示當(dāng)前環(huán)境下的平均偏差值。
在劃分的泰森多邊形的各個(gè)區(qū)域內(nèi),通過(guò)WKNN算法計(jì)算出目標(biāo)點(diǎn)的位置坐標(biāo),再將此坐標(biāo)加上該網(wǎng)絡(luò)的平均偏差值,獲得最終位置坐標(biāo),如公式(5):
(x,y)=(x′,y′)+(△x,△y),
(5)
(x′,y′)代表待測(cè)點(diǎn)的K個(gè)近鄰點(diǎn)通過(guò)WKNN算法計(jì)算的位置坐標(biāo);
(x,y)代表的最終定位位置坐標(biāo)。
室內(nèi)環(huán)境由于墻壁和室內(nèi)遮擋物等存在,實(shí)際的信號(hào)接收值比理想傳播模型要小,根據(jù)文獻(xiàn)[14]的研究結(jié)果,采用對(duì)數(shù)正態(tài)模型可以更好模擬室內(nèi)無(wú)線信號(hào)損耗,如式(6):
(6)
其中,PL(d),PL(d0)接收信號(hào)強(qiáng)度與參考距離d0米處接收信號(hào)強(qiáng)度,單位為dB。
n:環(huán)境衰減系數(shù)。
Xσ:零均值的高斯分布隨機(jī)變量,其標(biāo)準(zhǔn)差為σ,用于模擬噪聲誤差,單位為dB。
將其轉(zhuǎn)化為接收信號(hào)強(qiáng)度,可表示為公式(7):
(7)
其中RSS(d),RSS(d0)接收信號(hào)強(qiáng)度與d0米處接收信號(hào)強(qiáng)度,單位為dB。
n:路徑損耗系數(shù)。
Xσ:零均值的高斯分布隨機(jī)變量,其標(biāo)準(zhǔn)差為σ,用于模擬噪聲誤差,單位為dB。
本文的仿真實(shí)驗(yàn)均采用上述對(duì)數(shù)路徑損耗模型。經(jīng)過(guò)多次實(shí)驗(yàn)發(fā)現(xiàn),變量取值如表3所示時(shí),路徑損耗模型可以較好模擬存在障礙物的室內(nèi)環(huán)境。
通過(guò)仿真收集的數(shù)據(jù),所獲得的RSS信號(hào)的范圍在-101dB與-60dB之間。由圖7可知,直接獲取的RSS值波動(dòng)較大且存在奇異值,不適合作為深度神經(jīng)網(wǎng)絡(luò)的輸入。用公式(8)做歸一化處理,將RSS值設(shè)置于0-1之間。如圖8所示。
表2 對(duì)數(shù)路徑損耗模型參數(shù)Table 2 Logarithmic path loss model parameters
(8)
其中,RSSij為參考點(diǎn)的原始信號(hào)強(qiáng)度數(shù)據(jù),RSSij′為歸一化處理后的信號(hào)強(qiáng)度數(shù)據(jù),RSSmin為數(shù)據(jù)庫(kù)中收集到的最小信號(hào)強(qiáng)度值;RSSmax為數(shù)據(jù)庫(kù)中收集到的最大信號(hào)強(qiáng)度值。
圖7 原始的RSS值
圖8 處理后的RSS值
針對(duì)公式(2)的η選取,設(shè)定了20m*20m,30m*30m的仿真環(huán)境,記錄50個(gè)待測(cè)點(diǎn)的平均誤差。由圖9可知,在20m*20m的網(wǎng)絡(luò)中,最優(yōu)修正系數(shù)η為1.3,在30m*30m的網(wǎng)絡(luò)中,最優(yōu)系數(shù)η為1.5。實(shí)驗(yàn)表明,選擇η為1.3作為本文驗(yàn)證算法的最優(yōu)修正系數(shù)頻率較高。
本節(jié)中,將采用本文2.1給出的路徑損耗模型進(jìn)行數(shù)據(jù)采集和處理,模擬和驗(yàn)證本文所提出的算法(DV-WKNN)的性能。
在仿真場(chǎng)景中,測(cè)試空間的網(wǎng)絡(luò)環(huán)境大小分別設(shè)為20m*20m,30m*30m和50m*50m,相鄰RP之間的距離間隔為2米,在網(wǎng)絡(luò)空間的四角分別放上四個(gè)AP,將本文提出的DV-WKNN算法與KNN算法、WKNN算法和基于K-Means聚類的KNN指紋定位算法進(jìn)行性能比較。
表3、圖10為不同網(wǎng)絡(luò)中不同算法之間的平均誤差的具體數(shù)值表與條形圖,可知DV-WKNN算法明顯優(yōu)于KNN、K-Means聚類的KNN和WKNN算法,其中KNN算法性能最差。結(jié)果表明,與K-Means、WKNN和KNN相比,DV-WKNN的平均位置誤差分別降低了9.5%至13.1%,16.5%至18.9%和33.1%至48.5%。
表4、圖11為不同網(wǎng)絡(luò)中不同算法之間的最大誤差的具體數(shù)值表及條形圖,結(jié)果表明,DV-WKNN算法在室內(nèi)環(huán)境下的性能較好,相較于K-Means、WKNN和KNN分別降低了9.8%至17.9%,23.6%至28.8%和43.1%至63.9%。
圖9 η參數(shù)選取實(shí)驗(yàn)仿真結(jié)果
圖10 不同算法的平均位置誤差
表3 不同算法的平均位置誤差(單位:m)Table 3 Average position error of different algorithms (Unit:m)
表4 不同算法的最大位置誤差(單位:m)Table 4 Maximum position error of different algorithms (Unit:m)
圖11 不同算法的最大位置誤差
圖12 不同算法的平均誤差和最大誤差
圖13 50m*50m區(qū)域定位誤差累積分布Fig.13 Cumulative percentage in 50m*50m network
圖12為不同算法在相同條件下得到的位置誤差。仿真結(jié)果表明,DV-WKNN的定位精度明顯高于其他算法。與K-Means、WKNN和KNN算法相比,DV-WKNN算法的平均位置誤差分別降低了10.2%、18.9%和38.9%,最大誤差分別降低了17.6%、28.8%和43.3%。
圖13是在50m*50m的網(wǎng)絡(luò)環(huán)境中的仿真結(jié)果,當(dāng)兩個(gè)相鄰的RPs之間距離為2.5m時(shí),不同算法在該區(qū)域下的定位誤差累積分布情況。上述四種算法中定位精度較差的是KNN算法,在1米以下的累積分布僅為60%,WKNN算法和K-Means算法分別為73%和77%,DV-WKNN算法為85%。
本實(shí)驗(yàn)通過(guò)對(duì)WKNN的改進(jìn),并且與深度神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法,在準(zhǔn)確性和效率上都有所提高。引入深度神經(jīng)網(wǎng)絡(luò)算法增強(qiáng)對(duì)復(fù)雜的室內(nèi)環(huán)境的非線性學(xué)習(xí)能力,使待測(cè)點(diǎn)的預(yù)測(cè)位置更加接近于準(zhǔn)確位置,有利于泰森多邊形對(duì)多個(gè)定位目標(biāo)做動(dòng)態(tài)劃分定位區(qū)域,可以減少在線定位時(shí)全局遍歷時(shí)間,從而提高了定位效率。在每個(gè)定位區(qū)域內(nèi)利用WKNN算法定位時(shí),加入環(huán)境平均偏差值,有效的提高了定位精度。
仿真結(jié)果表明,通過(guò)與KNN、WKNN和基于K-Means聚類的KNN算法比較,本文改進(jìn)的算法(DV-WKNN)平均定位誤差最小。與KNN、WKNN和K-Means相比,在平均位置誤差上降低了38.9%、18.9%和10.2%左右,在最大定位誤差上最高降低了43.3%左右。
通過(guò)對(duì)本文所提算法實(shí)現(xiàn)流程及結(jié)果的分析,其在實(shí)現(xiàn)多目標(biāo)定位上有很好的應(yīng)用前景,如在養(yǎng)老院多位老人的位置同時(shí)跟蹤、智能物流分揀間的多臺(tái)物流機(jī)器人同時(shí)定位等場(chǎng)景,能夠有效的解決相關(guān)實(shí)際問(wèn)題。