劉嘉偉,毛文宇,魯華祥,3,4
(1.中國(guó)科學(xué)院大學(xué),北京 100089;2.中國(guó)科學(xué)院 半導(dǎo)體研究所,北京 100083;3.中國(guó)科學(xué)院 腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心,上海 200031;4.半導(dǎo)體神經(jīng)網(wǎng)絡(luò)智能感知與計(jì)算技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室(中國(guó)科學(xué)院),北京 100083)
近些年來(lái),基于接收信號(hào)強(qiáng)度(RSS)的無(wú)源室內(nèi)定位技術(shù)因其良好的便利性和用戶(hù)隱私性,得到了廣泛的研究。該方法一般分為兩種,一種是基于損耗模型的方法,通過(guò)非線(xiàn)性函數(shù)擬合目標(biāo)位置與相關(guān)鏈路 RSS 變化關(guān)系實(shí)現(xiàn)人員目標(biāo)的定位。Wang等[1]建立了目標(biāo)位置的觀察模型,通過(guò)粒子濾波來(lái)定位人員目標(biāo)。Kaltiokallio等[2]建立了基于信號(hào)衰落特征的RTI模型,提出了辨別并濾除非敏感鏈路的算法從而提高了定位精度。Yang等[3]綜合了路徑損耗、天線(xiàn)高度等參數(shù)對(duì)接收功率的影響,提出了適用于室內(nèi)走廊環(huán)境的路徑損耗定位模型。這些方法通過(guò)利用固定模型和固定特征來(lái)進(jìn)行普通室內(nèi)環(huán)境下的人員目標(biāo)無(wú)源定位,并取得了良好的定位精度。但當(dāng)室內(nèi)環(huán)境發(fā)生變化時(shí),鏈路屬性與目標(biāo)位置的對(duì)應(yīng)關(guān)系也會(huì)發(fā)生變化,致使該方法的定位準(zhǔn)確率下降。另一種是基于機(jī)器學(xué)習(xí)的方法,通過(guò)離線(xiàn)采集數(shù)據(jù)并訓(xùn)練模型進(jìn)行室內(nèi)定位。Youssef等[4]和Zhang等[5]分別利用指紋匹配進(jìn)行了無(wú)源室內(nèi)定位的初步研究。Wagner等[6]將檢測(cè)區(qū)域以不同坐標(biāo)劃分并利用人工神經(jīng)網(wǎng)絡(luò)模型對(duì)目標(biāo)進(jìn)行定位。Wang等[7]提出一種曲線(xiàn)擬合和位置搜索的室內(nèi)定位方法,利用窮舉搜索和梯度下降搜索來(lái)找出距離誤差最小的位置。Mao等[8]通過(guò)雙向小波濾波對(duì)RSS數(shù)據(jù)進(jìn)行優(yōu)化并利用集成學(xué)習(xí)模型實(shí)現(xiàn)目標(biāo)在復(fù)雜環(huán)境下的定位。Fazelinia等[9]使用一種基于ROC曲線(xiàn)的特征選擇技術(shù)將RSS數(shù)據(jù)降維,然后利用優(yōu)化的貝葉斯決策模型進(jìn)行定位。
在實(shí)際場(chǎng)景中,室內(nèi)布局和物品擺放的位置會(huì)經(jīng)常發(fā)生變化,造成RSS鏈路模型和樣本特征的改變,從而導(dǎo)致原定位模型不再適用于變動(dòng)后的環(huán)境。對(duì)此,許多研究人員也展開(kāi)了研究。Chen等[10]提出一種動(dòng)態(tài)調(diào)整室內(nèi)定位算法,減少了環(huán)境變動(dòng)和功率變化對(duì)定位系統(tǒng)的影響。Guo等[11]提出多指紋分類(lèi)器模型,提高了指紋和分類(lèi)器之間的互補(bǔ)性從而增加了模型環(huán)境適應(yīng)性。Manh等[12]提出一種多維核密度估計(jì)方法,該方法對(duì)信號(hào)噪聲和動(dòng)態(tài)環(huán)境都具有較強(qiáng)的魯棒性。這些方法雖然取得了一定進(jìn)展,但是很難同時(shí)兼顧人工工作量、時(shí)間消耗、計(jì)算復(fù)雜度和定位準(zhǔn)確率之間的平衡。
本文基于遷移學(xué)習(xí)的思想和數(shù)據(jù)增強(qiáng)的手段,提出了基于遷移聚類(lèi)和FusVAE的室內(nèi)環(huán)境變動(dòng)后的人員目標(biāo)無(wú)源定位算法,研究主要解決的問(wèn)題如圖1所示。在環(huán)境變動(dòng)后,采集少量變動(dòng)后環(huán)境的無(wú)標(biāo)簽RSS樣本,使用本文提出了基于度量學(xué)習(xí)的半監(jiān)督模糊C均值聚類(lèi)(SFCMML)對(duì)其進(jìn)行精確聚類(lèi)和標(biāo)簽標(biāo)注,并對(duì)原定位模型進(jìn)行重訓(xùn)練,得到能夠適應(yīng)變動(dòng)后環(huán)境的定位模型。以較小的時(shí)間、工作量和計(jì)算代價(jià),提高了變動(dòng)后環(huán)境下的定位準(zhǔn)確率、提升了定位精度。同時(shí),為了解決變動(dòng)后環(huán)境下RSS樣本較少,模型訓(xùn)練不充分的問(wèn)題,本文利用生成模型對(duì)RSS樣本進(jìn)行數(shù)據(jù)增強(qiáng),改善重訓(xùn)練過(guò)程。為了使生成的RSS新樣本更符合變動(dòng)后環(huán)境下的樣本特征和分布,定位過(guò)程更適應(yīng)變動(dòng)后的環(huán)境,對(duì)變分自編碼器(VAE)進(jìn)行了改進(jìn),提出了基于坐標(biāo)融合的變分自編碼器(FusVAE),增加了訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量,提高了模型的泛化能力。實(shí)驗(yàn)結(jié)果表明,在環(huán)境變動(dòng)的情況下,本文提出的算法的平均定位準(zhǔn)確率達(dá)到了88.6%,與同領(lǐng)域同類(lèi)型算法相比具有較高的定位精度和較好的環(huán)境變動(dòng)適應(yīng)性。
圖1 本文研究解決的問(wèn)題Fig.1 The research problem in the study
本文提出的基于遷移聚類(lèi)和FusVAE的室內(nèi)環(huán)境變動(dòng)下人員目標(biāo)無(wú)源定位算法的整體架構(gòu)見(jiàn)圖2。先在原環(huán)境中通過(guò)逐個(gè)坐標(biāo)點(diǎn)站定采集的方法獲得原環(huán)境下的已標(biāo)簽RSS數(shù)據(jù),使用該樣本集訓(xùn)練隨機(jī)森林定位模型。在環(huán)境改變后,被定位目標(biāo)在定位區(qū)域內(nèi)快速遍歷各個(gè)坐標(biāo)點(diǎn),并在被定位目標(biāo)移動(dòng)的過(guò)程中采集RSS數(shù)據(jù)獲得新環(huán)境下的無(wú)標(biāo)簽RSS樣本,這種采集方法消耗時(shí)間較短,且不需要進(jìn)行繁瑣的標(biāo)簽標(biāo)注工作。然后利用本文提出的基于度量學(xué)習(xí)的半監(jiān)督模糊C均值聚類(lèi)(SFCMML)算法對(duì)這些新樣本進(jìn)行聚類(lèi)和標(biāo)注標(biāo)簽,生成定位模型重訓(xùn)練所需的新環(huán)境下帶標(biāo)簽的樣本。用處理后的樣本進(jìn)行重訓(xùn)練,原定位模型只需進(jìn)行微調(diào),便可以很好地適應(yīng)環(huán)境變動(dòng)后人員目標(biāo)的定位過(guò)程,且具有較高的定位精度。在重訓(xùn)練的過(guò)程中,使用基于坐標(biāo)融合的變分自編碼器(FusVAE)算法,利用原環(huán)境和新環(huán)境下的先驗(yàn)知識(shí),生成新環(huán)境下的高質(zhì)量RSS樣本進(jìn)行數(shù)據(jù)增強(qiáng),進(jìn)一步提高了定位準(zhǔn)確率。
圖2 基于遷移聚類(lèi)的人員目標(biāo)無(wú)源室內(nèi)定位算法的整體架構(gòu)Fig.2 Overall architecture of device-free indoor localization based on transfer clustering
當(dāng)環(huán)境改變后,在改變后的環(huán)境中采集少量的數(shù)據(jù),和原環(huán)境每個(gè)坐標(biāo)站定采集RSS數(shù)據(jù)不同,被定位目標(biāo)只需在環(huán)境中隨機(jī)走動(dòng),遍歷每個(gè)坐標(biāo)點(diǎn)即可完成RSS數(shù)據(jù)的采集。與原環(huán)境中繁瑣的數(shù)據(jù)采集相比,可以節(jié)約大量樣本采集時(shí)間,但是這樣采集的數(shù)據(jù)為一個(gè)無(wú)標(biāo)簽樣本集,無(wú)法直接用于定位模型的重訓(xùn)練。為獲得新環(huán)境下的已標(biāo)簽樣本集,需要對(duì)其進(jìn)行聚類(lèi)及標(biāo)簽標(biāo)注。傳統(tǒng)的聚類(lèi)算法沒(méi)有將原環(huán)境和變動(dòng)后環(huán)境數(shù)據(jù)之間的聯(lián)系運(yùn)用到聚類(lèi)的過(guò)程中,利用原環(huán)境的先驗(yàn)知識(shí)對(duì)變動(dòng)后環(huán)境的聚類(lèi)進(jìn)行指導(dǎo),導(dǎo)致RSS數(shù)據(jù)聚類(lèi)效果較差。針對(duì)這個(gè)問(wèn)題,本文提出了基于度量學(xué)習(xí)的半監(jiān)督模糊C均值聚類(lèi)算法(semi-supervised fuzzyC-means clustering based on metric learning,SFCMML),算法架構(gòu)見(jiàn)圖3。該算法通過(guò)系數(shù)矩陣Ai在原環(huán)境中學(xué)習(xí)出不同坐標(biāo)點(diǎn)樣本每個(gè)維度不同的權(quán)重,使用Ai修改新環(huán)境坐標(biāo)點(diǎn)在聚類(lèi)過(guò)程中使用的距離函數(shù),使新環(huán)境下每類(lèi)樣本在聚類(lèi)過(guò)程中都能遵循原環(huán)境坐標(biāo)點(diǎn)數(shù)據(jù)的結(jié)構(gòu),實(shí)現(xiàn)了坐標(biāo)點(diǎn)樣本的精確聚類(lèi),相比于傳統(tǒng)的聚類(lèi)算法,該算法將原環(huán)境下的先驗(yàn)知識(shí)運(yùn)用到了新環(huán)境的聚類(lèi)中,提高了聚類(lèi)和標(biāo)簽標(biāo)注的準(zhǔn)確率,從而使重訓(xùn)練后的定位模型能夠更好地適用于變動(dòng)后的環(huán)境,提高了定位準(zhǔn)確率。接下來(lái)對(duì)SFCMML算法的原理進(jìn)行詳細(xì)介紹。
圖3 SFCMML算法整體架構(gòu)Fig.3 Overall architecture of SFCMML
Ds是被定位目標(biāo)在原環(huán)境中各坐標(biāo)點(diǎn)上站定采集得到的樣本集,Ds中的數(shù)據(jù)為已標(biāo)簽樣本,樣本的標(biāo)簽為目標(biāo)所站的坐標(biāo)點(diǎn)的標(biāo)號(hào)。Dt是被定位目標(biāo)在新環(huán)境中隨機(jī)走動(dòng)采集得到的樣本集,Dt中的數(shù)據(jù)為未標(biāo)簽樣本。對(duì)于Ds和Dt,在數(shù)據(jù)分布上存在一個(gè)假設(shè),即在同一環(huán)境下,不同坐標(biāo)點(diǎn)的數(shù)據(jù)分布完全不同,在不同環(huán)境下,相同坐標(biāo)點(diǎn)的分布雖然不同,但是有一定的相似性。所以只要找到原環(huán)境和新環(huán)境數(shù)據(jù)分布的潛在關(guān)系,就可以建立聯(lián)系,將原環(huán)境的知識(shí)遷移到新環(huán)境中,對(duì)Dt中的樣本進(jìn)行指導(dǎo)聚類(lèi)。
本文首先引入成對(duì)約束,成對(duì)約束可以用于改變底層的距離度量,對(duì)聚類(lèi)過(guò)程進(jìn)行引導(dǎo),達(dá)到更好的聚類(lèi)效果。從Ds中的每類(lèi)樣本中隨機(jī)選取若干樣本組成樣本對(duì),S?Ds×Ds是相似樣本對(duì)集合,集合中每個(gè)元素為一個(gè)樣本對(duì)(Xp,Xq),其中Xp和Xq都為同一類(lèi)的樣本。D?Ds×Ds是不相似樣本對(duì)集合,集合中元素為一個(gè)樣本對(duì)(Xp,Xq),其中Xp和Xq都為不同類(lèi)的樣本。這樣就構(gòu)建了成對(duì)約束,對(duì)于同類(lèi)樣本,我們希望樣本間的距離越小越好,對(duì)于不同類(lèi)樣本,我們希望樣本間的距離越大越好,所以希望可以找到一個(gè)功能函數(shù)f滿(mǎn)足
minf(Xp,Xq)(Xp,Xq)∈S
maxf(Xp,Xq)(Xp,Xq)∈D
(1)
對(duì)于每一類(lèi)坐標(biāo)點(diǎn)樣本,每個(gè)維度代表了每條鏈路的RSS值,由于網(wǎng)絡(luò)中存在易受影響、RSS值變化較大的活躍鏈路和基本不會(huì)受到影響、RSS值基本不變的非活躍鏈路,所以每個(gè)坐標(biāo)點(diǎn)樣本的維度的權(quán)重不同,都有自己的數(shù)據(jù)分布特征。本文使用對(duì)稱(chēng)正定矩陣Ai作為系數(shù)矩陣對(duì)歐氏距離進(jìn)行修改,修改后的距離度量函數(shù)如式(2)所示,這樣就可以在計(jì)算距離函數(shù)的時(shí)候使樣本每個(gè)維度的權(quán)重都不同,表示出該類(lèi)樣本的數(shù)據(jù)結(jié)構(gòu)特征。所以只要求解出原環(huán)境數(shù)據(jù)集Ds每類(lèi)樣本的Ai,就可以將其數(shù)據(jù)分布的先驗(yàn)知識(shí)通過(guò)系數(shù)矩陣Ai進(jìn)行知識(shí)遷移,在Dt聚類(lèi)過(guò)程中起到指導(dǎo)作用。
fAi(Xp,Xq)=‖Xp-Xq‖Ai=
(2)
使用修改后的距離度量函數(shù)可以將式(2)轉(zhuǎn)化為下式
(3)
如果t是一個(gè)正的對(duì)角矩陣,可以將式(3)中的最優(yōu)化問(wèn)題轉(zhuǎn)換為式(4),通過(guò)求解式(4)的最小值就可以求得系數(shù)矩陣Ai。
(4)
求解出原環(huán)境下每類(lèi)坐標(biāo)點(diǎn)樣本的系數(shù)矩陣Ai后,就可以使用能夠反映出原環(huán)境各類(lèi)樣本分布的距離函數(shù)對(duì)Dt進(jìn)行聚類(lèi),這樣的距離度量對(duì)于每個(gè)坐標(biāo)點(diǎn)都使用的不同度量,使得數(shù)據(jù)的聚類(lèi)可以是不同的形狀,同類(lèi)樣本間的距離更小,從而提高聚類(lèi)的準(zhǔn)確率,SFCMML 的目標(biāo)函數(shù)
(5)
式中:k為坐標(biāo)點(diǎn)的數(shù)目;n為Dt中樣本的數(shù)量;ci為第i類(lèi)的類(lèi)中心;U為隸屬度矩陣;uij為第j個(gè)樣本屬于第i類(lèi)的隸屬度;m為控制算法柔性的冪指數(shù)參數(shù),取值范圍為[1,∞),如果m過(guò)大,則聚類(lèi)效果會(huì)很差,如果m設(shè)置為1,則算法會(huì)接近硬聚類(lèi)算法HCM,在許多聚類(lèi)問(wèn)題中,m的取值一般為[1,3],而在本文的聚類(lèi)問(wèn)題中,經(jīng)過(guò)充分的實(shí)驗(yàn)證明,m取值為2效果最好。
ci和uij計(jì)算公式分別如式(6)和式(7)所示:
(6)
i=1,2,…,k;j=1,2,…n
(7)
在遷移聚類(lèi)過(guò)程中,為提高定位效率,在變動(dòng)后環(huán)境下采集的RSS樣本數(shù)量較少,Dt的樣本數(shù)量遠(yuǎn)小于Ds的樣本數(shù)量,導(dǎo)致采集的數(shù)據(jù)并不能完全反映出每個(gè)坐標(biāo)點(diǎn)數(shù)據(jù)的概率分布,如果直接對(duì)原定位模型進(jìn)行重訓(xùn)練,雖然可以提高定位準(zhǔn)確率,但是提升不大,還有很大的改進(jìn)空間。所以,可以使用生成模型生成變動(dòng)后環(huán)境的樣本進(jìn)行數(shù)據(jù)增強(qiáng)。對(duì)于目前主流的生成模型,對(duì)抗生成網(wǎng)絡(luò)(generative adversarial networks,GAN)調(diào)參過(guò)程復(fù)雜,生成的樣本多樣性差,本文引入數(shù)據(jù)增強(qiáng)方法的目的是提高研究和定位效率,如果使用GAN生成模型,會(huì)生成大量無(wú)效或重復(fù)樣本,樣本多樣性不高,不適合本文的應(yīng)用場(chǎng)景。流模型的生成函數(shù)需要精心設(shè)計(jì),求解過(guò)程復(fù)雜,在本文研究的定位過(guò)程中,室內(nèi)環(huán)境多變,每次環(huán)境變動(dòng)后都需要重新設(shè)計(jì)生成函數(shù),增加了定位過(guò)程的計(jì)算復(fù)雜度,降低了定位效率。而變分自編碼器(variational auto-encoder,VAE)不需要調(diào)試過(guò)多參數(shù),計(jì)算復(fù)雜度低,且生成樣本質(zhì)量較高,所以選用VAE作為生成模型生成新環(huán)境下的樣本進(jìn)行數(shù)據(jù)增強(qiáng)。但是普通的VAE不能很好地與變動(dòng)后環(huán)境下的定位問(wèn)題結(jié)合起來(lái),變動(dòng)后的數(shù)據(jù)既有新環(huán)境的數(shù)據(jù)分布特點(diǎn),又保留了一部分原環(huán)境中的數(shù)據(jù)分布特點(diǎn),普通的VAE只考慮了新環(huán)境對(duì)生成樣本的影響,完全舍棄了原環(huán)境的知識(shí),缺少了原環(huán)境中先驗(yàn)知識(shí)的指導(dǎo)和限制,從而導(dǎo)致了生成樣本質(zhì)量較低。所以本文提出了一種基于坐標(biāo)融合的變分自編碼器(FusVAE),算法架構(gòu)見(jiàn)圖4。
圖4 FusVAE的算法架構(gòu)Fig.4 Overall architecture of FusVAE
(8)
FusVAE的損失函數(shù)分為3部分,第1部分是VAE原有的損失函數(shù),由于篇幅限制,對(duì)于VAE的原理本文不再贅述,可詳見(jiàn)參考文獻(xiàn)[13-14]。該損失函數(shù)是為了使后驗(yàn)分布的近似分布qφ(z|x(i))趨近于標(biāo)準(zhǔn)正態(tài)分布N(0,1),保證模型生成能力的KL散度,可以表示為
(9)
式中第2部分和第3部分是本文為了使生成的新樣本更接近Xsi和Xti,對(duì)原損失函數(shù)進(jìn)行的改進(jìn)。
引入重構(gòu)損失函數(shù)作為約束條件,將其添加到FusVAE的損失函數(shù)中,其中與Xti的重構(gòu)損失函數(shù)記為R1,計(jì)算公式為
R1=EXti[‖Xti-X‖]
(10)
與Xsi的重構(gòu)損失函數(shù)記為R2,計(jì)算公式如式(11)所示
R2=EXsi[‖Xsi-X‖]
(11)
所以FusVAE完整的損失函數(shù)如式(12)所示
L=DKL(qφ(Z|X)‖N(0,1))+λR1+(1-λ)R2
(12)
式中λ為一個(gè)超參數(shù),取值范圍為[0,1],可以用來(lái)調(diào)節(jié)兩個(gè)重構(gòu)損失函數(shù)的權(quán)重。如果我們希望生成的新樣本更接近Xti中的樣本,可以將λ設(shè)置地比較大,如果希望生成的新樣本更接近Xsi中的樣本,可以將λ設(shè)置地較小。
和傳統(tǒng)的VAE相比,本文提出的FusVAE可控性更高,原因在于,不僅在隱變量空間中利用了原環(huán)境和新環(huán)境中的先驗(yàn)知識(shí),還可以通過(guò)超參數(shù)λ控制新樣本與兩個(gè)環(huán)境中樣本的相似程度,這樣生成的樣本在分布上可以更接近我們希望接近的坐標(biāo)點(diǎn)樣本,將其用于模型微調(diào),可以進(jìn)一步提高定位準(zhǔn)確率。
本文算法的具體步驟和流程見(jiàn)圖5。
圖5 本文算法流程圖Fig.5 Flow chart of the proposed algorithm
為驗(yàn)證本文提出算法的有效性與優(yōu)越性,將辦公室環(huán)境和實(shí)驗(yàn)室環(huán)境作為定位區(qū)域并分別設(shè)置實(shí)驗(yàn)。兩個(gè)環(huán)境的面積分別為30 m2和4相鄰坐標(biāo)點(diǎn)距離為0.7 m。將6個(gè)射頻節(jié)點(diǎn)如圖5所示布置在定位區(qū)域周?chē)-h(huán)境實(shí)拍圖和平面圖分別見(jiàn)圖6、7,被定位的單人員目標(biāo)在每個(gè)坐標(biāo)點(diǎn)上站定一段時(shí)間采集RSS數(shù)據(jù),每個(gè)坐標(biāo)點(diǎn)的采集時(shí)間為120 s。射頻節(jié)點(diǎn)使用的芯片是CC2530,工作頻率在2.45 GHz,使用IEEE 802.15.4通信協(xié)議。
圖6 環(huán)境實(shí)拍Fig.6 Picture of the environment
為了體現(xiàn)環(huán)境的動(dòng)態(tài)性,設(shè)置5組實(shí)驗(yàn)依次移動(dòng)環(huán)境中的物品,最開(kāi)始移動(dòng)椅子、書(shū)籍等對(duì)環(huán)境變化影響較小的物品,再逐漸移動(dòng)顯示器、實(shí)驗(yàn)器材等對(duì)環(huán)境變化影響較大的物品,呈現(xiàn)出環(huán)境變動(dòng)由小到大的效果。在每次環(huán)境變動(dòng)后,被定位的單人員目標(biāo)在環(huán)境中隨機(jī)走動(dòng)30 s,完成RSS數(shù)據(jù)的采集。辦公室環(huán)境下的環(huán)境變動(dòng)圖見(jiàn)圖8,同時(shí)在實(shí)驗(yàn)室環(huán)境下做出類(lèi)似的5組實(shí)驗(yàn)。
圖8 環(huán)境變動(dòng)Fig.8 Change in the environment
為了驗(yàn)證本文算法的有效性,使用定位準(zhǔn)確率和RMSE作為評(píng)價(jià)標(biāo)準(zhǔn)。
定位準(zhǔn)確率C計(jì)算公式為
(13)
式中,xr為坐標(biāo)點(diǎn)正確分類(lèi)的數(shù)目,xw為定位過(guò)程中所有定位結(jié)果的總數(shù)目,這是一種直觀體現(xiàn)分類(lèi)準(zhǔn)確率高低的方法。
圖7 環(huán)境平面Fig.7 Plan of the environment
RMSE計(jì)算公式如式(14)所示
(14)
式中:Pc為預(yù)測(cè)的坐標(biāo)點(diǎn),Rc為目標(biāo)所處的真實(shí)的坐標(biāo)點(diǎn),|Pc-Rc|為兩個(gè)坐標(biāo)點(diǎn)間的物理距離。當(dāng)一個(gè)坐標(biāo)點(diǎn)錯(cuò)分時(shí),錯(cuò)分為相鄰坐標(biāo)點(diǎn)和距離很遠(yuǎn)的坐標(biāo)點(diǎn)對(duì)定位精度的影響是不同的,所以RMSE可以在空間上體現(xiàn)出算法的定位精度。
2.3.1 不同聚類(lèi)算法的定位準(zhǔn)確率對(duì)比
為了體現(xiàn)本文提出的SFCMML算法聚類(lèi)的優(yōu)越性,和目前主要使用的DBSCAN[15]及模糊C均值聚類(lèi)(FCM)[16]算法進(jìn)行對(duì)比,將幾種算法都應(yīng)用到本文的算法中。同時(shí)為了體現(xiàn)本文算法的必要性,體現(xiàn)出遷移學(xué)習(xí)對(duì)定位準(zhǔn)確率的提升,將環(huán)境改變后不做任何處理的定位準(zhǔn)確率和RMSE一起進(jìn)行對(duì)比,定位準(zhǔn)確率對(duì)比見(jiàn)圖9,RMSE對(duì)比結(jié)果見(jiàn)表1。
圖9 不同聚類(lèi)算法定位準(zhǔn)確率對(duì)比Fig.9 Comparison of positioning accuracy of different clustering algorithms
表1 不同聚類(lèi)算法的RMSETab.1 RMSE for different clustering algorithms m
通過(guò)實(shí)驗(yàn)結(jié)果可以得出結(jié)論,所提基于遷移聚類(lèi)的人員目標(biāo)無(wú)源室內(nèi)定位算法可以提升變動(dòng)環(huán)境后的定位準(zhǔn)確率,但是如果在聚類(lèi)過(guò)程中選擇效果較差的算法,不僅提升效果不明顯,在有些情況下甚至?xí)箿?zhǔn)確率下降。所以在遷移學(xué)習(xí)過(guò)程中要選擇本文提出的SFCMML聚類(lèi)算法,聚類(lèi)準(zhǔn)確率高,定位準(zhǔn)確率改善效果明顯,準(zhǔn)確率的提升基本都在10%以上,最高準(zhǔn)確率提升高達(dá)17%,定位的誤差都控制在0.5 m以?xún)?nèi)。
2.3.2 FusVAE對(duì)定位準(zhǔn)確率的影響
FusVAE通過(guò)超參數(shù)λ控制生成的新樣本與原環(huán)境樣本或新環(huán)境樣本的相似程度。為了選取最優(yōu)的λ,選擇任意坐標(biāo)點(diǎn)在原環(huán)境下和新環(huán)境下的樣本集作為FusVAE的輸入,調(diào)節(jié)λ的值生成不同的樣本集,使用PCA降維,將30維的數(shù)據(jù)映射到三維空間中,觀察數(shù)據(jù)分布,見(jiàn)圖10。
圖10 新生成樣本集與原樣本集分布散點(diǎn)圖Fig.10 Distribution scatter diagram of the generated sample set and the original sample set
圖中深色點(diǎn)為新環(huán)境下坐標(biāo)點(diǎn)的樣本集,淺色點(diǎn)為新生成的樣本,通過(guò)對(duì)比可以發(fā)現(xiàn)當(dāng)λ=0.8時(shí),生成的RSS樣本在分布上與原樣本更接近、更緊湊、質(zhì)量更高,從后續(xù)的定位準(zhǔn)確率也可以證明將λ設(shè)為0.8時(shí)生成樣本質(zhì)量最高,數(shù)據(jù)增強(qiáng)效果最好。所以將λ的值設(shè)置為0.8,生成新環(huán)境下的RSS樣本對(duì)定位模型進(jìn)行重訓(xùn)練。
為了檢驗(yàn)FusVAE生成的樣本能夠起到數(shù)據(jù)增強(qiáng),提升定位準(zhǔn)確率的效果,并且體現(xiàn)FusVAE在數(shù)據(jù)增強(qiáng)時(shí)相較于普通VAE有更好的效果。將λ的值設(shè)置為0.8,在5組實(shí)驗(yàn)中分別不使用數(shù)據(jù)增強(qiáng)、使用VAE進(jìn)行數(shù)據(jù)增強(qiáng)、使用FusVAE進(jìn)行數(shù)據(jù)增強(qiáng),然后對(duì)比定位準(zhǔn)確率,定位準(zhǔn)確率對(duì)比結(jié)果見(jiàn)圖11。
圖11 VAE和FusVAE定位準(zhǔn)確率對(duì)比Fig.11 Comparison of positioning accuracy of VAE and FusVAE
實(shí)驗(yàn)結(jié)果表明通過(guò)VAE對(duì)基于遷移聚類(lèi)的無(wú)源室內(nèi)定位進(jìn)行數(shù)據(jù)增強(qiáng),可以提高最終的定位準(zhǔn)確率。但是本文提出的FusVAE因?yàn)槌浞掷昧嗽h(huán)境和新環(huán)境中的先驗(yàn)知識(shí)對(duì)樣本生成過(guò)程進(jìn)行約束和控制,生成的新樣本更接近新環(huán)境下的樣本數(shù)據(jù)分布,對(duì)定位準(zhǔn)確率的提升效果更明顯,對(duì)定位準(zhǔn)確率的平均提升約8%,比VAE的提升率高約4%。
2.3.3 本文算法與其他變動(dòng)后環(huán)境下的定位算法對(duì)比
為了體現(xiàn)本文提出的變動(dòng)后環(huán)境下的基于遷移聚類(lèi)和FusVAE的人員目標(biāo)無(wú)源室內(nèi)定位算法的優(yōu)越性。與其他變動(dòng)環(huán)境下室內(nèi)定位算法進(jìn)行對(duì)比,包括KAAL[11]、ILSITL[17]、RA[12]。ILSITL是一種基于實(shí)例遷移的室內(nèi)定位算法,將新環(huán)境下采集的數(shù)據(jù)直接和原環(huán)境采集的數(shù)據(jù)對(duì)原定位模型進(jìn)行調(diào)整。KAAL的方法通過(guò)訓(xùn)練多個(gè)指紋分類(lèi)器,利用指紋和多分類(lèi)器之間的互補(bǔ)性提高動(dòng)態(tài)環(huán)境下的定位準(zhǔn)確率。RA是一種基于區(qū)域定位的定位方法,建立的不是RSS值與坐標(biāo)點(diǎn)之間的聯(lián)系,而是通過(guò)RSS值與坐標(biāo)區(qū)域的聯(lián)系來(lái)降低環(huán)境變化為定位準(zhǔn)確率的影響。準(zhǔn)確率對(duì)比見(jiàn)圖12,RMSE結(jié)果見(jiàn)表2。
表2 不同定位算法的RMSETab.2 RMSE for different localization algorithms m
圖12 不同算法定位準(zhǔn)確率的對(duì)比Fig.12 Comparison of positioning accuracy of different algorithms
通過(guò)對(duì)比可以發(fā)現(xiàn)本文算法在每次環(huán)境變動(dòng)的定位準(zhǔn)確率都很高,平均定位準(zhǔn)確率為88.6%,平均RMSE為0.312 m,高于其他算法的定位準(zhǔn)確率。而且環(huán)境變化時(shí),定位準(zhǔn)確率基本不發(fā)生變化,極大程度地降低了環(huán)境變動(dòng)對(duì)于定位準(zhǔn)確率的影響,說(shuō)明了本文算法的有效性和相比于其他算法的優(yōu)越性。
2.3.4 整體定位結(jié)果展示
為了直觀地體現(xiàn)本文算法對(duì)環(huán)境變動(dòng)后定位準(zhǔn)確率的改善,設(shè)計(jì)實(shí)驗(yàn)讓被定位目標(biāo)按照坐標(biāo)點(diǎn)1→坐標(biāo)點(diǎn)2→坐標(biāo)點(diǎn)3→坐標(biāo)點(diǎn)4→坐標(biāo)點(diǎn)5→坐標(biāo)點(diǎn)6→坐標(biāo)點(diǎn)7的順序遍歷坐標(biāo)點(diǎn),同時(shí)采集RSS數(shù)據(jù)作為測(cè)試集用于檢驗(yàn)定位的效果。在辦公室環(huán)境和實(shí)驗(yàn)室環(huán)境,對(duì)比本文算法的定位結(jié)果、未改進(jìn)前的定位結(jié)果和目標(biāo)實(shí)際移動(dòng)路徑,見(jiàn)圖13。
1)提出了一種將遷移聚類(lèi)和FusVAE結(jié)合使用的數(shù)據(jù)增強(qiáng)型人員目標(biāo)無(wú)源室內(nèi)定位方法,通過(guò)遷移聚類(lèi)對(duì)新環(huán)境中的無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行指導(dǎo)聚類(lèi)和標(biāo)注標(biāo)簽,解決了環(huán)境變動(dòng)后定位模型的重訓(xùn)練問(wèn)題,然后使用FusVAE對(duì)新環(huán)境RSS樣本進(jìn)行補(bǔ)充,實(shí)現(xiàn)了模型重訓(xùn)練過(guò)程的數(shù)據(jù)增強(qiáng),有效提高了定位算法的變動(dòng)環(huán)境適用性和定位準(zhǔn)確率,實(shí)驗(yàn)結(jié)果表明,該方法在辦公室環(huán)境下的平均定位準(zhǔn)確率達(dá)88.6%;
2)提出了基于度量學(xué)習(xí)的半監(jiān)督模糊C均值聚類(lèi)(SFCMML)算法,根據(jù)原環(huán)境中的先驗(yàn)知識(shí)修改聚類(lèi)過(guò)程中的距離函數(shù),賦予坐標(biāo)點(diǎn)樣本每個(gè)維度不同的權(quán)重,有效提高了聚類(lèi)準(zhǔn)確率,實(shí)驗(yàn)結(jié)果表明,該算法對(duì)變動(dòng)后環(huán)境的定位準(zhǔn)確率提升明顯,在辦公室環(huán)境下準(zhǔn)確率的提升最高可達(dá)16%;
3)提出了基于坐標(biāo)融合的變分自編碼器(FusVAE)算法,利用原環(huán)境和新環(huán)境下的先驗(yàn)知識(shí),改進(jìn)了隱變量結(jié)構(gòu)并在損失函數(shù)中添加了生成樣本與原環(huán)境樣本和新環(huán)境樣本間的重構(gòu)誤差,增強(qiáng)了生成的RSS數(shù)據(jù)的樣本質(zhì)量,進(jìn)一步提高了模型的泛化能力。綜合實(shí)驗(yàn)結(jié)果表明,該算法可以進(jìn)一步提升環(huán)境變動(dòng)后的定位準(zhǔn)確率,在辦公室環(huán)境下準(zhǔn)確率的提升最高可達(dá)13%。