李鵬杰,李曉青,王瑞雪,邱金娜,劉俊鵬
(1.航天恒星科技有限公司,北京 100095;2.重慶大學 微電子與通信工程學院,重慶 400044)
隨著現(xiàn)代社會的生產(chǎn)活動對安全性要求的提高,在水電站等復(fù)雜室內(nèi)環(huán)境下,人員定位、物體定位等室內(nèi)高精度定位需求不斷增加。在開放環(huán)境中,超寬帶(Ultra-wideband,UWB) 定位技術(shù)的定位精度可達厘米級[1]。但是,在復(fù)雜非視距(Non-Line-of-Sight,NLOS) 室內(nèi)環(huán)境中,障礙物的遮擋會導(dǎo)致較大的UWB測距誤差[2],甚至造成信號傳輸中斷從而導(dǎo)致定位失敗。慣性導(dǎo)航技術(shù)[3]作為自主導(dǎo)航技術(shù),不受周圍環(huán)境影響,但隨著系統(tǒng)運行時間的增加,會出現(xiàn)誤差累積的情況。為了解決單一室內(nèi)定位技術(shù)在復(fù)雜非視距環(huán)境下遇到的技術(shù)瓶頸,聯(lián)合定位技術(shù)應(yīng)運而生。聯(lián)合定位技術(shù)將單一的定位技術(shù)組合起來,輔以數(shù)據(jù)融合算法進行信息融合,用以滿足室內(nèi)定位系統(tǒng)在高精度、實時性、低功耗、低成本等方面的需求。高精度室內(nèi)聯(lián)合定位技術(shù)的實現(xiàn),對在工廠、水電站等復(fù)雜非視距環(huán)境下人員定位、室內(nèi)機器人定位等高精度室內(nèi)定位需求的實現(xiàn)有著重要的意義。
對于機器學習算法在室內(nèi)定位中的研究,國內(nèi)外都做了大量工作。目前,被引入到室內(nèi)定位技術(shù)中的機器學習方法包括貝葉斯分類算法[4-5]、支持向量機[6-7]、決策樹[8-9]、人工神經(jīng)網(wǎng)絡(luò)算法等[10]。樸素貝葉斯分類簡單易實現(xiàn),但其計算量較大,且有強獨立性要求。支持向量機分類回歸能力突出,但其核函數(shù)敏感,僅在二分類問題效果顯著。決策樹算法計算成本低,但其建樹層級過深時易存在過擬合缺陷。人工神經(jīng)網(wǎng)絡(luò)可通過模型訓練過程自動提取系統(tǒng)特征[11],省卻了非線性映射和系統(tǒng)模型構(gòu)建的步驟,尤其是在噪聲復(fù)雜度較高的情況下表現(xiàn)優(yōu)異,適用于數(shù)據(jù)量較大、模型構(gòu)建復(fù)雜的定位系統(tǒng)。使用傳感器時序數(shù)據(jù)對定位點位置進行估計可被視為一種時間序列預(yù)測問題[12]。而在人工神經(jīng)網(wǎng)絡(luò)算法中,循環(huán)神經(jīng)網(wǎng)絡(luò)算法在序列數(shù)據(jù)處理上表現(xiàn)優(yōu)秀,適用于基于無線通信的室內(nèi)定位系統(tǒng)。
圖1展示了本文提出的基于長短時記憶(Long Short Term Memory,LSTM) 神經(jīng)網(wǎng)絡(luò)的聯(lián)合定位算法的總體架構(gòu)。由于采集到的UWB測距信息與慣性測量單元(Inertial Measurement Unit,IMU)傳感器信息都具有時域連續(xù)性,而LSTM在時間序列數(shù)據(jù)預(yù)測上有充分的理論優(yōu)勢,因此本文選取LSTM作為聯(lián)合定位算法中的核心算法。
圖1 LSTM定位算法架構(gòu)圖
整個聯(lián)合定位的算法過程可以作如下描述:首先使用室內(nèi)聯(lián)合定位系統(tǒng)對超寬帶測距信息與慣性測量單元的測量信息進行采集,接下來對采集到的信息進行批處理和歸一化,而后作訓練集和測試集的劃分,對于訓練集的數(shù)據(jù)使用LSTM深度神經(jīng)網(wǎng)絡(luò)進行離線訓練,得到訓練出來的模型。得到訓練模型后,以此模型結(jié)合測試集進行在線預(yù)測,得到估計的位置結(jié)果。
數(shù)據(jù)預(yù)處理過程的合理性直接影響著整個神經(jīng)網(wǎng)絡(luò)算法最后的估計結(jié)果精度。在本文中數(shù)據(jù)預(yù)處理過程包含數(shù)據(jù)粗濾波、數(shù)據(jù)規(guī)整、歸一化等過程。具體的數(shù)據(jù)預(yù)處理過程為:在采集到原始的UWB測距數(shù)據(jù)和IMU測量數(shù)據(jù)后,通過數(shù)據(jù)粗濾波去除掉其中錯誤的數(shù)據(jù)(如測距信息為負值的數(shù)據(jù)),再將UWB測距數(shù)據(jù)和IMU測量數(shù)據(jù)進行數(shù)據(jù)規(guī)整得到同一維度的數(shù)據(jù)矩陣,最后通過數(shù)據(jù)歸一化處理得到最終數(shù)據(jù)。
本文在對UWB測距數(shù)據(jù)和IMU測量數(shù)據(jù)進行處理的時候都選用同一種數(shù)據(jù)歸一化方法,即最大最小值歸一化法。由于在標簽運動過程中位置信息和IMU測量信息的變化幅度都不確定,但是都維持在一個相對低速的狀態(tài),同時也為了后續(xù)訓練時處理方便,需要歸一化處理數(shù)據(jù)。以UWB測距信息為例,最大最小值歸一化法的公式表示如下:
(1)
式中:Enorm為UWB測距值歸一化后的值,Esig是UWB測距原始數(shù)據(jù)矩陣中的值,Vmin為UWB測距數(shù)據(jù)矩陣中的最小值,Vmax是數(shù)據(jù)矩陣中的最大值,Vmax-Vmin為UWB測量數(shù)據(jù)極值。IMU測量數(shù)據(jù)在本文也通過同樣的方式進行數(shù)據(jù)歸一化映射。
本文中的LSTM網(wǎng)絡(luò)結(jié)構(gòu)在設(shè)計時采用Bi-LSTM(Bidirectional LSTM)層來替代基本LSTM層,并且在網(wǎng)絡(luò)結(jié)構(gòu)中引入注意力(Attention) 機制。相比于基本LSTM結(jié)構(gòu),Bi-LSTM具有時序數(shù)據(jù)利用率高的特點[14]。Bi-LSTM結(jié)構(gòu)由兩個方向相反的基本LSTM構(gòu)成,可以利用超寬帶和慣導(dǎo)數(shù)據(jù)的前后信息來對當前數(shù)據(jù)進行判定。Attention機制最初被用于自然語言處理領(lǐng)域,通常被用于Bi-LSTM層后面。本文中使用Attention層區(qū)分輸入的傳感器信息的重要程度。圖2為本文設(shè)計的LSTM聯(lián)合定位算法的網(wǎng)絡(luò)結(jié)構(gòu)。
圖2 LSTM定位算法網(wǎng)絡(luò)結(jié)構(gòu)圖
由圖2可知,本文提出的LSTM網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、隱藏層和輸出層三個部分。UWB測距和IMU測量時間序列數(shù)據(jù)依次通過輸入層、隱藏層和輸出層處理,最后得到一個位置信息的估計值。
輸入層是LSTM網(wǎng)絡(luò)結(jié)構(gòu)中用于接收及預(yù)處理傳感器序列數(shù)據(jù)的部分。隱藏層是LSTM網(wǎng)絡(luò)結(jié)構(gòu)中除輸入層和輸出層之外的部分,由兩個Bi-LSTM層和它們之間的級聯(lián)模塊以及Attention模塊組成。第一個Bi-LSTM層用于處理輸入層的輸出數(shù)據(jù),該層由若干對LSTM單元構(gòu)成,單元數(shù)量與輸入層的輸入窗口大小一致。接下來經(jīng)過一個級聯(lián)模塊以及Attention模塊,而后傳遞給第二個Bi-LSTM層。級聯(lián)模塊用于連接兩個Bi-LSTM層。Attention模塊賦予不同傳感器數(shù)據(jù)以不同的權(quán)重,用于區(qū)分不同傳感器數(shù)據(jù)之間的重要程度差別。第二個Bi-LSTM層由100對LSTM單元構(gòu)成。
輸出層則是由一個全連接層構(gòu)成,通過對單元進行全連接處理,降低數(shù)據(jù)維度,輸出LSTM網(wǎng)絡(luò)估計得到的最終結(jié)果,也就是位置估計值。全連接層的激活函數(shù)選用ReLU(Rectified Linear Units) 函數(shù)。ReLU函數(shù)可解決激活函數(shù)帶來的梯度消失問題[15],相較于sigmoid激活函數(shù),ReLU可以將取值映射到所有正數(shù)域。
本文中LSTM神經(jīng)網(wǎng)絡(luò)算法最終的目的是為了更加準確地估計出定位點的位置?;诖?,本文提出的損失函數(shù)如下所示:
(2)
為了得到模型的最優(yōu)解,本文使用Adam優(yōu)化器[16]來對模型進行優(yōu)化處理。
為了說明基于LSTM神經(jīng)網(wǎng)絡(luò)的聯(lián)合定位算法的準確性,本節(jié)將通過相應(yīng)的仿真實驗,對標簽在菱形和圓形運動軌跡下使用兩種聯(lián)合定位算法的定位準確度進行對比分析。下列仿真實驗均在配備六核Intel i7-8700k CPU、英偉達1080Ti GPU的電腦上完成,仿真編程語言選用Python,深度學習框架為TensorFlow 1.12.0。
在前文所述的仿真環(huán)境中,讓標簽沿著菱形運動軌跡運動,與此同時,采集到標簽的UWB測距信息以及慣導(dǎo)傳感器數(shù)據(jù),并分別以TOA定位算法、UKF聯(lián)合定位算法、LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位算法對位置進行估計。圖3為三種定位算法的定位點估計結(jié)果與真實點的對比分析圖。由圖3可知,在三種定位算法的對比中,在準確度上LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位算法明顯高于UKF聯(lián)合定位算法以及TOA定位算法。
圖3 定位估計點軌跡
圖4為三種定位算法的估計軌跡與真實軌跡的距離誤差的累積概率分布函數(shù)(Cumulative Distribution Function,CDF)對比圖。由圖4可知,距離誤差30 cm以內(nèi),LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位方法的估計點的累積概率為97.35%,UKF聯(lián)合定位方法的估計點的累積概率為86.93%,TOA定位方法的估計點的累積概率為49.3%。
圖4 距離誤差CDF
由三種算法的CDF對比圖可知,LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位算法的定位精度優(yōu)于UKF聯(lián)合定位算法。在直觀地對于三種定位算法的定位結(jié)果進行對比后,下面對三種定位算法的估計軌跡與真實軌跡之間的誤差進行定量分析。表1給出了在菱形運動軌跡仿真實驗中,三種定位算法的均方根誤差(Root Mean Square Error,RMSE) 對比。
由表1可知,LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位算法相比UKF聯(lián)合定位算法,真實點與估計點之間的距離RMSE從24.18 cm下降到15.83 cm,相比而言,定位誤差下降了34.53%。由此可得,在菱形軌跡仿真實驗中,LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位算法表現(xiàn)優(yōu)于UKF聯(lián)合定位算法。
表1 定位算法RMSE對比表
在理解了UWB和慣導(dǎo)室內(nèi)聯(lián)合定位系統(tǒng)的工作原理以后,為了驗證UWB和慣導(dǎo)聯(lián)合定位算法在實際環(huán)境中對于UWB定位系統(tǒng)的精度提高作用,我們專門設(shè)計實現(xiàn)了一套室內(nèi)聯(lián)合定位系統(tǒng)。本節(jié)將在此聯(lián)合定位系統(tǒng)上進行功能測試實驗以及動態(tài)聯(lián)合定位實驗,驗證聯(lián)合定位系統(tǒng)的功能以及前文提出的聯(lián)合定位算法在實際環(huán)境中的性能。
本次實驗選擇的環(huán)境為實驗樓的某一房間,房間總長為8.34 m,寬度為5.76 m,高度為2.62 m。房間內(nèi)部被清理出一片空曠區(qū)域,以便后文構(gòu)建視距和非視距實驗環(huán)境。
在此次實驗中,共使用4個定位基站,基站按照矩形的4個頂點的分布形式分布,分別為(4.65,-0.1)m、(4.65,3.1)m、(-0.5,3.1)m、(-0.5,-0.1)m。如圖5所示,定位標簽被固定在巡線機器人上,標簽安裝高度為25 cm。圖6和圖7是聯(lián)合定位系統(tǒng)的定位基站和定位標簽。
圖5 巡線機器人
圖6 定位基站實物圖
圖7 定位標簽實物圖
為驗證聯(lián)合定位算法在不同實驗環(huán)境中的定位效果,在定位區(qū)域中依次添加1號障礙物、2號障礙物、3號障礙物、4號障礙物,并對定位標簽在障礙物數(shù)量不同的情況下的定位結(jié)果進行對比分析。其中,1、2、3號障礙物都為鐵制電腦機箱,長為43 cm,寬為18 cm,高為40.5 cm;而4號障礙物為飲水機,長為29 cm,寬為29 cm,高為83 cm。圖8展示了4個障礙物的放置位置。
圖8 障礙物實驗場景示意圖
圖9 NLOS環(huán)境實驗場景圖
在障礙物數(shù)量不同的NLOS實驗環(huán)境中,讓機器人沿著正方形軌跡運行,采集相應(yīng)的傳感器信息,進行TOA定位以及LSTM聯(lián)合定位。圖10呈現(xiàn)了兩種定位算法在障礙物數(shù)量不同的NLOS實驗環(huán)境中的定位估計點軌跡對比結(jié)果。
(a)單個障礙物
(b)2個障礙物
(c)3個障礙物
(d)4個障礙物圖10 NLOS環(huán)境實驗結(jié)果對比圖
圖10(a) 展示的是在單個障礙物的情況下兩種定位算法的定位估計點軌跡對比結(jié)果,從圖中可以看出,與LOS實驗環(huán)境相比,定位標簽處于1號障礙物附近的路徑時,TOA定位精度出現(xiàn)了明顯下降。圖10(b)描述了在兩個障礙物情況下的兩種定位算法的定位點軌跡對比。相較于單個障礙物的情況,在兩個障礙物的實驗環(huán)境中,定位標簽處于1號障礙物附近的路徑時,TOA定位精度依舊出現(xiàn)了明顯下降,而在2號障礙物附近的路徑時,也有精度下降的情況出現(xiàn)。圖10(c)和圖10(d)分別展示了在3個障礙物和4個障礙物的實驗環(huán)境中,兩種定位算法的定位估計點軌跡對比結(jié)果。由圖10可知,隨著障礙物數(shù)量的增加,TOA定位點軌跡偏離真實軌跡的偏移值越大,也就是TOA定位精度越差。而且當標簽處于離障礙物附近的位置時,即障礙物處于標簽和基站之間的位置時,TOA定位精度受到的影響最大。與TOA定位算法類似,LSTM聯(lián)合定位算法的定位誤差變化也遵循這種趨勢,但是后者定位誤差受到的影響更小。與LOS環(huán)境下類似,TOA定位算法的定位誤差仍舊大于LSTM聯(lián)合定位算法的定位誤差。
本文提出了適用于UWB和IMU聯(lián)合定位的LSTM神經(jīng)網(wǎng)絡(luò)聯(lián)合定位算法,并就該聯(lián)合定位算法的總體架構(gòu)設(shè)計、數(shù)據(jù)預(yù)處理過程實現(xiàn)、核心LSTM網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計、模型訓練以及相關(guān)優(yōu)化方法進行了詳細說明,并進行了相應(yīng)仿真對比分析實驗。在自行設(shè)計的實驗平臺上對聯(lián)合定位算法在不同障礙物的非視距環(huán)境下進行了實驗驗證,結(jié)果表明,本文設(shè)計的聯(lián)合定位算法可顯著提升超寬帶TOA定位精度,并且該聯(lián)合定位算法的定位精度優(yōu)于傳統(tǒng)TOA、UKF聯(lián)合定位算法,更加適用于當今復(fù)雜的室內(nèi)定位。如果要繼續(xù)深入研究本課題,可以在精度更高的硬件配合下投入商用以發(fā)現(xiàn)更多實際中的問題,提升整個系統(tǒng)性能。