竇占樹, 崔麗珍?, 羅海勇, 洪金祥
(1.內(nèi)蒙古科技大學(xué) 信息工程學(xué)院,內(nèi)蒙古 包頭 014010;2.中國科學(xué)院 計算技術(shù)研究所,北京 100190)
近年來,煤礦智能化建設(shè)[1-3]成為當(dāng)下研究的熱點(diǎn),對煤礦井下目標(biāo)的定位精度[4]有了更高的要求。 與此同時,各種井下無線定位技術(shù)[5-6]得到快速發(fā)展。 基于WiFi 的井下定位技術(shù)[7-9]由于其特有的定位優(yōu)勢,已經(jīng)在工業(yè)生產(chǎn)中得到了廣泛應(yīng)用。井下環(huán)境復(fù)雜多變[10-11],狹長的井下通道、粗糙的巷道幫壁、工作人員的實(shí)時移動、大量的粉塵和復(fù)雜的井下基礎(chǔ)設(shè)施等都使得井下通信環(huán)境時刻處于變化之中,導(dǎo)致定位模型精度降低。 在復(fù)雜多變的煤礦井下環(huán)境及時并準(zhǔn)確地獲取井下作業(yè)人員的位置顯得非常重要。 基于位置指紋的定位技術(shù)由離線和在線階段組成。 離線建庫階段[12]的主要工作是收集樣本點(diǎn)RSS 的值和對應(yīng)的坐標(biāo),用于構(gòu)建指紋數(shù)據(jù)庫。 在線定位階段[13]需要選取合適的定位算法,通過對比用移動終端采集到的RSS 值和指紋數(shù)據(jù)庫[14]中存儲的RSS 值,數(shù)據(jù)庫中對應(yīng)的最相似參考點(diǎn)的坐標(biāo)就是待定位目標(biāo)點(diǎn)的坐標(biāo)。 離線數(shù)據(jù)庫主要用于訓(xùn)練定位模型,使模型具有更強(qiáng)的泛化能力。將在線數(shù)據(jù)輸入到用離線數(shù)據(jù)訓(xùn)練好的模型中,最終得到待定位目標(biāo)點(diǎn)的坐標(biāo)。 煤礦井下定位技術(shù)主要包括WiFi 技術(shù)、UWB 技術(shù)[15]和藍(lán)牙技術(shù)[16]等?;赪iFi 的井下定位技術(shù)能夠滿足井下定位的精度需求。
本文將在線順序極限學(xué)習(xí)機(jī)(Online Sequential Limit Learning Machine,OSELM)算法[17-20]用于井下定位,利用OSELM 算法的在線學(xué)習(xí)能力實(shí)現(xiàn)對定位模型的在線實(shí)時更新,同時對OSELM 算法進(jìn)行改進(jìn)。 實(shí)驗(yàn)表明,經(jīng)改進(jìn)的OSELM 算法能夠有效提高模型的定位精度。
本文選擇3 層OSELM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。 輸入層有4 個神經(jīng)元,代表4 個AP 點(diǎn)提供的RSSI 信號強(qiáng)度值;隱藏層有155 個神經(jīng)元;輸出層有2 個神經(jīng)元,輸出對應(yīng)的(X,Y)坐標(biāo)。 OSELM 網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 OSELM 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 OSELM network structure
f1(x)為隱藏層節(jié)點(diǎn)激活函數(shù),wij為輸入層第i個神經(jīng)元與隱藏層第j個神經(jīng)元間的連接權(quán)值,βjk為隱藏層第j個神經(jīng)元與輸出層第k個神經(jīng)元間的連接權(quán)值。 通常,SELM 由N個訓(xùn)練樣本、p個輸入層節(jié)點(diǎn)、L個隱藏層節(jié)點(diǎn)和q個輸出層節(jié)點(diǎn)組成,N個采樣節(jié)點(diǎn)的坐標(biāo)為:
在采樣節(jié)點(diǎn)處接收到的來自v個AP 無線接入點(diǎn)的信號強(qiáng)度值為:
OSELM 網(wǎng)絡(luò)表達(dá)式為:
式中,f(·)表示激活函數(shù);βj為隱藏層第j個神經(jīng)元與輸出層間的連接權(quán)值矩陣;wi=[wi1,wi2,…,wip]為輸入層與隱藏層間的連接權(quán)值矩陣;bj為第j個隱藏層神經(jīng)元偏置矩陣。 式(3)可簡化為:
式中,H 表示隱藏層輸出矩陣;C 表示期望輸出矩陣。 隱藏層與輸出層間的連接權(quán)值 β 能夠通過求解方程組最小二乘解得到,即:
式中,‖·‖表示范數(shù),對應(yīng)的解為:
式中,H?為H 的廣義逆矩陣,當(dāng)OSELM 網(wǎng)絡(luò)應(yīng)用于回歸預(yù)測領(lǐng)域時,對應(yīng)的定位誤差為:
利用OSELM 的在線學(xué)習(xí)能力,能很好地解決因井下環(huán)境高動態(tài)變化導(dǎo)致模型精度下降的問題。但該模型只是完成了在線更新的過程,并沒有對新增數(shù)據(jù)的質(zhì)量、有效性進(jìn)行評估。 本文對OSELM算法引入權(quán)重項ω進(jìn)行改進(jìn)。
在權(quán)值ω的設(shè)置中,應(yīng)考慮以下3 點(diǎn):
① 采集新增數(shù)據(jù)的參考點(diǎn)數(shù)占實(shí)驗(yàn)區(qū)域內(nèi)所有參考點(diǎn)數(shù)的比例大小。 采集新增數(shù)據(jù)的參考點(diǎn)都是均勻分布在實(shí)驗(yàn)區(qū)域的情況下,如果采集新增數(shù)據(jù)的參考點(diǎn)數(shù)較多,應(yīng)該給予相對較大的權(quán)重來對模型進(jìn)行更新。 反之,應(yīng)該給予相對較小的權(quán)重。用ω1表示采集新增數(shù)據(jù)的參考點(diǎn)覆蓋率的影響。
② 采集新增數(shù)據(jù)的時間先后順序。 當(dāng)有多批增量數(shù)據(jù)依次到達(dá)定位模型時,需要根據(jù)增量數(shù)據(jù)到達(dá)的時間先后順序給予權(quán)重上的不同。 采集新增數(shù)據(jù)的時間點(diǎn)距離在線定位的時間點(diǎn)越近,含有的有用信息越多,應(yīng)該給予更大的權(quán)值。 用ω2表示新增數(shù)據(jù)時效性的影響。
③ 當(dāng)考慮2 個影響因素時,將時效性和覆蓋率改進(jìn)實(shí)驗(yàn)進(jìn)行融合,做融合性改進(jìn)實(shí)驗(yàn)。 融合性權(quán)重ω3可表示為:
在煤礦井下環(huán)境進(jìn)行實(shí)驗(yàn)區(qū)域的部署。 采集數(shù)據(jù)的煤礦井下巷道空間狹長且曲折,同時有各種機(jī)械設(shè)備,環(huán)境較為復(fù)雜多變。 選定80 m×3 m×3 m的實(shí)驗(yàn)區(qū)域,離線階段每隔1 m 部署一個參考點(diǎn),共部署81 個參考點(diǎn)。 在10,30,50,70 m 處分別部署1 個WiFi AP 熱點(diǎn),共采集4 050 條數(shù)據(jù)。 在線階段每隔5 m 進(jìn)行數(shù)據(jù)采集,共17 個參考點(diǎn),采集850 條數(shù)據(jù)。 實(shí)驗(yàn)通過增加通道內(nèi)測試人員的走動,增加干擾噪聲的同時改變障礙物的位置,來達(dá)到使通道內(nèi)的通信環(huán)境發(fā)生變化的目的。 實(shí)驗(yàn)場景如圖2所示。
圖2 實(shí)驗(yàn)場景Fig.2 Experimental scene
為驗(yàn)證所提算法能有效解決井下環(huán)境高動態(tài)變化導(dǎo)致模型精度降低的問題,本文采用2 個實(shí)驗(yàn)對所提算法性能進(jìn)行驗(yàn)證。
實(shí)驗(yàn)1:在實(shí)驗(yàn)區(qū)域內(nèi)相同環(huán)境下采集離線建庫數(shù)據(jù)和在線定位數(shù)據(jù)。 實(shí)驗(yàn)2:離線建庫數(shù)據(jù)與實(shí)驗(yàn)1 相同,采集在線定位數(shù)據(jù)時,需要改變實(shí)驗(yàn)環(huán)境,即在同一實(shí)驗(yàn)區(qū)域不同環(huán)境下采集離線和在線數(shù)據(jù)。
定位精度是衡量本文實(shí)驗(yàn)結(jié)果的重要指標(biāo),主要是衡量通過定位算法得到的待定位目標(biāo)點(diǎn)的坐標(biāo)估計值與真實(shí)值之間的接近程度。 定位精度越高,說明待定位目標(biāo)點(diǎn)的坐標(biāo)估計值與真實(shí)值之間的接近程度越高,定位算法的優(yōu)越性越大。
3.1.1 實(shí)驗(yàn)1:3 種算法對比實(shí)驗(yàn)
SVM,ELM 和OSELM 三種算法的定位精度對比如圖3 所示。
圖3 定位精度對比Fig.3 Comparison of positioning accuracy
SVM,ELM 和OSELM 三種定位算法的均方根誤差(Root Mean Squared Error,RMSE)對比如表1 所示。
表1 3 種算法的RMSE 對比Tab.1 Comparison of RMSE of three algorithms單位:m
由圖3 可知,3 種算法的預(yù)測值和真實(shí)值擬合程度均較高。 對比3 種算法的RMSE 可知,OSELM算法比SVM 算法低0.241 2 m,OSELM 算法比ELM算法低0.541 1 m,定位誤差均在2 m 內(nèi),滿足復(fù)雜井下環(huán)境的定位精度需求。
3.1.2 實(shí)驗(yàn)2:3 種算法對比實(shí)驗(yàn)
SVM,ELM 和OSELM 三種算法的定位精度對比如圖4 所示。
圖4 定位精度對比Fig.4 Comparison of positioning accuracy
實(shí)驗(yàn)環(huán)境發(fā)生變化后,SVM,ELM 和OSELM 三種算法的RMSE 對比如表2 所示。
表2 3 種算法的RMSE 對比Tab.2 Comparison of RMSE of three algorithms單位:m
由圖4 可知,3 種算法預(yù)測輸出值和真實(shí)坐標(biāo)值的擬合程度與實(shí)驗(yàn)1 相比,定位精度都有所降低。對比表2 和表1 可以看出,SVM,ELM 和OSELM 三種算法的RMSE 分別增大了1.755 8,1.889 1,0.668 6 m。實(shí)驗(yàn)環(huán)境變化后,SVM 和ELM 定位算法的RMSE變化較大,OSELM 定位算法的RMSE 變化較小。 因此,OSELM 算法更適合用于解決WiFi 井下動態(tài)定位問題。
在實(shí)驗(yàn)區(qū)域內(nèi)共采集9 批數(shù)據(jù):1 個初始訓(xùn)練數(shù)據(jù)集Train-data、7 個不同時間采集的增量數(shù)據(jù)集Incredata1~7 和1 個測試數(shù)據(jù)集Test-data。 其中,增量數(shù)據(jù)集Incredata1~4 用于參考點(diǎn)覆蓋率的改進(jìn)實(shí)驗(yàn);增量數(shù)據(jù)集Incredata5~7 用于新增數(shù)據(jù)時效性的改進(jìn)實(shí)驗(yàn)。
(1)采集新增數(shù)據(jù)的參考點(diǎn)覆蓋率權(quán)重對定位模型精度的影響
用Incredata1~4 分別對模型進(jìn)行更新,權(quán)值計算公式為:
當(dāng)考慮權(quán)重時,由式(9)可知Incredata1~4 的權(quán)重分別為1/2,1/3,1/5,1。 當(dāng)不考慮權(quán)重時,ω值為1。 用Train-data 訓(xùn)練初始模型,分別用Incredata1~4 對模型進(jìn)行增量學(xué)習(xí)。 最后用Test-data 對模型進(jìn)行測試。 統(tǒng)計在不同誤差距離下的定位精度。 采集新增數(shù)據(jù)的參考點(diǎn)覆蓋率權(quán)重對定位精度的影響如圖5 所示。
圖5 采集參考點(diǎn)覆蓋率權(quán)重對定位精度的影響Fig.5 Effect of acquisition reference point coverage weights on positioning accuracy
用Incredata1~4 分別對模型進(jìn)行增量學(xué)習(xí),在誤差距離為1,2,3 m 的情況下,定位精度對比如表3所示。
表3 定位精度對比Tab.3 Comparison of positioning accuracy單位:%
由表3 可知,用每隔1 m(權(quán)值為1/2)和3 m(權(quán)值為1/3)的方式采集到的數(shù)據(jù)對模型進(jìn)行增量學(xué)習(xí)的定位精度較高,因?yàn)槊扛?,3 m 采集到的數(shù)據(jù)量剛好適用于對模型進(jìn)行增量學(xué)習(xí),使得模型泛化能力更強(qiáng)。 而按全覆蓋(權(quán)值為1)和每隔5 m(權(quán)值為1/5)的方式進(jìn)行數(shù)據(jù)的采集,采集到的數(shù)據(jù)量過多和過少,易使模型出現(xiàn)過擬合和欠擬合現(xiàn)象,導(dǎo)致模型精度降低。 用每隔1 m 采集到的數(shù)據(jù)對模型進(jìn)行增量學(xué)習(xí),定位精度最高,大大降低了數(shù)據(jù)采集工作量,提升了實(shí)驗(yàn)效率。
(2)增量數(shù)據(jù)時效性權(quán)重對模型精度的影響
考慮到采集增量數(shù)據(jù)的時間先后順序,為增量數(shù)據(jù)賦予時效性權(quán)重對模型進(jìn)行在線增量式學(xué)習(xí),計算公式為:
式中,T0為離線數(shù)據(jù)采集時間點(diǎn);Τ1為在線數(shù)據(jù)采集時間點(diǎn);t為增量數(shù)據(jù)采集時間點(diǎn),t∈[T0,T1]。
考慮時效性權(quán)重時,由式(10)可知,Incredata5~7的權(quán)重分別為:ω5=2/7,ω6=3/7,ω7=4/7。 有3 批數(shù)據(jù)用于時效性改進(jìn)實(shí)驗(yàn),共有6 種增量數(shù)據(jù)到達(dá)情況,增量順序1~6 分別為:(5,6,7),(5,7,6),(6,5,7),(6,7,5),(7,5,6)和(7,6,5)。 對比6 種不同增量順序情況下定位誤差在1,2 m 時的定位精度,如表4 所示。
表4 定位精度Tab.4 Positioning accuracy單位:%
由表4 可知,在增量順序?yàn)?5,6,7)的情況下,定位精度最高。 定位誤差在1,2 m 時,定位精度分別達(dá)到了88%和95%,按照采集增量數(shù)據(jù)的時間先后順序?qū)δP瓦M(jìn)行增量學(xué)習(xí),會使模型定位精度最高。
當(dāng)考慮時效性權(quán)重時,按照增量數(shù)據(jù)采集的時間先后順序(5,6,7)對定位模型進(jìn)行增量學(xué)習(xí)。 不考慮時效性權(quán)重時,把增量數(shù)據(jù)(5,6,7)作為一個整體進(jìn)行增量學(xué)習(xí)。 統(tǒng)計在3 m 誤差距離下的定位精度。 引入時效性權(quán)重對定位模型精度的影響如圖6 所示。
圖6 時效性權(quán)重對定位精度的影響Fig.6 Effect of timing weights on positioning accuracy
OSELM 算法和引入時效性權(quán)重進(jìn)行改進(jìn)的OSELM 算法在誤差距離為1,2,3 m 時的定位精度對比如表5 所示。
表5 定位精度對比Tab.5 Comparison of positioning accuracy單位:%
由表5 可知,在誤差距離為1,2,3 m 的情況下,引入時效性權(quán)重進(jìn)行改進(jìn)的OSELM 算法與OSELM算法相比,定位精度分別提高了6%,4%,5%。 在3 m 誤差距離內(nèi),為增量數(shù)據(jù)引入時效性權(quán)重能有效提高定位模型精度。
(3)同時考慮2 個影響因素時,做融合性改進(jìn)實(shí)驗(yàn)
采用乘法取權(quán)值的方式進(jìn)行權(quán)值的計算,權(quán)值計算公式為:
根據(jù)式(9)計算出Incredata1~7 的權(quán)值,各增量數(shù)據(jù)權(quán)值如表6 所示。
表6 各增量數(shù)據(jù)權(quán)值Tab.6 Weights of incremental data
首先,用Train-data 訓(xùn)練初始模型。 默認(rèn)不考慮權(quán)重的情況下,權(quán)值為1,所以Incredata4 是不考慮權(quán)重的情況。 其次,Incredata1 的權(quán)值最大,為1/2,因此在融合性改進(jìn)實(shí)驗(yàn)中,選擇用權(quán)值最大的Incredata1 對模型進(jìn)行在線增量式學(xué)習(xí)。 最后,用Testdata 對模型進(jìn)行測試。 所得定位結(jié)果與BP,ELM,OSELM 三種算法定位精度進(jìn)行對比,如圖7 所示。
圖7 定位精度對比Fig.7 Comparison of positioning accuracy
考慮2 種因素進(jìn)行改進(jìn)的OSELM 算法和BP,ELM,OSELM 三種算法在1,2,3 m 誤差距離下定位精度對比,如表7 所示。
表7 定位精度對比Tab.7 Comparison of positioning accuracy單位:%
綜合考慮2 種因素的基于改進(jìn)的OSELM 算法與其他3 種算法對比,定位精度最高。 在1,2,3 m 誤差距離下,定位精度分別達(dá)到了71%,93%,99%。在3 m 誤差距離范圍內(nèi),給予新增數(shù)據(jù)融合性權(quán)重,能夠提高模型定位精度。
本文將OSELM 算法用于井下定位,同時從新增數(shù)據(jù)時效性和采集新增數(shù)據(jù)的參考點(diǎn)覆蓋率兩方面以及綜合考慮這兩方面因素對OSELM 算法進(jìn)行改進(jìn)。 實(shí)驗(yàn)結(jié)果表明,實(shí)驗(yàn)環(huán)境變化后,與SVM 和ELM 算法相比,OSELM 算法對動態(tài)環(huán)境有更強(qiáng)的適應(yīng)能力。 同時,為OSELM 算法給予時效性權(quán)重,能夠提高定位模型精度。 每隔1 m 進(jìn)行增量數(shù)據(jù)的采集與全覆蓋采集方式相比,模型精度更高,同時大大降低了數(shù)據(jù)采集工作量。 綜合考慮兩方面因素對OSELM 算法進(jìn)行改進(jìn),與BP,ELM,OSELM 算法進(jìn)行對比,顯著提升了定位模型精度。 因此,在OSELM 算法基礎(chǔ)上加入權(quán)重項的考慮,能夠有效提高定位模型精度,所提OSELM 及其改進(jìn)算法均可行有效。