申向遠(yuǎn),袁 杰
(新疆大學(xué)電氣工程學(xué)院,烏魯木齊 830047)
羽流[1]是指泄漏物在介質(zhì)中傳播形成的羽流狀物質(zhì)。機(jī)器人主動嗅覺是指機(jī)器人利用機(jī)載傳感器,根據(jù)一系列搜索方法,自主完成羽流的發(fā)現(xiàn),跟蹤和定位任務(wù)[2]。近年來,機(jī)器人主動嗅覺已經(jīng)成為一個研究熱點(diǎn)。
機(jī)器人主動嗅覺可分為單機(jī)器人主動嗅覺與多機(jī)器人主動嗅覺。Vergassola等[3]利用貝葉斯推理提高信息增益,提出了信息趨向性算法,克服了在湍流環(huán)境下的局部最優(yōu)問題。Shigaki等[4]提出了時變飛蛾啟發(fā)算法,利用支持向量機(jī)估計(jì)行為模型,提高了羽流源的定位率。Jatmiko等[5]在Farrell等建立的室外大尺度水平層流煙羽模型環(huán)境下,采用改進(jìn)的粒子群優(yōu)化算法,通過仿真研究了氣味源定位問題。李飛等[6]提出了基于概率適應(yīng)度函數(shù)的粒子群優(yōu)化算法(probability-fitness-function based particle swarm optimization,P-PSO)算法,仿真證明了P-PSO搜索算法的可行性。鞏敦衛(wèi)等[7]利用多微粒群優(yōu)化算法,通過仿真實(shí)現(xiàn)了氣味源的定位。石志標(biāo)等[8]提出了基于遺傳算法的機(jī)器人主動嗅覺實(shí)現(xiàn)策略,完成了對羽流源的定位。以上學(xué)者利用氣體濃度信息及羽流流向/流速信息,通過仿真或?qū)嶒?yàn)驗(yàn)證了算法的可行性和有效性。趙攀等[9]根據(jù)決策樹,使用雙邊檢測完成羽流源定位。為提高定位精度,楊惠等[10]提出基于模糊邏輯的小型氣源定位系統(tǒng),通過實(shí)驗(yàn)驗(yàn)證了該方法的有效性。Thomas 等[11]提出了基于模型的多機(jī)器人協(xié)作氣體源定位策略,通過對氣體擴(kuò)散過程的分析,使用概率方法完成羽流源定位。
在室內(nèi)擴(kuò)散環(huán)境下,羽流流向/流速信息微弱,易導(dǎo)致源定位成功率低、效率低。灰狼優(yōu)化[12](grey wolf optimizer,GWO) 算法作為一種群體智能優(yōu)化的新算法,被廣泛應(yīng)用于路徑規(guī)劃[13-14],圖像分割、優(yōu)化調(diào)度[15]等領(lǐng)域。為了探索GWO算法在解決室內(nèi)擴(kuò)散環(huán)境下羽流追蹤問題的可行性與有效性,提出一種基于GWO算法的機(jī)器人羽流追蹤方法,研究羽流在擴(kuò)散環(huán)境下的分布;研究基于灰狼優(yōu)化算法的羽流追蹤方法,建立尋源機(jī)器人的行為模型。在實(shí)際環(huán)境中,羽流大多以煙羽團(tuán)方式存在,尋源機(jī)器人以氣體濃度值作為個體適應(yīng)度,并根據(jù)個體適應(yīng)度進(jìn)行位置更新迭代。在不使用羽流流向/流速傳感器的情況下,尋源機(jī)器人模擬灰狼群體社會機(jī)制與狩獵行為進(jìn)行羽流追蹤,提高在擴(kuò)散環(huán)境下追蹤羽流的可靠性以及羽流搜索速度。
由菲克擴(kuò)散定律可知,氣體濃度c隨時間的變化率等于該處的擴(kuò)散通量隨距離變化率的負(fù)值。在擴(kuò)散環(huán)境下,風(fēng)速u=0,氣體沿x、y、z方向的擴(kuò)散系數(shù)D相同,此時擴(kuò)散方程為
(1)
設(shè)羽流源(xs,ys,zs)在時刻t0以恒定速率Qv釋放氣體,則在點(diǎn)(x,y,z)處t時刻的濃度計(jì)算式為
(2)
(3)
將Qv/D定義為環(huán)境參數(shù)P,則平衡狀態(tài)的濃度計(jì)算公式可轉(zhuǎn)化為
(4)
在室內(nèi)擴(kuò)散環(huán)境下,以氣體濃度值作為個體適應(yīng)度,尋源機(jī)器人模擬灰狼種群的社會機(jī)制與狩獵行為進(jìn)行位置更新,使尋源機(jī)器人能高效地追蹤羽流并定位。
GWO算法是一種模擬灰狼種群的社會機(jī)制與狩獵行為的群體智能算法。在GWO中,社會等級的形狀類似于金字塔,等級從上到下遞減,第一層是α,第二層是β,第三層是δ,第四層是ω。GWO社會機(jī)制如圖1所示。
圖1 GWO社會機(jī)制Fig.1 The social mechanism of GWO
GWO算法根據(jù)種群中個體的適應(yīng)度確定社會等級,社會等級較低的個體根據(jù)社會等級前三的個體進(jìn)行位置更新,依次不斷重復(fù)迭代,直至滿足終止條件。GWO算法偽代碼見表1。
表1 GWO算法偽代碼Table 1 Algorithm pseudo code of GWO
尋源機(jī)器人以氣體濃度值作為個體適應(yīng)度,模擬灰狼種群的社會機(jī)制與狩獵行為進(jìn)行羽流追蹤。尋源機(jī)器人數(shù)學(xué)模型,即羽流源與尋源機(jī)器人距離計(jì)算公式和羽移動機(jī)器人位置更新公式為
D=|CXs(t)-X(t)|
(5)
X(t+1)=Xs(t)-AD
(6)
式(5)中:Xs為羽流源位置;X為尋源機(jī)器人位置;D為尋源機(jī)器人與羽流源間的位置關(guān)系;A和C為向量系數(shù),計(jì)算公式為
A=2ar1-a
(7)
C=2r2
(8)
式中:a為收斂因子,隨著迭代次數(shù)的增加,a從2線性減小到0;r1和r2為[0,1]的隨機(jī)數(shù);C為當(dāng)前尋源機(jī)器人位置距羽流源的影響權(quán)重,尋源機(jī)器人越靠近羽流源,距離權(quán)重越大。
在每一次位置更新中,尋源機(jī)器人根據(jù)檢測到的化學(xué)信號強(qiáng)度,由高到低分別劃分為α、β、δ、ω,其中α、β、δ代表化學(xué)信號強(qiáng)度前三的機(jī)器人位置,其他機(jī)器人位置均為ω。ω位置更新受α、β、δ位置影響。
ω位置更新數(shù)學(xué)模型為
Dα=|C1Xα-X|
(9)
Dβ=|C2Xβ-X|
(10)
Dδ=|C3Xδ-X|
(11)
式(9)~式(11)分別代表ω與當(dāng)前α、β、δ的距離。
X1=Xα-A1Dδ
(12)
X2=Xβ-A2Dδ
(13)
X3=Xδ-A3Dδ
(14)
式(12)~式(14)分別代表ω分別朝向α、β、δ前進(jìn)的步長與方向。
(15)
式(15)確定了ω的最終位置。
圖2 位置更新機(jī)制Fig.2 Location update mechanism
位置更新機(jī)制如圖2所示。R為尋源機(jī)器人位置距羽流源的影響權(quán)重。
尋源機(jī)器人羽流追蹤方法實(shí)現(xiàn)過程如圖3所示。
圖3 尋源機(jī)器人羽流追蹤方法流程圖Fig.3 Flow chart of plume tracking method for sourcing robot
設(shè)羽流源位于(5.0,5.0),在t0=0時刻以Qv=70 mg/s的釋放速率釋放氣體,擴(kuò)散系數(shù)D=0.08。通過對式(2)和式(4)仿真,得到t=1、10、100 s和穩(wěn)態(tài)下的氣體濃度分布圖,如圖4所示。
由于在擴(kuò)散環(huán)境中,氣體流動主要受分子擴(kuò)散作用影響,忽略墻壁及障礙物表面的黏性作用,氣體分布成中間高,四周低趨勢。當(dāng)t=1 s時,羽流源附近濃度最高,邊緣處濃度最低。隨著釋放時間的增加,羽流源及四周濃度逐漸增高,當(dāng)達(dá)到穩(wěn)態(tài)時,峰值濃度穩(wěn)定在50 mg/m3。
為了驗(yàn)證GWO算法在室內(nèi)環(huán)境無法借助可靠的羽流流向/流速信息的情況下,尋源機(jī)器人羽流源追蹤的可行性以及有效性,分別將粒子群算法、遺傳算法、Z形搜索策略、灰狼優(yōu)化算法用于尋源機(jī)器人羽流追蹤。規(guī)定:每種算法最大位置更新次數(shù)為15次,種群個數(shù)為10;逆時針為正方向。粒子群算法的加速度因子設(shè)置為2,慣性權(quán)重設(shè)置為0.9;遺傳算法的交叉概率設(shè)置為0.9,變異概率設(shè)置為0.1;Z字形搜索策略的轉(zhuǎn)向角范圍為0°~150°;灰狼優(yōu)化算法的收斂因子初始值設(shè)置為2。
聯(lián)想Y7000P筆記本安裝Ubuntu18.04操作系統(tǒng),在其系統(tǒng)下安裝機(jī)器人操作系統(tǒng)(robot operating system, ROS)。在ROS下構(gòu)建仿真環(huán)境與機(jī)器人模型。在14.0 m×8.0 m的區(qū)域中以尋源機(jī)器人初始位置為原點(diǎn),建立右手坐標(biāo)系,羽流源坐標(biāo)為(0.07,-3.01),尋源機(jī)器人初始位置距羽流源距離為9.6 m,尋源機(jī)器人與羽流源夾角為-90°,4種搜索算法仿真結(jié)果如圖5~圖8所示。
圖4 不同時刻氣體濃度分布圖Fig.4 Gas concentration distribution diagram at different moments
從圖5可以看出,在不借助可靠的羽流流向/流速信息的情況下,基于PSO算法的尋源機(jī)器人進(jìn)行了12次位置更新成功定位到羽流源。由于PSO算法存在后期收斂速度慢的問題,所以從圖5(a)中可以看出,在第5次位置更新之后,尋源機(jī)器人搜索速度下降。
從圖6可以看出,在不借助可靠的羽流流向/流速信息的情況下,基于遺傳算法(genetic algorithm, GA)的尋源機(jī)器人進(jìn)行了10次位置更新成功定位到羽流源。
從圖7(a)可以看出,在不借助可靠的羽流流向/流速信息的情況下,由于無法逆風(fēng)向上搜索,尋源機(jī)器人檢測到的氣體濃度波動較大?;赯字形搜索策略的尋源機(jī)器人進(jìn)行了9次位置更新成功定位到羽流源。
圖5 基于PSO算法的尋源機(jī)器人適應(yīng)度曲線及移動軌跡Fig.5 Fitness curve and moving trajectory of sourcing robot based on PSO algorithm
α代表每次迭代中移動機(jī)器人檢測氣體濃度最高的位置,β代表每次迭代中移動機(jī)器人檢測氣體濃度次于α的位置,δ代表每次迭代中移動機(jī)器人檢測氣體濃度次于β的位置。從圖8可以看出α、β、δ在逐步逼近羽流源。經(jīng)過10次位置更新,尋源機(jī)器人成功定位羽流源,但從圖8(b)中可以看出,α位置只改變了3次,從圖8(a)中可以看出,α在第2次迭代至第8次位置更新期間,氣體濃度并沒有發(fā)生變化。因此,GWO算法用于解決機(jī)器人羽流追蹤時仍存在后期收斂速度慢的問題?;贕WO算法的尋源機(jī)器人運(yùn)動仿真過程如圖9所示。
圖8 基于GWO算法的尋源機(jī)器人適應(yīng)度曲線及移動軌跡Fig.8 Fitness curve and moving trajectory of sourcing robot based on GWO algorithm
圖9(a)顯示了尋源機(jī)器人在運(yùn)動過程中,尋源機(jī)器人位置與濃度的變化過程。圖9(b)為尋源機(jī)器人羽流追蹤仿真過程中,尋源機(jī)器人位置與適應(yīng)度數(shù)據(jù)。
為了避免隨機(jī)性對結(jié)果的影響,仿真分為4組。第1組仿真的羽流源位置為(-2.19,1),尋源機(jī)器人與羽流源夾角為0°。第2組仿真的羽流源位置為(-2.98,-3.95),尋源機(jī)器人與羽流源夾角為90°。第3組仿真的羽流源位置為(4.19,-4.11),尋源機(jī)器人與羽流源夾角為180°。第4組仿真的羽流源位置為(3.34,0.62),尋源機(jī)器人與羽流源夾角為270°。每組分別將基于灰狼優(yōu)化算法、粒子群算法、遺傳算法、Z字形算法的尋源機(jī)器人羽流追蹤進(jìn)行50次仿真,仿真參數(shù)設(shè)置同上,每次仿真實(shí)驗(yàn)最大位置更新次數(shù)限制為15,最大運(yùn)行時間為240 s。規(guī)定:①逆時針為正方向;②在迭代次數(shù)小于等于15次、運(yùn)行時間小于等于240 s找到羽流源的視為定位成功,否則視為失敗。記錄在限制條件下,尋源機(jī)器人能分別根據(jù)4種算法追蹤羽流并成功定位羽流源的數(shù)據(jù)。仿真結(jié)果如表2所示。
表2 基于灰狼優(yōu)化算法、粒子群算法、遺傳算法、Z字形的羽流追蹤仿真結(jié)果Table 2 Plume tracking simulation results based on gray wolf optimization algorithm, particle swarm optimization algorithm, genetic algorithm and Z shape method
圖9 基于GWO算法的尋源機(jī)器人運(yùn)動仿真過程Fig.9 Motion simulation process of sourcing robot based on GWO algorithm
從表2可以看出,GWO算法同PSO、GA算法一樣,在解決室內(nèi)擴(kuò)散環(huán)境下羽流追蹤問題上具有一定的可行性與自主性。但在室內(nèi)擴(kuò)散環(huán)境下,由于缺失羽流流向/流速信息的情況下,機(jī)器人無法逆風(fēng)向上搜索,基于Z字形搜索策略的機(jī)器人羽流追蹤方法的成功率較低。
為了驗(yàn)證GWO算法在解決室內(nèi)擴(kuò)散環(huán)境下羽流追蹤問題的可行性與有效性,設(shè)置了3組實(shí)驗(yàn),每組20次實(shí)驗(yàn)。每次最大運(yùn)行時間為 180 s。實(shí)驗(yàn)場地如圖10所示。實(shí)驗(yàn)場地長5.2 m,寬 1.6 m,坐標(biāo)原點(diǎn)位于地圖左下角。尋源機(jī)器人初始位置為(0.54 m,0.60 m)。羽流釋放裝置采用裝有 100 mL,75%的醫(yī)用酒精與1 000 mL水的空氣加濕器。空氣加濕器直徑0.18 m,高度 0.32 m,噴射口距離地面0.34 m, 位于地圖(3.3 m,0.52 m)。
圖10 實(shí)驗(yàn)場地地圖Fig.10 The map of experimental site
在每次實(shí)驗(yàn)中,尋源機(jī)器人在每個位置的采樣時間為1 s, 采樣次數(shù)為10次。在第1組實(shí)驗(yàn)中,尋源機(jī)器人與羽流源的夾角為0°,羽流噴射角度為(-180°,90°,60°);在第2組實(shí)驗(yàn)中,尋源機(jī)器人與羽流源的夾角為90°,羽流噴射角度為(-90°,-180°,60°);在第3組實(shí)驗(yàn)中,尋源機(jī)器人與羽流源的夾角為270°,羽流噴射角度為(90°,0°,60°)。當(dāng)羽流濃度大于所設(shè)閾值時,判定尋源機(jī)器人發(fā)現(xiàn)羽流源。實(shí)驗(yàn)參數(shù)如表3所示。
表3 實(shí)驗(yàn)參數(shù)Table 3 Experimental parameters
圖11顯示了第1組實(shí)驗(yàn)效果圖。圖11(a)顯示了α、β、δ位置的更新變化,可以看出α、β、δ更新了3次;圖11(b)顯示了羽流濃度變化;圖11(c)顯示了尋源機(jī)器人采樣點(diǎn),尋源機(jī)器人在采樣點(diǎn)10處距離羽流源最近。結(jié)合圖11(b),可以看出在第100~110采樣期間,羽流濃度達(dá)到閾值,尋源機(jī)器人找到羽流源。
部分羽流追蹤過程如圖12所示。實(shí)驗(yàn)結(jié)果如表4所示。從表4可以看出,在3組實(shí)驗(yàn)中,尋源機(jī)器人從起始位置至第一次檢測到羽流所需時間平均約占總運(yùn)行時間7.5%、9.0%、9.7%,提高了羽流搜索速度;平均定位誤差分別為0.15、0.13、0.14 m。源定位成功率分別為95%、90%、90%,表明尋源機(jī)器人可以模擬灰狼種群的社會行為與狩獵機(jī)制追蹤羽流并成功定位到羽流源。
圖11 第1組實(shí)驗(yàn)效果圖Fig.11 The first group of experimental effect pictures
圖12 第1組實(shí)驗(yàn)尋源機(jī)器人羽流追蹤過程Fig.12 The plume tracking process of the first group of experimental source-seeking robots
表4 實(shí)驗(yàn)結(jié)果Table 4 Experiment results
在室內(nèi)擴(kuò)散環(huán)境,由于無法借助有效的羽流流向/流速信息,取消了用于傳統(tǒng)羽流追蹤研究中的羽流流向/流速傳感器。在這種情況下,提出一種基于灰狼優(yōu)化算法的機(jī)器人羽流追蹤方法。經(jīng)仿真驗(yàn)證,基于灰狼優(yōu)化算法的尋源機(jī)器人能有效地追蹤并定位擴(kuò)散環(huán)境下的羽流源。在4組仿真實(shí)驗(yàn)中,羽流源定位平均運(yùn)行時長為65、135、140、65 s,平均行駛距離為12.85、20.12、25.37、13.62 m,定位成功率為92%、94%、94%、94%。在三組實(shí)際實(shí)驗(yàn)中,羽流源源定位平均運(yùn)行時長為143.5、153.9、125.3 s,平均行駛距離為12.36、11.19、12.25 m,定位成功率為定位成功率分別為95%、90%、90%,驗(yàn)證了基于GWO算法的移動機(jī)器人羽流追蹤方法在解決室內(nèi)擴(kuò)散環(huán)境下羽流追蹤問題的可行性與有效性。