高 雅,夏紅偉,馬廣程,李旭東,孫浩然,馬長波
(1.哈爾濱工業(yè)大學(xué) 航天學(xué)院· 哈爾濱·150001;2.上海航天控制技術(shù)研究所·上?!?01109)
隨著空間技術(shù)的發(fā)展,一些復(fù)雜的應(yīng)用場景,比如太空中太陽能電池板等大型設(shè)備的組裝,已經(jīng)不能依靠單個航天器來完成,多航天器協(xié)同逐漸成為了解決這類空間任務(wù)的一種有效途徑[1]。航天器集群作為一種新興的多航天器協(xié)同模式,已經(jīng)成為了分布式空間系統(tǒng)的重要研究方向。近些年來,針對智能集群的理論研究取得了巨大的進(jìn)展,如人工勢場法[2]、模糊思想[3]、仿生行為分析[4]等。然而,為驗(yàn)證集群智能算法的可行性與正確性,僅進(jìn)行數(shù)學(xué)仿真是不夠的,還需要通過全物理仿真試驗(yàn)來復(fù)現(xiàn)系統(tǒng)所處的真實(shí)環(huán)境,模擬真實(shí)的噪聲、擾動等不確定因素。
氣浮模擬器系統(tǒng)是一種航天器集群地面仿真試驗(yàn)平臺,該平臺可以為航天器集群控制算法的可行性與正確性提供一種有效的模擬、評測環(huán)境和手段。以色列工學(xué)院的分布式空間系統(tǒng)實(shí)驗(yàn)室設(shè)計(jì)了一個用于測試衛(wèi)星集群飛行技術(shù)的試驗(yàn)平臺,在通過3D打印生產(chǎn)的氣浮機(jī)器人上配置了慣性單元、執(zhí)行機(jī)構(gòu)和控制器等設(shè)備,實(shí)現(xiàn)了集群行為的全物理仿真;由美國加利福尼亞理工學(xué)院噴氣推進(jìn)實(shí)驗(yàn)室開發(fā)的編隊(duì)控制模擬器,包括了兩套五自由度的模擬系統(tǒng),模擬器上裝有星敏感器、光纖陀螺、反作用輪、冷氣體推進(jìn)器以及嵌入式計(jì)算機(jī),用于論證航天器集群的制導(dǎo)、控制算法、參數(shù)估計(jì)等[5]。在國內(nèi),以哈爾濱工業(yè)大學(xué)、中國科學(xué)院大學(xué)、北京控制工程研究所等為代表的機(jī)構(gòu),在氣浮模擬器的研制方面取得了不俗的成果。但與國外相比,氣浮模擬器技術(shù)在航天器集群的全物理仿真系統(tǒng)方面的應(yīng)用較少。
在這種背景下,從理論和工程實(shí)踐兩方面考慮,本文設(shè)計(jì)了一種基于氣浮技術(shù)的航天器集群控制與規(guī)劃算法仿真驗(yàn)證平臺,該平臺可以在地面上實(shí)現(xiàn)集群導(dǎo)航、規(guī)劃與控制算法的全物理分析與驗(yàn)證。最后,給出了一種基于滑??刂频募郝窂揭?guī)劃算法,并通過仿真,驗(yàn)證了算法的有效性。
航天器集群系統(tǒng)在外太空工作時,大多采用圖像識別或慣性測量的位姿識別方式,并通過無線數(shù)據(jù)傳輸使每個成員均可獲得其余成員的位姿信息。在航天器集群控制技術(shù)的仿真驗(yàn)證系統(tǒng)中,參考真實(shí)航天器集群在軌工作時的位姿識別方式,為了便于進(jìn)行地面試驗(yàn),可以考慮以下三種位姿識別方案:
(1)基于慣性組合的位姿識別裝置
慣性組合具有實(shí)時性好、抗干擾能力強(qiáng)、不受氣象條件限制等優(yōu)點(diǎn),因此??杀挥糜谧藨B(tài)測量和導(dǎo)航等應(yīng)用領(lǐng)域。在仿真試驗(yàn)系統(tǒng)內(nèi)的每個成員上安裝包含陀螺和加速度計(jì)在內(nèi)的慣性組合,測量成員在x、y方向的平動狀態(tài)和繞豎直軸的轉(zhuǎn)動狀態(tài),并利用卡爾曼濾波算法對測量數(shù)據(jù)進(jìn)行處理,以獲得成員的高精度位姿信息。
(2)基于雙目視覺的相對位姿識別裝置
采用圖像測量的方式進(jìn)行位姿識別,可以避免由傳統(tǒng)慣組帶來的漂移誤差,確保長時間工作時的導(dǎo)航精度保持不變。雙目相機(jī)安裝在集群內(nèi)的每一個成員上,基于計(jì)算機(jī)視覺,通過頂部正中央的靶標(biāo)實(shí)時識別并獲得相鄰成員的位姿信息,同時與其他成員進(jìn)行通信,其效果如圖1所示。
圖1 基于雙目視覺的位姿測量裝置的識別效果圖Fig.1 Recognition effect diagram of pose measurement device based on binocular vision
(3)基于單目視覺的全局位姿識別裝置
慣組和雙目視覺相機(jī)的測量范圍有限。在集群導(dǎo)航定位過程中,每個成員需要實(shí)時地與其他成員交換位姿信息,這導(dǎo)致網(wǎng)絡(luò)負(fù)載較大。安裝在集群正上方的單目相機(jī)采用了全局測量方案,以每個成員頂部的靶標(biāo)為參照物,可實(shí)現(xiàn)對集群內(nèi)所有機(jī)器人的位姿測量。
本文提出的航天器集群控制技術(shù)仿真驗(yàn)證系統(tǒng)的第一代產(chǎn)品選用了第三種位姿識別方案,通過支撐架將單目相機(jī)固定在了實(shí)驗(yàn)平臺的正上方;安裝在機(jī)器人頂部正中央的靶標(biāo)圖像經(jīng)二值化處理后的結(jié)果如圖2所示,相機(jī)通過靶標(biāo)中的三個標(biāo)志點(diǎn)的相對位置信息來區(qū)分和識別集群內(nèi)的每個成員。其中,最外層的黑色圓形標(biāo)志點(diǎn)質(zhì)心記作Z,內(nèi)含的3個白色圓形標(biāo)志點(diǎn)質(zhì)心組成了三角形ABC。三角形的最長邊為AB,與之相對的頂點(diǎn)為C,次長邊為AC,與之相對的頂點(diǎn)為B,最短邊為BC,與之相對的頂點(diǎn)為A。首先,以整張測試圖片為目標(biāo)區(qū)域,以黑色為前景色,白色為背景色,提取輪廓,并求解質(zhì)心和輪廓半徑,可求得Z點(diǎn)的坐標(biāo)與對應(yīng)標(biāo)志點(diǎn)的外接矩形。隨后,以標(biāo)志點(diǎn)Z的外接矩形為目標(biāo)區(qū)域,以白色為前景色,黑色為背景色,提取輪廓,并求解質(zhì)心,可以得到3個白色標(biāo)志點(diǎn)的質(zhì)心坐標(biāo)。其中,A、B兩點(diǎn)的坐標(biāo)可用于進(jìn)一步對待測目標(biāo)的位姿進(jìn)行計(jì)算,C點(diǎn)可用于待測目標(biāo)之間的區(qū)分。相機(jī)識別靶標(biāo),并通過AB的長度以及C到AB中點(diǎn)的距離完成多個目標(biāo)的區(qū)分。
圖2 二值化后的靶標(biāo)圖像Fig.2 Target image after binarization
整個測姿定位過程主要可分為四個環(huán)節(jié),相機(jī)標(biāo)定、圖像采集、特征提取,以及目標(biāo)檢測并輸出結(jié)果。圖像采集開始之前,需要進(jìn)行相機(jī)標(biāo)定,建立相機(jī)的針孔成像模型,以便于后續(xù)的位姿坐標(biāo)變換;相機(jī)標(biāo)定完成后,通過圖像采集得到被測靶標(biāo)的圖像,根據(jù)工作距離、成像范圍等要求,設(shè)置合適的曝光時間、調(diào)節(jié)光圈及焦距,采集出成像效果最佳的靶標(biāo)圖像;然后,在指定區(qū)域生成模板圖像,定位出模板圖像的中心(參考點(diǎn)),并圈定所拍攝圖像的搜索區(qū)域,進(jìn)行靶標(biāo)圖像的特征提取,得到標(biāo)志點(diǎn)的位置坐標(biāo);最后,進(jìn)行目標(biāo)檢測并輸出結(jié)果。根據(jù)由特征提取得到的標(biāo)志點(diǎn)坐標(biāo),將通過相機(jī)標(biāo)定得到的數(shù)據(jù)進(jìn)行坐標(biāo)變換,并通過運(yùn)算得到真實(shí)坐標(biāo)系下的位姿信息。根據(jù)既定的判定條件,判定本次測姿定位數(shù)據(jù)是否可靠,位姿信息將按照設(shè)計(jì)的通信協(xié)議、通過UDP發(fā)送到每個成員的控制器上。
仿真實(shí)驗(yàn)系統(tǒng)由平臺支撐分系統(tǒng)、臺上氣浮機(jī)器人、位姿識別分系統(tǒng)和臺下監(jiān)控分系統(tǒng)構(gòu)成,系統(tǒng)組成如圖3所示。由光滑大理石平臺構(gòu)成的平臺支撐分系統(tǒng)為集群內(nèi)的氣浮機(jī)器人提供了工作模擬環(huán)境;氣浮機(jī)器人底部的氣足產(chǎn)生高壓氣膜,使其懸浮在大理石平臺上,可模擬航天器在外太空中的微阻尼動力學(xué)環(huán)境;位姿識別系統(tǒng)采用全局圖像測量的位姿檢測方式,并通過UDP將集群內(nèi)所有成員的位姿信息傳輸給每個氣浮機(jī)器人的控制器;演示系統(tǒng)配有臺下監(jiān)控分系統(tǒng)。通過友好的人機(jī)交互界面,使用戶在臺下能夠?qū)崟r監(jiān)控集群的運(yùn)動狀態(tài)。
圖3 仿真試驗(yàn)系統(tǒng)組成示意圖Fig.3 Schematic diagram of the demonstration system
氣浮機(jī)器人是整個演示系統(tǒng)的核心,其包括供電子系統(tǒng)、供氣子系統(tǒng)、控制器、執(zhí)行機(jī)構(gòu)等設(shè)備,采用了層次式結(jié)構(gòu),將機(jī)器人上的相關(guān)設(shè)備進(jìn)行了分層放置,使得布局更加合理、清晰。在系統(tǒng)工作的過程中,大理石平臺正上方的單目相機(jī)通過安裝于集群內(nèi)每個機(jī)器人表面的靶標(biāo)來區(qū)分不同的成員,并將每個成員的位姿數(shù)據(jù)通過USB數(shù)據(jù)線傳輸給臺下由配套工控機(jī)組成的監(jiān)控分系統(tǒng)。監(jiān)控分系統(tǒng)通過人機(jī)交互界面實(shí)時顯示每臺機(jī)器人的位姿數(shù)據(jù)。用戶在界面上輸入集群內(nèi)每個成員的期望位姿信息,每個機(jī)器人上的控制器通過UDP接收集群內(nèi)所有成員的位姿信息,再根據(jù)設(shè)計(jì)的路徑規(guī)劃算法求解出控制量。應(yīng)用力矩分配算法,控制器將控制量分配到每個執(zhí)行機(jī)構(gòu)上。最后,通過串口將每個執(zhí)行機(jī)構(gòu)的控制量輸出給驅(qū)動板。驅(qū)動板將控制信號轉(zhuǎn)換為PWM信號,以驅(qū)動執(zhí)行機(jī)構(gòu),控制過程如圖4所示。演示系統(tǒng)通過4個微型風(fēng)扇驅(qū)動氣浮機(jī)器人到達(dá)指定的位置和姿態(tài),以實(shí)現(xiàn)航天器集群編隊(duì)的全物理仿真。風(fēng)扇的安裝示意圖如圖5所示。
圖4 控制過程示意圖Fig.4 Schematic diagram of control process
圖5 風(fēng)扇安裝位置示意圖Fig.5 Schematic diagram of the fan installation position
演示系統(tǒng)內(nèi)的集群成員都是平等且獨(dú)立的。同時,通過上文論述的全局圖像識別技術(shù),每個成員都可以準(zhǔn)確地獲得其余成員的位姿信息。本文參考Izzo和Pettazzi在文獻(xiàn)[6]中提出的一種基于行為的集群運(yùn)動場建模方法,即設(shè)計(jì)集群內(nèi)成員的多種行為函數(shù),通過設(shè)置相應(yīng)的權(quán)重系數(shù),將集群的運(yùn)動場定義為不同行為的貢獻(xiàn)之和。這種方法從集群期望的編隊(duì)配置出發(fā),通過計(jì)算實(shí)現(xiàn)了最終配置時每個成員的期望速度。
假設(shè)集群內(nèi)有n個成員,每個成員的平衡位置為ξi,當(dāng)前位置和速度分別為xi和vi,i=1,…,n。集群內(nèi)每個成員受到的作用力可以分解為目標(biāo)位置對成員的吸引力和障礙物(集群內(nèi)其余成員和大理石平臺邊界)對成員的排斥力[7]。因此,由作用力產(chǎn)生的行為包括向目標(biāo)位置運(yùn)動的聚集行為和躲避障礙物的排斥行為。下面,給出兩種行為的具體定義函數(shù)。
(1)聚集行為
聚集行為表示目標(biāo)位置對成員的吸引效果,聚集行為將使得集群內(nèi)的每個成員向著目標(biāo)位置移動,可定義行為函數(shù)如下
(1)
(2)回避行為
回避行為表示障礙物對成員的排斥效果,如圖6所示。當(dāng)成員在遠(yuǎn)離平臺邊界的區(qū)域(區(qū)域Ⅱ)內(nèi)運(yùn)動時,僅考慮成員與其他成員之間避免碰撞
圖6 回避行為的作用區(qū)域示意圖Fig.6 Schematic diagram of the area of action of avoidance behavior
(2)
其中,整數(shù)bi表示排斥效果的強(qiáng)度,ka,i表示成員間排斥力的影響范圍。
當(dāng)成員在靠近平臺邊界的區(qū)域(區(qū)域Ⅰ)內(nèi)時,需要將邊界視為障礙物
(3)
式中,d0表示平臺邊界對成員的排斥效果的作用范圍,即區(qū)域Ⅰ的寬度,dj表示成員到邊界的距離。回避行為的效果強(qiáng)度與成員到障礙物的距離負(fù)相關(guān),且具有局部效應(yīng)。
集群內(nèi)每個機(jī)器人的期望速度是以上兩種行為的加權(quán)和
(4)
vi(x=ξ,λ)=0
(5)
其中,x=[xi…xn]T,ξ=[ξ1…ξn]T。當(dāng)給定范圍參數(shù)ka,i、kd,i、d0和一些強(qiáng)度參數(shù)時,可以求出剩余參數(shù)。
路徑規(guī)劃一直都是智能集群控制領(lǐng)域研究的重點(diǎn)問題[8]。通過給定一系列初始條件和約束條件,在有效躲避障礙物和避免集群內(nèi)成員相互碰撞的前提下,可自主地、實(shí)時地為每個成員規(guī)劃其到達(dá)目標(biāo)位置的滿意路徑[9-10]。綜合目前該領(lǐng)域中的研究成果[11-12],本文根據(jù)上一節(jié)推導(dǎo)的行為函數(shù)模型設(shè)計(jì)了一種基于滑模控制思想的路徑規(guī)劃算法。算法結(jié)構(gòu)簡單、魯棒性高[13],能夠快速有效地規(guī)劃出每個成員的運(yùn)動路徑,同時針對傳統(tǒng)滑模控制中存在的震顫問題,用一個連續(xù)函數(shù)代替了滑模控制中的開關(guān)函數(shù),最后的仿真結(jié)果證明了路徑規(guī)劃算法的可行性。
由于集群內(nèi)每個成員平等獨(dú)立且具有結(jié)構(gòu)相同的控制器,下面可省略下標(biāo)i。航天器集群在大理石平臺上運(yùn)動時,可僅考慮執(zhí)行機(jī)構(gòu)產(chǎn)生的驅(qū)動力和外界擾動力。因此,給出以下形式的集群運(yùn)動模型
(6)
其中,v是成員運(yùn)動速度,aN是未建模的擾動加速度,u是控制量。
滑模面及運(yùn)動示意圖如圖7所示,每個成員的運(yùn)動可以分為兩個階段:階段A使成員的運(yùn)動狀態(tài)從初始速度v0逐漸收斂至滑模軌跡,并始終保持在滑模軌跡上;階段B使成員的運(yùn)動狀態(tài)沿著設(shè)計(jì)的滑模軌跡s=0達(dá)到平衡的目標(biāo)位置,即實(shí)現(xiàn)設(shè)計(jì)的期望速度vd。
圖7 滑模面及運(yùn)動示意圖Fig.7 Schematic diagram of sliding surface and movement
首先,需要給出滑模軌跡在控制系統(tǒng)中的實(shí)際物理意義。為了使集群實(shí)現(xiàn)設(shè)計(jì)的平衡狀態(tài),本文給出了以下形式的滑模面函數(shù)
s=vd-v
(7)
其中,vd是給定的三種行為,即式(3)的定義。s=0能夠保證成員的速度最終達(dá)到設(shè)計(jì)的期望速度vd。當(dāng)系統(tǒng)狀態(tài)到達(dá)滑模軌跡s后,為了使其始終保持在s軌跡上,需要滿足以下關(guān)系
(8)
將式(6)代入式(8),則有
(9)
由此,可以得到滑??刂坡芍械牡刃Э刂撇糠?/p>
(10)
ueq使系統(tǒng)的運(yùn)動狀態(tài)與滑模軌跡相交后不再離開滑模軌跡,并逐漸收斂到穩(wěn)定的目標(biāo)位置;為了驅(qū)動系統(tǒng)的運(yùn)動狀態(tài)軌跡與滑模軌跡相交,需要在s<0或s>0的情況下引入切換控制uvss,迫使系統(tǒng)狀態(tài)向滑模軌跡趨近,并提高系統(tǒng)的魯棒性。因此,完整的控制律為
u=ueq+uvss
(11)
下面,通過李雅普諾夫穩(wěn)定性分析的方法來確定uvss。在實(shí)際集群系統(tǒng)中,由于每個成員的初始運(yùn)動狀態(tài)可能位于狀態(tài)空間中的任意位置,要求滑模軌跡對于整個狀態(tài)空間而言具有全局吸引力,即滑模軌跡需要滿足李雅普諾夫形式的全局到達(dá)條件
(12-1)
(12-2)
將式(6)和式(11)代入式(12-2)中,則有,(vd-v)(uvss-aN)>0,即有
s(uvss-aN)>0
(13)
滑??刂评碚摬]有對系統(tǒng)狀態(tài)的趨近運(yùn)動軌跡做出限制,只需保證狀態(tài)最終能夠收斂到滑模面即可。因此,任何滿足該條件的uvss均可驅(qū)動系統(tǒng)狀態(tài)向滑模軌跡運(yùn)動。本文采用趨近律對uvss的切換控制進(jìn)行設(shè)計(jì)。查閱文獻(xiàn)[14-15],可選擇以下形式的趨近律
uvss=u0sign(s)
(14)
在實(shí)際仿真時發(fā)現(xiàn),符號函數(shù)sign(s)的不連續(xù)性會導(dǎo)致成員在平衡位置附近產(chǎn)生不必要的震顫現(xiàn)象,如圖8所示。為了在實(shí)現(xiàn)控制目標(biāo)的前提下消除控制器的不連續(xù)性,本文采用平滑且連續(xù)的雙曲正切函數(shù)tanh(γs)來近似符號函數(shù)sign(s)。其中,γ表示函數(shù)在s=0處的斜率。近似后的控制器大大消除了系統(tǒng)震顫,減少了系統(tǒng)磨損,延長了使用壽命,如圖9所示。
圖8 滑模控制的震顫現(xiàn)象Fig.8 Chattering phenomenon of sliding mode control
圖9 改進(jìn)滑??刂频姆抡娼Y(jié)果Fig.9 Simulation results of improved sliding mode control
綜上,本文采用的滑??刂坡扇缦?/p>
(15)
本文分別針對包含兩個成員、三個成員和四個成員的集群編隊(duì)設(shè)計(jì)了期望達(dá)到的目標(biāo)隊(duì)形,根據(jù)上文提出的運(yùn)動場行為函數(shù)和路徑規(guī)劃算法,設(shè)置u0=10,γ=5,并進(jìn)行了仿真。仿真結(jié)果如圖10、圖11、圖12所示。圖10中的兩個成員最終到達(dá)兩個豎直距離為1m的目標(biāo)位置;圖11中
圖10 兩個成員的集群編隊(duì)仿真結(jié)果Fig.10 Simulation results of cluster formation of two members
圖11 三個成員的集群編隊(duì)仿真結(jié)果Fig.11 Simulation results of cluster formation of three members
圖12 四個成員的集群編隊(duì)仿真結(jié)果Fig.12 Simulation results of cluster formation of three members
本文提出了一種基于氣浮技術(shù)的航天器集群控制與規(guī)劃算法仿真驗(yàn)證平臺的總體設(shè)計(jì)方案?;趩文课蛔俗R別系統(tǒng),該仿真驗(yàn)證平臺可以實(shí)現(xiàn)對所有成員的位姿的全局測量。通過為集群定義“聚集”和“回避”兩種行為,建立了基于行為函數(shù)的集群運(yùn)動場模型,設(shè)計(jì)了一種基于滑??刂扑惴ǖ穆窂揭?guī)劃算法,并針對算法中存在的抖振現(xiàn)象做出了改進(jìn),最后通過仿真驗(yàn)證了本文方法的有效性。