丁 偉,張 峰,宋 敏,崔 龍,王宏偉,劉釗銘,繆 磊
(1. 沈陽工程學(xué)院自動化學(xué)院,沈陽 110136;2. 中國科學(xué)院沈陽自動化研究所機(jī)器人學(xué)國家重點實驗室,沈陽 110169)
撲翼飛行機(jī)器人通過機(jī)器人機(jī)翼撲動拍打空氣產(chǎn)生的反作用力提供推力和升力,并通過飛行機(jī)器人尾翼和側(cè)翼的位置偏移來調(diào)節(jié)機(jī)身的運(yùn)動方向[1]。撲翼飛行機(jī)器人能夠完成垂直升降、懸停和滑翔等高難度運(yùn)動,具有較高的運(yùn)動靈活性和敏捷性。撲翼飛行機(jī)器人相較于固定翼飛行機(jī)器人和旋翼飛行機(jī)器人,具有體積小、隱蔽性高和機(jī)動性強(qiáng)等多方面的優(yōu)勢。
隨著仿生學(xué)、機(jī)械制造、微納米加工、空氣動力學(xué)和智能控制等技術(shù)的進(jìn)一步發(fā)展,飛行機(jī)器人的研究引起越來越廣泛的關(guān)注,仿生撲翼飛行機(jī)器人技術(shù)也得到了進(jìn)一步的發(fā)展和提升[2]。微型化、智能化、集成化和集群化成為飛行機(jī)器人的發(fā)展趨勢和方向,飛行機(jī)器人能夠模仿鳥類和昆蟲的飛行方式,靈活地完成低空偵察、監(jiān)控以及搜索等任務(wù)。
國內(nèi)外研究團(tuán)隊己在仿生撲翼飛行機(jī)器人的飛行機(jī)理[3]、動力學(xué)分析[4-5]、撲翼機(jī)械結(jié)構(gòu)設(shè)計[6-10]、飛行控制方法[11-14]和機(jī)器人視覺[15]等方面取得了大量研究成果。其中,國外對撲翼飛行機(jī)器人開展研究較早,較多機(jī)構(gòu)進(jìn)行了撲翼飛行機(jī)器人系統(tǒng)的設(shè)計和研發(fā)工作。
2005 年,美國AeroVironment 公司開發(fā)的仿蜂鳥撲翼飛行機(jī)器人“Nano Hummingbird[16]”質(zhì)量約19 g,翼展約17 cm,能夠持續(xù)飛行11 min。
德國Festo 公司研制的一款翼展為50 cm 的仿生蝴蝶“eMotion Butterflies[17]”。其機(jī)翼骨架采用碳纖維材料,通過兩個獨立的伺服電機(jī)進(jìn)行機(jī)翼驅(qū)動與控制。
美國麻省理工學(xué)院的“Phoenix[18]”。寬大的柔性翼利用碳纖維棒構(gòu)成了一個三角形的結(jié)構(gòu),可提供300 W 的強(qiáng)大升力。該仿生撲翼飛行機(jī)器人可實現(xiàn)水平穩(wěn)定飛行,速度大約為4 m/s,能夠攜帶GPS 等多種傳感器。但其控制系統(tǒng)有待完善,只能以手持方式起飛,無法完成復(fù)雜飛控動作。
國內(nèi)關(guān)于撲翼飛行機(jī)器人的相關(guān)研究起步較晚,但自2000 年以來也取得了一定的發(fā)展和進(jìn)步[19-21]。
北京航空航天大學(xué)孫茂等[22]專注于空氣動力學(xué)相關(guān)原理研究,并揭示了昆蟲飛行時的非定常空氣動力機(jī)理。
西北工業(yè)大學(xué)[23-24]研制的“信鴿”仿鴿撲翼飛行機(jī)器人采用碳纖維材料搭建骨架,利用聚酯薄膜聚合物作為翼膜,翼展50 cm,質(zhì)量220 g,續(xù)航時間30 min。其在控制飛行方面,可實現(xiàn)自主起飛和航行,飛行機(jī)器人具有一定的抗風(fēng)能力,可應(yīng)用于救援和偵察等實際現(xiàn)場。
上海交通大學(xué)[25]研究了基于仿昆蟲飛行模式的數(shù)學(xué)建模,選取光刻膠SU-8 作為結(jié)構(gòu)材料,采用微機(jī)電加工技術(shù),設(shè)計了仿昆蟲微型撲翼飛行機(jī)器人。
北京科技大學(xué)[26]設(shè)計了“USTB-Dove”仿鳥撲翼飛行機(jī)器人,翼展70 cm,質(zhì)量220 g,可以通過手控或自控方式實現(xiàn)穩(wěn)定飛行,續(xù)航時間為40 min。
從整體來看,國內(nèi)對于仿生撲翼飛行機(jī)器人的研究成果相對集中在理論研究方面,實物實驗平臺的搭建相對較少,仍具有較大的進(jìn)步空間。
飛行機(jī)器人集群編隊是指飛行機(jī)器人集群根據(jù)不同的任務(wù)需求,構(gòu)成一定的幾何形態(tài)來協(xié)作執(zhí)行任務(wù),同時對環(huán)境具有感知能力,能作出適應(yīng)性動態(tài)調(diào)整行為的多智能體系統(tǒng)。
群體模型通常來自自然界和生物集群,如鳥群、蟻群、獸群、魚群和粒子群等。集群智能系統(tǒng)由一群簡單的個體組成,個體按照相關(guān)規(guī)則在彼此之間進(jìn)行信息交互,智能體也可以與環(huán)境進(jìn)行信息交互。群體智能在數(shù)量上表現(xiàn)為多數(shù)量,在群體層面表現(xiàn)為分散化、去中心化和自組織的群體特征。
總體來說,飛行機(jī)器人集群編隊研究內(nèi)容主要包括集群構(gòu)型設(shè)計與切換、控制與保持、路徑跟蹤、障礙規(guī)避等協(xié)作行為。飛行機(jī)器人集群編隊的研究仍處于探索階段。
集群系統(tǒng)比人工系統(tǒng)具有更優(yōu)越的自主性、協(xié)調(diào)性和智能性。隨著飛行任務(wù)復(fù)雜度的提升,對撲翼飛行機(jī)器人在大區(qū)域中執(zhí)行任務(wù)時的機(jī)動性、快速性和效率等性能提出了更高的要求,單撲翼機(jī)器人較難實現(xiàn)。在面對遠(yuǎn)距離、大環(huán)境信息量和高能量消耗等復(fù)雜任務(wù)時,撲翼飛行機(jī)器人集群具有感知信息量大、節(jié)省時間、作業(yè)效率高、群體能量消耗少和隱蔽性好等多方面優(yōu)勢,如圖1所示。
圖1 撲翼飛行機(jī)器人的技術(shù)優(yōu)勢Fig.1 Technical advantages of flapping-wing flying robot
仿生撲翼飛行機(jī)器人是以飛行鳥類為仿生對象,在仿生撲翼機(jī)器人集群飛行方面也需要從鳥類進(jìn)化的集群機(jī)理中得到啟發(fā)。通過陣型變換提升撲翼飛行機(jī)器人集群的搜索能力和環(huán)境避障能力,可以提升集群的任務(wù)執(zhí)行力。所以,撲翼飛行機(jī)器人集群在遠(yuǎn)距離軍事偵察、大范圍環(huán)境監(jiān)測、長時間災(zāi)難監(jiān)測等軍事或民用領(lǐng)域具有廣泛的應(yīng)用前景。
綜上所述,對仿生撲翼飛行機(jī)器人集群控制的研究,能夠很好地解決撲翼飛行機(jī)器人集群陣型選擇和變換的問題。利用集群控制,實現(xiàn)撲翼飛行機(jī)器人集群大范圍搜索、低空偵察和目標(biāo)覆蓋等復(fù)雜應(yīng)用任務(wù)。
現(xiàn)階段,由于固定翼飛行機(jī)器人和旋翼飛行機(jī)器人的控制技術(shù)發(fā)展相對成熟,集群編隊控制主要集中于上述兩類飛行機(jī)器人。相比之下,撲翼飛行機(jī)器人具有獨特的功能優(yōu)勢以及良好的仿生性能,其集群編隊作為一門前沿發(fā)展科學(xué),具有廣闊的應(yīng)用前景。
2014 年,匈牙利羅蘭大學(xué)Tamas Vicsek 團(tuán)隊[27]借鑒生物集群行為機(jī)理,在通信延遲、GPS丟失等情況下,利用10 架四旋翼飛行機(jī)器人完成了障礙物躲避、陣型穩(wěn)定保持和多目標(biāo)跟蹤等多項任務(wù)。2015 年,美國海軍研究院Timothy Chung團(tuán)隊[28]實現(xiàn)了50 余架固定翼飛行機(jī)器人的集群編隊飛行,利用無線自組織網(wǎng)絡(luò)進(jìn)行信息交互和共享。2018 年,美國國防預(yù)先研究計劃局設(shè)立的“小精靈”項目[29]通過集群內(nèi)部的信息收集與傳遞,協(xié)同破壞敵方防御系統(tǒng),執(zhí)行情報偵察與電子干擾攻擊等破壞性任務(wù)。
飛行機(jī)器人編隊飛行的主要目標(biāo)是驅(qū)動飛行機(jī)器人形成并保持固定陣型,其控制方法主要分為長機(jī)-僚機(jī)方法、基于行為方法、虛擬結(jié)構(gòu)方法和一致性方法。
傳統(tǒng)的長機(jī)-僚機(jī)方法主要由長機(jī)跟蹤預(yù)設(shè)軌跡,僚機(jī)與長機(jī)保持相對位置跟隨長機(jī)飛行。美國賓夕法尼亞大學(xué)Desai 團(tuán)隊[30]提出的長機(jī)-僚機(jī)改進(jìn)控制方案通過以上技術(shù)實現(xiàn)了無人飛行機(jī)器人在非GPS 定位環(huán)境中的集群編隊飛行?;谛袨榉椒ㄊ且环N通過定義飛行機(jī)器人幾種基本控制行為并對其進(jìn)行執(zhí)行和優(yōu)化的編隊控制方法。北京航空航天大學(xué)段海濱團(tuán)隊[31]提出了一種基于鴿群層級群聚特性的集群控制方法,并通過多無人飛行機(jī)器人對該集群控制方法進(jìn)行了仿真驗證。國防科技大學(xué)王祥科團(tuán)隊[32]針對大規(guī)模固定翼無人機(jī)集群的編隊控制問題,提出了一種分層分組控制方法,并通過100 架固定翼無人機(jī)集群的全流程數(shù)值仿真,驗證了集群控制方法的有效性。西北工業(yè)大學(xué)符小衛(wèi)團(tuán)隊[33]針對切換拓?fù)浣Y(jié)構(gòu)下的集群編隊控制問題,設(shè)計了只需個別無人機(jī)獲取虛擬長機(jī)信息也能保證集群連通性的編隊控制算法,并進(jìn)行了仿真實驗,驗證了算法的有效性。日本慶應(yīng)大學(xué)Kuriki 教授團(tuán)隊[34]結(jié)合模型預(yù)測控制和一致性控制方法,成功進(jìn)行了無人飛行機(jī)器人自主防碰撞的編隊飛行實驗。
以上幾種飛行機(jī)器人集群控制方法各有其特點和適應(yīng)場合,基于行為的控制方法符合人工智能的發(fā)展思路,設(shè)計合理的機(jī)器人集群行為,可有效實現(xiàn)集群的智能控制。
根據(jù)無人機(jī)的資源利用和作戰(zhàn)任務(wù)不同,飛行機(jī)器人集群的任務(wù)通常分為以下三類:(1)訪問任務(wù);(2)打擊任務(wù);(3)察打一體任務(wù)。其中,訪問任務(wù)具體包括三種任務(wù)類型:(1)覆蓋任務(wù);(2)搜尋作業(yè);(3)評估任務(wù)。
無人機(jī)群訪問任務(wù)是在滿足偵測設(shè)備與能量約束的情況下,通過對機(jī)器人集群進(jìn)行合理的任務(wù)分配,有效搜索、覆蓋或評估訪問目標(biāo), 實現(xiàn)訪問收益最大化的過程。飛行機(jī)器人集群覆蓋任務(wù)是對局部目標(biāo)進(jìn)行連續(xù)監(jiān)視和對特定區(qū)域的探測搜尋[35]。根據(jù)任務(wù)的執(zhí)行策略不同,可以將其歸類為行為式覆蓋和非行為式覆蓋[36]。行為式覆蓋策略是基于某種飛行機(jī)器人行為,優(yōu)化各機(jī)器人的方向和飛行時間,以實現(xiàn)對任務(wù)區(qū)域最大化覆蓋的目的,如圖2所示。
圖2 飛行機(jī)器人覆蓋任務(wù)的優(yōu)化策略Fig.2 Optimization strategy of flying robot covering tasks
搜索覆蓋率就是飛行機(jī)器人在搜索過程中覆蓋的區(qū)域面積與區(qū)域總面積的比值。搜索覆蓋率可按搜索面積或搜索點來進(jìn)行計算,如圖2(a)所示。圖中,將飛行機(jī)器人需要覆蓋的面積進(jìn)行網(wǎng)格化的處理,得到了6 × 10 個網(wǎng)格單元,飛行機(jī)器人從初始點(1,1)開始進(jìn)行基于行為的巡航覆蓋,直到完成覆蓋任務(wù),停止于坐標(biāo)點(3,9),共對6 × 10 網(wǎng)格區(qū)域的42 個子區(qū)域進(jìn)行了巡檢覆蓋。因此,基于行為的覆蓋策略,其搜索覆蓋率為42/60 × 100% = 70%。而以豎“一”字形編隊通過搜索覆蓋區(qū)域,其覆蓋率為編隊覆蓋區(qū)域/總搜索面積,覆蓋率為6/60 ×100%=10%。
避障通過率就是飛行機(jī)器人編隊在面對寬敞或狹窄等不同飛行通道環(huán)境的情況下,其飛行編隊根據(jù)自身隊形實現(xiàn)的障礙環(huán)境通過飛機(jī)數(shù)量與總飛機(jī)數(shù)量的比值。如圖3 所示,飛行機(jī)器人編隊以豎“一”字形編隊通過最大通過寬度為一架飛行機(jī)器人的障礙環(huán)境時,其障礙通過率為100%,而當(dāng)飛行機(jī)器人編隊以橫“一”字形編隊通過最大通過寬度為一架飛行機(jī)器人的障礙環(huán)境時,其障礙通過率為1/5 × 100%=20%。因此,可以看出,基于行為的覆蓋搜索策略有較高的搜索效率。
圖3 飛行機(jī)器人集群編隊隊形變換和飛行任務(wù)場景示意圖Fig.3 Schematic diagram of formation transformation and flight mission scenario of flying robot cluster
針對開放的非結(jié)構(gòu)化的區(qū)域進(jìn)行環(huán)境監(jiān)測,飛行機(jī)器人集群可利用單機(jī)間的信息交互和合作,達(dá)到監(jiān)測區(qū)域的動態(tài)變化,形成快速響應(yīng)。對于空間搜尋、區(qū)域覆蓋與監(jiān)測等任務(wù),機(jī)器人集群都是非常好的解決方法。
雁群每年會隨著季節(jié)變化而進(jìn)行大規(guī)模遷徙,在遷徙過程中,雁群會以“V”字陣型或“一”字陣型進(jìn)行編隊排布,在保持穩(wěn)定隊形基礎(chǔ)上,借助集群陣型提升群體的障礙通過性和飛行效率。
單架撲翼飛行機(jī)器人在執(zhí)行長距離偵察、巡邏以及多目標(biāo)搜索等任務(wù)時,通常會出現(xiàn)續(xù)航不足的問題。利用雁陣的不同隊形,可實現(xiàn)撲翼飛行機(jī)器人集群的大范圍空間搜索、巡檢和覆蓋任務(wù),“一”字陣型有利于提升集群的障礙通過率和安全性,“人”字和“V”字陣型有利于提升集群巡檢的搜索覆蓋率,提升巡檢任務(wù)的作業(yè)效率,如圖3所示。
2.1.1 單仿生撲翼飛行機(jī)器人模型與控制
為方便仿生撲翼飛行機(jī)器人模型建模和控制器設(shè)計,在假設(shè)地面坐標(biāo)系為慣性坐標(biāo)系的條件下,通過拉格朗日建模方法,可以得到仿生撲翼飛行機(jī)器人的非線性動力學(xué)模型
式中,qi=[qtiT,qriT]T=[xiyiziαiβiγi]T表示撲翼飛行機(jī)器人的位置及姿態(tài)狀態(tài)向量。
L表示一個使等式成立的矩陣。旋轉(zhuǎn)矩陣RIB=(RIB)-1=CB2C21C1I通過三個旋轉(zhuǎn)矩陣得到
式中,χ,α,γ表示機(jī)體坐標(biāo)系下的姿態(tài)信息量。
在主要考慮撲翼飛行機(jī)器人位置跟蹤的情況下,通過將式(1)進(jìn)行分解可得位置回路動力學(xué)模型
qt=[x,y,z]T表示撲翼飛行機(jī)器人在慣性坐標(biāo)系下的位置向量,τt表示位置控制輸入量。
2.1.2 仿生撲翼飛行機(jī)器人編隊陣型排布與集群模型
陣型切換思想主要源于大雁長途遷徙現(xiàn)象:雁群在整個遷徙過程中,會以“V”字陣型飛行實現(xiàn)整體能量優(yōu)化,同時也會根據(jù)環(huán)境變化隨時改變?nèi)后w陣型,可將雁陣變換思想應(yīng)用于撲翼飛行機(jī)器人集群,以提升飛行機(jī)器人集群的巡檢能力和效率。
按照“V”字陣型排布,第三排的撲翼飛行機(jī)器人與第一排的撲翼飛行機(jī)器人之間的橫向距離為πb/2,縱向距離為4b,垂直距離不變,對應(yīng)的最大升力和阻力變化量分別為ΔL'= 0.0113 N 和ΔD'= 0.0018 N。
由于ΔL'?ΔL以及ΔD'?ΔD,在陣型分析過程中只考慮前排撲翼飛行機(jī)器人對其最近后排撲翼飛行機(jī)器人的影響。前排飛行的撲翼飛行機(jī)器人產(chǎn)生的翼尖渦流方向主要為機(jī)翼的正后方,同排飛行的撲翼飛行機(jī)器人之間的橫向距離為πb/2,其對應(yīng)的升阻力變化值同樣遠(yuǎn)小于ΔL和ΔD,如圖4所示。
圖4 撲翼飛行機(jī)器人集群編隊陣型Fig.4 Flapping wing flying robot cluster formation
在穩(wěn)定飛行情況下,通過拉格朗日建模方法,可以得到仿生撲翼飛行機(jī)器人集群位置回路的非線性動力學(xué)模型
式中,qi=[qtiT,qriT]T=[xiyiziαiβiγi]T表示第i個撲翼飛行機(jī)器人的位置向量,Mti表示慣性矩陣,Gti=[0,0,-mig]T表示第i個撲翼飛行機(jī)器人的重力向量,τti=[τix,τiy,τiz]T表示第i個撲翼飛行機(jī)器人的控制輸入量,uti表示第i個撲翼飛行機(jī)器人在翼尖渦流影響下受到的額外升阻力向量,當(dāng)i為“長機(jī)”時uti=0,F(xiàn)ti=[-Fxi,F(xiàn)yi,F(xiàn)zi]T表示第i個撲翼飛行機(jī)器人在三軸方向所受到的阻力、側(cè)向力與升力。第i個撲翼飛行機(jī)器人的旋轉(zhuǎn)矩陣RiBI通過式(3)~(5)所示的三個旋轉(zhuǎn)矩陣得到。在此僅考慮偏航角γ為統(tǒng)一變化值,橫滾角χ和俯仰角α為固定值的情況。
2.2.1 仿生運(yùn)動行為綜述
仿生學(xué)誕生于上個世紀(jì)60 年代,仿生技術(shù)是在研究生物體、生命系統(tǒng)等結(jié)構(gòu)與功能原理的基礎(chǔ)上,根據(jù)這些生命特征原理形成的先進(jìn)技術(shù)和應(yīng)用。
生物行為就是具有某些特征的生物動作序列和集合。而機(jī)器人行為與生物行為類似,通過仿生運(yùn)動行為控制將機(jī)器人的特征行為進(jìn)行精確的建模和應(yīng)用。
在20 多年的發(fā)展過程中,多機(jī)器人編隊控制形成了多種具有代表性的研究方法[37-41],包括領(lǐng)航-跟隨法、基于行為的方法、人工勢場法和虛擬結(jié)構(gòu)法等?;谛袨榈姆椒ㄝ^為形象并易于理解,在機(jī)器人導(dǎo)航、編隊與協(xié)作、機(jī)器人足球和人機(jī)交互等方面獲得了廣泛的應(yīng)用。
上世紀(jì)80 年代,美國麻省理工學(xué)院的Rodney Brooks[42]提出了機(jī)器人行為控制方法和包容式的體系結(jié)構(gòu),將行為引入到機(jī)器人研究中。2004 年,Naffin等在協(xié)作、通信、運(yùn)動、編隊保持和傳感等方面為多機(jī)器人編隊設(shè)計了16 種行為,以執(zhí)行和完成編隊任務(wù)[43]。2009 年,Ray 等為多機(jī)器人編隊設(shè)計的分布式行為選擇機(jī)制,取決于編隊開始時處于領(lǐng)航者地位的機(jī)器人的初始狀態(tài)[44]。
在國內(nèi),經(jīng)過多年的積累,也形成了一系列的多撲翼飛行機(jī)器人集群編隊控制算法的研究成果[45-51]。2021 年,北京航空航天大學(xué)段海濱等研究了鴿群導(dǎo)航行為模型,探索了信鴿歸巢多種復(fù)雜行為學(xué)的內(nèi)在機(jī)理。信鴿歸巢導(dǎo)航過程呈現(xiàn)出了三個階段:(1)Map-and-Compass 階段,信鴿處于高熵狀態(tài),對應(yīng)依靠地圖羅盤的導(dǎo)航行為;(2)Leg Length 階段,信鴿處于中熵狀態(tài),對應(yīng)飛行中重定向期間的導(dǎo)航行為;(3)Immediate Home階段,信鴿處于低熵狀態(tài),對應(yīng)鴿子在鴿房附近快速歸巢的行為。
2.2.2 仿生運(yùn)動行為控制核心思想和理論模型
仿生行為控制的核心思想就是把底層的具體運(yùn)動細(xì)節(jié)交給執(zhí)行機(jī)構(gòu),控制系統(tǒng)高層只負(fù)責(zé)整體運(yùn)動規(guī)劃。在傳統(tǒng)的遙操作機(jī)器人控制系統(tǒng)中,期望軌跡在機(jī)器人核心控制器中生成,并對期望軌跡采樣,以對機(jī)器人進(jìn)行實時的運(yùn)動控制,對于操作者來說工作量較大。
基于仿生運(yùn)動行為的控制系統(tǒng)架構(gòu)不再傳輸離散的軌跡采樣點和基礎(chǔ)數(shù)據(jù),而是直接傳輸參數(shù)化的軌跡函數(shù)。參數(shù)化的軌跡函數(shù),是指利用變換函數(shù),把軌跡映射到一些定義的運(yùn)動行為函數(shù)上,通過對行為函數(shù)的線性組合就可以還原參考軌跡。通信系統(tǒng)只需要傳輸幾個運(yùn)動行為函數(shù)參數(shù),即可實現(xiàn)軌跡控制。在這種架構(gòu)下,通信傳輸量將大幅下降而控制精度卻能夠得到保證。
仿生運(yùn)動行為控制框架的系統(tǒng)結(jié)構(gòu)如圖5 所示。仿生行為控制字母表中的行為函數(shù)為二元組f=(v,γ)T的形式,允許每個行為函數(shù)在一個任意長的時間段內(nèi)執(zhí)行。在仿生行為控制系統(tǒng)結(jié)構(gòu)中,機(jī)器人控制器可進(jìn)行路徑規(guī)劃和機(jī)器人的軌跡生成,并通過仿生行為生成器生成仿生行為序列。隨后,將運(yùn)動行為序列發(fā)送給運(yùn)動行為解析器,以控制機(jī)器人執(zhí)行機(jī)構(gòu),來完成機(jī)器人的路徑規(guī)劃和作業(yè)任務(wù)。
圖5 仿生運(yùn)動行為控制理論框架的控制系統(tǒng)結(jié)構(gòu)Fig.5 Control system configuration of BCBC framework
在仿生運(yùn)動行為控制框架下,用運(yùn)動機(jī)對機(jī)器人系統(tǒng)進(jìn)行建模,用以描述機(jī)器人在離散時間接收仿生運(yùn)動行為命令并產(chǎn)生連續(xù)運(yùn)動的特征。仿生運(yùn)動行為控制的模型稱為運(yùn)動狀態(tài)機(jī)模型,就是生成從狀態(tài)空間到輸出空間的映射關(guān)系模型,其狀態(tài)方程為
式中,x,y和u為時間變量的矢量函數(shù),G為矩陣,h和k是矢量空間之間的映射。
二元組(fi,ψi)稱為“行為函數(shù)”,由這些二元組構(gòu)成的集合稱為“字母表”。機(jī)器人控制程序表示為由字母表中的行為函數(shù)構(gòu)成的符號串的形式。如果運(yùn)動機(jī)的初始狀態(tài)為x0=x(t0),在接收到符號串(f1,ψ1,T1)(f2,ψ2,T2)…(fn,ψn,Tn)后,其運(yùn)動規(guī)律可以描述為
式中,u、x、y均是時間t的函數(shù)。u是連續(xù)輸入控制函數(shù)。x是n維系統(tǒng)狀態(tài)函數(shù)。y是一個系統(tǒng)輸出函數(shù)。k是狀態(tài)反饋。
(f1,ψ1)行為函數(shù)含義實例說明如下:
當(dāng)飛行機(jī)器人以前進(jìn)方向趨近于期望直線時,飛行機(jī)器人方位角θ將趨向于期望直線的角度β,行為函數(shù)(f1,ψ1)中相應(yīng)的符號定義為
式中,v0為常數(shù),k1和k2是控制增益常數(shù),β為給定直線的傾角。
ψ1是定義在機(jī)器人輸出空間上的函數(shù),取值為整數(shù)值,即ψ1:Y->Z,用于確定下一采樣周期內(nèi)將要執(zhí)行的行為函數(shù)相對于當(dāng)前行為函數(shù)的位置。
(f2,ψ2)和(f3,ψ3)的符號定義和函數(shù)說明參考(f1,ψ1)。根據(jù)以上行為函數(shù)的定義,可以得到實現(xiàn)飛行機(jī)器人位姿鎮(zhèn)定的運(yùn)動字母表
將一個連續(xù)系統(tǒng)分段表示,然后將每一段用參數(shù)化的運(yùn)動行為函數(shù)(f,ψ)表達(dá),就可以用一串離散的符號序列來驅(qū)動一個連續(xù)系統(tǒng)。在仿生行為控制框架下,從初始時刻開始,仿生運(yùn)動行為編譯器接收到一個運(yùn)動行為函數(shù)的序列,隨后編譯器將這個序列翻譯成分段映射。仿生行為過程用運(yùn)動行為函數(shù)表達(dá),將行為構(gòu)成的符號串用于運(yùn)動規(guī)劃。
微型撲翼飛行機(jī)器人實驗系統(tǒng)由飛行機(jī)器人本體和地面控制單元兩大部分組成。撲翼飛行機(jī)器人機(jī)身本體系統(tǒng)由高強(qiáng)度碳纖維機(jī)身、X 型翼、機(jī)載微型電路板、微型電機(jī)和傳動機(jī)構(gòu)等組部件構(gòu)成。
撲翼飛行機(jī)器人集成了MEMS 工藝的仿生彈性翼,X 型翼在工程上較易實現(xiàn),可實現(xiàn)翅翼單自由度上、下?lián)鋭?。撲翼飛行機(jī)器人翼展14 cm,可連續(xù)穩(wěn)定飛行13 min 以上,質(zhì)量僅有6 g,如圖6(a)所示。飛行機(jī)器人機(jī)身可安裝陀螺儀等傳感器,可實現(xiàn)撲翼飛行機(jī)器人的自平穩(wěn)飛行、轉(zhuǎn)彎和避障等飛行功能。
圖6 撲翼飛行機(jī)器人結(jié)構(gòu)及地面控制站和圖傳單元Fig.6 Flapping-wing flying robot structure, ground control station and image transmission unit
地面控制單元裝置包括接收天線、線路放大器、計算機(jī)等結(jié)構(gòu)組部件。撲翼飛行機(jī)器人地面控制單元如圖6(b)所示,其控制手柄包括四個方向按鍵和加減速按鍵,通過天線將控制單元的數(shù)據(jù)級和行為級指令發(fā)送給撲翼機(jī)器人,同時可將撲翼機(jī)器人狀態(tài)信息和機(jī)器人視覺信息回傳給地面控制單元。地面控制和接收單元主要用來接收機(jī)器人機(jī)載信息和視覺傳感器實時回傳的信息,并將數(shù)據(jù)和信息進(jìn)行記錄和存儲。
撲翼飛行機(jī)器人單機(jī)可利用機(jī)載視覺進(jìn)行導(dǎo)航,撲翼飛行機(jī)器人的載荷可達(dá)5 g。圖傳模塊利用模擬圖傳,頻率為5.8 GHz,質(zhì)量僅為2 g,可實現(xiàn)圖片與視頻的高速、高帶寬傳輸。撲翼飛行機(jī)器人的載荷能力完全能夠承載圖傳單元等載荷。導(dǎo)航實驗方面,在室內(nèi)進(jìn)行撲翼飛行機(jī)器人三機(jī)的初步編隊飛行實驗,三機(jī)編隊飛行利用地面控制器來對三撲翼飛行機(jī)器人進(jìn)行飛行機(jī)器人本體驗證和編隊初步驗證。
撲翼飛行機(jī)器人實驗環(huán)境如圖7所示,利用兩根豎桿和桿連接線纜來模擬線纜巡檢任務(wù)和作業(yè)環(huán)境。通過設(shè)計實驗,以七架撲翼飛行機(jī)器人編隊為實驗研究對象,在集群編隊“人”字形到“V”字形的轉(zhuǎn)換、“人”字形到“一”字形的轉(zhuǎn)換、編隊避障與掉頭控制和編隊手動控制與仿生行為控制等多種情況下進(jìn)行實驗研究,以驗證仿生集群行為控制方法的有效性。
圖7 微型撲翼飛行機(jī)器人集群飛行實驗Fig.7 Cluster flight experiment of micro flapping-wing flying robot
飛行機(jī)器人編隊的“人”字形定義為飛行機(jī)器人頭機(jī)處于飛行方向的中間最前列,其他飛行機(jī)器人在頭機(jī)的側(cè)后方依次后向排列,如圖4 所示為人字形排列。而“V”字形排列為飛行機(jī)器人編隊頭機(jī)處于飛行方向的中間最后列,其他飛行機(jī)器人在頭機(jī)的側(cè)前方向依次排列,為“人”字形排列的反方向陣型。橫“一”字形為多飛行機(jī)器人沿著飛行方向并行飛行。豎“一”字形為多飛行機(jī)器人沿著飛行方向前后跟隨飛行,形成豎向排列的陣型。
飛行機(jī)器人在X、Y和Z三維空間進(jìn)行軌跡運(yùn)動。飛行機(jī)器人的控制方式是給定了機(jī)器人的初始位置、機(jī)器人的運(yùn)動速度和空間控制角度,飛行機(jī)器人即可進(jìn)行飛行軌跡運(yùn)動。飛行過程中,可根據(jù)飛行機(jī)器人的位置、姿態(tài)和算法進(jìn)行編隊調(diào)整,以完成飛行機(jī)器人的作業(yè)任務(wù)。
微型撲翼飛行機(jī)器人飛行實驗如圖7所示,外圈藍(lán)色虛線為飛行機(jī)器人編隊的飛行軌跡方向曲線,實驗以三個撲翼飛行機(jī)器人為三角形編隊,形成了三角形飛行機(jī)器人編隊的陣型,如圖7 中藍(lán)色三角形隊形所示。撲翼飛行機(jī)器人的行為就是具有相似特征的機(jī)器人動作集合,如平面圓形飛行等,并且機(jī)器人行為與運(yùn)動行為函數(shù)符號相對應(yīng)。通過對多撲翼飛行機(jī)器人集群編隊特點進(jìn)行分析,結(jié)合鴿群三階段歸巢行為模型,將撲翼飛行機(jī)器人導(dǎo)航過程分為:(1)第一階段——高熵自然羅盤導(dǎo)航階段;(2)第二階段——中熵重定向?qū)Ш叫袨殡A段;(3)第三階段——低熵狀態(tài)快速歸巢行為階段。設(shè)計十一個行為函數(shù)和字母表對飛行機(jī)器人編隊進(jìn)行控制,其仿生集群行為函數(shù)如表1所示。
表1 飛行機(jī)器人空間運(yùn)動的仿生集群行為函數(shù)表Table 1 Function table of BCBC for flying robot space motion
實驗地面平臺的控制方式采用基礎(chǔ)行為集合:上、下、左、右,基于作業(yè)任務(wù)分析的機(jī)器人集群特征行為集合:編隊“V”字形變換f5、編隊避障f9、編隊掉頭運(yùn)動f10、編隊隊形保持f11…。(f1,ψ1)、(f2,ψ2)、(f3,ψ3)、(f4,ψ4)…中,f為機(jī)器人運(yùn)動狀態(tài)控制函數(shù),ψ為機(jī)器人運(yùn)動切換函數(shù)。
通過以上撲翼飛行機(jī)器人的行為規(guī)劃,可實現(xiàn)撲翼機(jī)器人的智能行為控制,無需根據(jù)撲翼機(jī)器人的飛行狀態(tài)和飛行環(huán)境實時發(fā)送控制命令,通過基于仿生運(yùn)動行為控制的智能控制策略可大量節(jié)省控制器實時控制的負(fù)荷,大量減少底層位置控制的壓力,基于集群行為的智能控制方法為人處于控制閉環(huán)的機(jī)器人遙操作提供了有力的控制解決方案。
撲翼飛行機(jī)器人機(jī)身上裝有微型陀螺儀用來記錄撲翼飛行機(jī)器人的姿態(tài)數(shù)據(jù)。飛行機(jī)器人陀螺儀的數(shù)據(jù)采用了四元數(shù)法,記錄數(shù)據(jù)如表2所示。
表2 撲翼飛行機(jī)器人陀螺儀數(shù)據(jù)表Table 2 Flapping-wing flying robot gyro data sheet
根據(jù)撲翼飛行機(jī)器人陀螺儀的姿態(tài)數(shù)據(jù),可以更多了解飛行機(jī)器人集群的姿態(tài)信息和數(shù)據(jù)信息,為撲翼飛行機(jī)器人集群控制提供了更多的硬件保證和數(shù)據(jù)支持。
利用豎桿和橫桿作為實驗場地的飛行標(biāo)記點位,實驗的目的是利用三撲翼飛行機(jī)器人的三角形編隊變換來驗證撲翼機(jī)編隊變換,以形成初步編隊變換驗證數(shù)據(jù)并進(jìn)行數(shù)據(jù)分析。以地面桿作為標(biāo)記點,利用地面控制臺對飛行編隊進(jìn)行加速和行為控制,實現(xiàn)正三角撲翼機(jī)器人編隊向倒三角飛行機(jī)器人編隊的陣型轉(zhuǎn)換。
根據(jù)以上仿生行為函數(shù)的定義和規(guī)劃,設(shè)計以下一些仿真實驗來驗證基于雁陣變換的撲翼飛行機(jī)器人集群行為控制的有效性。飛行機(jī)器人編隊軌跡生成實驗是仿真軟件實驗,本實驗考慮將撲翼飛行機(jī)器人簡化為三維智能體點,重點研究編隊的軌跡規(guī)劃、編隊軌跡和編隊通過率及避障等后續(xù)問題。
(1)“人”字形—V字形轉(zhuǎn)換
七個撲翼飛行機(jī)器人分別從各自的初始位置[七個坐標(biāo)點:(4,4);(4,0);(0,4);(4,2);(2,4);(4,-2);(-2,4)]出發(fā),機(jī)器人的運(yùn)動方向為與XOY平面呈45°的直線方向。然后,給七個撲翼飛行機(jī)器人發(fā)送隊形轉(zhuǎn)換行為函數(shù)指令,七個撲翼機(jī)器人經(jīng)過隊形轉(zhuǎn)換后,變成倒三角隊形,由原來的“人”字形編隊變?yōu)椤癡”字形編隊隊形。隨后發(fā)送隊形轉(zhuǎn)換行為函數(shù)結(jié)束命令,七個撲翼機(jī)器人繼續(xù)以“V”字形進(jìn)行勻速直線運(yùn)動,如圖8所示。
圖8 基于仿生集群行為控制的“人”字形轉(zhuǎn)換“V”字形運(yùn)動行為空間軌跡圖Fig.8 Space trajectory of “V” type movement behavior of “herringbone” type transformation based on BCBC
(2)“人”字形-橫“一”字形轉(zhuǎn)換
七個撲翼機(jī)器人分別從各自的初始位置出發(fā),機(jī)器人的運(yùn)動方向為與XOY平面呈45°的直線方向。隨后,給撲翼飛行機(jī)器人編隊發(fā)送仿生運(yùn)動行為控制指令,撲翼機(jī)器人編隊進(jìn)行隊形變換,變?yōu)闄M“一”字形隊形。隨后,撲翼機(jī)編隊繼續(xù)進(jìn)行勻速直線運(yùn)動,如圖9所示。
圖9 基于仿生集群行為控制的“人”字形轉(zhuǎn)換橫“一”字形運(yùn)動行為空間軌跡圖Fig.9 Space trajectory of “herringbone” type transformation “一” type movement behavior controlled by BCBC
由七個撲翼飛行機(jī)器人組成的集群編隊分別從初始位置出發(fā),沿與XOY平面呈45°的平面勻速飛行。隨后給撲翼機(jī)編隊發(fā)送仿生編隊行為變換指令,撲翼機(jī)編隊在調(diào)整成橫“一”字形后,集體旋轉(zhuǎn)90°,隊形變?yōu)樨Q“一”字形編隊。隊形調(diào)整結(jié)束后,以豎“一”字形繼續(xù)進(jìn)行勻速直線運(yùn)動,如圖10所示。
圖10 基于仿生集群行為控制的“人”字形轉(zhuǎn)換橫“一”字形運(yùn)動行為空間軌跡圖Fig.10 Spatial trajectory of “herringbone” type transformation horizontal “一” type movement behavior controlled by BCBC
如圖9所示,飛行機(jī)器人編隊以“人”字形通過最大通過寬度為一架飛行機(jī)器人的狹窄障礙通道時,其障礙通過率為14%。而“人”字形的飛行機(jī)器人編隊搜索覆蓋率較高,可達(dá)到70%以上。所以,飛行機(jī)器人編隊控制的策略是:在進(jìn)行搜索覆蓋任務(wù)的情形下,以“人”字形編隊可提升覆蓋率;而在通過狹窄通道任務(wù)情形下,以豎“一”字形編隊方式,可大大提升障礙通過率,如圖10所示。
(3)集群避障與掉頭行為
由七個撲翼機(jī)器人組成的集群編隊由初始位置出發(fā),沿與XOY平面呈45°的平面運(yùn)動,如圖11 所示。隨后給撲翼機(jī)編隊發(fā)送編隊避障行為指令,集群編隊在調(diào)整為橫“一”字形后,以90°角向下集體運(yùn)動,以完成90°角集群避障行為。
圖11 基于仿生集群行為控制的集群避障行為和掉頭行為空間軌跡圖Fig.11 Space trajectory of obstacle avoidance behavior and turning behavior of the cluster based on BCBC
隨后給撲翼機(jī)器人編隊發(fā)送編隊掉頭行為指令,集群在調(diào)整為橫“一”字形后,以掉頭180°角反向運(yùn)動,以完成集群掉頭避障行為,如圖11所示。
(4)編隊手動控制比較
通過將實驗的集群手動控制方式和仿生集群行為控制方式進(jìn)行對比來觀察其缺點和優(yōu)點。以手柄控制器控制的手動控制方式,操作者通過視覺進(jìn)行實時判斷,手動控制地面控制器存在抖動現(xiàn)象,飛行機(jī)器人飛行軌跡同樣存在隨機(jī)抖動。因此,飛行機(jī)器人編隊軌跡存在抖動和軌跡非連續(xù)運(yùn)動的不足,如圖12(a)所示,抖動軌跡放大如圖12(b)所示。抖動尺寸范圍為0.1~0.4 cm,抖動呈現(xiàn)隨機(jī)分布,均值在0.1~0.2 cm,運(yùn)動范圍在0~20 cm,在1cm 的范圍之內(nèi)抖動有1~7 次左右,也呈現(xiàn)隨機(jī)狀態(tài)。因此,抖動幅度占總運(yùn)動幅度比率12%左右。飛行機(jī)器人抖動相對較小,在可控范圍之內(nèi)。
圖12 基于手動控制與仿生集群行為控制的飛行機(jī)器人編隊的空間運(yùn)動軌跡對比圖Fig.12 Comparison of space motion trajectory of flying robot formation based on manual control and BCBC
手控方式需要操作者進(jìn)行實時判斷和操控,操作者工作量大且較易疲勞。而在仿生集群行為控制方式下,利用機(jī)器人半智能行為級指令進(jìn)行編隊控制,操作者只需進(jìn)行編隊監(jiān)控和少量編隊指令交互即可,大量節(jié)省了操作者的工作量,并且控制軌跡平滑,如圖12(c)所示。因此,基于仿生集群行為控制的多飛行機(jī)器人集群控制方法有明顯的算法優(yōu)勢。
通過以上集群編隊“人”字形到“V”字形的轉(zhuǎn)換、“人”字形到“一”字形的轉(zhuǎn)換、編隊避障與掉頭控制和編隊手動控制與仿生行為控制的多種情況的實驗比較和驗證,基于仿生集群行為控制的多撲翼飛行機(jī)器人集群控制方法,能夠有效地完成飛行機(jī)器人集群編隊控制的作業(yè)任務(wù)。
本文提出了基于雁陣變換的多微型撲翼飛行機(jī)器人集群編隊行為控制方法。針對多撲翼飛行機(jī)器人實驗任務(wù)定義了多個編隊行為控制函數(shù),實現(xiàn)了飛行機(jī)器人編隊的隊形轉(zhuǎn)換和避障行為控制。并以多撲翼飛行機(jī)器人搭建了實驗平臺系統(tǒng),通過“人”字形、“V”字形、“一”字形等典型雁陣陣型轉(zhuǎn)換、編隊避障掉頭和手動控制等多種情況下的實驗驗證,最終驗證了基于雁陣變換的多微型撲翼飛行機(jī)器人集群行為控制方法的可行性和有效性。與傳統(tǒng)的撲翼飛行機(jī)器人實時控制相比,控制工作量大幅降低。下一步的研究工作主要集中在以下兩個方面:(1)將蟻群、魚群等群體智能算法應(yīng)用于撲翼飛行機(jī)器人集群控制;(2)將機(jī)器人的視覺感知和環(huán)境建模應(yīng)用于撲翼飛行機(jī)器人集群,朝著群體智能和智能機(jī)器人集群感知的方向發(fā)展。