賈高偉, 王建峰
(國防科技大學(xué)空天科學(xué)學(xué)院, 湖南 長(zhǎng)沙 410073)
任務(wù)規(guī)劃是指在任務(wù)執(zhí)行過程中對(duì)個(gè)體工作狀態(tài)及使用方法或步驟的規(guī)劃及安排,遍布于社會(huì)生活諸多領(lǐng)域,幾乎所有社會(huì)系統(tǒng)的運(yùn)作都必須明確什么樣的任務(wù)該由什么樣的成員來完成。任務(wù)規(guī)劃理論是多類領(lǐng)域特殊任務(wù)規(guī)劃問題求解發(fā)展的結(jié)果。鑒于任務(wù)規(guī)劃之于群體運(yùn)行的重要意義,長(zhǎng)時(shí)間的研究使得該方面成果豐富。理論上講,任務(wù)規(guī)劃是一類多約束條件下的優(yōu)化問題,從任務(wù)規(guī)劃理論的發(fā)展歷程看,20世紀(jì)60年代以前,主要的理論模型包括線性規(guī)劃問題及單純形方法[1]、指派問題[2]及匈牙利法[3]、整數(shù)規(guī)劃問題[4]及分支定界方法[5]等經(jīng)典的任務(wù)分配理論。隨后受分布式系統(tǒng)發(fā)展的影響,任務(wù)規(guī)劃理論得到快速的發(fā)展,隨之而來的關(guān)鍵成果包括典型的0-1規(guī)劃模型[6]、圖論模型[7]、負(fù)載平衡模型[8]。20世紀(jì)80年代后,分布式智能任務(wù)規(guī)劃方法開始出現(xiàn),該類算法對(duì)數(shù)學(xué)模型的依賴很小,借鑒生物習(xí)性,逐步形成一類優(yōu)化方法。
無人機(jī)具有低成本、無人員傷亡、操作方便簡(jiǎn)單、靈活可靠等優(yōu)點(diǎn),近年來發(fā)展迅速,各式各樣的無人機(jī)層出不窮。結(jié)合日益發(fā)展的網(wǎng)絡(luò)信息技術(shù),促使了無人機(jī)集群的出現(xiàn)和高速發(fā)展。無人機(jī)集群技術(shù)已經(jīng)演化為航空工業(yè)的核心技術(shù)之一,表現(xiàn)出巨大的應(yīng)用潛力,尤其在軍事應(yīng)用領(lǐng)域。類似于其他社會(huì)系統(tǒng),無人機(jī)集群的任務(wù)規(guī)劃為無人機(jī)集群應(yīng)用的核心技術(shù),是指根據(jù)無人機(jī)集群的數(shù)量、要完成的任務(wù)及任務(wù)載荷情況的不同,對(duì)無人機(jī)集群所需完成的具體任務(wù)進(jìn)行預(yù)先設(shè)定與統(tǒng)籌管理,決定著無人機(jī)集群的應(yīng)用效能。因此,相關(guān)研究在全世界范圍內(nèi)得到了廣泛持續(xù)的關(guān)注。從復(fù)雜程度上講,無人機(jī)集群是由多無人機(jī)進(jìn)一步提升發(fā)展而來,無人機(jī)集群是多無人機(jī)的高階形式,二者的區(qū)別可以由表1來概括。
表1 無人機(jī)集群與多無人機(jī)的對(duì)比
無人機(jī)集群的靈活組織與運(yùn)用,離不開科學(xué)的體系架構(gòu)設(shè)計(jì),不同的架構(gòu)設(shè)計(jì)又牽引著不同的技術(shù)路線和方向,影響著無人機(jī)集群的任務(wù)規(guī)劃、協(xié)同決策與實(shí)際效益。概括來講,適合于無人機(jī)集群的控制架構(gòu)包括集中式、分布式、集散式等多類[9]。
(1) 集中式:該體系的確立源自“單無人機(jī)-多無人機(jī)-無人機(jī)集群”的發(fā)展思路,是當(dāng)前最直接、最成熟的集群架構(gòu)模式,無人機(jī)集群接受單個(gè)或多個(gè)中心控制。該體系架構(gòu)對(duì)無人機(jī)數(shù)據(jù)鏈帶寬、速率、功率以及可靠性提出了很高要求。
(2) 分布式:該體系類似于自然界生物集群,無人機(jī)之間地位平等,通過彼此信息交互,協(xié)同完成任務(wù)。該體系是一種朝“完全自主”方向發(fā)展的任務(wù)構(gòu)型,對(duì)無人機(jī)機(jī)間協(xié)同能力要求很高。分布式體系下各無人機(jī)單元之間的通信信息量較大.
(3) 集散式:該體系結(jié)合了集中式和分布式的優(yōu)點(diǎn),利用分布式自治與集中式協(xié)作相結(jié)合的方式,來解決全局控制問題。該體系符合現(xiàn)階段集群技術(shù)發(fā)展現(xiàn)狀,在可預(yù)見的今后一段時(shí)間,可能成為常態(tài)的實(shí)用化體系架構(gòu)。
鑒于任務(wù)規(guī)劃理論的多樣性以及無人機(jī)任務(wù)樣式的復(fù)雜性,截止目前,關(guān)于多無人機(jī)任務(wù)規(guī)劃技術(shù)的研究成果豐富[10],而無人機(jī)集群是多無人機(jī)的高階形式,對(duì)應(yīng)的任務(wù)規(guī)劃技術(shù)將呈現(xiàn)更為復(fù)雜的技術(shù)特征,本文擬針對(duì)近幾年無人機(jī)集群的研究現(xiàn)狀,從兩個(gè)角度歸納無人機(jī)集群任務(wù)規(guī)劃技術(shù)的發(fā)展特點(diǎn)和關(guān)鍵方向。
基于人類知識(shí)所建立起來的邏輯與規(guī)則,是實(shí)現(xiàn)多無人機(jī)任務(wù)規(guī)劃的重要渠道,沿襲了分層遞階的思想[10],從頂層規(guī)劃到分層逐步實(shí)施,降低了問題的復(fù)雜性。該思路符合人類社會(huì)管理的一般規(guī)律,易于理解,成果豐富。典型的任務(wù)規(guī)劃方法也秉承了這一思想。
概括地講,多無人機(jī)任務(wù)規(guī)劃的內(nèi)涵十分寬泛,可以包括但不限于任務(wù)目標(biāo)分配、航跡規(guī)劃、任務(wù)載荷規(guī)劃、數(shù)據(jù)鏈路規(guī)劃、應(yīng)急處置規(guī)劃等等。一般地,任務(wù)載荷規(guī)劃、數(shù)據(jù)鏈路規(guī)劃以及應(yīng)急處置規(guī)劃等功能相對(duì)獨(dú)立,對(duì)無人機(jī)集群屬性的依賴度不夠強(qiáng),比如有專用的傳感器使用規(guī)劃、鏈路配置規(guī)劃系統(tǒng)等。常見的做法是在無人機(jī)集群的任務(wù)分配與航跡規(guī)劃中將任務(wù)載荷、鏈路設(shè)置、安全飛行等因素作為規(guī)劃的約束條件。
因此,本文對(duì)多無人機(jī)(乃至無人機(jī)集群)任務(wù)規(guī)劃技術(shù)的介紹,主要從任務(wù)分配和航跡規(guī)劃兩個(gè)層次展開。任務(wù)分配與航跡規(guī)劃是無人機(jī)集群任務(wù)規(guī)劃中的關(guān)鍵環(huán)節(jié),決定了無人機(jī)集群執(zhí)行任務(wù)的時(shí)序關(guān)系,多無人機(jī)與多目標(biāo)之間的映射關(guān)系,單架無人機(jī)的可執(zhí)行航線等,確保無人機(jī)能夠安全適時(shí)地抵達(dá)任務(wù)區(qū)域并最大效能地完成任務(wù)。任務(wù)分配和航跡規(guī)劃共同奠定了無人機(jī)集群執(zhí)行任務(wù)的基本能力基礎(chǔ)。
無人機(jī)任務(wù)分配用于建立無人機(jī)與任務(wù)之間的關(guān)聯(lián)和映射關(guān)系,是多約束條件下的離散空間組合優(yōu)化問題,其實(shí)施的關(guān)鍵是建立可數(shù)學(xué)表達(dá)的目標(biāo)函數(shù)并有效地處理各項(xiàng)約束。本節(jié)從集中式任務(wù)分配和分布式任務(wù)分配兩個(gè)方面簡(jiǎn)要地歸納相應(yīng)的典型方法。
1.1.1 集中式任務(wù)分配典型方法
適合于多無人機(jī)集中式任務(wù)分配的數(shù)學(xué)模型主要包括:多旅行商問題(multiple traveling salesman problem, MTSP)[11],車輛路徑問題(vehicle routing problem, VRP)[12],多選擇背包問題(multiple choice knapsack problem, MCKP)[13],混合整數(shù)線性規(guī)劃(mixed integer linear programming, MILP)問題[14], 動(dòng)態(tài)網(wǎng)絡(luò)流優(yōu)化(dynamic network flow optimization, DNFO)模型[15],多處理器資源分配(multiple processors resource allocation, CMTAP)模型[16]等。這些模型一般可以推廣應(yīng)用于無人機(jī)集群,但隨著無人機(jī)數(shù)量和任務(wù)類型增多,分配問題的描述將變得愈加復(fù)雜。
集中式任務(wù)分配求解方法又可以分為最優(yōu)化方法和啟發(fā)式方法。其中,典型的最優(yōu)化方法如圖1所示。整數(shù)規(guī)劃(integer programming, IP)法通過建立目標(biāo)函數(shù)和約束條件的方法進(jìn)行求解,矩陣作業(yè)法[17]、單純型法、匈牙利法、分支定界法等是常見的IP法,這一方法也演變出一類混合整數(shù)線性規(guī)劃算法[13]。約束規(guī)劃(constraint programming, CP)法由變量集和約束集兩者組成,變量集內(nèi)的所有變量都有自己對(duì)應(yīng)的值域,是求解組合優(yōu)化問題的常用方法。圖論法通過圖示的方法把目標(biāo)和接收任務(wù)的對(duì)象特征表征出來[7],利用圖論法在任務(wù)和系統(tǒng)成員之間建立匹配,網(wǎng)絡(luò)流模型和偶圖匹配模型是經(jīng)典的圖論任務(wù)分配模型。一般而言,最優(yōu)化算法具有描述簡(jiǎn)潔、直接等特點(diǎn),可以靈活調(diào)整約束條件來求解實(shí)際問題,具有理論最優(yōu)解,但規(guī)模不宜過大,一般可用于無人機(jī)集群離線式任務(wù)分配。
圖1 部分最優(yōu)化方法分類
啟發(fā)式方法的基本思想是在算法時(shí)間和求解結(jié)果之間進(jìn)行調(diào)節(jié),在能夠接受的時(shí)間內(nèi)求得局部最優(yōu)解或滿意解,具體分類如圖2所示。
圖2 啟發(fā)式方法分類
在啟發(fā)式方法中,列表算法基于優(yōu)先權(quán)函數(shù)對(duì)任務(wù)處理次序進(jìn)行排列,隨后分發(fā)給各成員[18];聚類算法將任務(wù)作為一個(gè)簇進(jìn)行聚類,通過滿足任務(wù)簇與系統(tǒng)成員數(shù)達(dá)到一致[19]實(shí)現(xiàn)分配,兩者都有一定應(yīng)用。智能類算法的應(yīng)用相對(duì)比較普遍,尤其以遺傳算法、粒子群優(yōu)化(particle swarm optimization, PSO)算法、蟻群算法為多。這幾類算法通常具有較強(qiáng)的穩(wěn)定性,適合分布式計(jì)算機(jī)制、也能夠與多類其他算法結(jié)合,但缺乏嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)基礎(chǔ),沒有對(duì)應(yīng)的深刻的、具有普遍意義的理論分析,對(duì)其機(jī)理的數(shù)學(xué)解釋薄弱,也缺乏規(guī)范化的、針對(duì)算法優(yōu)化性能的評(píng)價(jià)準(zhǔn)則。盡管如此,這些方法及其改進(jìn)算法依然廣泛應(yīng)用于無人機(jī)任務(wù)分配。
1.1.2 分布式任務(wù)分配典型方法
分布式任務(wù)分配的典型模型主要包括多智能體決策理論、類市場(chǎng)機(jī)制(合同/競(jìng)拍)、分布式馬爾可夫、分布式約束等。多Agent理論[20]廣泛應(yīng)用于機(jī)器人領(lǐng)域,其中一致性問題是多智能體協(xié)同控制的根本問題。隨著應(yīng)用樣式的多樣化,多Agent理論衍生了很多分支,并取得了諸多成果,具體如圖3所示。
圖3 分布式任務(wù)分配模型及方法
針對(duì)智能體與不確定因素之間的矛盾,已有的常用算法包括博弈論方法[21]、分布式馬爾可夫法[22]、分布式貝葉斯方法[23]等。分布式約束可以形式化為一個(gè)約束網(wǎng),網(wǎng)中變量有各自離散值域,且各自約束相互聯(lián)系,求解過程即是求出變量的某個(gè)組合使得所有約束值相加獲得極值[24]。分布式約束也可以看作是多Agent理論的分支應(yīng)用。
類市場(chǎng)機(jī)制的方法是多無人機(jī)任務(wù)分配中應(yīng)用廣泛的一種分布式方法,其核心處理是防止沖突,對(duì)每個(gè)問題的求解采用通信協(xié)商的方式解決。合同網(wǎng)方法[25]由發(fā)布者和競(jìng)標(biāo)者兩個(gè)角色,由“招標(biāo)-投標(biāo)-中標(biāo)-確認(rèn)”4個(gè)交互階段組成。而拍賣法[26]則是將要拍賣的物品用公開競(jìng)價(jià)的方式轉(zhuǎn)賣給應(yīng)價(jià)最高者。一個(gè)拍賣主要由參與方、拍賣品、收益函數(shù)和應(yīng)價(jià)策略等要素組成。拍賣算法的演化算法也逐漸引起廣泛重視,如一致性包算法(consensus-based bundle algorithm, CBBA)[27]。
1.2.1 單機(jī)航跡規(guī)劃方法
航跡規(guī)劃的作用在于為每架無人機(jī)執(zhí)行所分配的任務(wù)建立可執(zhí)行的航跡安排,其本質(zhì)上是連續(xù)空間的路徑尋優(yōu)問題,是任務(wù)規(guī)劃分層遞階策略的底層實(shí)現(xiàn)。從航跡規(guī)劃的發(fā)展歷程看,已有的典型規(guī)劃方法可以分為基于路標(biāo)圖形的航跡規(guī)劃和基于格柵的航跡規(guī)劃等,此處進(jìn)行簡(jiǎn)要概括,具體如圖4所示。
圖4 部分適合于單無人機(jī)航跡規(guī)劃的典型方法
最優(yōu)控制法[28-29]是將航跡規(guī)劃問題看作非線性、帶有狀態(tài)約束和控制約束的控制問題,進(jìn)而求解得到符合實(shí)際飛行要求的規(guī)劃路徑。又可分為間接法和直接法,后者的應(yīng)用更廣,其利用數(shù)值化將最優(yōu)控制問題轉(zhuǎn)化為非線性規(guī)劃問題,典型代表有偽譜法[30]。
路標(biāo)圖形法本質(zhì)上是對(duì)規(guī)劃環(huán)境的采樣,是對(duì)規(guī)劃空間的一種壓縮處理[31-32];可以結(jié)合目標(biāo)與規(guī)劃空間的威脅等因素構(gòu)建多類型圖形,如Voronoi圖,概率路標(biāo)圖(probabilistic road map, PRM)[33],可視圖和快速擴(kuò)展隨機(jī)樹(rapidly exploring random tree, RERT)等[32],最后通過搜索算法得到合理路徑[34]。
柵格處理同樣是對(duì)連續(xù)規(guī)劃空間的離散化,由于現(xiàn)代數(shù)字地圖都是柵格化處理得到,因此基于柵格的航跡規(guī)劃方法發(fā)展迅速。A*算法是啟發(fā)式搜索算法,將搜索空間表示為網(wǎng)絡(luò)的形式,以網(wǎng)絡(luò)的中心點(diǎn)或頂點(diǎn)作為航跡點(diǎn),搜索鄰域內(nèi)代價(jià)函數(shù)值最小的航跡點(diǎn),從起始點(diǎn)逐步搜索至目標(biāo)點(diǎn),最后逆向回溯當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)完成航跡生成[35]。
利用優(yōu)化求解方法獲得航跡規(guī)劃方面,人工勢(shì)場(chǎng)法算法簡(jiǎn)明、實(shí)時(shí)性好、規(guī)劃速度快,在局部規(guī)劃和實(shí)時(shí)規(guī)劃領(lǐng)域應(yīng)用廣泛[36],但主要問題是在復(fù)雜環(huán)境中容易產(chǎn)生局部極小值,在障礙物附近抖動(dòng)或頻繁擺動(dòng)。智能類優(yōu)化法的優(yōu)點(diǎn)是算法求解對(duì)初始解狀態(tài)依賴較小,能夠漸近收斂于全局最優(yōu)解[37]。
在實(shí)際應(yīng)用中,上述多類算法也可互相借鑒與融合應(yīng)用,解決航跡規(guī)劃速度問題、動(dòng)態(tài)性問題、航跡與載荷使用耦合問題等[38],例如Haider等人針對(duì)多無人機(jī)搜索與營(yíng)救任務(wù),采用Dijkstra算法和人工勢(shì)場(chǎng)算法結(jié)合的方法,完成靜態(tài)和動(dòng)態(tài)規(guī)劃[39]。
1.2.2 多無人機(jī)協(xié)同航跡規(guī)劃
多無人機(jī)航跡規(guī)劃協(xié)同性的體現(xiàn),大多針對(duì)特定的目標(biāo)或者具體任務(wù)。例如,龐強(qiáng)偉[40]圍繞多無人機(jī)對(duì)多目標(biāo)的協(xié)同偵察,依據(jù)K-means聚類算法完成目標(biāo)集合的聚類,求解偵察序列,由偵察序列對(duì)應(yīng)生成各無人機(jī)的任務(wù)航跡。胡超芳[41]針對(duì)多無人機(jī)協(xié)同追蹤地面移動(dòng)目標(biāo)的問題,基于分布式預(yù)測(cè)控制架構(gòu),引入多無人機(jī)之間避碰約束,求解有限時(shí)域內(nèi)每架無人機(jī)的局部航跡。周德云[42]針對(duì)多無人機(jī)區(qū)域內(nèi)協(xié)同打擊任務(wù),強(qiáng)調(diào)“同時(shí)抵達(dá)”的時(shí)間和空間強(qiáng)約束環(huán)境,建立了基于多目標(biāo)優(yōu)化的航跡規(guī)劃方法。王道波等人[43]針對(duì)地面移動(dòng)目標(biāo),考慮了傳感器安裝姿態(tài)及有效觀測(cè)模型約束,建立了基于化學(xué)反應(yīng)優(yōu)化理論框架的啟發(fā)式多無人機(jī)航跡優(yōu)化策略,得到了具有更長(zhǎng)的目標(biāo)檢測(cè)時(shí)間的規(guī)劃方案。Shah[44]考慮無人機(jī)間觀測(cè)區(qū)域必須重疊、所有無人機(jī)同時(shí)抵達(dá)、無人機(jī)間滿足通信條件等約束,基于Pythagorean曲線完成了有障礙環(huán)境內(nèi)的多無人機(jī)航跡規(guī)劃。Ema[45]針對(duì)市區(qū)環(huán)境內(nèi)協(xié)同避障,通過無人機(jī)間的信息交互為其他無人機(jī)在線提供障礙信息,得到了一種基于人工勢(shì)場(chǎng)和全局規(guī)劃策略結(jié)合的多無人機(jī)航跡規(guī)劃策略。概括來看,多無人機(jī)航跡協(xié)同是由于所執(zhí)行任務(wù)之間的耦合性牽引多機(jī)之間的時(shí)空協(xié)同。
隨著無人機(jī)集群數(shù)量和任務(wù)樣式的增多以及協(xié)同性要求的提高,第1節(jié)闡述的多無人機(jī)任務(wù)分配典型方法適用性受限。無人機(jī)集群相對(duì)于多無人機(jī),在任務(wù)分配上面臨的新的重要挑戰(zhàn)包括:模型的合理性與應(yīng)用適應(yīng)性需進(jìn)一步拓展、任務(wù)分配的求解速度與動(dòng)態(tài)可塑性要求進(jìn)一步提升、亟需適應(yīng)信息的不完整與不確定性。上述3個(gè)主要挑戰(zhàn)對(duì)應(yīng)的科學(xué)問題如下。
2.1.1 分配模型的完善與復(fù)雜度之間的均衡
無人機(jī)集群數(shù)量規(guī)模的增大,要求求解算法的效率大為提升,這是分配模型需要完善的重要驅(qū)動(dòng)力。進(jìn)化類算法對(duì)數(shù)學(xué)模型依賴小,因而得到了持續(xù)研究和發(fā)展,對(duì)智能類算法的初始化、粒子編碼的改進(jìn)是常見的應(yīng)對(duì)思想。王婷[46]通過設(shè)計(jì)新的遺傳算子,對(duì)適應(yīng)度值進(jìn)行標(biāo)定,避免了傳統(tǒng)遺傳算法在最優(yōu)解附近擺動(dòng)的現(xiàn)象。沈林成[47]根據(jù)PSO算法離散化映射方式,將離散PSO(discrete PSO, DPSO)分為基于連續(xù)空間的DPSO和基于離散空間的DPSO兩類模型,能夠用于求解集群高維復(fù)雜離散優(yōu)化問題。朱德法[48]設(shè)計(jì)新的粒子群位置和速度更新過程。國博[49]對(duì)粒子分群處理與合并優(yōu)化。Hoang[50]對(duì)無人機(jī)航向角進(jìn)行粒子編碼等策略,都促使粒子群算法分配模型針對(duì)性優(yōu)化以能夠適應(yīng)大規(guī)模集群,加速了粒子收斂速度。此外,Vincent[51]和Ugur[52]結(jié)合硬件設(shè)備特點(diǎn),實(shí)現(xiàn)了遺傳算法、PSO算法以及蟻群算法的并行化處理,也提升了進(jìn)化速度。
無人機(jī)集群任務(wù)樣式的多樣性和特殊性,要求分配模型進(jìn)行針對(duì)性與適應(yīng)性拓展,結(jié)合任務(wù)屬性增加模型約束條件并維持求解復(fù)雜度是常見的處理思想。張耀中[53]針對(duì)不同偵察能力的無人機(jī)集群多任務(wù)區(qū)協(xié)同偵察,將達(dá)到時(shí)間作為強(qiáng)約束,結(jié)合分布式拓展一致性束算法,在多項(xiàng)式時(shí)間復(fù)雜度的層面實(shí)現(xiàn)了遍歷偵察任務(wù)規(guī)劃。林君燦[54]針對(duì)偵察/控制/打擊/評(píng)估一體化無人機(jī)集群作戰(zhàn)應(yīng)用,在分配模型中增加時(shí)間窗約束,并利用混合整數(shù)線性規(guī)劃算法實(shí)現(xiàn)了集群離線式任務(wù)分配。嚴(yán)飛[55]針對(duì)多無人機(jī)協(xié)同搜索和同時(shí)攻擊的任務(wù)約束,引入?yún)f(xié)同粒子群、協(xié)同函數(shù)、協(xié)同變量,并結(jié)合合同網(wǎng)模型實(shí)現(xiàn)任務(wù)分配。羅德林[56]針對(duì)大規(guī)模無人機(jī)集群對(duì)抗任務(wù),引入了規(guī)避不利目標(biāo)、支援處于劣勢(shì)友機(jī)的功能約束,結(jié)合分布式博弈決策模型,實(shí)現(xiàn)了群對(duì)群對(duì)抗中的目標(biāo)分配。Khaled[57]針對(duì)森林著火點(diǎn)監(jiān)視與探測(cè),引入無人機(jī)間沖突規(guī)避約束,以及無人機(jī)控制參量化、時(shí)間離散化等建模策略,豐富對(duì)無人機(jī)單機(jī)控制模型的描述,實(shí)現(xiàn)著火點(diǎn)目標(biāo)的分配。
2.1.2 求解空間劇增條件下的快速收斂?jī)?yōu)化
滿足多目標(biāo)條件下的共同優(yōu)化是應(yīng)對(duì)協(xié)同等級(jí)提高的新需求,無人機(jī)集群多目標(biāo)任務(wù)分配使得求解空間大幅擴(kuò)增。以智能類優(yōu)化算法為例,加速進(jìn)化進(jìn)程和結(jié)構(gòu)化減小解空間是常見的快速收斂?jī)?yōu)化思想。Farid[58]針對(duì)無人機(jī)群對(duì)群對(duì)抗,在減少視場(chǎng)區(qū)域和滿足規(guī)避動(dòng)作的約束下,對(duì)比了多目標(biāo)PSO算法、改進(jìn)非劣分層多目標(biāo)遺傳算法(non-dominated sorting genetic algorithm version 2, NSGA2)[59]、強(qiáng)度Pareto算法(strength pareto evolutionary algorithm version 2, SPEA2)、多目標(biāo)進(jìn)化算法(multi-objective evolutionary algorithm, MOEA)等的任務(wù)規(guī)劃性能。施展[60]基于量子粒子群算法,通過將粒子高斯變異改為混沌變異,增加粒子群的遍歷性和隨機(jī)性,提升了多目標(biāo)分配收斂速度。王建峰[61]在量子粒子群算法中設(shè)計(jì)了多層編碼策略和約束調(diào)度方法,通過非支配解評(píng)估引導(dǎo)算法進(jìn)化,兼顧了收斂性和分布性。韓博文[62]基于量子粒子群算法,通過佳點(diǎn)集構(gòu)造產(chǎn)生初值解,基于量子變異和混沌因子拓展遍歷解空間,設(shè)置動(dòng)態(tài)慣性引導(dǎo)前期全局搜索、后期局部精細(xì)搜索,最終實(shí)現(xiàn)在保證遍歷性的基礎(chǔ)上加速進(jìn)化搜索。
實(shí)戰(zhàn)或者對(duì)抗背景下無人機(jī)集群的動(dòng)態(tài)調(diào)整導(dǎo)致求解空間增加,并迫切需要分配算法的快速收斂性。集群任務(wù)分配算法應(yīng)對(duì)動(dòng)態(tài)調(diào)整的直接思路是在原有任務(wù)方案基礎(chǔ)上對(duì)局部任務(wù)進(jìn)行重分配調(diào)整,當(dāng)前主要的處理思想是約束動(dòng)態(tài)重置對(duì)任務(wù)分配解空間產(chǎn)生非線性劇增。具體算法方面,Carlos[63]提出了一種通用的包括全局任務(wù)規(guī)劃和單智能體任務(wù)規(guī)劃的動(dòng)態(tài)分配架構(gòu),以全局規(guī)劃-局部調(diào)整的策略支持實(shí)時(shí)在線的任務(wù)調(diào)整。史豪斌[64]提出了基于迭代自組織數(shù)據(jù)分析技術(shù)算法(iterative self-organizing data analysis techniques algorithm, ISODATA)約束聚類的多無人機(jī)動(dòng)態(tài)任務(wù)分配方法,ISODATA是無監(jiān)督分類機(jī)器學(xué)習(xí)方法的一種,克服了K-means聚類方法需要人為設(shè)定K數(shù)值的不足,能夠動(dòng)態(tài)地進(jìn)行類的合并與分裂,最后得到滿足動(dòng)態(tài)性要求的任務(wù)方案。一致性競(jìng)拍算法(consensus-based auction algorithm, CBAA)和CBBA是基于市場(chǎng)競(jìng)拍策略的分布式任務(wù)分配算法[65],Noam[66]針對(duì)分布式時(shí)間敏感任務(wù),將CBBA與部分重規(guī)劃策略結(jié)合,通過改變?nèi)蝿?wù)重規(guī)劃過程中重置任務(wù)數(shù),在收斂速度和協(xié)調(diào)規(guī)模之間折衷,針對(duì)性重置最少的競(jìng)拍任務(wù),使得任務(wù)分配解空間同重置任務(wù)數(shù)和集群規(guī)模保持線性復(fù)雜度關(guān)系,在滿足任務(wù)約束的情況下大幅降低了運(yùn)算量。
2.1.3 信息不完整條件下的模糊度量和優(yōu)化分配
無人機(jī)集群的實(shí)戰(zhàn)對(duì)抗要求任務(wù)分配算法能夠在不確定因素(如態(tài)勢(shì)不明確、信息被阻滯、欺騙和干擾)存在的情況下完成高效的方案規(guī)劃。而集群數(shù)量規(guī)模的增大以及協(xié)同等級(jí)的提升,也放大了不確定因素的影響。該問題的關(guān)鍵處理思想是不確定度的建模與量化。陳俠[67]以目標(biāo)價(jià)值收益、毀傷代價(jià)以及航程代價(jià)的不確定信息為依據(jù),采用主觀賦值與客觀賦值相結(jié)合的方法確定指標(biāo)綜合權(quán)重,利用區(qū)間數(shù)表示不確定因素,建立了不確定多因素下多屬性任務(wù)分配模型,將離散粒子群算法與區(qū)間數(shù)排序方法相結(jié)合,適應(yīng)了不確定環(huán)境下的任務(wù)分配問題。任佳[68]提出了一種基于變結(jié)構(gòu)離散動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的決策模型,利用貝葉斯推理量化不確定度,得到當(dāng)前時(shí)刻的任務(wù)決策。Le[69]將無人機(jī)集群動(dòng)態(tài)環(huán)境下的非線性任務(wù)規(guī)劃問題轉(zhuǎn)換為差分凸函數(shù)規(guī)劃問題,并利用差分凸函數(shù)算法進(jìn)行求解。Alqahtani[70]針對(duì)多無人機(jī)偵察任務(wù),利用四叉樹表述不確定性,建立基于四叉樹和K部圖結(jié)合的分配架構(gòu),能夠在通信受限情況下完成任務(wù)分配。
結(jié)合第1.2.2節(jié)多無人機(jī)航跡協(xié)同技術(shù)現(xiàn)狀的論述可知,在充分的協(xié)同任務(wù)分配基礎(chǔ)上,任務(wù)規(guī)劃對(duì)于無人機(jī)集群航跡層面的邏輯協(xié)同要求降低。無人機(jī)集群任務(wù)對(duì)航跡規(guī)劃的核心要求體現(xiàn)為:精確的時(shí)間協(xié)同與空間沖突消解。精確的時(shí)間協(xié)同是任務(wù)協(xié)同分配方案得以實(shí)施的關(guān)鍵保障,而沖突消解則是無人機(jī)集群安全可靠應(yīng)用的基礎(chǔ)。需要說明的是,高精度的時(shí)間協(xié)同和空間沖突消解的應(yīng)用范圍不僅限于無人機(jī)集群,因此下文的闡述,著重于對(duì)兩類技術(shù)的現(xiàn)狀總結(jié)。
2.2.1 航跡的高精度時(shí)間協(xié)同
高精度時(shí)間協(xié)同條件下的航跡規(guī)劃演變?yōu)橛袝r(shí)間約束的路徑規(guī)劃,即4D路徑優(yōu)化問題。相關(guān)研究分為離散4D航跡規(guī)劃和連續(xù)4D航跡規(guī)劃。前者是以一系列離散的航路點(diǎn)來控制航跡形狀并為航路點(diǎn)設(shè)置到達(dá)時(shí)間,后者以位置和時(shí)間為變量,并采用連續(xù)數(shù)學(xué)表達(dá)式表述4D航跡時(shí)空關(guān)系。
離散4D航跡規(guī)劃方面,Chaimatanan[71]將航跡規(guī)劃轉(zhuǎn)換為混合元啟發(fā)式優(yōu)化問題,優(yōu)化航線和設(shè)定出發(fā)時(shí)間,實(shí)現(xiàn)了4D航跡設(shè)計(jì)。Antonio[72]通過對(duì)航路點(diǎn)設(shè)置時(shí)間屬性,基于調(diào)整飛機(jī)速度策略滿足時(shí)間要求。丁強(qiáng)[73]在Tau-H運(yùn)動(dòng)策略基礎(chǔ)上,利用PSO算法形成全局航跡預(yù)測(cè),隨后利用采樣間隔與沖突判斷雙驅(qū)動(dòng)的滾動(dòng)優(yōu)化方法,實(shí)現(xiàn)航跡不斷更新。周青[74]將到達(dá)時(shí)間偏差引入到A*算法中的估價(jià)函數(shù)中,不斷擴(kuò)展偏差最小的節(jié)點(diǎn),同時(shí)加入速度調(diào)整策略進(jìn)一步縮小時(shí)間誤差,滿足了到達(dá)時(shí)間要求。整體而言,離散4D航跡規(guī)劃方法具有直接、簡(jiǎn)便、規(guī)劃效率高的優(yōu)點(diǎn),但是忽略了航跡點(diǎn)之間速度變化的過渡過程,通常會(huì)導(dǎo)致航路規(guī)劃的靈活性及航線精度降低。
連續(xù)4D航跡規(guī)劃方面,Goerzen[75]運(yùn)用勾股速端曲線(pythagorean hodograph,PH)進(jìn)行航跡規(guī)劃,基于可變參數(shù)的矢量場(chǎng)中參數(shù)的調(diào)整,實(shí)現(xiàn)向終點(diǎn)的收斂以達(dá)到期望的4D協(xié)同。Antonio[76]和Bousson[77]基于3次至5次樣條曲線近似的方法,提出了搜索兩個(gè)連續(xù)航點(diǎn)之間最短軌跡的算法,在區(qū)域監(jiān)視的框架下實(shí)現(xiàn)了無人機(jī)的4D航跡規(guī)劃。概括地講,連續(xù)4D航跡規(guī)劃保證了時(shí)域的可微性和連續(xù)性,能夠提供更為光滑的航跡,且提供連續(xù)的速度和加速度,但通常航跡的表達(dá)式參數(shù)較多、形式復(fù)雜。
2.2.2 空間沖突消解
無人機(jī)集群飛行面臨空間沖突,盡管空間沖突的規(guī)避不完全由航跡規(guī)劃克服(控制層面也可發(fā)揮重要作用),但全面、有預(yù)案的無人機(jī)集群航跡規(guī)劃能夠大幅減小空間沖突概率。
在傳統(tǒng)的多機(jī)航跡規(guī)劃中,通常采用以安全飛行距離為半徑的“管道”來包圍航跡,保證多UAV之間不發(fā)生碰撞。這一處理思路同樣可以應(yīng)用到空間位置較為松散的無人機(jī)集群。無人機(jī)間沖突消解流程一般包括沖突的預(yù)判/檢測(cè)和基于規(guī)則的規(guī)避。在預(yù)判/檢測(cè)方面,可以分為基于幾何形狀的確定性方法和基于預(yù)測(cè)的概率性方法兩類,判決標(biāo)準(zhǔn)分別對(duì)應(yīng)于有其他物體進(jìn)入無人機(jī)安全保護(hù)區(qū)或者飛行器間沖突概率超過一定閾值[78-79]。沖突消解的典型策略可以分為基于航線、基于勢(shì)場(chǎng)、和模型轉(zhuǎn)化等3類,如圖5所示。
圖5 部分空間沖突消解典型方法
航線法沖突消解簡(jiǎn)單、直接,一般可以在時(shí)間維度消解,即調(diào)整無人機(jī)到達(dá)沖突位置時(shí)間;但在飛行器數(shù)量多、航線密集條件下應(yīng)用受限[80]。勢(shì)場(chǎng)法中定義無人機(jī)目標(biāo)為引力、空間沖突物為斥力,兩者合力作為無人機(jī)安全飛行方向,具有含義清晰、易于處理的特點(diǎn),但應(yīng)避免陷入局部極值。模型轉(zhuǎn)化類方法較為靈活、應(yīng)用廣泛,將沖突消解問題轉(zhuǎn)化為在線預(yù)測(cè)控制問題或博弈問題。魏瑞軒[81]提出了基于差分進(jìn)化(differential evolution,DE)算法和分布式模型預(yù)測(cè)控制(distributed model dictive control, DMPC)相結(jié)合的防碰撞控制策略,將編隊(duì)問題轉(zhuǎn)化為滾動(dòng)在線優(yōu)化問題,將碰撞約束納入代價(jià)函數(shù)。Kurik[82]將沖突消解轉(zhuǎn)化為基于一致性編隊(duì)控制問題。茹常劍[83]提出將無人機(jī)碰撞規(guī)避問題轉(zhuǎn)化為兩方博弈問題,建立了無人機(jī)間運(yùn)動(dòng)學(xué)模型,實(shí)現(xiàn)了基于認(rèn)知博弈制導(dǎo)的防碰撞方法[84]。Senthil[85]在無人機(jī)集群協(xié)同偵察應(yīng)用方面,將沖突消解轉(zhuǎn)化為速度空間的速度障礙問題,在保證偵察覆蓋范圍的條件下實(shí)現(xiàn)了無人機(jī)間動(dòng)態(tài)避障,其前提是假定無人機(jī)能夠在很大的范圍內(nèi)安全調(diào)整速度。
2.2.3 無人機(jī)集群航跡規(guī)劃的難點(diǎn)
整體來看,當(dāng)前有時(shí)間約束的路徑規(guī)劃以及多機(jī)間沖突消解方法的技術(shù)現(xiàn)狀尚不完全適應(yīng)于無人機(jī)集群。其一,無人機(jī)集群數(shù)量大、編隊(duì)密集等約束對(duì)連續(xù)4D航跡規(guī)劃的精確度和實(shí)時(shí)性提出了挑戰(zhàn)。其二,無人機(jī)集群數(shù)量大,以安全距離(區(qū)域)為約束的分割會(huì)限制集群的密集程度,基于概率的沖突檢測(cè)處理也面臨巨大計(jì)算壓力。其三,從時(shí)間維度看,無人機(jī)集群航跡可以存在交疊,當(dāng)任務(wù)類型或協(xié)同要求更復(fù)雜時(shí),基于局部調(diào)整的沖突消解容易引入新的沖突。滿足無人機(jī)集群應(yīng)用的航跡規(guī)劃問題仍需要持續(xù)關(guān)注和深入研究。
與秉承“自上而下”的思路研究集群技術(shù)相對(duì)應(yīng),“自下而上”思路研究集群技術(shù)也逐漸引起研究學(xué)者的廣泛興趣,該類技術(shù)的突出特點(diǎn)是對(duì)無人機(jī)集群的數(shù)量不敏感,而這一優(yōu)勢(shì)是“自上而下”式集群技術(shù)所缺乏的。
從生物、數(shù)學(xué)、計(jì)算機(jī)、控制、機(jī)器人等領(lǐng)域看,集群的出現(xiàn)和研究已經(jīng)歷時(shí)很久,對(duì)集群的關(guān)注重點(diǎn)包括自然界中的鴿群、魚群、蜂群、狼群等群居動(dòng)物[86],并不斷探索集群現(xiàn)象產(chǎn)生的原因及其衍生的工程應(yīng)用[87-88]。研究發(fā)現(xiàn),動(dòng)物集群一般具有臨近交互性、群體穩(wěn)定性、環(huán)境適應(yīng)性。動(dòng)物行為學(xué)表明可以通過個(gè)體間簡(jiǎn)單行為規(guī)則的合作產(chǎn)生復(fù)雜有序的集體行為。無人機(jī)集群技術(shù)的另一重要研究思路,即是基于生物集群行為的模仿,逐步向群體決策和認(rèn)知理論發(fā)展,最終實(shí)現(xiàn)飛行的智能、決策的智能,以及集群的智能。無人機(jī)飛行的智能化是實(shí)現(xiàn)無人機(jī)決策智能和集群智能的基礎(chǔ),而集群協(xié)同智能化的終極目標(biāo)是無人機(jī)集群的完全自主[89]。
Boid模型[90]、Vicsek模型[91-92]以及Couzin模型[93]是描述集群行為最為常見的3種模型。Boid模型于1986年由美國科學(xué)家Reynolds提出,基于靠近、對(duì)齊和避碰3條規(guī)則,假設(shè)每只鳥只能觀察到其周圍固定范圍內(nèi)的個(gè)體,就可以在計(jì)算機(jī)中復(fù)現(xiàn)出自然界中鳥類等動(dòng)物的集群現(xiàn)象、模擬其群體運(yùn)動(dòng)。Vicsek模型于1995年由匈牙利物理學(xué)家Vicsek及其合作者從統(tǒng)計(jì)力學(xué)的角度提出,通過改變?nèi)后w密度以及噪聲強(qiáng)度,對(duì)集群行為進(jìn)行定量分析。Conzin模型將個(gè)體的感知區(qū)域由內(nèi)而外分為排斥區(qū)域、對(duì)齊區(qū)域和吸引區(qū)域,3個(gè)區(qū)域互不重疊,分別對(duì)應(yīng)群體中分離、速度一致和聚集規(guī)則。這3類模型構(gòu)成了現(xiàn)有集群行為理論研究的重要基石,為后續(xù)集群研究提供必要的理論架構(gòu)、分析工具和方法支撐。近年來Jadbabaie[94], Tanner[95], Olfati-Saber[96]以及Levine[97]也提出了新的群集模型。
共識(shí)主動(dòng)性是生物群體中的一個(gè)核心概念:代表生物個(gè)體自治的信息協(xié)調(diào)機(jī)制,個(gè)體之間間接協(xié)調(diào),無需任何集中規(guī)劃以及直接通信即能完成復(fù)雜智能活動(dòng)。典型的例子是:螞蟻的大腦或基因中并沒有巢穴建造的計(jì)劃、組織和控制機(jī)制,個(gè)體間也沒有直接的交流,但是螞蟻個(gè)體通過識(shí)別其他螞蟻留下的信息素,達(dá)成共識(shí),共同完成了復(fù)雜和精致的蟻巢建造[98]。
在集群行為模擬與驗(yàn)證方面,Mataric[99]研制的The Nerd Herd系統(tǒng)被應(yīng)用在多機(jī)器人學(xué)習(xí)、群體行為、協(xié)調(diào)與協(xié)作等方面。James[100]基于“在多機(jī)器人上進(jìn)行并行算法運(yùn)算的復(fù)雜性度量項(xiàng)目”研制的多移動(dòng)機(jī)器人系統(tǒng),能夠開展大量多機(jī)器人行為協(xié)調(diào)算法設(shè)計(jì)以及性能預(yù)測(cè)研究。此外,典型系統(tǒng)還包括Kube[101]研制的 Collective Robotics系統(tǒng)以及Dorigo[102]開發(fā)的SWARM-BOTS系統(tǒng)。
實(shí)際的無人機(jī)集群系統(tǒng)方面,近年來引起廣泛關(guān)注的包括美國國防部高級(jí)研究計(jì)劃局(Defense Advanced Research Projects Agency, DARPA)支持的“小精靈”項(xiàng)目、美國海軍支持的“郊狼(LOCUST)”計(jì)劃、美國海軍參與研制的“山鶉”項(xiàng)目等[103],但這些項(xiàng)目的技術(shù)體制和方案細(xì)節(jié)并未公布。所見報(bào)道的其他無人機(jī)集群系統(tǒng)包括:匈牙利羅蘭大學(xué)Vicsek團(tuán)隊(duì)于2014年實(shí)現(xiàn)10架四旋翼飛機(jī)在室外的自主集群飛行[104-105],該項(xiàng)目在任務(wù)決策層利用了生物集群行為機(jī)制,四旋翼飛機(jī)與臨近個(gè)體之間進(jìn)行信息交互,實(shí)現(xiàn)了在全球定位系統(tǒng)(global positioning system, GPS)噪聲、通信延遲環(huán)境下的自主決策和穩(wěn)定飛行,包括區(qū)域內(nèi)碰撞規(guī)避、聚集、隊(duì)形保持和集群目標(biāo)跟蹤。Chung團(tuán)隊(duì)在2015年實(shí)現(xiàn)了一人控制50架固定翼飛機(jī)的集群飛行,無人機(jī)按照主從模式飛行,其工作重點(diǎn)是無人機(jī)操控權(quán)的轉(zhuǎn)移以及無人機(jī)自主飛行和決策[106]。
生物群體在去中心化、鄰近個(gè)體信息交互、整體自組織等方面的特點(diǎn)與無人機(jī)集群追求目標(biāo)一致,因此仿生研究是無人機(jī)集群任務(wù)規(guī)劃決策的重要研究方向之一[107-108]。對(duì)應(yīng)地,基于集群智能的無人機(jī)集群任務(wù)規(guī)劃的內(nèi)容包括但不限于威脅的判斷、目標(biāo)優(yōu)先權(quán)的排序、任務(wù)的動(dòng)態(tài)分配與調(diào)度、飛機(jī)航跡的規(guī)劃與任務(wù)載荷的協(xié)調(diào)等[109],且需要重點(diǎn)考慮多機(jī)之間邏輯與行為沖突消解?;诩褐悄苡楷F(xiàn)的無人機(jī)集群任務(wù)規(guī)劃的一般過程可以表述為:無人機(jī)個(gè)體收集并處理外界信息進(jìn)而更新個(gè)體知識(shí)以適應(yīng)環(huán)境,再同集群內(nèi)其他個(gè)體交互,完成經(jīng)驗(yàn)交互和社會(huì)學(xué)習(xí),實(shí)現(xiàn)共同進(jìn)化,并執(zhí)行復(fù)雜有序的集體行為[110]。而智能涌現(xiàn)在任務(wù)規(guī)劃方面的表征體現(xiàn)在3個(gè)層面:單機(jī)、群集以及任務(wù),分別對(duì)應(yīng)于無人機(jī)單機(jī)對(duì)環(huán)境的學(xué)習(xí)與適應(yīng),無人機(jī)集群群集行為的形成,以及無人機(jī)集群對(duì)復(fù)雜多樣化任務(wù)的完成。
具體進(jìn)展方面,Su[111]提出一種具有多個(gè)變速度虛擬領(lǐng)導(dǎo)者的多智能體蜂擁控制算法,從理論上證明了該方法可以準(zhǔn)確跟蹤對(duì)應(yīng)的虛擬領(lǐng)導(dǎo)者。周子為[112]分析研究了雁群長(zhǎng)途遷徙過程中的編隊(duì)飛行機(jī)制,并設(shè)計(jì)實(shí)現(xiàn)了一種仿雁群行為機(jī)制的多無人機(jī)緊密編隊(duì)控制與編隊(duì)變拓?fù)渲貥?gòu)方法。段海濱[113]提出一種基于注意力機(jī)制的群集模型,能夠通過刺激單一或者多個(gè)個(gè)體影響群體快速一致性反應(yīng)。王訓(xùn)[21]提出基于合作博弈的智能自主聚集策略,以實(shí)現(xiàn)群體聚集為“合作目標(biāo)”,以降低自身消耗為“競(jìng)爭(zhēng)目標(biāo)”開展博弈,最終引導(dǎo)群體系統(tǒng)出現(xiàn)聚集行為。段海濱團(tuán)隊(duì)[98,114]結(jié)合狼群的等級(jí)特性與社會(huì)組織,建立狼群合作狩獵運(yùn)動(dòng)模型,提出一種基于狼群行為機(jī)制的自主編隊(duì)控制方法,設(shè)計(jì)了基于狼群層級(jí)行為機(jī)制的編隊(duì)保持控制器。此外,該團(tuán)隊(duì)[115]針對(duì)鳥群運(yùn)動(dòng)中拓?fù)浣换?、策略切換等群集行為機(jī)制,映射建立了具有動(dòng)態(tài)環(huán)境適應(yīng)性的無人機(jī)集群協(xié)調(diào)決策控制模型。
除了模擬群體行為建立映射決策模型,研究學(xué)者的另一種思路是試圖提出通用的自組織集群模型架構(gòu),例如美國空軍試驗(yàn)室的Nowak面向戰(zhàn)場(chǎng)環(huán)境中集群任務(wù)的動(dòng)態(tài)性、部分可觀性提出了基于集群行為激勵(lì)的通用控制等級(jí)模型[116],如圖6所示。
圖6 基于自組織涌現(xiàn)的通用控制等級(jí)
Antonio[117]針對(duì)分布式目標(biāo)定位,提出了,群集激勵(lì)進(jìn)化(flocking, stigmergy, and evolution, FSE)算法,基于共識(shí)主動(dòng)性用潛在目標(biāo)吸引無人機(jī),基于聚集特性保證成員間協(xié)調(diào)觀測(cè),基于進(jìn)化特性來適應(yīng)動(dòng)態(tài)環(huán)境,如圖7所示。其他應(yīng)用場(chǎng)景方面,Wallar[118]基于集群行為建模,設(shè)計(jì)實(shí)現(xiàn)了無人機(jī)集群對(duì)某敏感危險(xiǎn)區(qū)域的監(jiān)視。Howden[119]基于聚集和共識(shí)主動(dòng)性,在無人機(jī)局部通信的約束下,實(shí)現(xiàn)了無人機(jī)集群對(duì)森林火場(chǎng)的自主監(jiān)視。
圖7 FSE算法結(jié)構(gòu)圖
總的來看,受當(dāng)前研究水平限制,基于生物集群行為學(xué)習(xí)與映射的集群任務(wù)規(guī)劃決策更適合于組織較為松散的簡(jiǎn)單反應(yīng)型任務(wù),是否能夠滿足高端無人機(jī)在行為更為嚴(yán)格受限條件下的任務(wù)執(zhí)行,還有待深入研究和驗(yàn)證。但這是一個(gè)充滿挑戰(zhàn)與希望的領(lǐng)域,有潛力產(chǎn)生涌現(xiàn)式的集群智能,發(fā)揮不可替代的作用,值得持續(xù)深入的研究。
上文分析了基于邏輯規(guī)則與集群智能涌現(xiàn)的兩類不同的無人機(jī)集群任務(wù)規(guī)劃方法,為便于對(duì)比,在表2中列出了二者的區(qū)別。
表2 兩類方法特性對(duì)比
從第2節(jié)和第3節(jié)的內(nèi)容看,無人機(jī)集群任務(wù)規(guī)劃的方式方法多樣,集群任務(wù)規(guī)劃技術(shù)的研究既有廣泛化、理論化等優(yōu)勢(shì)方面,也存在重復(fù)化和低端化的不足。以無人機(jī)集群實(shí)際能力建設(shè)為牽引,圍繞無人機(jī)集群系統(tǒng)的應(yīng)用前景,梳理無人機(jī)集群任務(wù)規(guī)劃技術(shù)的發(fā)展方向如下。
無人機(jī)集群任務(wù)規(guī)劃需要考慮單個(gè)無人機(jī)的動(dòng)力學(xué)和運(yùn)動(dòng)學(xué)約束、輸入飽和及狀態(tài)有界約束、模型非線性及不確定性約束,此外還需要滿足多無人機(jī)到達(dá)目的地的時(shí)間和空間協(xié)同約束,以及數(shù)據(jù)鏈系統(tǒng)連通性方面的網(wǎng)絡(luò)拓?fù)浼s束等。基于邏輯與規(guī)則的任務(wù)規(guī)劃模型在集群數(shù)量劇增的情況下很難以較低的復(fù)雜度準(zhǔn)確描述多約束條件以及協(xié)作機(jī)理,迫切需要研究多約束條件下基于集群智能涌現(xiàn)的系統(tǒng)建模和分布式協(xié)同控制機(jī)理。
在面臨時(shí)變?nèi)蝿?wù)和突發(fā)威脅條件下,無人機(jī)集群的實(shí)時(shí)協(xié)同規(guī)劃與決策在當(dāng)前和未來一段時(shí)間內(nèi)將是集群任務(wù)規(guī)劃的難點(diǎn)。不確定、動(dòng)態(tài)環(huán)境下的任務(wù)規(guī)劃?rùn)C(jī)理上依賴于推理判斷與優(yōu)化求解,鑒于深度學(xué)習(xí)方法在推理的其他應(yīng)用方面展現(xiàn)出極大優(yōu)勢(shì),將深度學(xué)習(xí)與分布式優(yōu)化相結(jié)合,在提升無人機(jī)集群任務(wù)協(xié)同分配和航跡規(guī)劃的實(shí)時(shí)性和最優(yōu)性方面具有巨大潛力。
無人機(jī)集群航跡規(guī)劃與調(diào)整要能夠滿足既定分配任務(wù),又要能夠自主防碰撞(由控制層面進(jìn)行的規(guī)避技術(shù)不在本文闡述范圍內(nèi)),而分布式控制下的無人機(jī)集群個(gè)體僅同局部臨近節(jié)點(diǎn)進(jìn)行信息交換和反饋,要兼顧集群系統(tǒng)的任務(wù)使命和智能個(gè)體的多約束條件,迫切需要研究局部信息反饋條件下的自組織航跡協(xié)同技術(shù),能夠應(yīng)對(duì)突發(fā)威脅并具備一定的容錯(cuò)和自愈能力。
邏輯規(guī)則與集群智能涌現(xiàn)相結(jié)合的規(guī)劃決策模式能夠增強(qiáng)無人機(jī)集群在通信受限環(huán)境下的適應(yīng)能力,在群間自組織通信正常情況下可采用基于邏輯/規(guī)則指派或動(dòng)態(tài)調(diào)整任務(wù)規(guī)劃方案,在電磁干擾導(dǎo)致通信受阻,可以結(jié)合集群個(gè)體間底層協(xié)調(diào),保持穩(wěn)定的隊(duì)形及功能,增強(qiáng)集群魯棒性。
作為“先進(jìn)的任務(wù)規(guī)劃技術(shù)能夠更好地發(fā)揮無人機(jī)集群能力”的逆問題,設(shè)計(jì)滿足一定功能的無人機(jī)集群系統(tǒng)具有重要現(xiàn)實(shí)意義,無論是基于邏輯與規(guī)則,還是基于集群智能涌現(xiàn),均需建立個(gè)體能力與集群整體效能的關(guān)系模型,形成個(gè)體能力與集體狀態(tài)之間的量化聯(lián)系。并根據(jù)系統(tǒng)的性能指標(biāo)要求,完成個(gè)體設(shè)計(jì)、結(jié)合(改善)個(gè)體間驅(qū)動(dòng)與激勵(lì)模式組織應(yīng)用,形成實(shí)用的無人機(jī)集群系統(tǒng)。
對(duì)于基于邏輯與規(guī)則的無人機(jī)集群任務(wù)規(guī)劃,目標(biāo)函數(shù)是評(píng)價(jià)任務(wù)方案優(yōu)良與否的基石,全面的目標(biāo)函數(shù)能夠度量任務(wù)方案的最優(yōu)性,但目標(biāo)函數(shù)復(fù)雜度的提升將大幅擴(kuò)增優(yōu)化解空間,影響求解效率,甚至無法求解。而基于集群智能涌現(xiàn)的任務(wù)規(guī)劃決策是開放式的架構(gòu),缺乏量化的能力評(píng)價(jià)。迫切需要開展無人機(jī)集群任務(wù)規(guī)劃方案的應(yīng)用效能評(píng)估技術(shù)[120-121],在無人機(jī)集群執(zhí)行任務(wù)前形成規(guī)劃閉環(huán)。
基于邏輯與規(guī)則的集群任務(wù)規(guī)劃技術(shù)的研究成果豐富,可以直接應(yīng)用于現(xiàn)有無人機(jī)集群系統(tǒng);對(duì)應(yīng)的研究大多是多無人機(jī)系統(tǒng)任務(wù)規(guī)劃技術(shù)針對(duì)無人機(jī)集群系統(tǒng)的拓展和適應(yīng)性調(diào)整,尚不能滿足在信息不完全、環(huán)境不確定、高動(dòng)態(tài)調(diào)整等對(duì)抗環(huán)境下的集群任務(wù)規(guī)劃要求,以無人機(jī)集群為對(duì)象的任務(wù)規(guī)劃建模與理論方面缺乏足夠創(chuàng)新。此外,基于集群智能涌現(xiàn)的任務(wù)規(guī)劃決策受當(dāng)前研究水平限制,尚不能靈活、機(jī)動(dòng)、高效、可控地完成復(fù)雜性耦合性強(qiáng)的集群任務(wù)。無人機(jī)集群任務(wù)規(guī)劃技術(shù)仍需要持續(xù)深入地研究與發(fā)展。
本文總結(jié)了無人機(jī)集群任務(wù)規(guī)劃技術(shù)潛在發(fā)展方向,對(duì)于全面了解無人機(jī)集群任務(wù)規(guī)劃研究現(xiàn)狀具有良好的參考意義。