彭 攀,白沐炎,陳長春,陳曉宇
(1.上海衛(wèi)星工程研究所,上海 201109;2.上海航天技術研究院,上海 201109;3.中國地質(zhì)大學 計算機學院,湖北 武漢 430074)
成像偵察衛(wèi)星調(diào)度問題是一類混合時間和資源分配的復雜調(diào)度問題,且已被證明是一類非確定多項式競爭(Non-deterministic Polynomial Complete,NPC)問題[1],涉及了多學科交叉知識,是我國空天地一體化體系設計的基礎。作為空間信息網(wǎng)絡構建和衛(wèi)星應用控制領域的關鍵支撐技術,成像偵察衛(wèi)星調(diào)度問題已成為實際應用中的一個重要研究內(nèi)容,受到學術界和工程界的高度重視[2]。
很多學者最初研究了單星調(diào)度規(guī)劃問題,設計了高效的求解模型和算法。Jang等[3]通過對任務可見時間窗口離散化,并在此基礎上構建了0/1 線性規(guī)劃模型。Wu等[4]提出了一種基于任務動態(tài)劃分的自適應模擬退火算法,并引入禁忌表求解了單星多軌道對地觀測調(diào)度規(guī)劃問題。潘耀等[5]通過對遙感衛(wèi)星成像任務規(guī)劃中的點目標進行聚類,構建了任務聚類圖模型,設計了一種改進的單軌最優(yōu)團劃分聚類方法。這一系列的工作在單星調(diào)度規(guī)劃最優(yōu)可行解生成和問題界限描述上均取得了顯著的進展。
隨著航天任務的復雜化和要求的提高,在軌運行衛(wèi)星數(shù)量和類型逐漸增多,用戶需求不斷增加,且表現(xiàn)出復雜多樣的特性,由多顆星組成的衛(wèi)星網(wǎng)絡系統(tǒng)在通信、導航和遙感等領域都得到了重要的應用。與單星調(diào)度規(guī)劃問題相比,調(diào)度復雜任務約束下多顆協(xié)同運作的衛(wèi)星需要考慮觀測資源選擇和執(zhí)行時間窗口選擇,以及更多的執(zhí)行操作約束[6]??紤]到傳統(tǒng)任務規(guī)劃算法不能適應多衛(wèi)星資源的應用特點,有學者將多星聯(lián)合調(diào)度規(guī)劃問題劃分為任務到資源分配的主問題和多個單星調(diào)度規(guī)劃的子問題[7-8]。賀仁杰等[9]深入分析了成像衛(wèi)星任務規(guī)劃技術,將其看作是帶時間窗口約束的并行機調(diào)度問題,并采用禁忌搜索算法求解了較大規(guī)模的任務協(xié)同規(guī)劃問題。劉偉[10]提出了混合整數(shù)規(guī)劃模型和約束滿足模型相結(jié)合的調(diào)度規(guī)劃模型,研究了這兩種模型下的Lagrangian 松弛確定性優(yōu)化方法和模擬退火算法隨機性優(yōu)化方法。Salman等[11]提出了混合差分進化的元啟發(fā)式隨機擴散搜索算法,研究了多衛(wèi)星聯(lián)合廣播任務調(diào)度問題。Xu等[12]提出了基于任務優(yōu)先級指標的蟻群算法,研究了最大化收益值的多敏捷衛(wèi)星對地觀測調(diào)度規(guī)劃問題。Zhang等[13]構建了一個獨立的復雜沖突結(jié)構圖模型,以最小化任務執(zhí)行時延為目標,提出了蟻群優(yōu)化多星聯(lián)合調(diào)度問題。Zheng等[14]提出一種改進的混合動態(tài)變異算子的遺傳算法求解多星聯(lián)合對地觀測調(diào)度規(guī)劃問題,顯著提升了算法的性能。嚴珍珍等[15]提出一種加入精英策略的改進蟻群算法的多敏捷衛(wèi)星成像調(diào)度方法。陳曉宇等[16]提出了基于任務優(yōu)先級和沖突消解的改進差分進化算法。Song等[17]采用帶局部搜索的改進遺傳算法,求解了多星調(diào)度規(guī)劃問題,提高了算法搜索效率。
在上述研究背景下,本文主要針對智能優(yōu)化算法求解多星聯(lián)合調(diào)度規(guī)劃問題中存在的算法性能隨問題規(guī)模增大而大大降低的問題,旨在提出一種改進差分進化算法。首先建立了多星聯(lián)合調(diào)度規(guī)劃約束滿足最優(yōu)化模型,并在標準差分進化算法的基礎上,通過分析成像衛(wèi)星的成像過程和工作原理,將成像衛(wèi)星調(diào)度過程分為調(diào)度預處理、任務規(guī)劃和調(diào)度優(yōu)化3 個階段。其中,調(diào)度預處理操作是根據(jù)用戶需求來篩選衛(wèi)星系統(tǒng)資源,確定每個觀測任務的可選資源以及可分配的時間窗口;在任務規(guī)劃過程中,采用基于啟發(fā)式思想的差分進化算法對成像衛(wèi)星調(diào)度問題進行求解,重新定義了個體適應度評估函數(shù),設計了任務沖突消解方法;優(yōu)化過程是根據(jù)系統(tǒng)性能評估結(jié)果,主要對調(diào)度規(guī)劃結(jié)果中由于資源沖突而未完成的任務和因時間限制有時延的任務進行進一步的優(yōu)化。
多成像偵察衛(wèi)星調(diào)度問題可以描述為在m個互不相同的遙感設備(資源集合R)安排n個觀測任務(活動集合M)。對每個活動Mi∈M,只有資源子集R(Mi)∈R可以滿足其執(zhí)行要求,該活動完成需要占用資源Rj∈R,占用時間為[Begi,Endi]。此外,活動Mi在占用資源Rj時具有一組互不相交的時間窗口集約束,且只能在其中的一個時間窗口內(nèi)不中斷地執(zhí)行完成。如果活動Mi和活動Mi'在執(zhí)行過程中占用同一個資源Rj,且活動Mi在活動Mi'之前執(zhí)行,那么活動Mi執(zhí)行完成后,必須經(jīng)過一個轉(zhuǎn)換時間活 動Mi'才能開始執(zhí)行。由于資源 能力及時間的限制,活動可能不被安排。因此,每個活動Mi都有權值wi,代表該活動安排時的效益值。
一個最優(yōu)調(diào)度方案應滿足以下條件:1)每個活動只能在自己的時間窗口內(nèi)執(zhí)行,否則,認為該活動未安排;2)每個活動只能占用滿足其要求的資源集合中的一個資源,且執(zhí)行過程不能中斷;3)每個資源在任何時候只能同時滿足一個活動的需求;4)安排活動的總權值最大。
2.1.1 集合
M:活動集合。M={M1,M2,…,Mn},其中第i個任務用Mi表示。
R:資源集合。R={R1,R2,…,Rm},其中第j個資源用Rj表示。
M(Rj):所有可以被安排在資源Rj上被執(zhí)行的活動集合。Rj∈R,M(Rj)∈M。
R(Mi):滿足觀測活動Mi要求的資源集合。Mi∈M,R(Mi)∈R。
TWij:活動Mi占用資源Rj是所允許的時間窗口集合。Nij表示活動Mi占用資源Rj時所允許的可見時間窗口數(shù)目。其中,代表在活動Mi占用資源Rj時所允許的第k個時間窗口開始時間,代表活動Mi占用資源Rj時 所允許的第k個時間窗口結(jié)束時間。
RTWj:資源Rj的有效執(zhí)行區(qū)間段集合,表示資源在哪些時間段內(nèi)可用。
2.1.2 參數(shù)
RPj:表示資源的圖像類型。RPj=1 表示可見光成像,RPj=2 表示紅外線成像,RPj=3 表示多光譜成像,RPj=4 表示雷達成像。
Δj:表示資源Rj成像前的穩(wěn)定時長。
Aj:表示資源Rj在整個仿真周期內(nèi)的最大執(zhí)行時長。
wi:活動Mi的權值。Mi∈M,wi>0。
Di:活動Mi完成所需要的持續(xù)時間。Mi∈M,TDi>0。
TPi:活動Mi成像所要求的圖像類型。TPi=0表示成像類型無要求,TPi=1 表示可見光成像,TPi=2 表示紅外線成像,TPi=3 表示多光譜成像,TPi=4 表示雷達成像。
SCBeg:場景開始時間。
SCEnd:場景結(jié)束時間。
Begi:活動Mi的開始執(zhí)行時間約束。其中,Mi∈M,Begi≥SCBeg。
Endi:活動Mi的執(zhí)行結(jié)束時間約束。其中,Mi∈M,Endi≤SCEnd。
2.2.1 優(yōu)化變量
dsti:表示活動Mi被安排時的開始執(zhí)行時間。
2.2.2 優(yōu)化目標
最大化任務執(zhí)行總效益
2.2.3 約束條件
1)每個任務Mi最多只被執(zhí)行一次,且只能在一個時間窗口內(nèi)執(zhí)行,或即使被執(zhí)行多次也只計算一次的收益,即
2)資源最大使用時長。該約束用于表示在一個軌道周期或給定時長內(nèi)的總側(cè)擺次數(shù)和開機工作時長不能超過其允許的上限范圍,即
3)任務執(zhí)行時間約束。每個任務都需要被分配在其所屬規(guī)劃時間區(qū)間內(nèi),該條件多用于表示周期性覆蓋或者受光照等約束的應急任務或通信任務中。即,如果
4)為每個任務分配的觀測窗口需要滿足成像資源的可用性約束和任務的觀測時長約束。在調(diào)度過程中,如果為任務Mi分配了資源Rj以及相應的可見時間窗口,則該任務的觀測時間段必須完全落在分配的可見時間窗口內(nèi)。該約束表示如下:
對于任意的Mi∈M,以及任意的Rj∈R(Mi),k∈{1,2,…,Ni,j},如果,則
5)同一資源上的連續(xù)兩個觀測任務間的最小轉(zhuǎn)換時長約束。上述分析可知,衛(wèi)星在執(zhí)行任務的過程中,星載傳感器的側(cè)擺角和旋轉(zhuǎn)角隨著不同開始執(zhí)行時間變化,因此,安排在同一資源上相鄰的兩個任務,需要考慮任務間的最小轉(zhuǎn)換時長,從而使得衛(wèi)星或者星載傳感器調(diào)整到正確的姿態(tài)。同時考慮到兩個任務的不同執(zhí)行先后順序,該約束表示如下:
對于任意的Rj∈R和分配在該資源上的任意兩個連續(xù) 觀測任務序列Mi,Mi'∈M(Rj),如 果且同時成 立,則
6)成像資源類型選擇約束。當任務Mi選定資源Rj以及相應的可見時間窗口時,必須滿足當前情況下資源Rj是可用的,并且資源Rj對應的載荷圖像類型能夠滿足活動要求的成像類型要求。即,如果,則
7)優(yōu)化變量取值約束。對于任意的Mi∈M、資源Rj∈R(Mi),以及所有的k∈{1,2,…,Ni,j},有如下約束:
針對成像衛(wèi)星調(diào)度這一NP 完全問題的求解,為提高問題的求解效率,首先可以對該問題進行分類,然后再采用相應的算法進行求解??紤]在通常情況下,當問題求解規(guī)模較大時,該問題往往很難得到一組可行解,此時,只能通過一些典型的智能算法進行求解。而差分進化(Differential Evolu?tion,DE)算法是一種用于最優(yōu)化問題的后設啟發(fā)式算法,是一種基于實數(shù)編碼的具有保優(yōu)思想的貪婪遺傳算法。在相關已有工作中,大量研究表明DE 是一種性能非常好的求解實數(shù)編碼優(yōu)化問題的啟發(fā)式方法。為了提高調(diào)度方案解的優(yōu)越性及算法的運行效率,本文是在標準DE 基礎上,加入調(diào)度預處理操作和一些啟發(fā)式思想對成像衛(wèi)星調(diào)度問題進行求解。同樣,當采用近似算法對問題進行求解后,往往還存在很多未完成的任務,這時可通過再次運用確定性算法,為未完成的任務在剩余的時間窗口內(nèi)嘗試重新選取時間窗口,從而進一步達到問題最優(yōu)解的定義。
在演化的過程中,算法中涉及的幾項重要操作(調(diào)度預處理、沖突消除、效益值計算、可行解二次優(yōu)化)如下。
首先,對衛(wèi)星系統(tǒng)資源及用戶需求進行分析,優(yōu)先處理多星聯(lián)合對地覆蓋過程中只與其靜態(tài)覆蓋性能相關的約束,計算所有滿足星地觀測需求的可見時間窗口集合。只有當觀測需求同時具有可用資源和可用時間時,才認為該觀測需求可能被完成,需要通過進一步調(diào)度來確定其是否被執(zhí)行、執(zhí)行該觀測需求的衛(wèi)星和為其分配的成像時間段。其次,當任務至少存在一個可見時間窗口且在調(diào)度過程中可能被執(zhí)行時,分析該任務的可見時間窗口區(qū)間上的資源爭用沖突度,考慮優(yōu)先安排含有空閑資源的任務,旨在降低問題的搜索空間,提高算法求解效率。
針對某一假定調(diào)度規(guī)劃場景,經(jīng)過調(diào)度預處理操作,可生成衛(wèi)星與目標之間的可見時間窗口約束集,如圖1 所示。
種群中個體上每個基因位編碼為一個任務的執(zhí)行狀態(tài)(包括任務屬性、是否被安排執(zhí)行、被安排的觀測資源和觀測時間窗口),種群中的每個個體對應一個調(diào)度可行解。個體的初始化主要分為兩個方面:1)采用基于任務執(zhí)行時間優(yōu)先或基于任務執(zhí)行收益優(yōu)先的貪心算法得到的可行解,對個體中的部分任務進行編碼,調(diào)度方案中未能完成的剩余任務則在其可見時間窗口集中隨機選擇進行編碼;2)首先對擁有空閑時間區(qū)間的任務進行編碼,其次為剩余的任務在其所有可見時間窗口中隨機選擇進行編碼。
圖1 調(diào)度預處理Fig.1 Scheduling preprocessing
當個體中的多個任務爭用資源產(chǎn)生資源沖突情況時,如何消除資源沖突,通常情況下是采用其中一個個體的沖突基因位重新隨機選擇時間窗口,而對于這類資源沖突較大的情況,重新選擇的時間窗口往往會引起與其他任務更多的資源沖突情況,因此,對于發(fā)生資源沖突的基因位選擇新的資源和執(zhí)行時間窗口也是至關重要的。運用啟發(fā)式的思想,當為個體中兩個成像任務分配的資源和執(zhí)行時間不滿足約束條件,則需要消除一個任務,為其重新分配資源和執(zhí)行時間。為了使得該優(yōu)化序列的效益值最大,可通過以下方式選擇消除的基因位:1)沖突基因位的沖突效益值;2)沖突基因位的可見時間窗口長度和時間窗口的沖突度。
在 同一資源上 執(zhí)行的任 務M1、Mi、Mj、Mk,有任務Mi、Mj、Mk執(zhí)行時間 窗口相互沖突,如 圖1 所示。其中,任務Mi和Mk的沖突度均為1,而任務Mj的沖突度為2,且該任務的可見時間窗口長度最大,故為任務Mj重新選擇時間窗口。在重新選擇的時間窗口時,任務Mj的第一個時間窗口又可能會引起任務Mi和Mk的沖突,故為任務Mj重新分配的執(zhí)行時間窗口為第3 個可見時間窗口。
通常情況下,效益值的計算是直接與任務完成個數(shù)或個體沖突度相關聯(lián)的[18],即適應度函數(shù)值的計算與個體效益值無關,只與完成個數(shù)和沖突度相關,即沖突個數(shù)相等的兩個個體效益值相等,同樣對于如下情況計算得到的效益值也是相等的。
假設任務Mi、Mj、Mk有相同的效益值,顯然,對于圖2 所示任務執(zhí)行狀態(tài)1,在調(diào)度方案中只需要消除任務Mj,就可完成Mi和Mk兩項任務,而對于圖3所示任務執(zhí)行狀態(tài)2,無論如何消除沖突,調(diào)度方案中最終只有一個任務可以被完成。
對于上述情況,可以采取一種個體任務沖突度的方式消除沖突。個體適應度評估函數(shù)為
圖2 任務執(zhí)行沖突1Fig.2 Mission execution conflict of case 1
圖3 任務執(zhí)行沖突2Fig.3 Mission execution conflict of case 2
式中:任 務Mi、Mj、Mk的效益值分別為wi、wj、wk,故任務Mi、Mj、Mk的沖突度分別為Vi、Vj、Vk,Vi=wj+wk,Vj=wi+wk,Vk=wi+wj,按任務沖 突度降序排序,依次刪除任務,直到個體中無任務沖突為止,此時再計算個體中的所有分配時間窗口的任務的效益之總和。這樣可以更大限度地保留效益值或權重較大的任務,從而更有效地選出效益值較大的個體,生成較優(yōu)的調(diào)度方案。
當采用近似算法求解該衛(wèi)星星座調(diào)度問題時,對于每次求解生成的調(diào)度方案,針對性地用確定性算法對調(diào)度結(jié)果進行二次優(yōu)化。針對某一次的調(diào)度結(jié)果,主要從任務完成率、資源利用率和時效性3個方面對指定衛(wèi)星系統(tǒng)的本次調(diào)度方案進行評估。對于當前調(diào)度結(jié)果,如果存在由于資源沖突而未能完成的任務,或者為任務分配的時間段對其要求的時間限有延遲,則通過調(diào)度優(yōu)化操作可以在任務完成率、資源利用率和時效性3 個方面都能夠進行優(yōu)化,從而進一步解決并優(yōu)化調(diào)度結(jié)果,使得調(diào)度結(jié)果更優(yōu),并能夠滿足用戶的需求。
1)對調(diào)度結(jié)果中的所有已分配時間窗口的任務進行時間優(yōu)化。找出已分配時間窗口的任務,結(jié)合預處理結(jié)果,將所有任務的分配時間窗口前移,且主要針對有時間延遲的任務,嘗試為其選擇更好的執(zhí)行時間窗口。
2)為調(diào)度方案中因資源沖突未完成的任務重新搜索時間窗口。針對上一步操作,對經(jīng)過時間優(yōu)化后的調(diào)度結(jié)果進行分析,找出所有因資源沖突而未能安排的任務,遍歷其所有可見時間窗口,嘗試為其重新選擇執(zhí)行時間窗口。
成像偵察衛(wèi)星需要包括觀測衛(wèi)星及其所載傳感器。為了使本文設計的成像偵察衛(wèi)星系統(tǒng)資源更加切合實際,從國外衛(wèi)星應用強國發(fā)射并投入使用的觀測衛(wèi)星中選取了5 顆構造了一個成像偵察衛(wèi)星 網(wǎng),分別 是SPOT-5、MTI、ORBVIEW-3、IKO?NOS-2、EO-1,衛(wèi)星軌道參數(shù)可查詢AGI 公司發(fā)布的全球衛(wèi)星軌道數(shù)據(jù)庫。隨著衛(wèi)星應用的深入,衛(wèi)星星上載荷類型不斷豐富,從傳感器角度看,包括可見光、紅外、多光譜、高光譜、合成孔徑雷達(Syn?thetic Aperture Radar,SAR)等多種傳感器類型。為體現(xiàn)成像類型約束,本文中星載傳感器的性能參數(shù)設置見表1。場景仿真周期為2018-01-01 00∶00∶00—2018-01-01 18∶00∶00
表1 傳感器參數(shù)Tab.1 Sensor parameters
地面目標即觀測目標,它是生成觀測任務的基本要素。本文在地球陸地范圍內(nèi)隨機選取了100 個地面目標以及中國境內(nèi)的35 個城市作為目標。這個地面目標集合具有一定的代表性,基本上能夠以一定的密度覆蓋地球陸地。地面目標的具體分布如圖4 所示(軟件STK 提供的二維平面地圖)。圖4中,紅色圓點表示待成像的地面目標,陰影部分表示星載傳感器在當前時刻對地面的覆蓋范圍。在實際應用中,經(jīng)常會對某一個地區(qū)比較集中的若干點目標進行觀測,從而引起任務對資源的爭用沖突,因此,在地面目標集也設計了幾組位置比較集中的點目標,這種目標比較集中的觀測任務往往會帶來對衛(wèi)星資源的需求沖突問題,采用手工計算很難解決,必須依靠計算機來解決。
圖4 二維地面目標分布圖Fig.4 2D ground-target distribution
對于上述測試實例計算可得,任務完成理論上限為135 個。分別采用標準DE 和基于啟發(fā)式思想的改進DE 進行求解,實驗生成的調(diào)度方案結(jié)果對比見表2 和表3。
表2 標準DE 任務完成情況Tab.2 Mission completion status with the standard DE
1)標準DE 和改進DE 對該問題的求解,算法性能對比分析。
測試方案的任務完成率和任務完成效益比值分別如圖5 和圖6 所示。圖中,紅線表示任務完成上限,綠線表示采用改進DE 得到的結(jié)果,藍線表示采用標準DE 得到的結(jié)果。
由圖5 和圖6 可知:本文在問題的求解過程中,采用啟發(fā)式思想消除個體沖突和計算適應值,可以有效地生成較好的任務規(guī)劃結(jié)果,生成調(diào)度方案的任務完成率和任務完成效益非常接近于任務完成理論上限值,并且對于每一組調(diào)度方案,任務的完成效益都大于任務的完成率。
表3 改進DE 任務完成情況Tab.3 Mission completion status with the improved DE
圖5 測試方案的任務完成率Fig.5 Mission completion rate of the test scheme
圖6 測試方案的任務完成效益率Fig.6 Mission completion benefit rate of the test scheme
2)采用調(diào)度優(yōu)化模塊對調(diào)度方案的結(jié)果影響分析。
采用標準DE 生成調(diào)度方案的任務完成率和任務完成效益比值分別如圖7 和圖8 所示。圖中,紅線表示任務完成上限,藍線表示直接采用標準DE得到的結(jié)果,綠線表示在調(diào)度方案的基礎上采用調(diào)度優(yōu)化模塊后得到的結(jié)果。
圖7 標準DE 生成調(diào)度方案的任務完成率Fig.7 Mission completion rate of the scheduling scheme generated by the standard DE algorithm
圖8 標準DE 生成調(diào)度方案的任務完成效益Fig.8 Mission completion benefit rate of the scheduling scheme generated by the standard DE algorithm
采用DE 生成調(diào)度方案的任務完成率和任務完成效益比值分別如圖9 和圖10 所示。圖中,紅線表示任務完成上限,藍線表示直接采用改進DE 得到的結(jié)果,綠線表示在調(diào)度方案的基礎上采用調(diào)度優(yōu)化模塊后得到的結(jié)果。
由調(diào)度優(yōu)化模塊對調(diào)度方案的影響結(jié)果分析圖可知,當采用近似算法求解該衛(wèi)星星座調(diào)度問題時,對于每次求解生成的調(diào)度方案,具有針對性地用確定性算法對調(diào)度結(jié)果進行二次優(yōu)化。對于存在由于資源沖突而未能完成的任務,或者為任務分配的時間段對其要求的時間限有延遲,則通過調(diào)度優(yōu)化操作可以在任務完成率、資源利用率和時效性3 個方面都能夠進行優(yōu)化,從而進一步解決并優(yōu)化調(diào)度結(jié)果,使得調(diào)度結(jié)果更優(yōu),并能夠滿足用戶的需求。
圖9 改進DE 生成調(diào)度方案的任務完成率Fig.9 Mission completion rate of the scheduling scheme generated by the improved DE algorithm
圖10 改進DE 生成調(diào)度方案的任務完成效益Fig.10 Mission completion benefit rate of the scheduling scheme generated by the improved DE algorithm
本文通過分析成像衛(wèi)星的成像過程和工作原理,建立了多成像衛(wèi)星的約束滿足最優(yōu)化調(diào)度規(guī)劃模型。在此基礎上,采用啟發(fā)式算法思想,設計了成像衛(wèi)星聯(lián)合任務規(guī)劃問題的改進DE 求解方案。通過測試實例發(fā)現(xiàn),在改進DE 迭代過程中采用啟發(fā)式算法思想,消除個體中任務的沖突并計算個體適應值,可以快速地生成較優(yōu)的調(diào)度方案。調(diào)度優(yōu)化操作的實現(xiàn)對每一次調(diào)度結(jié)果進行優(yōu)化,可以進一步提高本次調(diào)度方案的任務完成率、資源利用率和時效性。同時,調(diào)度優(yōu)化操作的實現(xiàn),同樣也可以應用到應急調(diào)度中,從而生成較優(yōu)的調(diào)度方案。