王新堯,孫厚俊,王朝陽(yáng),曹云峰
(1. 南京航空航天大學(xué)航天學(xué)院,南京210016;2. 洛陽(yáng)電光設(shè)備研究所,洛陽(yáng)471000)
當(dāng)前,無(wú)人機(jī)系統(tǒng)承擔(dān)的軍事任務(wù)正在由安全空域執(zhí)行情報(bào)、監(jiān)視與偵察任務(wù)向戰(zhàn)場(chǎng)對(duì)抗環(huán)境下執(zhí)行對(duì)地打擊、空戰(zhàn)等作戰(zhàn)任務(wù)方向擴(kuò)展[1],但由于技術(shù)水平的限制,目前現(xiàn)役無(wú)人機(jī)不具備對(duì)意外事件實(shí)時(shí)響應(yīng)處理能力,因此在對(duì)抗環(huán)境中易處于誘騙、干擾和被打擊的險(xiǎn)境,導(dǎo)致其自衛(wèi)和空中對(duì)抗能力不足,甚至失去制空權(quán)。綜上,在未來(lái)較長(zhǎng)的時(shí)期內(nèi)無(wú)人機(jī)難以在戰(zhàn)場(chǎng)對(duì)抗環(huán)境中實(shí)現(xiàn)完全自主作戰(zhàn),其執(zhí)行任務(wù)時(shí)還需要由人通過(guò)數(shù)據(jù)鏈進(jìn)行操作和控制。然而,現(xiàn)有的“地面站遠(yuǎn)程異地控制無(wú)人機(jī)”模式[2],存在數(shù)據(jù)鏈中斷和決策延時(shí)等缺陷,難以支撐無(wú)人機(jī)在戰(zhàn)場(chǎng)對(duì)抗環(huán)境下遂行作戰(zhàn)任務(wù),而采用有人機(jī)決策模式,可以實(shí)現(xiàn)對(duì)無(wú)人機(jī)的就近指揮。同時(shí),無(wú)人機(jī)與有人機(jī)在認(rèn)知能力、平臺(tái)能力、機(jī)載傳感器和武器性能等方面存在能力互補(bǔ)的天然優(yōu)勢(shì)[3]。通過(guò)兩者優(yōu)勢(shì)互補(bǔ),可有效彌補(bǔ)有人機(jī)/無(wú)人機(jī)能力不足,提高無(wú)人機(jī)對(duì)作戰(zhàn)環(huán)境變化的應(yīng)對(duì)能力、作戰(zhàn)效能和戰(zhàn)場(chǎng)生存能力。有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)將是未來(lái)戰(zhàn)場(chǎng)中重要的空中作戰(zhàn)模式。
有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)的重點(diǎn)是針對(duì)無(wú)人機(jī)和有人機(jī)混合編隊(duì),研究多無(wú)人機(jī)與有人機(jī)決策體系結(jié)構(gòu)與架構(gòu)設(shè)計(jì)[4-6]、協(xié)同任務(wù)規(guī)劃[7-10]、協(xié)同成像偵察[11]、人機(jī)協(xié)作[12-13]等方向。其中人機(jī)協(xié)作問(wèn)題是有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同區(qū)別于傳統(tǒng)單一有人系統(tǒng)或單一無(wú)人系統(tǒng)的主要問(wèn)題。人機(jī)協(xié)作中,操作員的狀態(tài)、無(wú)人機(jī)自主程度以及當(dāng)前態(tài)勢(shì)等變化,會(huì)給整個(gè)系統(tǒng)帶來(lái)不確定因素。Marcus Wohler 針對(duì)操作員的狀態(tài)和無(wú)人機(jī)通信鏈路的變化,提出了雙模認(rèn)知自動(dòng)化智能輔助系統(tǒng)架構(gòu)[12],該架構(gòu)系統(tǒng)的表述了人與無(wú)人機(jī)系統(tǒng)的整體結(jié)構(gòu)。然而,該系統(tǒng)架構(gòu)仍然面臨操作員耐力不足的危機(jī),主要原因是原系統(tǒng)的操作員是在地面控制且只需要決策一架無(wú)人機(jī),難以實(shí)現(xiàn)一架有人機(jī)同時(shí)指揮引導(dǎo)多架無(wú)人機(jī)的作戰(zhàn)要求。
為了解決上述問(wèn)題,本文研究了有人機(jī)/無(wú)人機(jī)編隊(duì)決策系統(tǒng)體系結(jié)構(gòu),并針對(duì)不同場(chǎng)景下對(duì)決策結(jié)構(gòu)的適應(yīng)性要求,將雙模認(rèn)知自動(dòng)化智能輔助系統(tǒng)架構(gòu)改進(jìn)擴(kuò)展為三模認(rèn)知自動(dòng)化決策系統(tǒng)架構(gòu),給出操作員決策策略和與智能系統(tǒng)的交互機(jī)制,通過(guò)提供冗余的任務(wù)管理功能,提高操作員指揮多架無(wú)人機(jī)的能力。
多智能體控制系統(tǒng)體系結(jié)構(gòu)主要是表示多智能體系統(tǒng)中的信息和控制關(guān)系,反映該系統(tǒng)的信息存儲(chǔ)、共享方式以及問(wèn)題求解能力的分布模式等[14]。常見(jiàn)的有人機(jī)/無(wú)人機(jī)編隊(duì)體系結(jié)構(gòu)有:完全集中式(無(wú)人機(jī)配合有人機(jī),完全依賴有人機(jī)決策)、有限集中分布式(有人機(jī)協(xié)助無(wú)人機(jī),無(wú)人機(jī)具有一定的自主功能,有人機(jī)可修正決策)、無(wú)中心分布式(無(wú)人機(jī)能夠自主決策,與有人機(jī)互補(bǔ)互動(dòng))[2]。分別如圖1~3所示。
圖1 集中式結(jié)構(gòu)Fig.1 Centralized structure
圖2 有限集中分布式結(jié)構(gòu)Fig.2 Limited centralized distributed command structure
圖3 無(wú)中心分布式結(jié)構(gòu)Fig.3 Distributed structure
在不同的決策結(jié)構(gòu)中,有人機(jī)和無(wú)人機(jī)的人機(jī)功能分配不同[14]。集中式?jīng)Q策結(jié)構(gòu)中有人機(jī)直接生成決策指令發(fā)送給無(wú)人機(jī),無(wú)人機(jī)之間不通信;全自主分布式指揮結(jié)構(gòu)指有人機(jī)不再發(fā)送決策指令,決策結(jié)果由各個(gè)無(wú)人機(jī)協(xié)商生成;有限集中式控制指揮結(jié)構(gòu)是指部分無(wú)人機(jī)完全依賴有人機(jī)決策控制。通常異構(gòu)無(wú)人機(jī)會(huì)處于不同智能等級(jí)或發(fā)生通信狀態(tài)異常等情況,導(dǎo)致無(wú)人機(jī)對(duì)有人機(jī)決策依賴程度存在的差異。因此,有必要將三種控制結(jié)構(gòu)集成到一個(gè)統(tǒng)一的框架下,根據(jù)實(shí)際任務(wù)需求的不同采取相對(duì)應(yīng)的決策結(jié)構(gòu),而實(shí)現(xiàn)上述功能的關(guān)鍵在于其決策系統(tǒng)的架構(gòu)設(shè)計(jì)。
在有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)決策系統(tǒng)中起到?jīng)Q策功能的智能決策智能體包括人類操作員、有人機(jī)機(jī)載智能決策輔助系統(tǒng)和無(wú)人機(jī)機(jī)載智能決策輔助系統(tǒng),如圖4 所示,機(jī)器人頭部所象征機(jī)載智能決策系統(tǒng)安裝在有人機(jī)和每一架無(wú)人機(jī)上。傳統(tǒng)的人機(jī)接口(Human Machine Interface,HMI)被擴(kuò)展到人、機(jī)器和智能體的接口(Human Machine and Agent Interface,HMAI),以實(shí)現(xiàn)人類和智能體之間通信。智能決策體通過(guò)控制機(jī)載無(wú)人機(jī)自身裝備的飛行控制系統(tǒng)(Flight Control System,F(xiàn)CS)和飛行管理系統(tǒng)(Flight Management System,F(xiàn)MS),決策無(wú)人機(jī)執(zhí)行任務(wù)。
將人類操作員工作狀態(tài)分為“人在回路內(nèi)”“人在回路上”和“人在回路外”,以適應(yīng)不同態(tài)勢(shì)、不同操作員狀態(tài)下對(duì)決策主體的需求,“人在回路內(nèi)”“人在回路上”和“人在回路外”的三種人類工作狀態(tài)所對(duì)應(yīng)的機(jī)載智能決策系統(tǒng)可處于3 種狀態(tài),如圖5~7所示。
圖4 有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)決策系統(tǒng)組成Fig.4 Manned/unmanned aerial vehicle formation collaborative operation decision system composition
圖5 人在回路內(nèi)Fig.5 People in the loop
圖6 人在回路上Fig.6 People on the loop
圖7 人在回路外Fig.7 People off the loop
人在回路內(nèi)時(shí):工作目標(biāo)主要由操作人員完成,有人機(jī)機(jī)載智能決策系統(tǒng)仍在工作,起到提示操作員的功能,對(duì)應(yīng)體系結(jié)構(gòu)為集中式體系結(jié)構(gòu)。無(wú)人機(jī)機(jī)載決策系統(tǒng)負(fù)責(zé)監(jiān)督無(wú)人機(jī)飛行狀態(tài)和執(zhí)行任務(wù)狀態(tài),并將無(wú)人機(jī)系統(tǒng)狀態(tài)反饋給有人機(jī)。
人在回路上時(shí):當(dāng)無(wú)人機(jī)智能程度不足時(shí),人類監(jiān)督有人機(jī)機(jī)載智能決策系統(tǒng)決策無(wú)人機(jī),無(wú)人機(jī)機(jī)載決策系統(tǒng)仍然只負(fù)責(zé)監(jiān)督無(wú)人機(jī)飛行狀態(tài)和執(zhí)行任務(wù)狀態(tài)。當(dāng)無(wú)人機(jī)智能程度滿足當(dāng)前任務(wù)需求時(shí),無(wú)人機(jī)可自主協(xié)同執(zhí)行任務(wù),將決策結(jié)果反饋回有人機(jī),取代了有人機(jī)智能決策系統(tǒng)地位。
人在回路外時(shí):當(dāng)無(wú)人機(jī)鏈路可用,有人機(jī)機(jī)載智能決策系統(tǒng)取代人類操作員工作;反之,無(wú)人機(jī)鏈路不可用時(shí),無(wú)人機(jī)機(jī)載智能決策系統(tǒng)取代人類操作員工作。
由上述可知,除了直接采用有人機(jī)機(jī)載智能決策系統(tǒng)、無(wú)人機(jī)機(jī)載智能決策系統(tǒng)決策結(jié)果和操作員直接輸入決策指令外,還有操作員與機(jī)載智能決策系統(tǒng)的切換(操作員與機(jī)載決策系統(tǒng)的切換機(jī)制流程圖如圖8 所示)。值得注意的是,當(dāng)有人機(jī)/無(wú)人機(jī)編隊(duì)中無(wú)人機(jī)數(shù)量大于1 時(shí),對(duì)于不同的無(wú)人機(jī)來(lái)說(shuō),無(wú)人機(jī)可處于不同的通信鏈路狀態(tài)或不同的自主程度,因此其決策來(lái)源也會(huì)因此不同。
圖8 操作員與機(jī)載智能決策系統(tǒng)切換機(jī)制流程圖Fig.8 Flow chart of switching mechanism between operator and airborne intelligent decision system
操作員和有人機(jī)機(jī)載智能決策系統(tǒng)均可為無(wú)人機(jī)提供決策指令,實(shí)現(xiàn)集中式?jīng)Q策體系結(jié)構(gòu);無(wú)人機(jī)機(jī)載智能決策系統(tǒng)可實(shí)現(xiàn)無(wú)人機(jī)間協(xié)同決策,實(shí)現(xiàn)無(wú)中心分布式?jīng)Q策體系結(jié)構(gòu)和有限集中分布式控制體系結(jié)構(gòu)。因此,上述架構(gòu)可以適應(yīng)不同體系結(jié)構(gòu)的有人機(jī)/無(wú)人機(jī)編隊(duì)決策系統(tǒng)。此外有人機(jī)機(jī)載智能決策系統(tǒng)和無(wú)人機(jī)機(jī)載智能決策系統(tǒng)可提供任務(wù)管理的冗余功能,提高操作員決策多架無(wú)人機(jī)的能力。
雖然提出的基于三模認(rèn)知自動(dòng)化的決策系統(tǒng)架構(gòu)能夠減輕操作員決策無(wú)人機(jī)負(fù)擔(dān)問(wèn)題,但該架構(gòu)也帶來(lái)存在多個(gè)決策指令時(shí)可能導(dǎo)致的邏輯混亂的問(wèn)題。因此,仿真實(shí)驗(yàn)的主要目標(biāo)是對(duì)該架構(gòu)進(jìn)行決策邏輯驗(yàn)證,避免由于決策主體增加而產(chǎn)生的決策沖突等問(wèn)題。IBM Rational Rhapsody 可以實(shí)現(xiàn)模型與底層代碼(C++、Java 或Ada)的雙向關(guān)聯(lián),通過(guò)構(gòu)建架構(gòu)的動(dòng)態(tài)模型,支持對(duì)架構(gòu)的驗(yàn)證分析,因此選擇該工具來(lái)構(gòu)建有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)決策系統(tǒng)架構(gòu)的可執(zhí)行模型[15]。
以有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)協(xié)同對(duì)空攻擊作戰(zhàn)為背景,對(duì)有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)決策系統(tǒng)架構(gòu)的邏輯合理性進(jìn)行驗(yàn)證。本項(xiàng)目考慮的影響決策智能體變化的因素主要有:無(wú)人機(jī)-無(wú)人機(jī)通信、有人機(jī)-無(wú)人機(jī)通信條件、操作員狀態(tài)和無(wú)人機(jī)自主等級(jí),具體如表1所示。
表1 有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)決策指令來(lái)源Table 1 Source of dicision for manned/unmanned aerial vehicle formations
在有人機(jī)-無(wú)人機(jī)通信鏈路可用狀態(tài)下,有人機(jī)和無(wú)人機(jī)狀態(tài)圖如圖9 所示。當(dāng)有人機(jī)發(fā)送send_command(.)(決策指令)轉(zhuǎn)入attack_object(.)(攻擊任務(wù))狀態(tài),觸發(fā)make_command_to_air(.)事件,即無(wú)人機(jī)接受到?jīng)Q策指令,轉(zhuǎn)入air_attack(作戰(zhàn)模式)狀態(tài)。
圖9 通信鏈路正常-有人機(jī)/無(wú)人機(jī)狀態(tài)圖Fig.9 Communication link normal-status diagram of manned/unmanned aerial vehicle
當(dāng)操作員在控制回路內(nèi),發(fā)送操作員輸入的指令決策無(wú)人機(jī)時(shí),有人機(jī)狀態(tài)圖如圖10 所示。auto_desition_assistance(.)(有人機(jī)機(jī)載決策系統(tǒng))為操作員建議,但操作人觸發(fā)not_agree 事件(不同意當(dāng)前有人機(jī)機(jī)載決策系統(tǒng)提供的建議指令),操作人狀態(tài)由polit_on(.)(操作員在控制回路上)轉(zhuǎn)為polit_in(.)(操作員在控制回路內(nèi))狀態(tài),決策指令由polit_handle(.)(操作員手動(dòng)輸入)實(shí)現(xiàn)。
圖10 操作員在線-有人機(jī)狀態(tài)圖Fig.10 People in the loop-status diagram of manned aerial vehicle
圖11 操作員采納建議-有人機(jī)狀態(tài)圖Fig.11 People on the loop-status diagram of manned aerial vehicle
當(dāng)操作員在控制回路上,但采用了有人機(jī)機(jī)載決策系統(tǒng)的建議方案,有人機(jī)狀態(tài)圖如圖11 所示。操作員觸發(fā)agree 事件,操作員狀態(tài)由polit_on(.)(操作員在控制回路上)轉(zhuǎn)為polit_off(.)(操作員在控制回路外),直接發(fā)送由有人機(jī)機(jī)載決策系統(tǒng)提供的指揮命令。
圖12 操作員輸入超時(shí)-有人機(jī)狀態(tài)圖Fig.12 People off the loop-status diagram of manned aerial vehicle
圖13 通信鏈路斷-無(wú)人機(jī)狀態(tài)圖Fig.13 Communication link unnormal-status diagram of unmanned aerial vehicle
當(dāng)操作員在控制回路上,但由于操作員狀態(tài)不佳等問(wèn)題導(dǎo)致輸入指令超時(shí),則操作員狀態(tài)由polit_in(.)(操作員在控制回路內(nèi))轉(zhuǎn)至polit_off(.)(操作員在控制回路外),狀態(tài)圖如圖12 所示。此時(shí),決策指令仍由auto_desition_assistance(.)(有人機(jī)機(jī)載決策系統(tǒng))提供。
在有人機(jī)/無(wú)人機(jī)通信鏈路不可用狀態(tài)下,無(wú)人機(jī)狀態(tài)圖如圖13 所示。有人機(jī)無(wú)法發(fā)送決策指令,無(wú)人機(jī)直接轉(zhuǎn)入full_auto(.)(全自主控制模式)狀態(tài)。
本文針對(duì)有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同作戰(zhàn)決策系統(tǒng)中三種典型的決策結(jié)構(gòu),探討了三種決策結(jié)構(gòu)對(duì)有人機(jī)和無(wú)人機(jī)功能分配的影響和對(duì)不同任務(wù)需求的適應(yīng)性。提出的三模認(rèn)知自動(dòng)化決策架構(gòu)將三種決策結(jié)構(gòu)集成到一個(gè)統(tǒng)一的架構(gòu)下,架構(gòu)中作為決策系統(tǒng)的組件有操作員、有人機(jī)機(jī)載智能決策系統(tǒng)和無(wú)人機(jī)機(jī)載智能決策系統(tǒng),其中有人機(jī)機(jī)載智能決策系統(tǒng)和無(wú)人機(jī)機(jī)載智能決策系統(tǒng)可提供任務(wù)管理的冗余功能,以提高整體決策系統(tǒng)的魯棒性和決策能力。仿真實(shí)驗(yàn)中,針對(duì)有人機(jī)操作員負(fù)荷、無(wú)人機(jī)與有人機(jī)通信鏈路狀態(tài)和無(wú)人機(jī)自主等級(jí)等因素影響,驗(yàn)證了決策指令獲取的邏輯,結(jié)果表明,面向不同任務(wù)需求或處于不同系統(tǒng)狀態(tài)時(shí),無(wú)人機(jī)都有效適應(yīng)并執(zhí)行任務(wù)。