邱建文,徐 瑞,趙宇庭
(1. 中廣核研究院北京分院,北京 100086; 2. 北京理工大學宇航學院,北京 100081;3.深空自主導(dǎo)航與控制工信部重點實驗室,北京 100081)
能源是航天領(lǐng)域的一個核心問題,目前航天器的主要能源是化學能、太陽能和核能。在深空探測任務(wù)中,尤其需要能適應(yīng)復(fù)雜惡劣的空間環(huán)境、在無人干預(yù)的情況下可以穩(wěn)定供能的能量來源?;瘜W能和太陽能的固有缺陷,令其應(yīng)用在空間的潛力十分有限[1]。使用化學能需要占用大量的質(zhì)量和空間,太陽能受到行星環(huán)境和與太陽距離的影響,在沙塵等環(huán)境中太陽能板難以接受能量,而木星及以遠空間的太陽常數(shù)過低,利用太陽能發(fā)電效率低下。核反應(yīng)堆芯具有小體積、大功率、可變大小、長壽命等特點,是目前地球上最高能量密度的可用資源[2-3]。在已有的深空探測任務(wù)中,美國的“旅行者號”(Voyager)、“新視野號”(New Horizons)、“好奇號”(Curiosity)等深空探測器均采用了同位素核電源。美國國家航空航天局(NASA)計劃在2030年利用核能實現(xiàn)載人登陸火星,NASA已經(jīng)與Ad Astra公司簽訂協(xié)議,在國際空間站上進行核能發(fā)動機的試驗飛行,Ad Astra公司也提出了使用200 MW核反應(yīng)堆的短期載人往返火星的概念[4],圖1為核動力火星飛船示意圖。由此可見,核動力必將成為發(fā)展深空探測的戰(zhàn)略性能源選擇,在國防需求推動下快速發(fā)展。
隨著近些年來核電事業(yè)的發(fā)展,尤其福島事故后隨著對核電安全要求的提高,小型反應(yīng)堆因為良好的安全設(shè)計理念、結(jié)構(gòu)簡單的特點,能滿足中小型電網(wǎng)的供電、制氫、城市供熱、工業(yè)工藝供熱、混合清潔能源和海水淡化等特殊應(yīng)用要求的優(yōu)勢,引起了研發(fā)和建設(shè)熱潮。商用小型堆發(fā)展為空間堆應(yīng)用提供了堅實基礎(chǔ)。
按照國際原子能機構(gòu)(IAEA)的定義,小型反應(yīng)堆的電功率在300 MWe以下。小型反應(yīng)堆主要有輕水堆、高溫氣冷堆、液態(tài)金屬反應(yīng)堆、熔鹽堆等類型。模塊化小型堆是目前優(yōu)先開發(fā)的方向。世界各國近期開發(fā)的典型小型堆如表1所示[5]。
圖1 Ad Astra 200 MW載人火星飛船示意圖Fig.1 A schematic map of the Ad Astra 200 MW manned Mars spacecraft
序號堆型名稱設(shè)計公司國別發(fā)電能力/MWe設(shè)計狀態(tài)1System Integrated Modular Advanced Reactor (SMART)Korea Atomic Energy Research Institute俄羅斯1002012年7月4日收到標準設(shè)計批準2mPowerB&W GenerationmPower美國180/module2015年申請設(shè)計認證3NuScaleNuScale Power Inc.美國50/module(gross)2016年中申請設(shè)計認證4ACP100CNNC/NPIC中國100詳細設(shè)計,2016年開始建設(shè)
反應(yīng)堆自主控制的需求主要體現(xiàn)在兩個方面:
1)經(jīng)濟競爭力需求。空間堆的投資成本和日常管理成本決定了其經(jīng)濟競爭力,實現(xiàn)自主控制能降低反應(yīng)堆對人工管理的需求,節(jié)約成本。
2)空間反應(yīng)堆本身自主控制需求。由于深空探測器遠離地球,具有很長的通信時延,傳統(tǒng)的控制技術(shù)依賴地面人員決策,探測器上搭載設(shè)備均需要自主控制??臻g反應(yīng)堆作為能量來源,是深空探測器的重要組成部分,需要實現(xiàn)自主控制,保證設(shè)備的長期可靠運行。小型模塊化堆有運行靈活、生產(chǎn)能力模塊化配置的優(yōu)勢,適于實現(xiàn)空間中的自主控制。
目前的反應(yīng)堆控制大多是自動化控制,無法滿足深空探測器空間堆對自主性的需求,如何提高自主程度,從“自動化控制”到“自主控制”,是問題的關(guān)鍵。
機器人、運輸、航天等領(lǐng)域中已采用了不同自主程度的控制系統(tǒng)。理想的自主控制具有智能性、魯棒性、優(yōu)化性、靈活性、適應(yīng)性和可靠性等特性。雖然各領(lǐng)域所實現(xiàn)的自主程度和特定的控制算法不同,但對反應(yīng)堆自主控制系統(tǒng)關(guān)鍵特性和先進自主功能架構(gòu)實現(xiàn)都有參考價值。
核反應(yīng)堆上應(yīng)用自主控制面臨下述挑戰(zhàn):1)在運核電站還沒有實現(xiàn)自主控制;2)目前正在研發(fā)的先進概念反應(yīng)堆,也沒有自主控制應(yīng)用的研究;3)當前核電站的自動化控制技術(shù)都相當成熟,高度自動化控制也足以應(yīng)對最理想工況;4)在當前技術(shù)水平下,降質(zhì)、故障和其他非正常事件等非最理想工況反應(yīng)堆性能、以及直接人工干預(yù)能力受到限制;5)在核電特殊運行區(qū)域,自主控制功能的開發(fā)和示范還存在著明顯差距。
國內(nèi)核電廠的儀表與控制系統(tǒng)在全世界具有代表性。按照技術(shù)沿革,各核電廠的技術(shù)情況如表2所示。
核反應(yīng)堆的儀表與控制系統(tǒng)由測量系統(tǒng)、控制(調(diào)節(jié))系統(tǒng)、反應(yīng)堆保護系統(tǒng)、專設(shè)安全設(shè)施等組成[6]。核電廠數(shù)字化分布式儀表與控制系統(tǒng)總體縱向分為四層。
1)現(xiàn)場級(輸入/輸出層):執(zhí)行過程輸入和輸出功能。本級是系統(tǒng)級與核電站工藝設(shè)備之間信號傳遞的橋梁。
表2 國內(nèi)核電廠的儀表與控制系統(tǒng)Table 2 Instrumentation and control system of nuclear power plants in China
2)系統(tǒng)級(控制層):執(zhí)行信號采集、數(shù)據(jù)處理和執(zhí)行保護與控制功能。該級包括:反應(yīng)堆保護系統(tǒng)、數(shù)據(jù)采集與處理系統(tǒng)、反應(yīng)堆控制系統(tǒng)、汽輪發(fā)電機組控制和保護系統(tǒng)以及承擔機組控制和設(shè)備保護任務(wù)的標準控制系統(tǒng)。主要采用PID調(diào)節(jié)器控制技術(shù)。
3)機組級(過程信息處理層):處理一個機組的所有數(shù)據(jù),執(zhí)行機組的監(jiān)測、控制和信息顯示功能,是人機接口的界面。包括主控室、全廠放射性水平監(jiān)視系統(tǒng)和火災(zāi)監(jiān)測報警系統(tǒng)、緊急停堆控制盤系統(tǒng)等。
4)電站級(管理層):處理所有機組公用數(shù)據(jù)。
目前商用反應(yīng)堆系統(tǒng)主要采用經(jīng)典單輸入單輸出控制技術(shù),少部分采用多變量控制,比如蒸汽發(fā)生器的三變量控制器。商用反應(yīng)堆控制技術(shù)的發(fā)展趨勢是基于總體控制目標,協(xié)調(diào)各個控制回路的動作,并擴大自動控制范圍。
在反應(yīng)堆控制技術(shù)研究中,常見的控制技術(shù)有自適應(yīng)魯棒控制、功率轉(zhuǎn)換模糊邏輯控制、蒸汽發(fā)生器的H∞控制與基于遺傳算法的控制,以及反應(yīng)堆堆芯功率分布的神經(jīng)網(wǎng)絡(luò)控制,還有具有容錯與重構(gòu)特征、先進反應(yīng)堆—回路功率控制的模型預(yù)測控制。這些技術(shù)主要應(yīng)用在大學研究中,或者研究堆以及先進小型堆中。
第一臺自主式機器人探測車火星探路者索杰納于1997年7月開始探索火星地表。索杰納的自主能力非常有限,導(dǎo)航、資源管理和應(yīng)急響應(yīng)等仍然需要地面遙控。火星雙子探測漫游車(MERS)——勇氣號和機遇號,于2004年1月開始了星表探測任務(wù),探測活動一直持續(xù)到2017年。除了具有自主障礙檢測和導(dǎo)航能力,這兩輛漫游車在索杰納的能力之上擴展了其自主能力,還具有基于模型的恢復(fù)、資源管理和自主規(guī)劃能力。用于促進火星雙子探測漫游車自主的集成軟件架構(gòu)是“自主機器人耦合層體系結(jié)構(gòu)”(CLARAty)。CLARAty包含兩層結(jié)構(gòu),由人工智能軟件決策層和實現(xiàn)控制的功能層組成。每層中的隱式粒度允許具有嵌套能力的功能體系結(jié)構(gòu)[7]。
航天器的自主性已隨深空一號任務(wù)進行了演示。深空一號于1998年10月發(fā)射。作為驗證太空中高風險先進技術(shù)的試驗平臺,除了演示航天器的自主導(dǎo)航外,還進行了一個主要實驗,演示了用于星上規(guī)劃和航天器活動執(zhí)行的遠程智能體人工智能系統(tǒng)[8]。除了在深空一號上的實驗性應(yīng)用,自主技術(shù)已經(jīng)實際應(yīng)用于航天器,比如哈勃望遠鏡使用的“科學規(guī)劃交互知識系統(tǒng)(SPIKE)”[9],“地球觀測衛(wèi)星1號”(EO-1)使用的ASPEN系統(tǒng)[10]。國內(nèi)的高校和院所也已經(jīng)開展了航天器自主技術(shù)的研究,如北京理工大學深空探測技術(shù)研究所對航天器的自主任務(wù)規(guī)劃技術(shù)[11-12]、自主姿態(tài)規(guī)劃技術(shù)進行了研究[12-13],中國科學院、北京理工大學、國防科技大學、北京航空航天大學等對多種深空自主導(dǎo)航方式進行了研究,嫦娥三號月球軟著陸成功采用了自主導(dǎo)航技術(shù)[14],姜連祥等[15]對航天器的自主故障診斷技術(shù)發(fā)展進行了總結(jié)。國內(nèi)的深空探測器自主技術(shù)處于起步階段,雖然從多個角度開展了理論研究,但尚未廣泛應(yīng)用到實際深空探測任務(wù)中。
未來的深空探測器應(yīng)具備系統(tǒng)級的自主能力,通過接收地面的高級指令,自主進行任務(wù)規(guī)劃、命令序列化、探測器行為監(jiān)測、探測器故障診斷和恢復(fù)等,只在出現(xiàn)無法解決的故障時,求助于地面[12]。另外,需要合理地自主運行體系結(jié)構(gòu)以整合各項自主技術(shù)。在體系結(jié)構(gòu)設(shè)計中,航天器各系統(tǒng)應(yīng)盡量提高自主性,以減輕上一級系統(tǒng)的控制壓力[16]。
美國戰(zhàn)略防御計劃研制了SP-100核熱離子反應(yīng)堆系統(tǒng),其中采用了容錯控制方法,論證了將這種方法應(yīng)用于空間裂變反應(yīng)堆控制的可行性,反應(yīng)堆既可用于推進(核電或核熱),也可作為能源[17]。
反應(yīng)堆自主控制與典型自動控制不同。自動控制使被控對象自動執(zhí)行基本動作,重大決策需要由人決定。自主控制具有控制、診斷和決策能力,甚至還具有自我維護、修復(fù)能力。從自動控制到自主控制的智能化過程如圖2所示。
圖2 自動控制到自主控制的智能化過程Fig.2 The intellectualized process from automatic control to autonomous control
自主控制可以在反應(yīng)堆所有運行模式下應(yīng)用。應(yīng)用場景包括:工藝性能優(yōu)化(如自整定);連續(xù)監(jiān)測、性能指標診斷以及預(yù)測與安全相關(guān)參數(shù)的變化趨勢;組件的健康診斷、處理預(yù)期與未預(yù)期事件和提供壽命有限元件(如電池和驅(qū)動機構(gòu))保護的柔性控制;適應(yīng)工況不斷變化或降質(zhì);控制系統(tǒng)性能檢驗和維護。
自主控制關(guān)鍵特性包括:確認系統(tǒng)性能并檢測降質(zhì)或故障狀態(tài)的智能性;適應(yīng)不確定性和變化工況的魯棒性;設(shè)備負荷最小化和有效應(yīng)對運行事件而不影響系統(tǒng)完整性的優(yōu)化性;通過在現(xiàn)有控制系統(tǒng)元素之間重新配置或調(diào)整控制系統(tǒng)策略、算法或參數(shù),以適應(yīng)故障的靈活性和適應(yīng)性。
智能性(嵌入式?jīng)Q策和管理/規(guī)劃權(quán))有助于減少或不依賴于人的干預(yù),并能容納一個完整的、全系統(tǒng)方法的控制。智能控制提供了基于系統(tǒng)知識的動作預(yù)期和事件預(yù)測。為了支持控制和決策,對于狀態(tài)識別和健康/狀態(tài)監(jiān)測,實時診斷/預(yù)測能力非常重要。自我驗證是處理數(shù)據(jù)、命令和系統(tǒng)性能評估和響應(yīng)智能化的一個方面。
除了具有適應(yīng)各種環(huán)境的能力外,還需考慮設(shè)計不確定性和未建模動態(tài)所需的魯棒性。故障管理是實現(xiàn)魯棒性的一個重要考慮因素。故障管理包含故障避免、故障排除、容錯和故障預(yù)測等技術(shù)。此外,魯棒性也可以包含自我維護或自愈。這種能力是通過獲取設(shè)計知識與自我糾正性能、預(yù)測識別早期故障、故障檢測與故障隔離等技術(shù)來提升的。
優(yōu)化意味著對需求的快速響應(yīng)、與目標條件的最小偏差以及高效的執(zhí)行器動作。優(yōu)化控制可以通過自調(diào)整和其他形式的自適應(yīng)來實現(xiàn)。靈活性和適應(yīng)性可以通過不同的測量、多種通信選項和不同的控制解決方案來實現(xiàn)。功能可重構(gòu)性有助于這些系統(tǒng)可選項的有效利用,而固有的重設(shè)計能力可以適應(yīng)未預(yù)期工況。
與地面核電站采用不同程度的直接人工控制和運行決策不同,空間反應(yīng)堆控制系統(tǒng)將遇到獨特的挑戰(zhàn)??臻g堆控制系統(tǒng)應(yīng)能提供連續(xù)、遠程、無人值守(有限直接人工干預(yù))運行。此外,空間堆控制系統(tǒng)應(yīng)滿足系統(tǒng)和設(shè)備降質(zhì)或失效以及罕見或未預(yù)期運行事件。因此,為支持運行目標,需要對快速事件作出反應(yīng)并適應(yīng)不斷變化或降質(zhì)工況,而不需要立即進行直接的人為監(jiān)督。自主控制可以在不需要直接人工干預(yù)的情況下,在存在重大不確定性、干擾和降質(zhì)的情況下,滿足重要的控制目標,同時提升經(jīng)濟競爭力。
自主控制的目標是限制非正常事件的發(fā)展及減少停堆動作,非正常事件包括如下幾個方面:熱負荷瞬變(如熱電轉(zhuǎn)換系統(tǒng)故障,冷源喪失);負荷/電源中斷,執(zhí)行器降質(zhì)或失效,執(zhí)行器信號中斷或受干擾;余熱排出系統(tǒng)降質(zhì)或損壞,控制處理器故障,罕見的軟件錯誤,傳感器故障,傳感器信號中斷或干擾、傳感器漂移、信號調(diào)理電路漂移、傳感器噪聲增加、通信故障或通信重發(fā);快速降負荷是最有可能觸發(fā)直接保護動作的一個重大事件??臻g堆運行模式見圖3。
圖3 空間堆的運行模式Fig.3 Operation modes of space nuclear reactor
應(yīng)對非正常事件的手段有:
1)反應(yīng)堆保護
通過多樣性和縱深防御來提供增強的分層反應(yīng)堆保護。或利用限制系統(tǒng),在保護反應(yīng)堆的同時最大限度地降低昂貴的緊急停堆風險。
2)可用率保證
通過故障管理、自動控制、性能管理、數(shù)據(jù)管理和通信等方式保證可用率。
故障管理是自主控制的重要組成部分,在給定變化的設(shè)備或反應(yīng)堆狀態(tài)下,進行檢測、診斷和適應(yīng)(或重新配置)??刂葡到y(tǒng)和反應(yīng)堆性能的檢測、診斷和驗證。通過這種能力,作為預(yù)期動作而非反應(yīng)性動作,反應(yīng)堆控制系統(tǒng)能夠識別始發(fā)事件(瞬變或故障),確定保護壽命有限或易損部件的措施,并確保反應(yīng)堆持續(xù)可靠地運行。
自動控制是在正常運行模式下的自主控制功能。性能管理評估控制系統(tǒng)和反應(yīng)堆的狀態(tài),以確定何時進行應(yīng)調(diào)用的控制器預(yù)先調(diào)整。評估能夠監(jiān)測控制系統(tǒng)的有效性,識別反應(yīng)堆的動態(tài)狀態(tài)和確定關(guān)鍵設(shè)備的狀態(tài)。評估的方法有:狀態(tài)估計算法、過程系統(tǒng)診斷、設(shè)備狀態(tài)監(jiān)視和控制參數(shù)自適應(yīng)。另外數(shù)據(jù)管理和通信能力也與自主功能相關(guān)。
總的來說,應(yīng)對非正常事件的手段有兩點。一是通過多樣性和縱深防御來提供增強的分層反應(yīng)堆保護。二是開發(fā)限制系統(tǒng),在保護反應(yīng)堆的同時最大限度地減少昂貴的緊急停堆風險。
空間堆自主性的主要功能達到何種程度取決于賦予自主控制系統(tǒng)的責任水平和自主控制系統(tǒng)必須緩解的運行風險程度。
影響空間堆自主性水平的因素有:持續(xù)直接人機交互潛力限制(因多個智能體共享操作員監(jiān)管職責或因限制空間安裝維護人數(shù))、績效目標、系統(tǒng)需求復(fù)雜、技術(shù)限制,運行風險考慮、極簡約(即可靠性)與復(fù)雜程度(即檢測和調(diào)節(jié)能力)。
盡管具有高度可靠的反應(yīng)堆控制系統(tǒng)很重要,但在沒有直接人為干預(yù)或緊急停堆的情況下,如果控制系統(tǒng)不能適應(yīng)反應(yīng)堆降質(zhì),那么控制系統(tǒng)價值也有限。在這種空間堆狀態(tài)變化情況下,一個高度可靠的控制系統(tǒng)卻發(fā)揮不了作用。
總的來說,反應(yīng)堆的自主控制研究經(jīng)驗不足,技術(shù)基礎(chǔ)不深,特別是自主控制尚未在地面運行的核電廠實現(xiàn)。對于空間反應(yīng)堆自主控制的研發(fā)工作,關(guān)鍵要素包括建立適當?shù)墓δ芗軜?gòu)、開發(fā)支持自主的基本模塊、并進行自主能力的地面綜合示范應(yīng)用。
如圖4所示,在分層自主控制方法中,自主控制體系結(jié)構(gòu)包含三層:規(guī)劃器層、執(zhí)行層和功能層[18-19]。規(guī)劃器層提供慎思式規(guī)劃,執(zhí)行層提供動作排序,功能層提供直接控制。
圖4 自主控制體系結(jié)構(gòu)Fig.4 Autonomous control architecture
例如,火星探測漫游車任務(wù)中采用了基于CLARAty軟件環(huán)境的自主控制架構(gòu)。CLARAty體系結(jié)構(gòu)折疊了規(guī)劃器層和執(zhí)行層,其特點是將智能高層放入決策層。把慎思和程序功能合并成一個與功能層并行的層,并提供支持決策的公用數(shù)據(jù)庫。
在空間堆自主控制中,功能層是一個面向?qū)ο蟮慕Y(jié)構(gòu),它提供對核推進/系統(tǒng)硬件功能的訪問,并充當決策層對控制對象(機器人、航天器、核推進)的控制接口。決策層提供由功能層的智能控制能力分解和執(zhí)行的高級命令,建立基于核推進/系統(tǒng)狀態(tài)和已知約束的任務(wù)序列,評估功能層實現(xiàn)這些命令的能力[20]。
圖5 空間堆近自主控制體系結(jié)構(gòu)Fig.5 Near autonomous control architecture of space nuclear reactor
本文根據(jù)已有研究成果和實踐,提出一種近自主控制系統(tǒng)體系結(jié)構(gòu)方法,如圖5所示。本體系結(jié)構(gòu)具有與運行人員的高級接口,運行人員為空間堆最終監(jiān)管者,決策和目標由人確定??刂葡到y(tǒng)承擔了正常控制、異常事件響應(yīng)和系統(tǒng)容錯等擴展職能。
體系結(jié)構(gòu)中的每個節(jié)點(除了底層的終端節(jié)點)都是一個監(jiān)視模塊。體系結(jié)構(gòu)中每一級的監(jiān)視模塊都響應(yīng)其上層模塊所設(shè)定的目標和指令,也響應(yīng)它下層的模塊所提供的數(shù)據(jù)和信息。每個模塊做出適合其體系結(jié)構(gòu)的決策,并將決策結(jié)果和必要的支持信息傳遞給功能連接模塊。
體系結(jié)構(gòu)中各層具有不同的功能。設(shè)備網(wǎng)絡(luò)層連接傳感器、執(zhí)行器和通訊;控制/監(jiān)視/診斷層的功能是控制模塊與較底層節(jié)點的耦合,相當于由控制器與現(xiàn)場設(shè)備組成的自動控制系統(tǒng),監(jiān)視和診斷模塊提供派生數(shù)據(jù)以支持設(shè)備和過程系統(tǒng)的狀態(tài)確定和監(jiān)視;混合控制/預(yù)測層的功能是提供命令和信號驗證功能,支持失效早期或正在出現(xiàn)的設(shè)備降質(zhì)的預(yù)測(即故障識別);命令/決策層提供算法,允許重新配置或調(diào)節(jié)以適應(yīng)檢測到或預(yù)測到的反應(yīng)堆狀況(即,容錯活動),替代原有控制器,基于操縱員命令抑制或逆轉(zhuǎn)自主控制動作;監(jiān)管者/協(xié)調(diào)人層提供人機接口,負責操作員指令下達。
自然界常常能給科學研究帶來啟發(fā)。當思考如何自主控制系統(tǒng)中的多個子系統(tǒng)時,可能聯(lián)想到章魚,它能同時協(xié)調(diào)八個腕足。章魚具有整個動物界最奇特的智能——分散處理信息的能力。這種能力的實現(xiàn)依賴于章魚的生理特性。章魚具有8個外圍神經(jīng)系統(tǒng):每個腕足受數(shù)百個觸覺、化學和本體神經(jīng)支配,具有自主能力,不受大腦節(jié)制。同時,章魚還有一個專門化的中央大腦,與人類海馬體相似,專注于高級認知活動(認知、決策、協(xié)調(diào)復(fù)雜動作等)[21]。這種信息處理方式是動物界典型的多智能體自主控制。
由于空間反應(yīng)堆控制有安全性、經(jīng)濟性、操控約束、環(huán)境(空間、余熱排出)受限、人工參與受限等特點,近自主控制的分層體系結(jié)構(gòu)無法完全適用。尤其是在人難以及時參與決策的深空環(huán)境中,近自主控制分層體系結(jié)構(gòu)中的監(jiān)管者/協(xié)調(diào)人層無法發(fā)揮原有的作用。因此,在多智能體自主控制中應(yīng)用分層控制體系結(jié)構(gòu)方法,根據(jù)空間堆的特點調(diào)整自主控制體系結(jié)構(gòu)的分層方式,提出多智能體自主控制體系結(jié)構(gòu)。
多智能體系統(tǒng)具有的能力有:控制能力,感知周圍環(huán)境的能力,智能體間的交互能力,信息處理和計算能力,響應(yīng)及決策能力。多智能體自主控制體系利用多智能體的能力解決空間反應(yīng)堆控制問題,在人工參與受限的情況下,自主控制反應(yīng)堆,滿足各種條件的約束,達到安全性、經(jīng)濟性等控制目標。
多智能體自主控制系統(tǒng)體系結(jié)構(gòu)如圖6所示。該體系結(jié)構(gòu)是一個抽象模型框架,它定義了系統(tǒng)中的結(jié)構(gòu)、設(shè)備、關(guān)系、動態(tài)和通訊。決策與功能層融合是其主要特征。在空間堆近自主控制體系結(jié)構(gòu)的基礎(chǔ)上,兩層融合能夠簡化體系結(jié)構(gòu),提升決策層獲取系統(tǒng)狀態(tài)信息的效率。決策功能單元包含:計劃與調(diào)度模塊、數(shù)據(jù)采集模塊、診斷與預(yù)測模塊、決策模塊、控制動作預(yù)測與驗證模塊、命令生成模塊,其中決策模塊是主智能體,擁有最高決策權(quán)。
圖6 多智能體自主控制體系結(jié)構(gòu)Fig.6 Architecture of multi-agent autonomous control system
體系結(jié)構(gòu)最低層的兩級結(jié)構(gòu)相當于一個自動化控制系統(tǒng)。較低層智能體實現(xiàn)可靠的、容錯的嵌入式功能,為實現(xiàn)響應(yīng)快速事件和適應(yīng)變化或降質(zhì)工況也可集成一些與控制/監(jiān)視/診斷級別相關(guān)聯(lián)的基本決策能力。較高層級智能體將承擔更高程度的決策能力。
體系結(jié)構(gòu)中嵌入式智能體功能有:數(shù)據(jù)采集、執(zhí)行器激活、驗證、仲裁、控制、限制、檢查、監(jiān)視、命令、預(yù)測、通信、故障管理和配置管理。
多智能體體系結(jié)構(gòu)的功能分配必須基于自主程度、技術(shù)成熟度、可靠性和故障管理、軟件開發(fā)實踐和平臺功能,以及反應(yīng)堆控制系統(tǒng)硬件的物理體系結(jié)構(gòu),這有待于今后進一步開發(fā)細化。
雖然在機器人、航天等應(yīng)用領(lǐng)域把自動化增強為自主化已經(jīng)取得了顯著進展,但核能行業(yè)在將人的作用和職責轉(zhuǎn)移到機器(系統(tǒng))方面的進展并不大。尤其是有限的幾乎是學術(shù)性的研究主要集中在開發(fā)先進控制和監(jiān)控能力上。實現(xiàn)空間堆自主控制的主要技術(shù)差距與決策能力(例如戰(zhàn)略、解釋、適應(yīng)、預(yù)測)有關(guān)。采用多智能體自主控制結(jié)構(gòu)將提供高效、有效、經(jīng)濟的空間堆控制解決方案,滿足空間堆的自主控制需求,提升反應(yīng)堆的經(jīng)濟競爭力。實現(xiàn)一個空間反應(yīng)堆自主控制系統(tǒng),需要通過地面技術(shù)開發(fā)和示范活動提供所需的技術(shù)準備,特別是在其功能體系結(jié)構(gòu)中建立監(jiān)視、趨勢、檢測、診斷、決策和自我調(diào)節(jié)能力。目前,實現(xiàn)具有完全自主運行、自主保護和自主管理智能體反應(yīng)堆模塊尚處于設(shè)想階段,但對于未來深空探測能源系統(tǒng)的發(fā)展具有重要意義。