冶運濤,蔣云鐘,梁犁麗,趙紅莉,顧晶晶,董甲平,曹 引,段 浩
(1. 中國水利水電科學研究院,北京 100038;2. 水利部數(shù)字孿生流域重點實驗室,北京 100038;3. 中國長江三峽集團有限公司科學技術研究院,北京 101199)
全球氣候變化和人類活動疊加影響使得氣候形勢愈發(fā)復雜多變,導致局地強降水、超強臺風、區(qū)域性嚴重干旱及累積水污染等極端事件的突發(fā)性、異常性和不確定性更為突出,且數(shù)量明顯增多,如2021年鄭州“7·20”暴雨、黃河中下游秋汛、塔克拉瑪干沙漠地區(qū)洪水及珠江三角洲部分地區(qū)旱情。極端天氣的超標準載荷極易造成水利工程隱患集中暴發(fā),形成災害鏈放大效應。水問題表象在河流,根子在流域,江河湖泊的流域特性決定了必須以流域為單元展開科學研究[1- 2]。解決水旱災害頻發(fā)、水資源短缺、水環(huán)境污染和水生態(tài)損害等問題,是國內外公認的科學命題[3- 4]。流域是以水為紐帶的復雜開放性系統(tǒng)。水系統(tǒng)演化具有很強的不確定性,科學本質上更具綜合性、協(xié)作性、跨學科性,迫切需要新的工具來支撐新的研究范式[5- 7]。同時,可獲得的前所未有的遙感、地表或地下儀器監(jiān)測、社會公眾以及網(wǎng)絡可用的高度復雜且無序的各種數(shù)據(jù),需要新的工具進行處理分析和洞察理解[5]。此外,流域治理管理要求決策支持平臺具有全息性、時效性、科學性和協(xié)同性等性能,亟需新的工具承載這種要求[8- 9]。
2019年Nature發(fā)表論文《Make more digital twins》[10],數(shù)字孿生研究得到國際廣泛關注[11],其核心是構建仿真模型以實現(xiàn)信息空間和物理空間的無縫集成與實時映射[12],從而對物理空間對象進行全生命周期管控,降低復雜系統(tǒng)預測不確定性和規(guī)避應急事件帶來的風險[13]。數(shù)字孿生以實時同步、虛實映射、高保真度等特性為拓展流域科學研究提供了一種新的工具,它與流域科學研究和治理管理相結合推動了數(shù)字孿生流域概念的誕生[14]。數(shù)字孿生流域是數(shù)字流域的高級階段[15- 16],是實現(xiàn)智慧流域理想目標的最佳技術路徑[17- 18],是賦予流域智慧管理的重要設施和基礎能力[19]。
歐盟(European Union,EU)和美國國家航空航天局(National Aeronautics and Space Administration,NASA)先后提出了數(shù)字孿生地球計劃[6- 7,20],旨在建立一個可持續(xù)演進、可交互和集成多域多尺度的數(shù)字孿生化地球,通過對大自然和人類活動的可視化、監(jiān)控和預測,模擬未來氣候趨勢,評估災難性事件,保護生態(tài)環(huán)境,推進地球各項管理工作精細化。數(shù)字孿生流域作為數(shù)字孿生地球的一個重要區(qū)域層次,它的開發(fā)和研究是實施數(shù)字孿生地球的一個很好的試驗場所和切入點[16]。國際上,很多學者探索了數(shù)字孿生技術在水治理管理中的應用。Ghaith等[21]基于數(shù)字孿生建立了城市尺度洪水防御框架;Bartos等[22]提出了將水力求解與在線數(shù)據(jù)同化相結合的雨洪系統(tǒng)數(shù)字孿生模型;Alperen等[23]研究了基于ANN的水文數(shù)字孿生防洪模擬;Ranjbar等[24]建立了法國加來渠道的數(shù)字孿生框架;Conejos等[25]將數(shù)字孿生應用于西班牙巴倫西亞供配水網(wǎng)絡;Pedersen等[26]建立了城市水系統(tǒng)逼真的和原型的數(shù)字孿生。在國內,在理論探索方面,與NASA提出的數(shù)字孿生概念同期,蔣云鐘等[8]于2010年提出了智慧流域概念,定義中描述了通過物理流域與數(shù)字流域無縫集成實現(xiàn)對流域智慧化管理,已具備數(shù)字孿生的思想;此外,國內學者繼而發(fā)展出“虛擬流域”理論與方法。虛擬流域屬于數(shù)字流域范疇,但更強調了對真實流域對象的精準化描述[27]。這些研究為解析數(shù)字孿生流域提供了理論儲備。在技術方面,水利部黃河水利委員會、清華大學、華中科技大學、天津大學等單位開展了虛擬化技術在流域管理、水利工程施工中的應用研究[27],但這些研究僅僅是利用數(shù)字化方式進行信息管理,還處于數(shù)字孿生技術的初級應用階段,尚不具備數(shù)字孿生的特征。當前,在國家全力推動下,數(shù)字孿生流域已成為全社會焦點,如黃艷等[28]探索了面向流域水工程防災聯(lián)合智能調度的數(shù)字孿生長江建設;劉昌軍等[29]研究了數(shù)字孿生淮河流域智慧防洪體系;李文學等[30]、甘郝新等[31]、廖曉玉等[32]分別探索了數(shù)字孿生黃河、數(shù)字孿生珠江、數(shù)字孿生松遼的建設方案。由于對數(shù)字孿生范式認識不足、理論研究不充分和技術挑戰(zhàn)尚未攻克,數(shù)字孿生的真實效用尚未真正發(fā)揮[33- 34]。
綜合分析已有研究成果可知,數(shù)字孿生流域的基礎理論研究尚處于起步階段,以下關鍵問題亟待厘清:數(shù)字孿生流域的定義及內涵特征,數(shù)字孿生流域基本模型,數(shù)字孿生流域的核心能力,數(shù)字孿生流域的關鍵技術,數(shù)字孿生流域亟需發(fā)展方向。通過上述問題探索,為中國數(shù)字孿生流域建設提供理論支撐。
數(shù)字孿生可追溯到美國密歇根大學Grieves教授于2003年前后在其產(chǎn)品全生命周期管理課程上提出的“與物理產(chǎn)品等價的虛擬數(shù)字表達”概念[35],當時沒有被稱為數(shù)字孿生,卻具備了數(shù)字孿生的基本組成要素,被認為是數(shù)字孿生的雛形。2010年,數(shù)字孿生由NASA首次書面提出并給出了定義,即充分利用物理模型、傳感器更新、運行歷史等數(shù)據(jù),集成多學科、多物理量、多尺度、多概率的仿真過程,在虛擬空間中完成映射,從而反映相對應的實體裝備的全生命周期過程[36- 37]。2014年,Grieves教授提出數(shù)字孿生概念模型包括3個主要部分:實體空間中的物理產(chǎn)品,虛擬空間中的虛擬產(chǎn)品,將虛擬產(chǎn)品和物理產(chǎn)品聯(lián)系在一起的數(shù)據(jù)和信息的連接[35]。盡管其他科研機構、企業(yè)和學者也各自提出對數(shù)字孿生的理解,但仍是以上述概念為基礎,針對不同的使用目的進行闡述[38]。陶飛等[37]在Grieves數(shù)字孿生三維模型基礎上發(fā)展出五維模型,包括物理實體、虛擬實體、服務、數(shù)據(jù)和連接。隨著大數(shù)據(jù)和人工智能的發(fā)展,知識作為核心要素將在數(shù)字孿生研究中發(fā)揮重要作用[39- 40]。與數(shù)字孿生流域相關的數(shù)字孿生地球被定義為可用數(shù)據(jù)和物理規(guī)律約束的地球系統(tǒng)狀態(tài)和時間演進進行數(shù)字復制的信息系統(tǒng)[6- 7],該定義的核心要素包括虛擬地球空間(數(shù)字復制)、數(shù)據(jù)、知識(物理規(guī)律約束)以及服務(信息系統(tǒng))。
綜合上述研究成果,將數(shù)字孿生五維模型擴展為六維模型,包括物理實體、虛擬實體、連接、服務、數(shù)據(jù)和知識。由此,將數(shù)字孿生六維模型和流域治理管理相結合,提出數(shù)字孿生流域包括物理流域、虛擬流域、實時連接交互、數(shù)字賦能服務、孿生流域數(shù)據(jù)及孿生流域知識6個基本要素。在6個要素協(xié)同下,完成對流域的動態(tài)監(jiān)控、診斷評估、模擬仿真、預測預報、決策優(yōu)化、管理控制等功能。其中,虛擬流域是物理流域的數(shù)字鏡像,是數(shù)字孿生流域的虛擬孿生體;物理流域是數(shù)字孿生流域的物理孿生體。
從技術角度理解,與數(shù)字孿生流域相關的概念是數(shù)字孿生地球,Bauer等[6]認為數(shù)字孿生地球是地球數(shù)字復制的信息系統(tǒng)。如果單純從傳統(tǒng)信息系統(tǒng)的角度,無法反映新一代信息技術給各行業(yè)帶來的革命性變化,更反映不出對傳統(tǒng)基礎設施改造的特點,而數(shù)字孿生流域超越了傳統(tǒng)信息系統(tǒng)的范疇[41],可以認為是一種新型基礎設施。從科學研究角度理解,虛擬空間拓展了地理科學研究空間,受到了國際重視,英國皇家科學院院士Batty[42]認為,發(fā)展虛擬地理學可以有效地建立起現(xiàn)實地理環(huán)境與虛擬空間的連接橋梁;Bainbridge[43]在Science撰文論述了虛擬世界的科學研究潛力;李雙成等[44]認為在孿生空間中,物與物之間、人與人之間、人與物之間的時空壁壘被清除,一個萬物感知、萬物互聯(lián)、萬物交融的虛實交融空間將開辟地理學模擬現(xiàn)實、預測未來的新綜合研究范式。數(shù)字孿生作為科學研究和工程實踐新范式受到國際認可[38,45- 46]。
通過上面對數(shù)字孿生流域基本組成要素和數(shù)字孿生概念的分析,本文定義數(shù)字孿生流域為:數(shù)字孿生流域是服務流域全生命周期管理的全量數(shù)據(jù)和領域知識驅動物理流域和虛擬流域交互映射、共智進化、虛實融合的新基建新范式。數(shù)字孿生流域基本原理是通過物理流域與虛擬流域的精準映射與動態(tài)交互,實現(xiàn)物理流域、虛擬流域、流域服務系統(tǒng)的全流域要素、全時空數(shù)據(jù)、全領域知識及全業(yè)務流程的無縫集成和深度融合,以孿生數(shù)據(jù)和孿生知識驅動物理流域、虛擬流域、流域服務系統(tǒng)的全景仿真[47]、演化自治、實時同步、閉環(huán)互動與共生進化,在虛擬流域空間實現(xiàn)對物理流域對象全生命周期過程的監(jiān)控、診斷、模擬、預測、決策、控制和管理,從而在滿足特定目標和約束的前提下,達到流域治理管理決策最優(yōu)。
建模和仿真是數(shù)字孿生流域的核心,但是數(shù)字孿生與傳統(tǒng)的建模仿真仍有區(qū)別,見表1[6- 7,47]。
表1 數(shù)字孿生與傳統(tǒng)建模仿真的區(qū)別
數(shù)字孿生流域的內涵是:基于高度集成的數(shù)據(jù)閉環(huán)賦能新體系[48],生成以自然地理、干支流水系、水利工程、氣象水文、經(jīng)濟社會、生態(tài)環(huán)境等為主要內容的全息數(shù)字虛擬鏡像空間;通過“由實入虛”,利用多維多時空尺度高保真模型的數(shù)字化仿真、虛擬化交互,形成數(shù)據(jù)驅動決策、虛實充分融合交織的智能系統(tǒng);通過“以虛映實”,使物理流域對象可以在虛擬流域空間進行協(xié)同建模、仿真預測、自主演化、干預操控;通過“由虛控實”,以最優(yōu)化方案在物理流域中的實施來最大程度地規(guī)避風險、減少損失、提高效益[14],實現(xiàn)對物理流域對象的模擬、監(jiān)控、診斷、預測與控制,解決物理流域系統(tǒng)中規(guī)劃、設計、運行、管理、任務執(zhí)行等閉環(huán)過程中的復雜性和不確定性問題[6- 7,35]。
基于數(shù)字孿生流域概念定義與內涵分析,將數(shù)字孿生核心特點[49- 51]和流域治理管理相結合,提出數(shù)字孿生流域的特征,包括高度保真、演化自治、實時同步、閉環(huán)互動及共生進化。
(1) 高度保真性指河流、湖泊等自然水系以及地下含水層機構和大壩、閘門、泵站、渠道、管道等物理流域對象與虛擬流域空間中的虛擬對象不僅在幾何結構和外形表觀有著高度的相似性,而且水流運動狀態(tài)、工程運行狀態(tài)以及流域治理管理活動狀態(tài)也保持高度仿真,同時要求建立描述水資源- 生態(tài)環(huán)境- 社會經(jīng)濟系統(tǒng)相互作用、共同演化的流域數(shù)字孿生模型,能夠精確地模擬預測物理流域系統(tǒng)的時空變化過程。
(2) 演化自治性是物理流域對象(如物理空間中的水流運動)和虛擬流域對象(如虛擬空間中水流運動)遵循質量守恒、動量守恒、能量守恒等相同的物理原理進行相互獨立的時空演化。如根據(jù)采集的真實河道的邊界條件或假定的邊界條件,在虛擬流域空間中,利用可擴展的數(shù)字孿生模型(如水文水動力模型和可視化模型)能夠立體直觀地自主模擬仿真推演歷史或未來或某種工況條件下河道水流的演進過程,分析各種外部影響因子對河道水流狀態(tài)及伴隨屬性的影響,從而提升數(shù)字孿生流域的推演能力。
(3) 實時同步性指物理流域對象在受氣候變化和人類活動影響下處于不斷變化過程中,那么這就要求虛擬流域對象與對應的物理流域對象的初始條件和動態(tài)運行時的結構、狀態(tài)、參數(shù)保持一致性。利用物理流域對象(如河道)當前狀態(tài)(如地形、水位、流量)的實時數(shù)據(jù)初始化虛擬流域模型運行的起始狀態(tài),以保證數(shù)字孿生模型能夠實時預測物理流域對象的運行軌跡,尤其能夠跟蹤極端事件的變化態(tài)勢。在數(shù)字孿生模型運行中,利用實測數(shù)據(jù)不斷調整模型結構、狀態(tài)和參數(shù),使物理流域對象演化的物理規(guī)律與虛擬流域模型蘊含的物理規(guī)律保持一致,以保證對物理流域對象變化軌跡進行高精度的預測。
(4) 閉環(huán)互動性指虛擬流域和物理流域之間通過實時連接交互嵌入業(yè)務鏈中,實現(xiàn)數(shù)字孿生流域的閉環(huán)來實現(xiàn)業(yè)務賦能。一方面,通過對物理流域空間中水循環(huán)過程的監(jiān)測分析以及演變規(guī)律和形成機理的深度洞察,完善和調整流域數(shù)字模型結構和參數(shù)來降低不確定性,使其更加準確地反映流域水循環(huán)特性,精準預測水循環(huán)變化趨勢;另一方面,在虛擬流域空間中,利用數(shù)字孿生流域高度保真性和演化自治性,通過模擬仿真推演結果的分析評估,滾動調整水利工程運行、應急調度、人員防災避險等應對措施,制定工程運行和優(yōu)化調度等方案策略,從而改變物理流域對象的演化軌跡。
(5) 共生進化性指以數(shù)字孿生技術構成的虛擬流域和物理流域的“雙胞胎”通過高度保真性、演化自治性、實時同步性和閉環(huán)互動性來實現(xiàn)共生融合、迭代進化,促進彼此之間的發(fā)展。對物理流域來說,虛擬流域通過復演物理流域的歷史軌跡、監(jiān)視和模擬物理流域實時運行態(tài)勢和預測物理流域未來變化,對流域治理管理的全生命周期進行全方位掌控,為制定可行性的流域治理管理方案提供協(xié)商決策平臺,從而使物理流域每條河流向“幸福河”目標逼近。對虛擬流域來說,隨著“幸福河”分階段實現(xiàn),說明管理和技術人員對物理流域的運行規(guī)律認識更加深刻,從而能夠對物理流域進行“精準畫像”,以更加全面的精準認知促進虛擬流域的調整和升級。
由前文數(shù)字孿生流域概念定義分析可知,數(shù)字孿生流域基本模型(WDT)如式(1) 所示:
WDT={WP,WV,WC,WS,WD,WK}
(1)
式中:WP為物理流域;WV為虛擬流域;WC為實時連接交互;WS為數(shù)字賦能服務;WD為孿生流域數(shù)據(jù);WK為孿生流域知識。WDT基本架構如圖1所示。
圖1 數(shù)字孿生流域基本架構Fig.1 Basic framework of digital twin watershed
(1) 物理流域。WP是將物理流域信息及時反饋給流域虛擬孿生體(即虛擬流域),包括自然地形地貌、水利工程、流域治理管理活動對象及與其關聯(lián)的監(jiān)測控制信息化設施設備。在現(xiàn)有監(jiān)測站網(wǎng)基礎上,構建天空地一體化水利感知網(wǎng),及時、準確地采集物理流域的水文、水資源、水利工程、水土保持、河湖、經(jīng)濟社會和生態(tài)環(huán)境等信息,全面掌握流域下墊面數(shù)字地形、植被覆蓋、河道阻水建筑物、河灘占用、水文大斷面和重要河段水下地形等信息,為“由實入虛”提供基礎,支撐數(shù)字孿生流域的運行。
(2) 虛擬流域。WV是重點構建多維度多尺度的虛擬模型或數(shù)字孿生模型,包括幾何模型(MG)、機理模型(MM)、數(shù)據(jù)模型(MD)、機理和數(shù)據(jù)融合模型(MM&D)、智能識別模型(MR)、行為模型(MB)、知識模型(MK),這些模型能夠從多時空尺度多維度對WV進行描述與刻畫,如式(2)所示:
WV={MG,MM,MD,MM&D,MR,MB,MK}
(2)
MG為描述WP幾何結構和參數(shù)、空間位置與關系的實景三維模型,與WP保持時空一致性;對MG進行材質、光照、紋理等渲染,外觀與WP具有高度的相似性和逼真度。MG可用BIM、AutoCAD、3dMAX等建模軟件或傾斜攝影測量、激光掃描點云進行創(chuàng)建。
MM是氣象、水文、水動力、結構、生態(tài)環(huán)境、社會經(jīng)濟等模型,適用于流域系統(tǒng)物理對象過程和參數(shù)能夠觀測、運動機理明晰和變化規(guī)律充分掌握、數(shù)學模型表達形式固定的情況。MD通常利用數(shù)理統(tǒng)計、機器學習和深度學習對海量樣本進行訓練建立,適用于物理流域對象物理機制不清楚、參數(shù)眾多且狀態(tài)變量缺少觀測的情況。MM&D是將MM和MD相結合進行融合建模,分為并聯(lián)型和串聯(lián)型2種方式,前者是以MM為主、MD作為誤差補償方式校正MM;后者是MD通過海量樣本訓練獲得MM的輸入或者MD通過估計MM模型內部變量或參數(shù)的關系作為MM的輸出。
MR是遙感、視頻、語音等信息的人工智能識別模型,實現(xiàn)河湖“四亂”(亂占、亂采、亂堆、亂建)問題、水利工程安全運行和安全監(jiān)測、應急突發(fā)涉水事件等自動識別[14]。為了增加MR的識別準確率,重視識別對象或事件樣本庫的構建,MR對不斷積累的樣本學習訓練,不斷提升認知能力。
MB是描述物理流域對象的實時響應及行為的模型,比如水循環(huán)健康狀態(tài)評估模型、水工程安全評估模型、水工程調度模型、方案決策模型、水工程控制執(zhí)行模型及節(jié)水效率評估模型等。
MK是通過對流域知識進行存儲計算的模型。知識模型可以通過知識圖譜方式進行構建,隨著規(guī)律、規(guī)則、經(jīng)驗日益豐富,能夠自主學習和演化,對WV進行同步校正和一致性分析,既能提高WV的實時判斷、動態(tài)評估、持續(xù)優(yōu)化及精準預測的能力,又能提升WP的精細管理、自動控制與安全運行水平。
(3) 實時連接交互。WC由業(yè)務網(wǎng)、工控網(wǎng)、政務網(wǎng)、互聯(lián)網(wǎng)、傳感網(wǎng)及通信協(xié)議、輸入輸出設備、安全保障設施及相關技術組成,實現(xiàn)物理流域、虛擬流域、數(shù)字賦能服務、孿生流域數(shù)據(jù)和孿生流域知識間的高效連接傳輸、協(xié)同交互操控及同步迭代優(yōu)化,如式(3)所示:
WC={CPV,CPD,CPS,CPK,CVD,CVS,CVK,CDK,CDS,CKS}
(3)
CPV實現(xiàn)WP和WV之間的交互,利用水利傳感器、數(shù)據(jù)采集中間件等采集WV數(shù)據(jù),通過Modbus- RTU、OPC- UA等協(xié)議傳輸給WV,用于實時校正各種水利數(shù)字模型;采集的WV的模擬分析、仿真預測、方案決策等數(shù)據(jù)轉化為控制指令和管理措施,既能傳輸至物理設備執(zhí)行器進行控制,又能傳給相應管理人員進行操控。
CPD實現(xiàn)WP和WD之間的交互,利用與CPV類似實現(xiàn)方式采集數(shù)據(jù)至WD,反過來,WD經(jīng)過融合同化處理后的數(shù)據(jù)或質量反饋指導WP的健康運行。
CPS實現(xiàn)WP和WS之間的交互,利用與CPV類似實現(xiàn)方式采集數(shù)據(jù)至WS進行更新和優(yōu)化;WS產(chǎn)生的診斷分析、決策優(yōu)化、管理措施和控制運行等結果以大屏端、電腦端和移動端方式推送給用戶,以人工方式實現(xiàn)對事件的管理和設備的調控。
CPK實現(xiàn)WP和WK之間的交互,利用WK反饋指導WP的健康運行。
CVD實現(xiàn)WV和WD之間的交互,通過JDBC、ODBC、OLE DB、數(shù)據(jù)庫網(wǎng)關等數(shù)據(jù)庫接口實現(xiàn),WV一方面把模擬分析、預測預報相關數(shù)據(jù)實時傳輸至WD進行存儲,另一方面能夠實時讀取WD中的融合同化數(shù)據(jù)、關聯(lián)分析數(shù)據(jù)、物理流域對象的全生命周期數(shù)據(jù)等用于驅動水利模擬分析、預測預報。
CVS實現(xiàn)WV和WS之間的交互,可以通過Socket、RPC、MQSeries等軟件接口[36]實現(xiàn)WV和WS的數(shù)據(jù)收發(fā)、消息同步、指令傳遞等雙向通訊。
CVK實現(xiàn)WV和WK之間的交互,WV推導的規(guī)律性結果、生成的方案反饋給WK進行存儲管理,WK反過來指導WV的建模、仿真與預測。
CDK實現(xiàn)WD和WK之間的交互,一方面通過數(shù)據(jù)挖掘的可用結果實時傳輸至WK進行存儲;另一方面,WD能夠讀取WK的知識指導數(shù)據(jù)挖掘。
CDS實現(xiàn)WD和WS之間的交互,利用與CVD相似的實現(xiàn)方式,一方面將WS產(chǎn)生的數(shù)據(jù)實時傳輸至WD進行存儲,另一方面通過讀取WD中的水利實時、歷史、預測等數(shù)據(jù)以支撐業(yè)務運行及優(yōu)化。
CKS實現(xiàn)WK和WS之間的交互,利用與CVD相似的實現(xiàn)方式,一方面將WS產(chǎn)生的知識實時傳輸至WK進行存儲,另一方面通過讀取WK中的規(guī)則、算法、模型等知識以支撐業(yè)務運行及優(yōu)化。
(4) 數(shù)字賦能服務。WS是數(shù)字孿生流域建設的目的,面向水行政主管部門、水利工程運行管理單位、社會公眾、技術開發(fā)運維人員等不同用戶,通過集成物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能、虛擬現(xiàn)實、區(qū)塊鏈等技術,實現(xiàn)物理流域與虛擬流域的平行運行,以虛擬流域在虛擬空間中的實時更新數(shù)據(jù)反饋優(yōu)化物理流域,如式(4)所示:
WS={Sf,Sb1,Sb2,Sb3,Sb4,Sb5}
(4)
Sf是面向技術開發(fā)運維人員的功能性服務,將數(shù)字孿生流域中各類水利數(shù)據(jù)、水利模型、水利算法、水利仿真、統(tǒng)計分析和計算結果進行服務化封裝,以工具組件(如監(jiān)測預警組件、協(xié)同填報組件等)、中間件(如數(shù)據(jù)交換中間件)、模塊引擎(如模擬引擎、知識引擎、仿真引擎等)等形式支撐數(shù)字孿生流域的感知、傳輸、數(shù)據(jù)、模型、知識、仿真等功能的運行與實現(xiàn)。Sb1、Sb2、Sb3、Sb4、Sb5是面向水行政主管部門、水利工程運行管理單位以及社會公眾,基于深度和強化學習、知識引導和推理、群智協(xié)同優(yōu)化、智能控制等先進數(shù)字技術,以應用軟件規(guī)范輸入輸出,以“大屏、電腦、手機”或“三端合一”提供的工程安全運行、業(yè)務高效管理、資源優(yōu)化配置與調控、生態(tài)環(huán)境保護、應急快速處置、公共主動服務等業(yè)務性服務。
(5) 孿生流域數(shù)據(jù)。WD是數(shù)字孿生流域的動力源,是建設數(shù)字孿生流域的基礎,主要包括WP數(shù)據(jù)(DP)、WV數(shù)據(jù)(DV)、WS數(shù)據(jù)(DS)及融合同化衍生數(shù)據(jù)(Df),如式(5)所示:
WD={DP,DV,DS,Df}
(5)
DP主要包括河流、水庫、灌區(qū)、引調水工程等的基礎數(shù)據(jù)、屬性數(shù)據(jù)及監(jiān)測數(shù)據(jù);DV主要包括WV相關的幾何尺寸、空間位置、外觀紋理等幾何模型相關數(shù)據(jù),模型邊界條件、模型參數(shù)化時空分布等數(shù)學模型相關數(shù)據(jù),外部條件變化、水系統(tǒng)響應及運行狀態(tài)調整等行為相關數(shù)據(jù),邊界條件約束、調度控制運行規(guī)則、流域實體關聯(lián)關系等規(guī)則數(shù)據(jù),以及基于上述模型開展的模擬評價、預測預報、調配優(yōu)化等的仿真模擬數(shù)據(jù);DS包括Sf的流域算法和模型、流域數(shù)據(jù)處理方法等相關數(shù)據(jù)和Sb的流域防洪、水資源管理與調配等業(yè)務管理數(shù)據(jù);Df是對DP、DV、DS進行數(shù)據(jù)治理(如數(shù)據(jù)轉換、數(shù)據(jù)預處理、數(shù)據(jù)分類、數(shù)據(jù)關聯(lián)、數(shù)據(jù)集成、數(shù)據(jù)融合等)后得到的衍生數(shù)據(jù),通過融合自然水系、水利工程、流域治理管理活動等實況數(shù)據(jù)與“時間- 空間- 業(yè)務域”關聯(lián)數(shù)據(jù)、歷史統(tǒng)計數(shù)據(jù)、專家經(jīng)驗知識等數(shù)據(jù)得到的“信息- 物理”融合數(shù)據(jù)[37]。
(6) 孿生流域知識。知識通常分為描述性和程序性知識,由事實、概念、過程和規(guī)則組成[52]。因此,WK包括事實知識(Kf)、概念知識(Kc)、過程知識(Kp)和規(guī)則知識(Kr),如式(6) 所示:
WK={Kf,Kc,Kp,Kr}
(6)
Kf主要包括法律法規(guī)、標準規(guī)范、規(guī)章制度及水利對象之間關系、專家經(jīng)驗、視頻識別的樣本、遙感識別的樣本、語音識別的樣本等;Kc主要包括流域治理管理中所涉及的概念,如河流、水庫、水資源分區(qū)等;Kp主要包括面向特定流域科學問題的計算過程模型以及經(jīng)過演化推導過程后的最終結論(如地下水位管控的閾值、降水與徑流的定性或定量關系、歷史場景等);Kr主要包括預報調度方案、業(yè)務流程規(guī)則等。
為反映高度保真、演化自治、實時同步、閉環(huán)互動、共生進化等特征需求,數(shù)字孿生流域應具備7種核心能力,即物理流域感知操控能力、全要素數(shù)字化表達能力、實景可視動態(tài)呈現(xiàn)能力、流域數(shù)據(jù)融合供給能力、流域知識融合供給能力、流域模擬仿真推演能力和孿生自主學習優(yōu)化能力。
(1) 物理流域感知操控能力。數(shù)字孿生流域根據(jù)物理流域的結構、特征和承載的資源、生態(tài)環(huán)境和社會經(jīng)濟功能,在流域上布設雨量、水位、流量、水質、泥沙、墑情、位移、形變、視頻、位置等傳感器以及利用衛(wèi)星、航空遙感“感知”真實的物理流域,形成空天地集成傳感網(wǎng),通過各類傳感器資源接入管理實現(xiàn)物理流域對象的泛在實時連接、全息協(xié)同感知以及運行態(tài)勢診斷[53],支撐對物理流域對象、過程和行為的智能化感知、識別、跟蹤、管理和控制。通過虛擬流域對各種流域治理方案優(yōu)化,對物理流域進行智能干預和遠程操控使其運行達到最優(yōu),進而為虛擬流域迭代優(yōu)化提供海量運行數(shù)據(jù),使得數(shù)字孿生流域具備自我學習、智慧生長的能力[10]。
(2) 全要素數(shù)字化表達能力。數(shù)字孿生流域對物理流域各種管控對象全要素進行精確的數(shù)字化標識,利用流域、區(qū)域、計算單元等編碼相結合以及空間剖分和時間細分整合的方式對物理流域對象進行唯一標識,支撐數(shù)據(jù)資源互聯(lián)互通。通過新型智能數(shù)據(jù)采集設備,對物理流域進行多維度、多層級、多粒度的數(shù)字化及語義化描述[54- 55],能夠在虛擬流域空間重現(xiàn)擬真物理流域,從粗到細、從宏觀到微觀、從地上到地下、從外部到內部復制、仿真或預測物理流域的狀態(tài)和過程,實現(xiàn)物理流域空間在虛擬流域空間中的精準映射,為數(shù)字孿生流域可視化展現(xiàn)、智能計算分析、高保真仿真模擬、智能決策等提供數(shù)據(jù)基礎。
(3) 實景可視動態(tài)呈現(xiàn)能力。數(shù)字孿生流域感知、匯聚、融合物理流域對象全生命周期的數(shù)據(jù),獲得流域地理地貌、土地利用、工程、降水、土壤水分及生態(tài)環(huán)境、社會經(jīng)濟等全方面的時效信息,通過對物理流域對象進行多層次實時渲染及可視化呈現(xiàn),支撐對空間分析、大數(shù)據(jù)分析、仿真過程的多終端一體化展示,不僅能夠真實展現(xiàn)流域地形地貌、自然環(huán)境、工程背景等各種場景,更重要的是能夠將運行機理復雜、結構復雜、且內部狀態(tài)和過程不可見的流域系統(tǒng)變得透明,幫助決策者全面深入地了解物理流域對象的性能、運行狀態(tài)及趨勢、歷史信息、運行環(huán)境和任務需求等[56- 58],有效支持流域資源配置、生態(tài)環(huán)境保護和工程安全運行。支撐視頻虛實融合、傾斜攝影動態(tài)加載等,能夠提供虛擬場景的自動實時動態(tài)演變、運行態(tài)勢自動實時動態(tài)還原。
(4) 流域數(shù)據(jù)融合供給能力。數(shù)字孿生流域能夠全面匯聚、關聯(lián)集成流域多源、多類型、多形態(tài)的水資源、生態(tài)環(huán)境和社會經(jīng)濟等數(shù)據(jù),提供涉水全空間(空中、地表、地下、水中)、涉水全要素、涉水全過程的一體化流域數(shù)據(jù)融合能力[59- 60]。能夠在保證流域數(shù)據(jù)及時、全面、準確、完整要求的前提下,以實時數(shù)據(jù)流方式按需供給幾何模型、機理模型、數(shù)據(jù)模型、知識模型、業(yè)務模型等多維度多尺度模型,支撐更為精確全面的流域結構、功能和行為的動態(tài)呈現(xiàn)和可視化表達[61],更準確地實現(xiàn)動態(tài)監(jiān)測、態(tài)勢診斷、趨勢預判、虛實互動等核心功能。
(5) 流域知識融合供給能力。數(shù)字孿生流域能夠從Word、Excel、PPT、csv或JSON、XML、HTML等文件進行導入、讀取和存儲,解析成流域的概念、實體、事件、關系等相關知識源。能夠提供自然語言處理、知識抽取、知識融合和知識加工能力,以及集成表示學習、關系推理、屬性推理、事件推理、路徑計算、比較算法等模型能力。具有穩(wěn)定高效的知識譜圖架構以靈活適應流域資源優(yōu)化配置、生態(tài)環(huán)境保護、工程安全運行等不同應用場景需求[62]。
(6) 流域模擬仿真推演能力。數(shù)字孿生流域能夠在虛擬流域空間中通過數(shù)據(jù)建模和事態(tài)擬合進行某些特定事件的評估、計算、推演,同時具備預測流域未來運行態(tài)勢的能力,即給定外部環(huán)境信息,數(shù)字孿生流域模型能夠對流域特性進行較高準確度的計算推演,結果可用于防汛態(tài)勢診斷、治理決策方案優(yōu)化等應用場景。與物理流域相比,虛擬流域具有可重復性、可逆性,全景數(shù)據(jù)可采集、重建成本低、試驗后果可控等特性[63]。通過提供空間類模擬仿真、流程類模擬仿真、空間- 流程綜合類模擬仿真等能力,可以為流域規(guī)劃、應急處置等方案的評估與優(yōu)化提供細化的、量化的、變化的、直觀化的分析與評估結論。
(7) 孿生自主學習優(yōu)化能力。數(shù)字孿生流域模型系統(tǒng)可以利用深度學習、強化學習、對抗學習、粒子濾波、集合卡爾曼濾波等在線學習算法,融合領域知識和專業(yè)模型,利用實時采集流域數(shù)據(jù)更新模型計算邊界條件,實現(xiàn)孿生模型的結構和參數(shù)的自我學習和持續(xù)優(yōu)化,實現(xiàn)高精度的仿真模擬。
結合數(shù)字孿生流域概念、內涵、特征,圍繞數(shù)字孿生流域基本模型和核心能力,將制約數(shù)字孿生流域構建的核心科學問題歸納為兩方面:一方面是如何實現(xiàn)物理流域向虛擬流域保真建模,另一方面是如何實現(xiàn)虛擬流域向物理流域反饋優(yōu)化。
(1) 實現(xiàn)物理流域向虛擬流域保真建模。物理流域對象空間分布廣、行為特征不同,建立精準映射的前提是要根據(jù)不同物理流域對象的時空演變特點,優(yōu)化布局可靠的感知裝置、構建高效傳輸?shù)倪B接以及海量數(shù)據(jù)的接入與處理方式。由于流域系統(tǒng)復雜性,影響水循環(huán)系統(tǒng)運行的環(huán)境因素多,水循環(huán)系統(tǒng)運行狀態(tài)存在隨機性和不確定性,應充分結合物理機理建模和數(shù)據(jù)驅動建模的優(yōu)點,構建物理流域與虛擬流域融合的動態(tài)多維、多時空保真模型,同時要平衡虛擬流域環(huán)境模型保真度與計算復雜度之間的矛盾,根據(jù)研究對象和場景的變化能夠實現(xiàn)模型自適應動態(tài)匹配和無縫切換,從而保證以有效計算資源支持模型高效求解、數(shù)據(jù)快速分析與場景沉浸渲染[63]。
(2) 實現(xiàn)虛擬流域向物理流域反饋優(yōu)化。流域治理管理決策影響因素眾多、約束條件復雜、目標維度高、非線性特點突出、時效滯后,傳統(tǒng)的單一時空尺度、單目標最優(yōu)的決策模式已無法滿足可變時空下的綜合效益最優(yōu),需要構建物理流域和虛擬流域之間的迭代交互與動態(tài)演化模式,實現(xiàn)物理流域系統(tǒng)運行數(shù)據(jù)驅動下的虛擬流域模型自主學習與進化。虛擬流域通過與物理流域之間數(shù)據(jù)、知識的雙向流動,利用人工智能將數(shù)據(jù)與知識深度融合,進而對流域治理管理決策方案進行挖掘分析,生成最優(yōu)方案與執(zhí)行指令反饋給物理流域對象。
圍繞上述2個科學問題,需要突破6項關鍵技術,包括物理流域對象全景感控與共融關鍵技術、虛擬流域高保真模型構建關鍵技術、數(shù)字孿生流域實時連接交互關鍵技術、數(shù)字孿生流域孿生數(shù)據(jù)關鍵技術、數(shù)字孿生流域孿生知識關鍵技術及數(shù)字孿生流域數(shù)字賦能服務關鍵技術,如圖2所示。
圖2 數(shù)字孿生流域關鍵技術組成Fig.2 Composition of key technologies of digital twin watershed
5.2.1 物理流域全景感控與共融關鍵技術
物理流域的全面感知是實現(xiàn)數(shù)字孿生流域的基礎。雖然具備了較為全面的空間信息基礎設施,但如何有效地集成利用、構建一體化空間信息基礎設施、應對“三多現(xiàn)狀”(多觀測融合、多協(xié)議互聯(lián)、多主題交互)和“三高需求”(高時空感知、高精度感知、高智能感知)一直面臨巨大挑戰(zhàn)[64],而構建空天地集成化傳感網(wǎng)是應對這一挑戰(zhàn)具有希望的解決方案[64]??仗斓丶苫瘋鞲芯W(wǎng),利用高速通信網(wǎng)絡和無處不在的感知手段,遵循觀測、數(shù)據(jù)、處理和服務等標準規(guī)范,集成現(xiàn)有空間信息基礎設施,采用異構資源集成管理、多平臺協(xié)同觀測、多源數(shù)據(jù)融合,以及信息聚焦服務等多種方法和技術,構建互聯(lián)互通的流域感知基礎體系[53,65]。
(1) 新型監(jiān)測設備研制。水文監(jiān)測要素主要包括水位、流量、雨量、水質、泥沙含量。水文傳感器雖然在業(yè)務應用中發(fā)揮了重要作用,但是由于國產(chǎn)化設備較少,尤其存在針對江河斷面水流和泥沙通量在線監(jiān)測國產(chǎn)化設備少、設備計量校準裝置少、監(jiān)測精度不高等突出問題,亟需研制基于聲學、光學、雷達等傳感技術的水流流速在線監(jiān)測和基于光學、聲學等傳感技術的泥沙含量在線監(jiān)測等國產(chǎn)化關鍵設備,研發(fā)流量和泥沙在線監(jiān)測關鍵設備計量校準方法及量值溯源關鍵技術與方法體系,研制計量校準裝置。高寒高海拔河流湖泊水文要素在線監(jiān)測技術與裝備、水文儀器裝備檢驗測試裝備等亟待攻克。另外,還需要開發(fā)面向復雜環(huán)境的低功耗水環(huán)境綜合陣列傳感器[66]。同時,加強智能測繪設備研制及技術攻關,以快速構建及更新實景三維流域[54- 55]。
(2) 地面?zhèn)鞲芯W(wǎng)節(jié)點布局。地面觀測網(wǎng)設計過程中,如何設計最優(yōu)化的傳感器節(jié)點布置方案,從而能夠準確捕捉關鍵生態(tài)水文變量的時空異質性特征,為流域集成模擬研究提供高精度的輸入數(shù)據(jù),同時節(jié)省運維成本。例如,以優(yōu)化雨量站網(wǎng)為目標,有學者提出了一種考慮地形影響和特殊選址要求的“點觀測- 面覆蓋”型傳感網(wǎng)站點(雨量站)最大覆蓋模型,形成了面覆蓋觀測優(yōu)化布局方法[64];以優(yōu)化流量站網(wǎng)為目標,有學者提出了一種基于線目標交點集的“點觀測- 線覆蓋”型傳感網(wǎng)站點(流量站)最大覆蓋模型,形成了線覆蓋觀測優(yōu)化布局方法[64]。
(3) 流域遙感對地觀測。新型衛(wèi)星傳感器愈發(fā)精細與多樣,且時間、空間、光譜分辨率顯著提升,在流域下墊面要素、水循環(huán)過程、生態(tài)環(huán)境與災害監(jiān)測等領域的作用日益顯著。隨著基于流域遙感試驗構建的流域土壤- 植被- 大氣等相關參量遙感反演方法的不斷優(yōu)化,眾多有價值的流域遙感數(shù)據(jù)產(chǎn)品如流域地物類型、植被結構參數(shù)、植被生長狀況、水環(huán)境參數(shù)、水循環(huán)參量與資源管理等,以及與之相關的遙感產(chǎn)品生成方法不斷涌現(xiàn),如何從紛繁復雜的遙感信息產(chǎn)品中,挖掘出有用的流域管理信息,成為流域管理的最后一公里瓶頸[67]。同時,還需要針對流域管理需求發(fā)展水循環(huán)地表狀態(tài)變量探測衛(wèi)星、水循環(huán)地氣通量探測衛(wèi)星、冰凍圈(固態(tài)水)的專題衛(wèi)星等。
(4) 邊緣智能與協(xié)同。包括對人工智能算法與模型的邊緣側處理和適配?;谏疃葘W習架構下的模型及機器學習算法,對人工智能模型及算法在邊緣側進行剪枝、量化、壓縮,通過軟件定義的輕量化容器技術,實現(xiàn)物理資源的邊緣側應用,通過多參量物理代理實現(xiàn)多種傳感接入、業(yè)務分發(fā)、邊緣計算及區(qū)域自治,最終實現(xiàn)高性能、低成本、高靈活性的人工智能技術邊緣側下沉。
(5) 空天地傳感器集成管理。開展海量傳感器組網(wǎng)通信、異構傳感器接入、傳感網(wǎng)資源管理、傳感網(wǎng)服務組合、流式數(shù)據(jù)挖掘分析和地理信息互操作等技術研究;研究協(xié)同多源異構感知資源的新方法,包括傳感器信息建模、觀測能力評價、協(xié)同監(jiān)測、點面觀測數(shù)據(jù)融合和按需聚焦服務等方法。
(6) 工程群耦聯(lián)智能控制。針對明渠非恒定流輸水的水動力學過程具有強耦合、大時滯等非線性控制特點,需將控制算法與渠道運行方式結合,開展渠道運行方式、控制方式和閘門控制算法的適用性和匹配性研究[68];研究分段子系統(tǒng)渠道水力特性對控制系統(tǒng)影響的物理機制,探索合理的渠道運行方式,并研制閘泵控制器;改進渠道運行的閘泵群聯(lián)合控制模式,開發(fā)動態(tài)耦合控制模式和控制算法;研發(fā)冰期輸水過程控制技術,制定冰期輸水的閘泵群安全調度操作程序;研究極端、事故條件下的分級、分段控制模式,研發(fā)能夠處理常態(tài)和應急工況的閘泵群全自動控制平臺。
5.2.2 虛擬流域高保真模型構建關鍵技術
數(shù)字孿生建模是精確刻畫物理流域對象的核心,它使數(shù)字孿生流域能夠提供監(jiān)控、仿真、預測、優(yōu)化決策支持功能性服務以滿足流域治理管理的需要[69]。
(1) 流域高保真建模。引入先驗知識改善機器學習模型的可解釋性、魯棒性與可泛化性,是突破目前人工智能在流域應用瓶頸的一個重要方向。流域系統(tǒng)在長期的生產(chǎn)實踐中積累了大量的邏輯規(guī)則、代數(shù)模型、物理模型等,將上述機理知識引入數(shù)據(jù)驅動的分析方法中,可降低對訓練樣本數(shù)量及質量的要求,使機器學習模型具有應對動態(tài)環(huán)境的能力。針對不同場景下模型的獲取難度,物理機理與數(shù)據(jù)驅動融合建模方法可分為數(shù)據(jù)模型對機理模型的改進、機理模型對數(shù)據(jù)模型的指導以及構建混合模型等[70]。
(2) 模型與觀測數(shù)據(jù)同化。數(shù)據(jù)同化成功地融合了先驗的模型信息和大量觀測信息,以概率方式調和了模型和觀測,批判式地漸進真值[71]。數(shù)據(jù)同化已成為地理系統(tǒng)科學方法論的重要組成部分,它以新的范式改進了地球系統(tǒng)的可觀測性和可預報型。但面臨著廣義和嚴謹?shù)臄?shù)據(jù)同化數(shù)學框架、自然- 社會系統(tǒng)的數(shù)據(jù)同化、數(shù)據(jù)同化不確定性研究以及與機器學習新方法的融合等問題[72]。
(3) 模型資源共享與集成。對多源異構的流域模型進行標準化、規(guī)范化的描述,以屏蔽流域模型的異構型,也需要具有模型廣泛共享能力,幫助模型使用者發(fā)現(xiàn)、獲取和使用散布在網(wǎng)絡中的流域模型,支持模型的共享與重用[34]。根據(jù)流域過程內在機理,對多流域模型進行尺度適應、計算網(wǎng)格轉換、數(shù)據(jù)匹配、邏輯連接與整合。同時,在集成模擬過程中,還需要對參與集成的各種子模型(或組件、模塊)進行控制與優(yōu)化,對誤差和不確定性進行跟蹤和量化,因此需要大力發(fā)展集成建模環(huán)境,推動集成建模過程中的模型選擇、整合集成、過程控制,從而實現(xiàn)面向多要素、多過程乃至全要素、全過程的集成流域建模[34]。
(4) 模型可信度評估。模型可信度評估是一項非常復雜的過程,涉及對大量定性和定量指標的測量與評估,評估過程中通常還需要依賴領域專家的判斷,同時需要將不同類型的測量與評估結果進行綜合處理。如今的流域模型越來越復雜,狀態(tài)變量與輸出變量眾多,變量關聯(lián)關系復雜多樣,如何度量復雜模型的可信度,已成為建模與仿真領域的關鍵難題[73]。因此,需要針對數(shù)字孿生模型在構建檢驗、運行管理、重構優(yōu)化、遷移復用、流通交付等階段開展系統(tǒng)性評價理論和方法研究[74]。
(5) 模型高性能計算。實時性是衡量數(shù)字孿生系統(tǒng)性能的重要指標。隨著地理信息系統(tǒng)、數(shù)字高程模型、遙感、航測和雷達等遙測技術的發(fā)展,流域模型輸入所需的降水、蒸發(fā)、地形、土地覆被、土壤等信息的時空精度不斷提高,模型模擬的空間范圍越來越大,時空分辨率越來越趨于精細化。隨著洪水監(jiān)測預報、非點源污染、水資源評價管理及氣候變化等科學問題的深入研究,需要根據(jù)實際應用開展多學科交融、多過程耦合的分布式模擬。傳統(tǒng)流域模型所采用的串行計算方式,限制了模擬的時空范圍和精度,不利于多要素、多過程的耦合,亟需發(fā)展并行計算技術。硬件架構(多核CPU、GPU和計算機集群等)的發(fā)展和并行環(huán)境(MPI、OpenMP、CUDA和Hybrid等)的逐步完善,為流域模型并行化研究提供了軟硬件支撐[75]。
(6) 模型沉浸可視化。傳統(tǒng)的數(shù)字流域平臺在地理空間元素的真實可視化和流域管理的強大決策支持方面存在局限性,需要開展數(shù)字孿生模型沉浸式可視化研究[56- 57]。主要研究流域場景管理、場景重構以及場景輸出等場景控制技術;利用場景與模型的耦合機制,實現(xiàn)流域場景與流域模型的有效融合,通過將不同尺度的流域模型運算與結果展示構建到真三維的虛擬環(huán)境上,實現(xiàn)從宏觀到微觀多尺度流域現(xiàn)象展示、分析與預測[56- 57];融合數(shù)據(jù)索引與加速技術構建多感知數(shù)據(jù)分離與調度引擎,實現(xiàn)不同感知數(shù)據(jù)的識別、分離、調度與同步,針對不同設備性能、網(wǎng)絡帶寬條件上可視化流暢性需求,自適應地調整輸出內容、輸出格式與繪制質量;最終實現(xiàn)專業(yè)虛擬現(xiàn)實環(huán)境、高性能工作站、移動設備以及三維顯示器、三維鼠標、漫游/觸感頭盔等多感知設備的協(xié)同運作,實現(xiàn)沉浸式、多感知交互的虛擬流域環(huán)境的表達與人機交互[76]。
5.2.3 數(shù)字孿生流域實時連接交互關鍵技術
在物理流域與虛擬流域模型、數(shù)據(jù)、知識和服務的連接中,物理流域對象的識別、感知和跟蹤至關重要。因此,RFID(Radio Frequency Identification)、傳感器、無線傳感器網(wǎng)絡和其他物聯(lián)網(wǎng)技術至關重要。數(shù)據(jù)和知識的交換需要統(tǒng)一的通信接口和協(xié)議技術,包括協(xié)議解析和轉換、接口兼容性和通用網(wǎng)關接口等[77]。由于人類在物理和虛擬世界中都與數(shù)字孿生交互,因此人與計算機的交互技術,如VR(Virtual Reality)、AR(Augmented Reality)、MR(Mixed Reality),以及人與機器的交互協(xié)作都應納入考慮。鑒于模型的多樣性,模型和數(shù)據(jù)、知識的連接需要通信接口、協(xié)議和標準技術,以確保虛擬模型和數(shù)據(jù)、知識之間的穩(wěn)定交互。同樣,服務和虛擬模型之間的連接也需要通信接口、協(xié)議、標準技術和協(xié)作技術。最后,必須合并安全技術(如設備安全、網(wǎng)絡安全、信息安全)以保護數(shù)字孿生流域的安全[77]。
(1) 實時連接。主要用于確保數(shù)字孿生流域不同部分之間的實時交互[77]。當前,接口、協(xié)議和標準的不一致是數(shù)字孿生流域連接的瓶頸。有必要研究通用的互聯(lián)理論、標準以及具有異構多源元素的設備[77]。隨著數(shù)據(jù)流量持續(xù)以指數(shù)級增長,諸如多維復用和相干技術之類的研究熱點可以提供更多的帶寬和更低的延遲訪問服務[77]。面對海量傳入數(shù)據(jù),一種有前途的解決方案是構建具有數(shù)千萬條小型路由條目的超大容量路由器,以提供端到端的通信。有必要開發(fā)新的網(wǎng)絡體系架構,以實現(xiàn)對網(wǎng)絡流量的靈活控制并使網(wǎng)絡更為智能。隨著通信帶寬和能源消耗的增加,有必要為綠色通信開發(fā)新的策略和方法[77]。
(2) 本體映射。要實現(xiàn)知識的共享,就需要建設本體之間的映射,本體映射是分布式環(huán)境下實現(xiàn)不同本體之間知識共享和互操作的基礎性任務。本體映射系統(tǒng)可分為預處理組件、映射發(fā)現(xiàn)組件、資源組件、匹配器組件、映射表示組件。對于流域而言,需要基于領域知識特點建立領域本體的映射方法,主要是針對解決水問題的需求,使用具體的領域規(guī)則、啟發(fā)式學習或者是背景知識進行輔助映射,能夠提高領域本體映射的準確率[78]。
(3) 虛實映射。通過數(shù)據(jù)采集、信息集成獲得統(tǒng)一規(guī)范的數(shù)據(jù),對虛擬模型的自定義屬性綁定對應的數(shù)據(jù)接口,將模型與數(shù)據(jù)關聯(lián)起來。同時虛擬模型的物理、行為、邏輯需要在幾何模型中體現(xiàn)、關聯(lián)與集成,達到物理流域與虛擬流域的初步融合。為了實現(xiàn)進一步的虛實深度融合,研究虛- 實數(shù)據(jù)訂閱傳輸模式,實現(xiàn)虛實空間的動態(tài)映射?;跀?shù)據(jù)采集、數(shù)據(jù)集成和數(shù)據(jù)匹配等,可以通過數(shù)字孿生實時呈現(xiàn)流域運行狀態(tài),實現(xiàn)物理流域與虛擬流域的數(shù)據(jù)同步[79]。
(4) 數(shù)字主線。數(shù)字主線是數(shù)字孿生技術體系中最為關鍵的核心技術,能夠屏蔽不同類型數(shù)據(jù)和模型格式,支撐全類數(shù)據(jù)和模型快速流轉和無縫集成,主要包括正向數(shù)字主線技術和逆向數(shù)字主線技術兩大類型[80]。正向數(shù)字主線技術以基于模型的系統(tǒng)工程MBSE(Model- Based Systems Engineering)為代表,在數(shù)據(jù)和模型構建初期就基于統(tǒng)一建模語言UML(Unified Modeling Language)定義好各類數(shù)據(jù)和模型規(guī)范,為后期全類數(shù)據(jù)和模型在數(shù)字空間集成融合提供基礎支撐;逆向數(shù)字主線技術以資產(chǎn)管理殼AAS(Asset Administration Shell)為代表,面向數(shù)字孿生打造了數(shù)據(jù)/信息/模型的互聯(lián)、互通、互操作的標準體系,對已構建完成或定義好規(guī)范的數(shù)據(jù)和模型進行“逆向”集成,進而為數(shù)模聯(lián)動和虛實映射提供基礎。
(5) 網(wǎng)絡安全。數(shù)字孿生方便了流域治理管理,但是隱藏著黑客、病毒等的入侵和攻擊。網(wǎng)絡化和數(shù)字化進程加快,越來越多的核心資產(chǎn)被網(wǎng)絡集成和管理的同時,也被暴露在網(wǎng)絡空間中,成為潛在被攻擊的對象。針對數(shù)字孿生系統(tǒng)的信息安全問題,以數(shù)字孿生安全大腦為核心,提出以主動防御為目的基于云邊協(xié)同的安全數(shù)據(jù)交互及協(xié)同防御、仿生的平行數(shù)字孿生系統(tǒng)主動防御、仿生的平行數(shù)字孿生系統(tǒng)安全態(tài)勢感知、基于免疫系統(tǒng)的數(shù)字孿生系統(tǒng)主動防控、基于AI(Artificial Intelligence)的數(shù)字孿生系統(tǒng)的反攻擊智能識別等技術[81]。
5.2.4 數(shù)字孿生流域孿生數(shù)據(jù)關鍵技術
保障高質量的數(shù)據(jù)資源是實現(xiàn)數(shù)字孿生精準映射和保真建模的基礎。數(shù)字孿生提出了對數(shù)據(jù)全面獲取、數(shù)據(jù)深度挖掘、數(shù)據(jù)充分融合、數(shù)據(jù)實時交互、數(shù)據(jù)通用普適以及數(shù)據(jù)按需使用的新需求[82],因此需要基于互補性、標準化、及時性、關聯(lián)、融合、信息增長和服務化等準則,研究數(shù)字孿生流域數(shù)據(jù)“交互- 存儲- 關聯(lián)- 融合- 演化- 可視”全生命周期全鏈條數(shù)據(jù)技術。
(1) 數(shù)據(jù)交互。包括數(shù)據(jù)采集、數(shù)據(jù)降維、數(shù)據(jù)壓縮、數(shù)據(jù)中間件和數(shù)據(jù)一致性評估等技術。其中,數(shù)據(jù)采集技術可通過傳感器、網(wǎng)絡爬蟲、軟件接口等多種方式從各部分數(shù)字孿生流域數(shù)據(jù)中提取連接數(shù)據(jù);數(shù)據(jù)降維技術可減少無關數(shù)據(jù)、冗余數(shù)據(jù);數(shù)據(jù)中間件技術實現(xiàn)數(shù)據(jù)格式、接口及通信協(xié)議的轉換,保證數(shù)據(jù)統(tǒng)一傳輸;數(shù)據(jù)一致性評估技術實現(xiàn)數(shù)據(jù)距離計算、一致性評估閾值設定等。
(2) 數(shù)據(jù)存儲。面向具有不同結構、格式、類型、封裝及接口等數(shù)據(jù),研究數(shù)據(jù)統(tǒng)一建模、數(shù)據(jù)庫管理、數(shù)據(jù)空間擴展、數(shù)據(jù)集成等技術。其中,數(shù)據(jù)統(tǒng)一建模技術實現(xiàn)對各類數(shù)據(jù)的統(tǒng)一轉換與描述;數(shù)據(jù)庫管理技術支持基本數(shù)據(jù)操作;數(shù)據(jù)空間擴展技術能夠適應不斷增長的數(shù)字孿生流域數(shù)據(jù);數(shù)據(jù)集成技術可消除數(shù)據(jù)孤島,保證數(shù)字孿生流域數(shù)據(jù)的全面共享。
(3) 數(shù)據(jù)關聯(lián)。包括數(shù)據(jù)時空配準、數(shù)據(jù)關聯(lián)關系挖掘、知識挖掘等技術。數(shù)據(jù)時空配準技術使數(shù)字孿生數(shù)據(jù)在時間上同步、在空間上屬于同一坐標系;數(shù)據(jù)關聯(lián)關系挖掘算法支持對數(shù)據(jù)分類、關系及相關性分析;知識挖掘技術進一步從數(shù)據(jù)分類、關系及相關性中提取知識。
(4) 數(shù)據(jù)融合。包括異常數(shù)據(jù)檢測、粒度轉換、異構數(shù)據(jù)融合、數(shù)據(jù)融合容錯機制、數(shù)據(jù)融合算法等技術。異常數(shù)據(jù)檢測技術在數(shù)據(jù)融合前去除異常數(shù)據(jù);粒度轉換技術可將不同粒度的數(shù)據(jù)(如稀疏數(shù)據(jù)和密集數(shù)據(jù)、原始數(shù)據(jù)和數(shù)據(jù)特征、抽象符號和具有實際意義的數(shù)據(jù))轉到相同粒度;異構數(shù)據(jù)融合技術可融合具有不同類型、結構、采樣頻率的數(shù)據(jù);容錯機制可增強數(shù)據(jù)融合的魯棒性。
(5) 數(shù)據(jù)演化。包括復雜網(wǎng)絡建模技術、傳播動力學建模技術。其中,復雜網(wǎng)絡建模技術支持數(shù)據(jù)關聯(lián)關系網(wǎng)路的構建并基于信息測量技術可評估網(wǎng)絡節(jié)點信息量、信息分布、信息累計量;傳播動力學建模技術可分析從單個數(shù)據(jù)到融合數(shù)據(jù)的信息傳遞,動態(tài)描述信息傳播過程。此外,可從信息增長、變化、傳遞過程中挖掘數(shù)據(jù)進化規(guī)則,優(yōu)化對融合數(shù)據(jù)類型、方法、機制的選擇。
(6) 數(shù)據(jù)可視。包括文本、網(wǎng)絡或圖、時空及多維數(shù)據(jù)等可視化技術。其中,文本可視化能夠將文本中蘊含的語義特征(如詞頻與重要度、邏輯結構、主題聚類、動態(tài)演化規(guī)律等)直觀地展示出來;網(wǎng)絡或圖可視化的形式主要是基于節(jié)點和邊的可視化、具有層次特征的可視化等;時空數(shù)據(jù)可視化是反映物理流域對象隨時間進展與空間位置所發(fā)生的行為變化,通常通過物理流域對象的屬性可視化展現(xiàn);多維數(shù)據(jù)可視化方法主要包括基于幾何圖形、基于圖標、基于像素、基于層次結構、基于圖結構及混合方法等。
5.2.5 數(shù)字孿生流域孿生知識關鍵技術
數(shù)字孿生流域知識庫是在時空數(shù)據(jù)庫基礎上通過知識抽取、空間或非空間關聯(lián),形成領域知識網(wǎng)絡,基于語義推理和空間計算,實現(xiàn)知識重組,為用戶提供時空知識服務。時空知識庫針對抽取或收集的每一類知識,厘清其內涵、來源和用途,進行詳細的粒度劃分,有效揭示和形式化描述流域的概念、實體、屬性及其相互關系,構成知識圖譜。關鍵技術包括知識建模、知識抽取、知識存儲、知識融合、知識計算和知識表達,實現(xiàn)從知識加工、知識圖譜構建到知識表達的深度序化[83]。
(1) 知識建模?;诙嘣粗R進行結構化建模和關聯(lián)化處理,構建本體模型,實現(xiàn)實體、屬性、關系的有序聚合,指導知識的抽取。知識建模除了用到語義關系外,也要充分考慮時間和空間關系。
(2) 知識抽取。將蘊含于信息源中的知識經(jīng)過分析、識別、理解、篩選、關聯(lián)、歸納等過程抽取出來,形成知識點存入到知識庫。知識抽取除了從結構化、半結構和非結構化數(shù)據(jù)中抽取實體及其概念、語義關系和屬性,還需利用空間分析、知識挖掘、深度學習等技術,從二維或三維空間數(shù)據(jù)中發(fā)現(xiàn)蘊含的實體空間分布格局、空間關聯(lián)、空間關系、時空演化等過程性知識[83]。
(3) 知識存儲。知識存儲方式的質量直接影響到知識查詢、知識計算及知識更新的效率,主要分為基于表結構的存儲和基于圖結構的存儲,前者代表為關系型數(shù)據(jù)庫,后者代表為圖數(shù)據(jù)庫。圖數(shù)據(jù)庫的數(shù)據(jù)模型主要是以節(jié)點和關系(邊)來體現(xiàn),也可以處理鍵值對。相比傳統(tǒng)的關系型數(shù)據(jù)庫,查詢速度快,操作簡單,能提供更為豐富的關系展現(xiàn)方式,成為知識存儲的主流工具。
(4) 知識融合。旨在消除實體、關系、屬性等指稱項與事實對象之間的歧義,形成高質量的知識[84]。從多源異構文本中獲取知識,存在大量的數(shù)據(jù)冗余和空間或邏輯不一致的問題,需要借助實體鏈接、本體對齊、實體匹配、屬性空間化等技術進行知識融合[83]。在知識融合前,應當進行知識歸一化處理,清洗、規(guī)范知識表達。然后,通過語義相似度計算和實體相似度計算記錄實體鏈接。經(jīng)過知識驗證,進行概念、屬性、實力層次的語義對齊,達到知識融合的目的。
(5) 知識計算。針對已建的知識圖譜所存在的不完備性和錯誤信息,將知識統(tǒng)計與圖挖掘、知識推理等方法和場景應用相結合,提高知識的完備性和擴大知識的覆蓋面。知識統(tǒng)計和圖挖掘的方法是基于圖特征的算法來進行社區(qū)計算、相似子圖計算、鏈接預測、不一致檢測等;知識推理是從給定知識圖譜中推導出新的實體、關系和屬性。
(6) 知識表達。不同于計算機領域對知識表達的定義,流域時空知識表達應當從時空的視角,將隱性知識同地圖表達相結合,形成靜態(tài)表達、動態(tài)表達以及交互式表達等模式,直觀地反映格局差異、趨勢特征、成因機理等系統(tǒng)性知識,便于人們識別和理解知識。
5.2.6 數(shù)字孿生流域數(shù)字賦能服務關鍵技術
數(shù)字孿生流域數(shù)字賦能服務是將數(shù)據(jù)、知識、模型、應用程序以及計算存儲資源封裝在服務中[84],屏蔽底層各種數(shù)字孿生資源的異構性和復雜性,基于云計算架構,根據(jù)不同用戶的需求提供個性化、便捷性的數(shù)字孿生云服務。目前水系統(tǒng)多是單部門或行業(yè)內開發(fā),網(wǎng)絡互聯(lián)的廣度和深度不夠,各種數(shù)字孿生資源的移植性差、擴展性不強,感知- 數(shù)據(jù)- 知識- 模型- 應用的服務鏈條尚不完整,導致數(shù)字賦能服務研究較少。借鑒其他領域研究成果,歸納數(shù)字孿生云服務研究重點包括服務生成、服務搜索與匹配、服務評估與推薦、服務優(yōu)選與組合、服務供需匹配、服務調度與容錯等技術[78,84]。
(1) 服務生成。針對計算存儲、數(shù)據(jù)、知識、模型、應用程序等不同類型的數(shù)字孿生資源,研究數(shù)字孿生資源服務建模和數(shù)字化描述方法,對其進行規(guī)范統(tǒng)一的描述?;赪eb本體語言(OWL)、語義Web服務描述語言(Web Service Description Language,WSDL)、網(wǎng)絡本體語言描述模型(Web Ontology Language Description Logic,OWL- DL)等,構建適合于數(shù)字孿生資源特點的服務描述語言;在此基礎上,研究能夠適應流域治理管理業(yè)務需求的服務封裝邏輯(如服務描述接口、服務操作接口及服務部署接口),對各種數(shù)字孿生資源進行注冊和發(fā)布,為服務搜索與匹配(即服務發(fā)現(xiàn))提供基礎[85]。
(2) 服務搜索與匹配。在云環(huán)境下,用戶根據(jù)流域防洪、水資源管理與調配、水利工程建設管理等業(yè)務的需求,在云服務平臺上提出數(shù)字孿生服務資源的請求,云服務平臺根據(jù)預設的匹配算法搜索與用戶服務請求相匹配的服務資源,將其推薦給用戶。數(shù)字孿生服務資源的搜索與匹配問題屬于多屬性決策優(yōu)化問題,可采用語義描述相關技術制定搜索匹配策略,并構建服務發(fā)現(xiàn)框架與搜索機制,研究服務供需匹配模型和方法,同時研究服務評估和推薦方法,以提高服務資源與業(yè)務需求之間匹配的效率和精準度[86]。
(3) 服務優(yōu)選與組合。針對流域治理管理中防洪、水資源管理與調配、水生態(tài)環(huán)境保護等多種數(shù)字孿生資源服務的需求業(yè)務,從云服務平臺得到滿足各子任務功能性約束需求的待選服務資源集體中各選1個服務資源,按照一定的順序組裝成組合資源服務,協(xié)同完成該任務資源服務任務的過程。服務組合問題是個多目標規(guī)劃問題,因此研究以服務質量為主要函數(shù)目標,求解算法可用智能演化算法,以發(fā)揮其在速度、通用型、編碼難易度上的優(yōu)勢[86]。
(4) 服務調度與容錯。服務調度就是經(jīng)過調度策略的優(yōu)化得到服務申請的響應接口,形成服務分配方案輸出。接口執(zhí)行分配方案處理服務申請,進行服務的選擇,即從服務集中選出最合適的服務匹配服務申請,并將結果通過接口反饋給用戶。在數(shù)字孿生平臺運行過程中,除了考慮I/O、調用的前提條件和效果等基本屬性之外,還應考慮運行狀態(tài)、業(yè)務關系等動態(tài)屬性[87]。伴隨數(shù)字孿生平臺的運行,服務及其組合服務的執(zhí)行可能會不可避免地發(fā)生某些故障。因此,服務調度故障的檢測和恢復也是研究重點。
(5) 服務執(zhí)行評價。服務執(zhí)行評價反映了用戶對服務使用效果的反饋信息。硬件資源、軟件資源和智力資源所形成的服務效用不同,在評價方法、評價指標選擇方面也需要有所區(qū)別。服務執(zhí)行評價需要對服務資源的使用全過程進行監(jiān)控,以了解服務資源和業(yè)務需求之間的供需情況。通過對服務執(zhí)行情況進行評價,部分服務可能因為資源描述與實際運行狀況不符、服務能力達不到用戶需求等原因,從資源服務庫中被刪除。也有部分資源特別是智力資源在階段任務執(zhí)行完成后,因知識沉淀和累積以及服務能力的提高、可參與的服務范圍增大,與其對應的資源描述信息會被調整修改,而等待下一次被用戶檢索[86]。
數(shù)字孿生流域作為流域治理管理所需的感知、數(shù)據(jù)、知識、模型、服務等核心的絕佳載體[39],為“大云物移智鏈”技術與流域治理管理融合的潛力釋放創(chuàng)造了有利條件[63]。網(wǎng)絡化是感知單元、數(shù)據(jù)單元、知識單元、模型單元、服務單元等打破孤島、協(xié)同聯(lián)動激發(fā)更大價值的發(fā)展趨勢。隨著感知網(wǎng)、數(shù)據(jù)網(wǎng)、知識網(wǎng)、模型網(wǎng)和服務網(wǎng)形態(tài)的構建,數(shù)字孿生流域才能真正在流域治理管理中具有增值效益,為元流域(元宇宙在流域治理管理中的應用)或水利元宇宙或更大尺度的元水圈發(fā)展奠定基礎[88],循序推進智慧流域建設。
(1) 感知網(wǎng)。中國已形成了地面站網(wǎng)體系,以水利部門為例,截至2020年底,中國縣級以上水利部門各類信息采集點達43.4萬處,其中,水文、水資源、水土保持等各類采集點共約20.9萬處,大中型水庫安全監(jiān)測采集點約22.5萬處。截至目前為止,中國智能手機用戶已超過10億。另外中國對地觀測衛(wèi)星初步建成了包括氣象、海洋、資源、環(huán)境和減災、高分等較為完善的對地遙感器和衛(wèi)星系統(tǒng)及應用系列衛(wèi)星體系[89]。未來流域感知體系的發(fā)展趨勢就是構建具有感知、計算和通信能力的傳感器網(wǎng)絡與萬維網(wǎng)結合而產(chǎn)生的空天地集成化觀測網(wǎng)絡,構建智慧流域的綜合感知基站[90],對物理流域各種狀態(tài)進行立體、即時和準確感知,通過一系列接口提供觀測數(shù)據(jù)與空間信息服務,從而在正確的時間、正確的地點將正確的信息傳遞給正確的人或物的4R靈性服務[66],為流域資源優(yōu)化配置、生態(tài)環(huán)境等綜合管理提供數(shù)字化基礎。
(2) 數(shù)據(jù)網(wǎng)。2010年3月Science的文章指出科學技術的發(fā)展正在變得越來越依賴數(shù)據(jù),圖靈獎獲得者Gray也指出數(shù)據(jù)密集型科學發(fā)現(xiàn)將成為科技發(fā)展的第四范式[91],中國學者也指出流域科學研究需要加重大數(shù)據(jù)的研究。隨著流域計算和大數(shù)據(jù)研究的發(fā)展,如何基于動態(tài)實時觀測大數(shù)據(jù)、快速提取流域事件和行為的格局和過程信息、科學分析其演化規(guī)律并提供主動的智能服務,是流域時空大數(shù)據(jù)實踐所面臨的新挑戰(zhàn)和新機遇。截至2020年底,中國省級以上水利部門存儲的各類數(shù)據(jù)資源約2 887項,數(shù)據(jù)總量約6.02 PB,但是水利數(shù)據(jù)仍存在內容不全面、準確性不高、頻次參差不齊、價值密度較低、共享程度不高、更新周期長、開發(fā)利用水平低等問題[14],可用數(shù)據(jù)的供給與流域防洪、水資源管理與調配、河湖管理保護等智慧化應用的需求尚無法實現(xiàn)時空精準匹配。數(shù)據(jù)供給與需求失衡成為制約水利大數(shù)據(jù)分析和應用亟需克服的“痛點”,更是數(shù)字孿生流域理想目標實現(xiàn)亟需打破的“瓶頸”。因此,涉水大數(shù)據(jù)的獲取、處理、分析與挖掘在數(shù)字孿生流域研究中仍是重中之重。大數(shù)據(jù)時代對流域科學中的數(shù)據(jù)集成、數(shù)據(jù)和模型的集成提出了新的挑戰(zhàn),需要加強無縫、自動、智能化的數(shù)據(jù)- 模型對接[34],為此,高級別的自動數(shù)據(jù)質量控制、高層次的數(shù)據(jù)集成以及數(shù)據(jù)向模型的推送技術都十分關鍵。
(3) 知識網(wǎng)。知識圖譜能夠提升數(shù)字孿生流域的語義理解和知識推理能力[92]。流域知識圖譜是領域知識圖譜在流域治理管理和科學研究中的具體應用,較通用領域知識圖譜,往往需要可靠的知識來源、更強的專業(yè)相關性和更優(yōu)質準確的內容[93],它將流域的數(shù)據(jù)信息表達成更加貼近人類認知世界的知識表現(xiàn)形式,具有規(guī)模巨大、語義關系豐富、質量優(yōu)秀、結構友好的特性[91]。流域知識圖譜旨在充分利用流域物聯(lián)網(wǎng)承載的數(shù)據(jù)信息,以結構化方式刻畫流域系統(tǒng)中的概念、實體、事件及其間的關系,為涉水行業(yè)產(chǎn)業(yè)鏈提供一種更有效的跨媒體大數(shù)據(jù)組織、管理及認知能力。結合大數(shù)據(jù)與人工智能技術,流域知識圖譜正逐步成為推動流域人工智能發(fā)展的核心驅動力之一。但目前流域知識圖譜應用場景相對有限、應用方式仍顯得創(chuàng)新不足,因而在一定程度上顯得內生驅動力有所不足。如何有效推動知識圖譜的應用,實現(xiàn)基于流域原生數(shù)據(jù)的深度知識推理,提高大規(guī)模知識圖譜的計算效率與算法精度,一方面需要認真剖析流域數(shù)據(jù)與知識的特性,在認知推理、圖計算、類腦計算以及演化計算的算法上多下功夫;另一方面,有待加強知識圖譜標準化測試工具的建設。
(4) 模型網(wǎng)。流域虛擬模型是數(shù)字孿生流域建設的核心,是能夠體現(xiàn)數(shù)字孿生智能化協(xié)同交互和自主性進化的根本。通過對水文過程的模擬,促進對流域水循環(huán)和生物化學過程的理解,重點在天空地集成化感知網(wǎng)支持下,以區(qū)域氣候模式為驅動,以分布式水文模型和陸面過程模型為骨架,耦合地下水模型、水資源模型、生態(tài)模型和社會經(jīng)濟模型,形成具有綜合模擬能力的流域集成模型,全面揭示水循環(huán)及其伴隨物理、化學和生物過程的發(fā)生及演化規(guī)律。但由于水系統(tǒng)的復雜性,傳統(tǒng)的機理模型過參數(shù)化和建模條件簡化,導致模型運行過程中的誤差累積效應使模擬預測軌跡越來越偏離真實軌跡,為了解決上述問題,一是要開展流域科學基礎研究,利用大數(shù)據(jù)深化對水系統(tǒng)演變規(guī)律與相互作用機理的認識,改進模型結構對物理流域的精準描述;二是在模型運行演進中動態(tài)融合持續(xù)的觀測數(shù)據(jù),實時校正模型狀態(tài)變量和參數(shù),調整模型運行軌跡;三是以機器學習和深度學習為基礎構建數(shù)據(jù)驅動模型,并融合多維度多尺度模型形成高保真模型。除了對模型進行研發(fā)外,需要開發(fā)一個支持集成模型高效開發(fā)、已有模型或模塊的便捷連接、模型管理、數(shù)據(jù)前處理、參數(shù)標定、可視化的計算機軟件平臺。模型平臺應具有的特征包括[34]:① 平臺中既包括地表水、地下水、陸面過程、生態(tài)過程、植被生長等自然過程模型,也包括土地利用、水資源調配與管理、經(jīng)濟、政策等社會經(jīng)濟模型;② 支持模型向流域尺度擴展;③ 支持從分鐘到年、數(shù)十年甚至上萬年的時間尺度模擬;④ 支持數(shù)據(jù)同化和模型- 觀測融合;⑤ 集成知識系統(tǒng),充分利用非結構化信息;⑥ 集成機器學習技術;⑦ 具 有在網(wǎng)絡環(huán)境下運行的能力,支持云計算;⑧ 具有快速定制決策支持能力。
(5) 服務網(wǎng)。數(shù)字孿生流域服務是云計算和數(shù)字孿生結合的新型服務模式[94]。融合現(xiàn)有的云計算、物聯(lián)網(wǎng)、語義Web、高性能計算等技術,將各類資源(包括硬物理設備、仿真系統(tǒng)、計算與通訊系統(tǒng)、軟件、模型、數(shù)據(jù)和知識等)虛擬化、服務化,并進行統(tǒng)一的、集中的智能化管理和經(jīng)營,實現(xiàn)智能化、多方共贏、普適化及高效的共享和協(xié)同,通過網(wǎng)絡為流域全生命周期管理提供隨時可獲取的、按需使用的、安全可靠的、優(yōu)質高效的服務[95]。它由云提供端(云服務提供者)、云請求端(云服務使用者)和云服務平臺(中間件)組成,其中,云提供端通過云服務平臺提供相應的資源和能力服務;云請求端通過云服務平臺提出服務請求;云服務平臺根據(jù)用戶提交的任務請求,在云端化技術、云服務綜合管理技術、云安全技術和云業(yè)務管理模式技術等支持下尋找符合用戶需求的服務,并為云請求端提供按需服務[95]。
數(shù)字孿生流域系統(tǒng)通過借鑒產(chǎn)生于工業(yè)互聯(lián)網(wǎng)領域的數(shù)字孿生理念,以水利行業(yè)為例,結合流域防洪、水資源管理與調配、河湖管理保護、水利工程建設與管理等業(yè)務,闡述數(shù)字孿生流域賦能領域,主要包括賦能流域感知、賦能流域認知、賦能流域智能、賦能流域調控、賦能流域管理等方面。
(1) 賦能流域感知。即利用數(shù)字孿生流域對流域自然規(guī)律掌握基礎上,補充水利傳感器的不足。從理想角度而言,在流域自然社會系統(tǒng)布設更多的水利傳感器能夠更好地跟蹤捕捉流域自然水系、水利工程和水利治理管理活動的運行狀態(tài),但是龐大數(shù)量的水利傳感器要求前期投入大量資金以及后期還要投入很多運維成本,因而要求結合潛在收益研究分析和實踐驗證,尋找最佳的水利傳感器布設方式。數(shù)字孿生流域和大數(shù)據(jù)相結合,基于“自然- 社會”二元水循環(huán)規(guī)律和演變特征、部門共享數(shù)據(jù)、天空地監(jiān)測數(shù)據(jù)、社交媒體數(shù)據(jù),可以對沒有布設水利傳感器的自然水系、水利工程和水利治理管理活動對象的狀態(tài)進行推算和了解。
(2) 賦能流域認知。流域水利系統(tǒng)是以流域為單元,由水資源系統(tǒng)、生態(tài)環(huán)境系統(tǒng)、社會經(jīng)濟系統(tǒng)組成的相互作用、耦合共生的復雜性系統(tǒng),如極端降水和超標洪水形成機理、自然水循環(huán)和社會水循環(huán)演變機理和變化規(guī)律、江河變化機理和泥沙沖淤規(guī)律等基礎性科學問題仍有待研究??梢圆捎谜w論和還原論相結合的綜合集成思路,利用數(shù)字孿生流域的虛擬流域不斷模擬水利系統(tǒng)的運行特性,形成水利大數(shù)據(jù)集,以大數(shù)據(jù)分析方法探索未知物理流域對象的時空特征和變化規(guī)律。
(3) 賦能流域智能。流域智能主要體現(xiàn)在物理流域對象的自我感知、自主學習、自主判斷、自主預測、自主決策和自主執(zhí)行的進化能力。虛擬流域以在線、全面的運行方式,通過在線實時的模擬仿真、歷史數(shù)據(jù)的萃取、經(jīng)驗數(shù)據(jù)的積累形成海量的樣本數(shù)據(jù),利用深度學習、強化學習總結物理流域對象的特征構建物理流域對象的運行規(guī)則和知識圖譜,并進行不斷的自我訓練,獲得最優(yōu)決策方案以指導執(zhí)行操作,再根據(jù)執(zhí)行效果進行再訓練,增加虛擬流域的“智商”,提高不確定場景的應變能力。
(4) 賦能流域調控。數(shù)字孿生流域可以預演洪水行進路徑、洪峰、洪量、過程,動態(tài)調整防洪調度方案;根據(jù)流域內不同區(qū)域生產(chǎn)、生活、生態(tài)對水位、水量、水質等指標的要求,預演工程體系調度,動態(tài)調整和優(yōu)化水資源調度方案。由于河流、渠道、管道等組成的水利工程群存在輸入數(shù)據(jù)多輸出變量多、模型存在非線性、隨機擾動頻繁等問題,數(shù)字孿生流域可以作為水庫群、引調水工程、灌區(qū)等閘門、泵站聯(lián)合控制的仿真測試平臺,在不同水動力邊界條件下獲得閘門、泵站的控制運行規(guī)律,為全面評估閘門、泵站的預測控制、最優(yōu)控制等算法適用性提供閉環(huán)驗證環(huán)境,以實現(xiàn)水利工程群的準確控制和性能優(yōu)化。
(5) 賦能流域管理。數(shù)字孿生流域可以有助于管理者動態(tài)掌握水資源利用、河湖“四亂”、河湖水系連通、復蘇河湖生態(tài)環(huán)境、生產(chǎn)建設項目水土流失、水利設施毀壞等情況,實現(xiàn)權威存證、精準定位、影響分析,加強信息共享和業(yè)務協(xié)同,支撐上下游、左右岸、干支流的跨層級、跨行業(yè)、跨部門之間對涉水日常事務和應急事件的聯(lián)合防御、聯(lián)合管控、聯(lián)合治理,賦能依法實施流域統(tǒng)一監(jiān)督和管理。
致謝:感謝水利部黃河水利委員會寇懷忠正高級工程師對本文的指導!