徐雪寒, 孟慶浩, 劉科顯, 井 濤
水下羽流追蹤方法研究進(jìn)展
徐雪寒, 孟慶浩, 劉科顯, 井 濤
(天津大學(xué)電氣自動化與信息工程學(xué)院 機(jī)器人與自主系統(tǒng)研究所, 天津, 300072)
水下羽流相關(guān)研究在海洋資源開采及環(huán)境保護(hù)等方面有著重要意義。文中圍繞水下羽流擴(kuò)散建模與追蹤方法研究, 對現(xiàn)有相關(guān)研究成果進(jìn)行歸納, 從基礎(chǔ)、方法以及應(yīng)用等角度, 總結(jié)了水下羽流追蹤的研究進(jìn)展和發(fā)展趨勢。全文包括4部分: 1) 介紹水下羽流分類和羽流追蹤的應(yīng)用背景; 2) 從擴(kuò)散模型和仿真平臺2個方面梳理羽流擴(kuò)散建模的研究現(xiàn)狀; 3) 將現(xiàn)有水下羽流追蹤方法分為反應(yīng)類方法、概率估計類方法和強(qiáng)化學(xué)習(xí)類方法3類, 對各類方法的研究進(jìn)展進(jìn)行歸納; 4) 討論了水下羽流追蹤研究未來的發(fā)展趨勢。通過對已有研究成果進(jìn)行總結(jié), 為水下羽流追蹤的進(jìn)一步研究提供參考。
水下羽流; 擴(kuò)散建模; 羽流追蹤
近年來海洋科技突飛猛進(jìn), 取得了日新月異的進(jìn)展。在海洋資源開發(fā)及環(huán)境保護(hù)等方面, 以更有效的方式探測和追蹤水下羽流具有重要意義。水下羽流種類繁多, 各種羽流都具有特定的物理、化學(xué)和生物學(xué)特性, 以及變化顯著的特征時空尺度。
深海熱液、冷泉、海上石油泄漏以及污染廢水都是典型的水下羽流。熱液和冷泉是孤立而獨特的生態(tài)系統(tǒng), 是研究地質(zhì)過程的關(guān)鍵元素, 也是深海潛在的礦產(chǎn)資源[1-5]。石油泄漏和污染廢水則對人類和海洋生物有直接的致命影響[6-7]。水下羽流追蹤指水下機(jī)器人根據(jù)傳感器檢測到的羽流信息, 進(jìn)行羽流源追蹤(羽流溯源)和羽流分布構(gòu)建(羽流建圖)的相關(guān)研究。在廣闊海洋環(huán)境中, 擴(kuò)散源釋放物質(zhì)形成的水下羽流是進(jìn)行目標(biāo)資源和污染物搜索的重要依據(jù)。追蹤羽流定位源頭, 確定羽流的分布及邊界, 有助于人類開發(fā)深海資源和應(yīng)對海洋污染物擴(kuò)散。
由于水下環(huán)境復(fù)雜、實驗成本較高等原因, 羽流追蹤研究最早在空氣中展開[8], 基于移動機(jī)器人對空氣中的氣味源進(jìn)行定位, 即“主動嗅覺”研究[9]。文獻(xiàn)[10]~[13]圍繞空氣環(huán)境主動嗅覺研究, 從算法實現(xiàn)角度對主動嗅覺進(jìn)行總結(jié), 反映了氣體羽流追蹤研究的發(fā)展趨勢。
現(xiàn)有關(guān)于水下羽流追蹤方面的綜述文章主要針對某種特定的羽流展開, 如石油泄漏、冷泉熱液等。Ji等[14]總結(jié)了針對侵入層中水下石油的形成、檢測和建模方法, 為了解水下石油形成機(jī)理及在溢油響應(yīng)過程中更好地跟蹤水下石油羽流提供了理論支撐。韓同剛等[15]介紹了冷泉和熱液2種常見的海底羽流, 系統(tǒng)分析了不同的海底羽流探測方法及其適用性, 對海底冷泉和熱液羽流探測方法選擇具有指導(dǎo)意義。馬媛媛等[16]統(tǒng)計了全球多個熱液噴口流體樣品中的硫化氫濃度數(shù)據(jù), 分析了其濃度的影響因素, 并綜述了采樣及探測技術(shù)的研究進(jìn)展, 指出海底原位探測具有廣闊的發(fā)展空間。
由于氣體羽流追蹤與水下羽流追蹤在擴(kuò)散環(huán)境、追蹤平臺、傳感器以及目標(biāo)物等方面的不同, 二者羽流追蹤算法的側(cè)重點也不同。已有的羽流綜述文章主要圍繞氣體羽流追蹤及源定位進(jìn)行總結(jié), 關(guān)于水下羽流追蹤的文獻(xiàn)綜述研究僅針對特定羽流對象開展, 缺少對水下羽流追蹤算法的全面總結(jié)與分析。近些年學(xué)界在深海熱液追蹤、冷泉探測、石油泄漏等方面開展了豐富的應(yīng)用研究, 因此對水下羽流追蹤算法的整體研究進(jìn)展和現(xiàn)有成果進(jìn)行整理分析, 對未來研究方向和趨勢進(jìn)行討論是十分必要的。
隨著水下羽流研究的多樣化以及追蹤算法的多樣性, 需要對其進(jìn)行較為全面的歸納和總結(jié)。文中立足于水下羽流追蹤方面的研究成果, 對常見的水下羽流目標(biāo)物及其對應(yīng)的傳感器進(jìn)行總結(jié), 并對水下羽流追蹤的建模方法和仿真環(huán)境進(jìn)行歸納, 從算法原理的角度對水下羽流追蹤算法進(jìn)行分類與總結(jié), 可為進(jìn)一步的研究提供參考。
羽流主要指從孔口流入比孔口尺度更大的流體空間的一股流體, 其全部周界都是流體[17], 因此可被理解為“一種流體在另一種流體中移動”。羽流具有隨空間和時間演變的動態(tài)特征。羽流的起始慣性力與浮力相比較小, 進(jìn)入層流環(huán)境后, 主要靠濃度梯度使其進(jìn)一步運動擴(kuò)散; 進(jìn)入湍流環(huán)境后, 在水流的作用下主要以湍流擴(kuò)散為主。其擴(kuò)散物形似羽毛漂浮在水中, 故得名羽流。
水下羽流種類繁多, 針對不同的水下羽流類型, 概括了其特點和相應(yīng)的探測技術(shù)如下。
1) 深海熱液
深海熱液指由海床裂縫噴出的地?zé)釤嵋? 表現(xiàn)為攜帶化學(xué)物質(zhì)的上升流體, 與周圍環(huán)境發(fā)生反應(yīng)后冷卻、混合, 并在海底上方一定距離處水平擴(kuò)散, 形成熱液噴口羽流[18]。深海熱液噴口蘊藏著豐富的礦產(chǎn)資源, 尋找活動熱液噴口是勘探多金屬硫化物礦床最直接的方法[15, 19]。常用的熱液探測技術(shù)如表1所示。
表1 常用熱液探測技術(shù)
2) 海底冷泉
海底冷泉是由于地層壓力或構(gòu)造活動造成的海底液體滲漏現(xiàn)象, 氣體羽流是冷泉的重要指示標(biāo)志。氣體通過斷層、裂隙等運移通道進(jìn)入海水后, 會以氣泡的形式向上運動, 形成海底冷泉羽狀流[20]。海底冷泉羽流是海底活動冷泉最直接、最確切的表現(xiàn)形式[21]。海底滲漏的冷泉氣體改變了海底沉積層的物理性質(zhì), 除了利用可視化方法進(jìn)行直觀觀測, 還可以基于聲吶和地震探測等聲學(xué)方法根據(jù)不同的聲學(xué)響應(yīng)特征來探測海底冷泉羽狀流[15]。常用的冷泉探測技術(shù)如表2所示。
表2 常用冷泉探測技術(shù)
3) 石油泄漏
發(fā)生石油泄漏時需要快速確定石油羽流的擴(kuò)散范圍, 以評估和降低對環(huán)境、植物、動物、海洋食物供應(yīng)和沿海人口的損害[22]。溢油事件會對生態(tài)環(huán)境構(gòu)成嚴(yán)重威脅, 如果不及時采取有效措施將造成不可估量的損失。常用的溢油檢測技術(shù)如表3所示。
表3 常用溢油檢測技術(shù)
4) 污染廢水
排放進(jìn)水域中的污染廢水包括酸性/堿性廢水、含氰/鉻/鎘/汞廢水和放射性廢水等[23]。根據(jù)廢水羽流搜索污染源頭對監(jiān)測水體污染、評價水質(zhì)狀況等環(huán)保工作具有重要意義。常規(guī)的水質(zhì)監(jiān)測方法為取樣后進(jìn)行理化技術(shù)檢測, 包括原子吸收分光光度法、離子選擇電極法、離子色譜法、氣相色譜法及等離子體發(fā)射光譜法等[24]。傳統(tǒng)的自然示蹤劑(鹽度、后向散射)無法在離排水口較遠(yuǎn)的情況下保持羽流特征, 通常只在近場進(jìn)行研究。Rogowski等[25]通過實驗證實了自然羽流示蹤劑——色溶性有機(jī)物繪制羽流特征的可行性。
水下羽流追蹤不僅在環(huán)境監(jiān)測與保護(hù)、事故應(yīng)急方面有重要應(yīng)用, 而且在羽流建模、資源搜索等方面也具有廣闊的應(yīng)用前景。從20世紀(jì)90年代開始, 水下羽流追蹤成為一個熱點課題, 其核心研究內(nèi)容是機(jī)器人自主追蹤羽流的策略和相關(guān)算法。通過分析國內(nèi)外的相關(guān)研究, 追蹤水下時變羽流的主要應(yīng)用有2個方面: 一是繪制目標(biāo)物的二維邊界[26-27]或三維結(jié)構(gòu)[28], 即水下機(jī)器人利用獲得的羽流示蹤物檢測信息和流速流向信息, 自主進(jìn)行羽流探測任務(wù)以高效地獲取其時空分布信息; 二是搜索源位置[29-30], 即水下機(jī)器人利用自身攜帶的傳感器檢測環(huán)境信息, 如海流流速、流向以及羽流示蹤物強(qiáng)度等信息, 自主進(jìn)行在線決策、路徑規(guī)劃, 自主搜索環(huán)境中的羽流信息, 找到羽流后根據(jù)追蹤策略到達(dá)羽流源頭位置并對源頭進(jìn)行精確定位。
1) 羽流分布建圖
由于水流的時變特點, 導(dǎo)致水下羽流擴(kuò)散呈現(xiàn)一定程度的間歇、蜿蜒特點。羽流分布建圖指的是通過對環(huán)境羽流示蹤物濃度的離散采樣, 獲得示蹤物的稀疏分布信息, 進(jìn)一步利用重建算法構(gòu)建對應(yīng)區(qū)域的示蹤物濃度分布圖。羽流分布建圖是一個時空變化分布估計的問題[31], 主要應(yīng)用于海洋污染評估方面, 如評估石油泄漏、赤潮藻華以及核污染的污染程度等。通過分布建圖可以確定目標(biāo)物的污染范圍及程度, 有助于海洋環(huán)境治理任務(wù)的開展。
Cannell等[26]基于傳感器信息在線規(guī)劃策略, 采用梳狀路徑對羽流的剖面和邊界進(jìn)行在線測繪。通過自主水下航行器(autonomous undersea vehicle, AUV)自適應(yīng)地沿羽流邊界曲折前進(jìn), 可繪制核電站冷卻水羽流分布圖, 并跟蹤羽流邊界。
2010年美國墨西哥灣原油泄漏之后, Camilli等[32]采用Z字形羽流跟蹤方法, 利用Sentry AUV探測和跟蹤了墨西哥灣馬孔多油井泄漏的水下石油羽流路徑。質(zhì)譜儀收集了沿途的碳?xì)浠衔餄舛葦?shù)據(jù), AUV利用Z字形跟蹤法在水下1 120 m檢測到了碳?xì)浠衔锓逯?。通過多次動態(tài)任務(wù)分配, AUV繪制了三維天然氣(甲烷)羽流圖。
Gildner等[33]提出了一種自主采樣策略, 采用自適應(yīng)樣帶、傳感器融合和在線估計等手段, 自動繪制噴流場和羽流的邊界和范圍。該研究還通過任務(wù)主導(dǎo)操作系統(tǒng)(mission oriented operations suite, MOOS)建立的仿真環(huán)境對該策略進(jìn)行了驗證。
Kukulya等[34]開發(fā)了一種用于“尋找最大值”的自適應(yīng)羽流映射算法。該算法將AUV的深度設(shè)置為上下浮動, 并定義最小和最大搜索深度, 以便發(fā)現(xiàn)羽流所在的“層”。每當(dāng)AUV檢測到一個新的最大值時, 它會保存位置和深度。該算法通過現(xiàn)場試驗驗證, 可以應(yīng)用到石油羽流和環(huán)境異常檢測與建圖方面。
2) 羽流溯源
羽流溯源指水下機(jī)器人根據(jù)獲得的環(huán)境羽流信息, 通過追蹤環(huán)境羽流最終確定羽流源的位置。如1.2節(jié)所述, 水下羽流一般來自某種釋放源/泄漏源, 通過追蹤水下羽流, 可以實現(xiàn)對其源位置的實時定位。具體的羽流溯源追蹤方法及成果在第3章進(jìn)行介紹。
擴(kuò)散建模是關(guān)于構(gòu)建擴(kuò)散源釋放的擴(kuò)散物質(zhì)在環(huán)境中擴(kuò)散過程模型的研究。擴(kuò)散模型描述了擴(kuò)散物質(zhì)在目標(biāo)環(huán)境中隨時間變化的分布狀態(tài)?;跀U(kuò)散模型, 可以實現(xiàn)對擴(kuò)散過程的計算機(jī)仿真, 為擴(kuò)散源定位等應(yīng)用提供信息。
氣體羽流擴(kuò)散和水下羽流擴(kuò)散在擴(kuò)散建模上并沒有顯著差異[35]。尚未有相關(guān)研究針對特定羽流類型進(jìn)行擴(kuò)散建模, 并將之用于溯源算法中。目前, 關(guān)于水下羽流溯源的應(yīng)用研究, 暫時是使用通用的氣體/液體羽流擴(kuò)散模型進(jìn)行溯源算法設(shè)計。以下對幾種空氣和水下常用的羽流擴(kuò)散模型進(jìn)行介紹。
1) 高斯羽流模型
高斯羽流模型是最常用的擴(kuò)散模型, 也是一個高度簡化的模型。高斯模型中羽流濃度從源位置所在軸線向外遞減, 濃度呈現(xiàn)高斯分布, 從而可得出羽流的時均濃度分布。但該模型僅能表征羽流的靜態(tài)特征, 無法體現(xiàn)羽流的蜿蜒性等瞬時結(jié)構(gòu), 僅適用于湍流程度較小的流體環(huán)境, 與實際動態(tài)羽流差別較大[36]。
2) 細(xì)絲模型
細(xì)絲模型由Farrell等[37]提出, 其假設(shè)羽流由許多細(xì)絲組成, 將細(xì)絲作為羽狀流的基本單位, 通過羽流細(xì)絲的運動來描述羽流的擴(kuò)散分布。為了提高模型的計算效率, 將時均納維-斯托克斯(Navier-Stokes, N-S)方程進(jìn)行簡化, 用于計算細(xì)絲位置的平流速度, 將細(xì)絲運動視為流體內(nèi)擴(kuò)散運動和隨流體平流運動的疊加, 以反映羽流的瞬時結(jié)構(gòu)。通過將得到的仿真數(shù)據(jù)與真實數(shù)據(jù)進(jìn)行對比, 證明了該仿真模型的有效性。但由于細(xì)絲模型對N-S模型進(jìn)行了過多簡化, 導(dǎo)致該模型對流場模型的描述不夠準(zhǔn)確, 不適用于對復(fù)雜場景的擴(kuò)散建模。
3) 格構(gòu)羽流模型
Balkovsky等[38]提出的格構(gòu)模型利用氣味包作為羽流的基本單位。格構(gòu)模型中搜索區(qū)域被離散化為邊長為1的正方形網(wǎng)格, 單位時間內(nèi)氣味源釋放1個氣味包, 其在流場中的速度與風(fēng)速相同, 風(fēng)速只能取(-1, 1)、(0, 1)和(1, 1)3個離散值。在單位時間內(nèi), 氣味包選擇1個風(fēng)速值, 并分別在和方向移動相應(yīng)的距離。該模型雖然能夠模擬羽狀流內(nèi)部濃度的間歇特性, 但是流場和羽流運動模型都過于理想化, 與實際情況存在較大差距[39]。
4) 計算流體力學(xué)模型
隨著計算機(jī)計算能力的不斷提高, 計算流體力學(xué)(computational fluid dynamics, CFD)方法成為研究各種復(fù)雜環(huán)境下流體動力學(xué)的可行工具[40]。CFD方法通過數(shù)值求解某一形式的三維N-S方程實現(xiàn)。根據(jù)計算的尺度范圍, CFD模型可分為三大類, 即雷諾時均化求解N-S方程模型[41]、大渦模擬模型[41]和直接數(shù)值仿真模型[42]。CFD模型在流場求解方面更加準(zhǔn)確, 但目前都是使用連續(xù)相模擬羽流, 不能體現(xiàn)出羽流的間歇性, 且計算量大, 難以應(yīng)用到實時的羽流跟蹤中。
水下實驗成本較高, 而且水域流場時變不可控, 不易復(fù)現(xiàn), 難以進(jìn)行大量重復(fù)性研究。得益于仿真技術(shù)的發(fā)展, 仿真平臺可以為水下羽流追蹤研究提供可重復(fù)的羽流擴(kuò)散環(huán)境, 具有較好的適應(yīng)性, 可以對不同算法進(jìn)行對比驗證, 減少追蹤算法的開發(fā)周期, 降低實驗成本。用于羽流擴(kuò)散建模的常用商業(yè)軟件有ANSYS FLUENT[43]、MATLAB[44]、Delft3D和MIKE 21[45]等。隨著羽流追蹤研究的不斷發(fā)展, 部分研究團(tuán)隊設(shè)計并開發(fā)了面向水下羽流追蹤的仿真平臺, 用于算法驗證。根據(jù)這些仿真平臺所模擬環(huán)境的特點, 可以將其分為二維仿真平臺和三維仿真平臺。
1) 二維仿真平臺
二維仿真主要是針對非浮力羽流(如石油泄漏形成的羽流), 不考慮垂直方向流場對羽流的影響, 簡化了羽流垂直方向運動的建模。
Gildner等[33]為了實現(xiàn)水下機(jī)器人對射流羽流的采樣, 基于MOOS建立了一個二維模型, 該模型包含了由量綱、長度尺度分析和經(jīng)驗研究得出的擴(kuò)散規(guī)律、中心線衰減規(guī)律和軌跡規(guī)律。其采用模擬退火參數(shù)估計方法將模型與歷史數(shù)據(jù)進(jìn)行擬合。模型能準(zhǔn)確地復(fù)現(xiàn)羽流的輸運方向、強(qiáng)度和擴(kuò)散形態(tài)。該模型以C++庫形式實現(xiàn), 可以與各種MOOS應(yīng)用程序集成。
糾海峰等[46]通過流體方程對湍流環(huán)境下的輸運速度進(jìn)行求解, 利用細(xì)絲模型建立了羽流的濃度模型。利用VC++編程工具, 建立了100 m× 100 m范圍的二維羽流動態(tài)仿真平臺。通過將仿真得到的羽流與文獻(xiàn)[47]在實際條件下測得的羽流進(jìn)行比對, 結(jié)果顯示兩者在擴(kuò)散范圍和蜿蜒形態(tài)上都具有相同的特征。
Soares等[48]基于ANSYS FLUENT軟件離線仿真生成了鹽水流體中的淡水羽流。該研究基于MATLAB/Simulink中的機(jī)器人仿真, 使用MEDUSA車輛模型模擬水下機(jī)器人, 實現(xiàn)了水下機(jī)器人對淡水羽流追蹤的仿真。
Branch等[49]開發(fā)了一個大尺度熱液追蹤仿真平臺, 用于對AUV熱流追蹤的仿真研究。該平臺利用海洋環(huán)流模式有限體積法對熱液羽流擴(kuò)散進(jìn)行數(shù)值仿真。該仿真平臺實現(xiàn)了對相關(guān)傳感器的仿真, 以固定間隔測量環(huán)境溫度、鹽度、被動示蹤劑強(qiáng)度、AUV深度和到海底的距離, 但并未對化學(xué)傳感器(如氧化還原電位)和AUV的能源與數(shù)據(jù)容量等進(jìn)行建模。
除了上述根據(jù)羽流擴(kuò)散模型建立的仿真平臺外, 部分仿真平臺是依據(jù)試驗數(shù)據(jù)進(jìn)行建模的。Hwang等[50]根據(jù)之前2次傳感器測試獲得的結(jié)果, 設(shè)計了一個虛擬的油羽模型, 虛擬油羽由無數(shù)的小油滴組成, 在水中混合, 形成一個密度不同的不連續(xù)羽流。該仿真平臺同時建立了AUV的運動模型與聲吶成像傳感器模型, 通過仿真研究對比了不同的搜索模式, 進(jìn)而對其搜索能力進(jìn)行了評估。
2) 三維仿真平臺
三維羽流追蹤仿真平臺同時考慮了水平非浮力羽流與垂直方向的浮力羽流, 可實現(xiàn)對羽流三維追蹤的仿真。密度較小的流體羽流從噴口噴出后, 在初始噴溢動量和其與周界流體的密度差作用下迅速上升, 并在上升過程中通過湍流夾帶卷吸周界流體使其被稀釋, 稀釋后與周界流體密度相當(dāng), 其上升動量減小為零后停止上升, 這一階段的羽流即為浮力羽流[51]。
Han等[52]基于細(xì)絲擴(kuò)散模型, 提出了一個簡化的三維熱液羽流仿真模型。該模型建立在簡化的三維N-S方程基礎(chǔ)上。這種簡化不能滿足非浮力熱液羽流的物理特征, 但可以用較少的計算資源計算并顯示羽流形狀特征。
Sutton等[53]基于細(xì)絲模型和平流流體流模型, 通過將細(xì)絲模型擴(kuò)散到三維空間, 同時集成了仿生化學(xué)羽流追蹤(chemical plume tracking, CPT)算法, 設(shè)計并開發(fā)了名為CPT_M3D的羽流追蹤仿真環(huán)境。CPT_M3D仿真環(huán)境同時實現(xiàn)了機(jī)器人模型仿真, 以及相應(yīng)傳感器的仿真, 同時支持對多機(jī)器人跟蹤多羽流的仿真研究。
Tian等[54]開發(fā)了一個包含AUV動力學(xué)仿真、流場仿真和化學(xué)羽流仿真等模塊的深海熱液羽流追蹤仿真平臺。該平臺通過龍格-庫塔法求解AUV的運動方程, 采用簡化的湍流平均N-S方程求解流場, 使用拉格朗日粒子隨機(jī)游走法求解羽流擴(kuò)散方程, 運用光滑粒子動力學(xué)法計算空間任意位置的熱液羽流示蹤物強(qiáng)度。該平臺能較好地仿真羽流的結(jié)構(gòu)特性、分布尺度以及擴(kuò)散濃度等, 可以用于設(shè)計、優(yōu)化和驗證關(guān)于AUV水下羽流探測和源定位策略的研究。
追蹤水下羽流并對其源頭定位的主要思路可以分為以下2種:
1) 基于當(dāng)前獲得的羽流信息做出動作反應(yīng), 研究和設(shè)計用于自主機(jī)器人羽流追蹤的策略和算法, 即反應(yīng)式方法;
2) 從水下羽流擴(kuò)散模型出發(fā), 利用信息學(xué)和概率論等相關(guān)領(lǐng)域理論, 研究和設(shè)計用于自主機(jī)器人探測羽流, 估計羽流源頭位置并同時向羽流源方向運動的策略和算法, 即基于概率估計的方法。
近年來得益于強(qiáng)化學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)在機(jī)器人領(lǐng)域的發(fā)展, 基于強(qiáng)化學(xué)習(xí)的水下羽流追蹤方法也成為了一個新的研究熱點。文中按照反應(yīng)式方法、概率估計方法和強(qiáng)化學(xué)習(xí)方法3類對水下羽流追蹤相關(guān)研究進(jìn)行分類總結(jié)。
反應(yīng)式方法將機(jī)器人當(dāng)前時刻的感知信息和系統(tǒng)狀態(tài)作為輸入, 直接得到對應(yīng)的輸出(下一時刻機(jī)器人的動作指令), 建立一種“感知—反應(yīng)”的簡單控制策略[55]。反應(yīng)式羽流追蹤方法的輸入包括羽流濃度梯度和環(huán)境流向等信息, 通過梯度上升搜索策略或仿生策略構(gòu)建從輸入到動作的連接。
根據(jù)羽流所處流體環(huán)境湍流程度的不同, 可以分為低雷諾數(shù)的層流環(huán)境和高雷諾數(shù)的湍流環(huán)境。層流環(huán)境流動相對穩(wěn)定, 主要由分子擴(kuò)散運動形成較穩(wěn)定的示蹤物濃度梯度; 湍流環(huán)境下各種渦流運動導(dǎo)致示蹤物濃度分布不連續(xù), 呈現(xiàn)出間歇性的特征, 單純依靠濃度梯度難以有效進(jìn)行溯源[29]。受相應(yīng)環(huán)境下的生物搜索行為的啟發(fā), 對應(yīng)這2種環(huán)境的反應(yīng)式算法相繼被提出。文中根據(jù)算法輸入信息的不同, 將反應(yīng)式羽流追蹤方法分為趨化算法(只輸入羽流濃度梯度信息)和趨流算法(同時輸入羽流濃度梯度和環(huán)境流向信息)兩類。
1) 趨化算法
趨化也稱化學(xué)趨向性, 是指生物趨向環(huán)境中特定化學(xué)物質(zhì)的運動。趨化算法是受某些生物(如細(xì)菌)的趨化行為啟發(fā)設(shè)計的算法, 根據(jù)檢測到的信息素濃度梯度進(jìn)行運動控制, 使機(jī)器人保持趨向濃度增大的方向(正梯度方向)。最直接的趨化方法即驅(qū)動機(jī)器人沿著羽流濃度梯度的正方向移動, 因此可以將此問題建模為化學(xué)濃度場的極大值搜索問題, 并通過梯度上升法或其他非線性規(guī)劃方法求解。
羽流濃度隨著羽流源的遠(yuǎn)離而逐漸衰減, 較為簡單的尋源方法是沿梯度上升方向搜索。可以利用多AUV進(jìn)行分布式感知估計場梯度, 以此來獲取局部梯度。但部署多個AUV成本較高, 也增加了作業(yè)風(fēng)險。對單個AUV來說, 難以同時得到分布的測量信息, 如Burian等[56]主要通過設(shè)計局部運動模式來獲取局部梯度信息; Li等[57]則是通過在AUV上安裝多個傳感器來獲取局部梯度信息。
細(xì)菌的搜索行為和運動適用于低雷諾數(shù)流動, 而水生生物或昆蟲的行為和運動則適合中高雷諾數(shù)[58]。隨著羽流的形成, 流體流動的湍流性質(zhì)將羽流分成比周圍流體濃度相對更高的小斑塊(patches)[59]。通常細(xì)菌使用信號梯度來定位食物來源。趨化過程主要是2種行為模式的組合, 即前進(jìn)和轉(zhuǎn)向[60]。前進(jìn)指沿固定朝向向前運動一定距離, 轉(zhuǎn)向指以一定角速度轉(zhuǎn)動一定角度。
Grasso等[60]受龍蝦溯源行為的啟發(fā), 設(shè)計了一種基于雙傳感器的趨化算法, 并在水下機(jī)器人Robolobster上進(jìn)行了驗證。機(jī)器人頭部帶有1對傳感器, 仿照龍蝦的嗅覺感知器官, 可以追蹤水箱里的鹽水羽流。當(dāng)2個傳感器的濃度測量值有顯著差異時, 轉(zhuǎn)向濃度較高的一側(cè); 當(dāng)2個傳感器濃度相近時, 機(jī)器人保持向前移動以更接近羽流源。當(dāng)2個傳感器都檢測不到羽流時, 機(jī)器人向后移動, 以保證不與羽流失去聯(lián)系。這種方法具有較低的功耗和數(shù)據(jù)存儲要求。
割草機(jī)算法即在搜索區(qū)域內(nèi)執(zhí)行往復(fù)的平行線運動, 來探測羽流信息, 可以通過改變線間距來改變測量的分辨率, 適用于較大范圍內(nèi)的羽流追蹤, 但其存在耗時和依賴導(dǎo)航系統(tǒng)精度等局限性[62]。Burian等[56]提出了一種圓搜索算法, 即AUV首先執(zhí)行一個圓搜索來估計梯度, 然后沿直線運動, 直到檢測到拐點后再執(zhí)行另一個圓搜索。通過改變搜索圓的半徑, 可以指定AUV對梯度進(jìn)行不同距離的采樣。
Mason等[63]通過仿真分別對比分析了梯度上升策略、貪婪斷面策略和嵌套搜索策略在熱液探測方面的效果。其中, 嵌套策略下的源位置預(yù)測結(jié)果最接近真實位置, 但搜索耗時最長; 貪婪斷面策略在尋找源頭方面表現(xiàn)良好, 源定位搜索相對較快; 梯度上升策略表現(xiàn)不佳, 源定位精度較差, 但是搜索速度最快。
Ferri等[64]提出了一種觸發(fā)螺旋勘探的機(jī)器人移動策略, 適用于羽流源定位的第一階段勘測, 其將預(yù)設(shè)軌跡線的魯棒性與數(shù)據(jù)驅(qū)動算法相結(jié)合, 不依賴于水流方向和強(qiáng)度等易產(chǎn)生誤導(dǎo)和難以分析的信息。
Wang等[65]提出了一種用于AUV在水下環(huán)境中尋找熱液噴口的三維化學(xué)羽流追蹤算法。在追蹤熱液羽流的過程中, 定義了2種搜索模式。在水平搜索模式下, AUV采用由飛蛾啟發(fā)的方法在水平面上跟蹤羽流; 當(dāng)垂直搜索模式被激活時, AUV遵循三維螺旋軌跡來檢測深水區(qū)域的羽流。這2種搜索模式交替進(jìn)行, 直到找到熱液噴口。仿真結(jié)果驗證了該算法在三維水下環(huán)境中定位熱液噴口的有效性。
Ai等[66]為了避免現(xiàn)有方法在獲取局部梯度過程中造成的多余行程, 提出了一種基于在線場估計的策略, 即利用搜索路徑上采集的測量數(shù)據(jù)來更新估計的場模型, 該場模型為高斯過程的平均函數(shù)。仿真表明, AUV按照梯度法規(guī)劃路徑點, 并選擇合適的步長, 最終會到達(dá)指示源的局部最大點。
Li等[57]提出了基于估計梯度的AUV羽流尋源策略。其在AUV上安裝呈半圓形排列的傳感器陣列, 以估計局部羽流的濃度梯度?;诠烙嬏荻仍O(shè)計控制器, 驅(qū)動AUV向源頭逼近。由于缺乏濃度場的先驗信息, AUV只能在保證定位誤差的情況下到達(dá)源頭附近。同時還給出了定位誤差的上界, 該上界取決于濃度場的分布、安放傳感器半圓的半徑以及傳感器的個數(shù)。
當(dāng)水下環(huán)境中的化學(xué)濃度梯度場相對穩(wěn)定且可以被準(zhǔn)確描述時, 基于梯度方法的效果較好[56]。然而在受湍流支配的實際深海環(huán)境中, 流體介質(zhì)的湍動造成羽流細(xì)絲不斷地伸展和扭曲。由于湍流的時變特點, 羽流中心線呈現(xiàn)出蜿蜒性和間歇性, 因此羽流濃度梯度場表現(xiàn)為不連續(xù)分布, 搜索到的峰值信息有可能是局部濃度最大值, 基于梯度下降法的搜索方法效果較差。
2) 趨流算法
趨流算法也是受某些生物(如飛蛾, 龍蝦等)行為啟發(fā)而設(shè)計的算法, 它不僅利用濃度測量信息, 同時還使用環(huán)境流向信息, 故稱趨流算法。
受飛蛾等昆蟲啟發(fā)的趨流算法由“逆流前進(jìn)”(surge)和“局部搜索”(cast)2種模式組成[67]。當(dāng)檢測到羽流信息時, 飛蛾逆流前進(jìn), 即surge; 當(dāng)丟失羽流信息時, 飛蛾飛到?jīng)]有煙羽的位置折返, 直到再次接觸到羽流, 即cast。在水下湍流環(huán)境中, 檢測到的羽流來源一般位于逆流方向, 而在湍流作用下羽流具有蜿蜒不連續(xù)的特性, 當(dāng)發(fā)生丟失羽流信息的情況時, 需要采用局部搜索來重新獲取羽流信息。
Farrell等[68-69]提出了一種基于行為的規(guī)劃方法來跟蹤羽流并確定其來源的位置。該方法采用了6種不同的行為, 即運動至起始點、搜索羽流、跟蹤羽流、丟失羽流、重新獲取羽流和確認(rèn)源頭, 這些行為是受到雄蛾追隨信息素羽流尋找雌蛾這一行為的啟發(fā)而得出的。當(dāng)探測到羽流信號或在一段特定時間內(nèi)探測不到羽流信號時, 就會觸發(fā)丟失羽流和重新獲取羽流這2種行為之間的切換。通過近海環(huán)境水下試驗, 驗證了該方法可以有效追蹤羽流完成羽流源確認(rèn)。
Li等[70]提出了一種基于行為的自適應(yīng)任務(wù)規(guī)劃器。當(dāng)在短時間內(nèi)沒有探測到羽流信息時, 水下機(jī)器人以固定的偏置角逆流航行。該研究使用REMUS AUV進(jìn)行了化學(xué)羽流追蹤實驗, 實驗結(jié)果表明該算法可以獲得準(zhǔn)確度較高的羽流源位置。
Grasso等[71]用仿生機(jī)器人對不同趨流算法進(jìn)行了驗證, 通過實驗對比了3種傳感器部署策略, 即單傳感器、雙傳感器以及結(jié)合歷史刺激記憶的雙傳感器, 量化分析了每個策略的相對優(yōu)勢。結(jié)果表明, 使用結(jié)合歷史刺激記憶的雙傳感器策略具有顯著優(yōu)勢, 它能夠判斷并朝向接受羽流信息較多的方向運動, 具有更好的溯源性能。
反應(yīng)式方法的本質(zhì)為行為狀態(tài)機(jī)器人對不同狀態(tài)與信息做出對應(yīng)的行為響應(yīng)。該方法不引入復(fù)雜計算和歷史信息, 算法簡單, 容易實現(xiàn), 對機(jī)器人計算性能要求較低, 在某些特定環(huán)境下可以獲得較好的溯源效果; 但其對場景的依賴性較強(qiáng), 趨化算法僅適用于擴(kuò)散主導(dǎo)的層流環(huán)境, 趨流算法則需依賴穩(wěn)定的、可檢測的流向信息。
反應(yīng)式方法具有明顯的仿生特點, 即以生物行為為啟發(fā)設(shè)計溯源策略, 但是由于機(jī)器人的機(jī)動性和感知能力與現(xiàn)實中的生物存在明顯的差距, 所以此類方法難以獲得與生物體相當(dāng)?shù)乃菰茨芰Α?/p>
概率估計方法通過生成羽流源似然圖來估計源位置, 并利用路徑規(guī)劃算法將機(jī)器人導(dǎo)向估計的位置, 即概率最高的羽流源所在區(qū)域。構(gòu)建羽流源似然圖的常見方法包括貝葉斯推理[29]、隱式馬爾可夫模型(hidden Markov model, HMM)方法[72]和部分可觀測馬爾可夫決策過程(partially observable markov decision process, POMDP)方法[73]。
1) 貝葉斯推理
Pang等[29]提出了一種基于高斯羽流模型的源位置概率估計算法, 基于貝葉斯方法對不同事件概率進(jìn)行融合, 以迭代更新源似然圖, 并在其博士論文中對該算法進(jìn)行了詳細(xì)介紹[74]。
Jakuba[2]提出了一種近似遞歸算法, 相對于標(biāo)準(zhǔn)貝葉斯遞歸算法性能有所提高, 而兩者計算成本相等。其后Jakuba等[75]采用了不同于經(jīng)典貝葉斯的地圖更新規(guī)則, 將占據(jù)柵格圖中的網(wǎng)格單元定位為二元狀態(tài), 以網(wǎng)格占用或者空缺來表示羽流源是否存在, 并將羽流探測的可能性建模為羽流源與探測器之間的相對位置的函數(shù)。結(jié)果表明, 該算法能夠在未知羽流源數(shù)量的環(huán)境下進(jìn)行羽流源定位, 在多源場景中的表現(xiàn)優(yōu)于經(jīng)典規(guī)則。
Pang[76]提出了一種基于貝葉斯推理的羽流建圖算法和基于人工勢場法的搜索算法, 用于水下熱液噴口的定位。該方法采用羽流細(xì)絲模型, 通過實時預(yù)測噴口位置, 不斷優(yōu)化水下機(jī)器人的運動軌跡, 在熱液羽流中導(dǎo)航并定位熱液噴口。
鄧薇等[77]通過貝葉斯方法對羽狀物源頭的概率分布進(jìn)行估計, 同時利用人工勢場法進(jìn)行羽流追蹤。通過真實的水域?qū)嶒烌炞C了貝葉斯方法實時在線更新源頭概率分布圖的可靠性和人工勢場法用于追蹤的有效性。
2) 馬爾可夫方法
HMM方法可以對狀態(tài)的轉(zhuǎn)移進(jìn)行建模。羽流追蹤任務(wù)可以將搜索區(qū)域劃分成網(wǎng)格, 所有網(wǎng)格的狀態(tài)集合(是否包含羽流)就構(gòu)成了羽流當(dāng)前時刻的狀態(tài), 馬爾可夫性表明狀態(tài)轉(zhuǎn)移只與當(dāng)前狀態(tài)相關(guān), 而與之前時刻的歷史狀態(tài)無關(guān)。
Farrell等[72]提出了一種基于HMM方法的羽流建圖方法, 并通過仿真驗證了此方法估計羽流擴(kuò)散路徑和羽流源概率分布的有效性?;贖MM方法構(gòu)建羽流擴(kuò)散路徑并估計源位置可分別解決下列5個子問題: ①基于流場信息和假設(shè)的源概率向量, 確定哪些單元可能包含可檢測的羽流; ②基于測量的流場信息確定哪些單元在檢測到(或未檢測到)羽流時可能產(chǎn)生羽流; ③估計羽流源概率向量; ④確定羽流從假定源位置到感興趣單元的最可能路徑; ⑤確定最有可能檢測到羽流的2個位置之間的路徑。最后, 綜合上述估計結(jié)果生成羽流概率分布圖。此方法只給出了羽流在湍流環(huán)境中的概率分布圖, 而沒有指出如何利用羽流概率分布圖來指導(dǎo)機(jī)器人定位羽流源。
Jiu等[73]提出了一種基于POMDP算法和人工勢場算法的路徑規(guī)劃策略。利用POMDP算法構(gòu)造羽流源似然圖, 并根據(jù)AUV傳感器檢測的環(huán)境信息實時更新源似然圖。根據(jù)獲得的羽流源似然圖, 基于人工勢場算法精確規(guī)劃跟蹤路徑, 引導(dǎo)AUV沿路徑跟蹤, 直到檢測到羽流源。通過仿真驗證, 此方法與仿生方法相比成功率更高, 穩(wěn)定性更好。
Wang等[78]提出了一種結(jié)合了基于POMDP的羽流源建圖和A*路徑規(guī)劃算法的CPT策略, 可以用于AUV在有障礙物的水下環(huán)境中定位羽流源。通過基于POMDP生成的羽流源似然圖獲得羽流源的估算位置。在確定羽流源的估算位置后, 利用A*路徑規(guī)劃算法生成避開障礙物的最短路徑。仿真結(jié)果驗證了該方法的有效性。與基于HMM的羽流源建圖算法相比, 此算法能夠更快地收斂到正確的羽流源位置。此外, A*路徑規(guī)劃算法使AUV能夠避開路徑規(guī)劃算法中的障礙物和局部極小問題。
概率估計方法是基于測量結(jié)果推斷后驗概率, 從而規(guī)劃水下機(jī)器人運動追蹤羽流。基于概率估計方法的研究成果主要體現(xiàn)在計算機(jī)仿真和實驗室環(huán)境人工模擬的小時空尺度羽流。該方法在選擇適合應(yīng)用場景的羽流分布模型上更加靈活, 但依賴于采樣點的精確定位, 需要較高的計算成本。在復(fù)雜的自然環(huán)境中, 流場是非均勻且時變的, 而推斷概率都是基于一些假設(shè)條件, 與實際情況存在一定的偏差。隨著對擴(kuò)散模型研究的深入, 概率估計方法將成為羽流追蹤研究的一個重要方向。
強(qiáng)化學(xué)習(xí)的主要思想是: 智能體在環(huán)境中進(jìn)行感知, 并采取一系列行動, 使累計得到的獎勵最大[79]。強(qiáng)化學(xué)習(xí)算法的框架可以用于水下機(jī)器人羽流源定位, 其目標(biāo)是在未知環(huán)境中尋找羽流源。通過適當(dāng)?shù)囟x獎勵機(jī)制, 水下機(jī)器人可以選擇有利于定位羽流來源的行動, 從而到達(dá)最大的獎勵位置。水下機(jī)器人通過與環(huán)境的交互, 根據(jù)環(huán)境信息與當(dāng)前狀態(tài)做出動作決策, 以執(zhí)行動作的獎懲作為反饋, 學(xué)習(xí)最優(yōu)動作策略, 完成溯源任務(wù)[80]。順序型強(qiáng)化學(xué)習(xí)問題可以抽象為馬爾科夫決策過程(Markov decision process, MDP), 但很多情況下機(jī)器人所得到的觀察值可能是不確定的, 因此可以建模為POMDP[81]。
Niu等[82]提出了一種有連續(xù)狀態(tài)和動作域的強(qiáng)化學(xué)習(xí)羽流跟蹤策略。其將跟蹤問題建模為轉(zhuǎn)移矩陣未知的MDP, 采用連續(xù)時間差分和確定性策略梯度(deterministic policy gradient, DPG)方法進(jìn)行估計值函數(shù)和改進(jìn)逼近策略。同時提出了監(jiān)督初始化、獎勵塑造和改進(jìn)的貪心搜索算法來加速學(xué)習(xí)。這種基于學(xué)習(xí)的方法可以平滑搜索軌跡并降低丟失羽流的風(fēng)險, 該策略的有效性和高效性也在仿真中得到了驗證。
在現(xiàn)實的深海環(huán)境中, 由于感知能力和噪聲的限制, AUV無法獲得足夠精確的觀測信息來制定最佳策略以追蹤羽流并溯源。因此羽流跟蹤問題可以被建模為具有連續(xù)狀態(tài)空間和動作空間的POMDP問題, AUV通過傳感器收集環(huán)境信息(觀測值)來更新對當(dāng)前所處狀態(tài)的可信度。Hu等[83]提出了一個基于長短時記憶網(wǎng)絡(luò)的DPG框架來優(yōu)化目標(biāo), 并用由動態(tài)規(guī)劃方法衍生的監(jiān)督策略提高訓(xùn)練速度和性能; 同時還建立了時變湍流流場和交互信息的水下羽流追蹤尋源仿真環(huán)境, 并在仿真環(huán)境下驗證了羽流跟蹤策略的有效性。
Wang等[84]提出了一種基于模型的強(qiáng)化學(xué)習(xí)方法。其通過構(gòu)建POMDP和HMM模型估計羽流分布圖和源位置分布圖。采用模糊推理的決策方法, 動態(tài)融合2幅地圖的信息, 將融合信息分配給獎勵函數(shù), 并采用值迭代的路徑規(guī)劃算法來求解最優(yōu)策略。通過仿真驗證了該方法在湍流環(huán)境下的有效性。
水下機(jī)器人通過與環(huán)境交互學(xué)習(xí), 完成未知環(huán)境下的溯源, 這是一個典型的強(qiáng)化學(xué)習(xí)問題。由于水下湍流環(huán)境的時變特點, 傳統(tǒng)強(qiáng)化學(xué)習(xí)的策略設(shè)計方法難以獲得較好的溯源效果。深度強(qiáng)化學(xué)習(xí)方法基于深度網(wǎng)絡(luò)設(shè)計動作策略、獎勵函數(shù), 可以更好地應(yīng)對復(fù)雜時變的水下環(huán)境, 獲得較好的溯源效果。強(qiáng)化學(xué)習(xí)需要通過和環(huán)境交互進(jìn)行策略學(xué)習(xí), 受限于水下實驗的復(fù)雜性, 難以在實際環(huán)境中開展學(xué)習(xí)實驗, 因此更加依賴仿真平臺的支持。隨著仿真技術(shù)的不斷提高, 強(qiáng)化學(xué)習(xí)方法在水下羽流追蹤研究上具有廣闊的前景。
水下羽流追蹤研究需要從二維向三維過渡, 但面臨著水域龐大廣闊, 流場復(fù)雜多變, 實驗成本高昂, 經(jīng)驗積累不足(浮升羽流追蹤成果罕見)等挑戰(zhàn)。
隨著海洋觀測設(shè)備種類的增加及相關(guān)軟硬件技術(shù)的快速發(fā)展, 水下羽流追蹤技術(shù)近些年得到了廣泛的研究。就目前而言, 羽流追蹤技術(shù)實際應(yīng)用并不成熟, 多集中于仿真和實驗研究?,F(xiàn)階段水下羽流追蹤的發(fā)展趨勢包括以下幾個方面。
氣體羽流追蹤研究起步較早, 有較好的技術(shù)積累, 并涌現(xiàn)了大量的研究成果。氣體羽流研究從層流到湍流、從二維到三維的逐步過渡, 可以為水下羽流追蹤提供參考和思路。
針對水下羽流溯源應(yīng)用, 尚未出現(xiàn)針對特定羽流類型進(jìn)行擴(kuò)散建模, 并將模型用于溯源算法中的研究, 更多地是使用通用的氣體/液體羽流擴(kuò)散模型進(jìn)行溯源算法設(shè)計。因此, 水下羽流追蹤可以借鑒空氣中的追蹤方法, 如基于優(yōu)化的方法(粒子群優(yōu)化算法等)、基于多機(jī)器人的方法等。
目前針對溯源問題的擴(kuò)散建模并沒有體現(xiàn)出氣體羽流擴(kuò)散和水下羽流擴(kuò)散的區(qū)別, 但不能說明這兩者之間完全一樣。仍需立足于分析氣體羽流擴(kuò)散和水下羽流擴(kuò)散的區(qū)別, 進(jìn)而通過仿真、實驗等方法驗證將氣體羽流追蹤方法應(yīng)用于水下羽流追蹤任務(wù)的可行性。
現(xiàn)有羽流擴(kuò)散建模體系仍有待完善。對于氣泡或液滴產(chǎn)生的湍流沒有公認(rèn)的模型, CFD模型可以在這些情況下進(jìn)行預(yù)測, 但缺乏驗證數(shù)據(jù)[40]。在實際的水下環(huán)境中, 存在許多參數(shù)難以確定的風(fēng)、浪、流、渦等復(fù)雜情況, 湍流模型的計算復(fù)雜度較高, 難以滿足實時性要求, 而簡化后的湍流模型與實際環(huán)境差異較大, 難以復(fù)現(xiàn)追蹤的實際過程。研究與實際環(huán)境一致性較高且可以滿足實時計算要求的羽流擴(kuò)散模型, 對羽流追蹤研究十分重要。完善羽流模型時要充分考慮不同類型水下羽流的擴(kuò)散特點, 如: 石油羽流的浮力較大, 而熱液羽流呈中性浮力等。隨著水下羽流溯源研究的進(jìn)一步深入, 針對不同類型的水下羽流特點進(jìn)行擴(kuò)散建模, 通過仿真、實驗等方法進(jìn)行驗證, 并將模型應(yīng)用于羽流溯源研究中, 是提高水下羽流溯源實時性、準(zhǔn)確性的必然要求, 也是未來的水下羽流追蹤研究的重要方向。除了進(jìn)一步改進(jìn)羽流擴(kuò)散模型之外, 還可以考慮改進(jìn)流場的變化周期和組成成份, 使模擬環(huán)境更接近真實環(huán)境。
現(xiàn)有的面向水下環(huán)境的三維羽流仿真平臺較少, 且功能較單一, 目前缺少集合各種水下羽流特點的仿真平臺。隨著計算能力的提高, 仿真環(huán)境應(yīng)向大尺度(較大尺度三維環(huán)境仿真)、集成化(集成流場計算、羽流分布計算等過程)、多功能(對不同類型羽流追蹤任務(wù)的仿真)的方向發(fā)展。
Tian等[30]提出了一種通過集成化學(xué)和視覺傳感器信息識別近岸和海洋環(huán)境中羽流源的策略。雖然生物追蹤羽流主要依賴于嗅覺器官對目標(biāo)信息素的感知, 但羽流源位置的確認(rèn)可以利用多種傳感器數(shù)據(jù), 包括視覺、觸覺甚至聽覺線索[85]??諝庵袣馕对炊ㄎ灰呀?jīng)有融合其他模態(tài), 尤其是視覺模態(tài)的研究案例, 水下羽流追蹤也可以嘗試融合其他模態(tài)信息。結(jié)合深度學(xué)習(xí)方法, 基于視覺的目標(biāo)分類、分割研究已經(jīng)有了飛躍式的發(fā)展, 也可能為水下羽流追蹤提供新的信息。羽流追蹤應(yīng)將部分基于嗅覺的定向行為與基于多傳感器的局部搜索相結(jié)合, 利用多模態(tài)信息融合技術(shù)實現(xiàn)水下羽流的追蹤與定位。
水下機(jī)器人是羽流溯源最常見的平臺。無論是對水下羽流追蹤進(jìn)行仿真研究還是試驗驗證, 一般多采用單剛體滑翔機(jī)或AUV, 但其機(jī)動性都較差, 比如REMUSAUV需要5~10 m的轉(zhuǎn)彎半徑來改變方向[70], 較大的轉(zhuǎn)彎半徑在復(fù)雜的湍流環(huán)境下易導(dǎo)致羽流丟失, 難以實現(xiàn)對羽流的實時追蹤。深海熱液、冷泉等羽流的源頭多位于海底, 從二維平面到三維空間追蹤水下羽流, 對AUV提出了更高的要求, 需要設(shè)計開發(fā)靈活性更好的AUV, 更需要考驗其耐壓能力、續(xù)航能力及通信能力等。羽流探測傳感器也需要面向深海應(yīng)用發(fā)展, 小型化、輕型化、精確度高、靈敏度高且耐壓能力強(qiáng)的傳感器設(shè)備也是今后的發(fā)展趨勢。
水下羽流追蹤涉及機(jī)器人技術(shù)、流體力學(xué)、人工智能和海洋科學(xué)等多個學(xué)科或領(lǐng)域, 具有較高的學(xué)術(shù)研究價值和廣闊的應(yīng)用前景, 可為人類探索海洋、保護(hù)海洋及開采海洋資源等方面提供新的方法與手段。截至目前, 有關(guān)水下羽流追蹤方面的研究還不是很多。文章從已有的相關(guān)研究成果出發(fā), 總結(jié)了常見羽流及其檢測技術(shù), 根據(jù)算法原理將水下羽流的追蹤方法梳理為反應(yīng)類、概率估計類和強(qiáng)化學(xué)習(xí)類3種。反應(yīng)類方法較簡單, 容易實現(xiàn), 但僅針對特定的環(huán)境條件; 概率估計方法依賴有數(shù)學(xué)理論基礎(chǔ)的擴(kuò)散模型, 隨著研究的深入, 可能成為羽流追蹤研究的一個重要方向; 強(qiáng)化學(xué)習(xí)方法可以更好地應(yīng)對時變的水下環(huán)境, 但需要通過和環(huán)境交互進(jìn)行學(xué)習(xí), 受限于水下實驗的復(fù)雜性, 更依賴于仿真平臺的支持。
文章最后總結(jié)了水下羽流追蹤技術(shù)未來的發(fā)展趨勢, 包括借鑒氣體羽流追蹤的研究成果, 不斷優(yōu)化水下羽流擴(kuò)散模型及仿真平臺, 利用多模態(tài)信息融合方法對水下羽流進(jìn)行追蹤定位, 以及優(yōu)化面向深海試驗的羽流搜索平臺和傳感技術(shù)。
[1] Dover C L V.Impacts of Anthropogenic Disturbances at Deep-Sea Hydrothermal Vent Ecosystems: A Review[J].Marine Environmental Research, 2014, 102: 59-72.
[2] Jakuba M V.Stochastic Mapping for Chemical Plume Source Localization with Application to Autonomous Hydrothermal Vent Discovery[D].USA: Massachusetts Institute of Technology, 2007.
[3] Aryadi Y, Rizal I S, Fadhli M N.Electricity Generation from Hydrothermal vents[C]//IOP Conference Series: Earth and Environmental Science.Indonesia: IOP Publishing, 2016.
[4] Talukder A R.Review of Submarine Cold Seep Plumbing Systems: Leakage to Seepage and Venting[J].Terra Nova, 2012, 24(4): 255-272.
[5] Leifer I.A Synthesis Review of Emissions and Fates for the Coal Oil Point Marine Hydrocarbon Seep Field and California Marine Seepage[J].Geofluids, 2019(5): 1-48.
[6] Hwang J, Bose N, Nguyen H D, et al.Acoustic Search and Detection of Oil Plumes Using an Autonomous Underwater Vehicle[J].Journal of Marine Science and Engineering, 2020, 8(8): 618.
[7] Wang Q, Yang Z.Industrial Water Pollution, Water Environment Treatment, and Health Risks in China[J].Environmental Pollution, 2016, 218(11): 358-365.
[8] Russell R A, Bab-Hadiashar A, Shepherd R L, et al.A Comparison of Reactive Robot Chemotaxis Algorithms[J].Robotics and Autonomous Systems, 2003, 45(2): 83-97.
[9] 孟慶浩, 李飛.主動嗅覺研究現(xiàn)狀[J].機(jī)器人, 2006, 28(1): 89-96.
Meng Qing-hao, Li Fei.Review of Active Olfaction[J].Robot, 2006, 28(1): 89-96.
[10] Kowadlo G, Russell R A.Robot Odor Localization: a Taxonomy and Survey[J].The International Journal of Robotics Research, 2008, 27(8): 869-894.
[11] Ishida H, Wada Y, Matsukura H.Chemical Sensing in Robotic Applications: A Review[J].IEEE Sensors Journal, 2012, 12(11): 3163-3173.
[12] Chen X X, Huang J.Odor Source Localization Algorithms on Mobile Robots: A Review and Future Outlook[J].Robotics and Autonomous Systems, 2019, 112: 123-136.
[13] Jing T, Meng Q H, Ishida H.Recent Progress and Trend of Robot Odor Source Localization[J].IEEJ Transactions on Electrical and Electronic Engineering, 2021, 16(7): 938-953.
[14] Ji C, Beegle-Krause C J, Englehardt J D.Formation, Detection, and Modeling of Submerged Oil: A Review[J].Journal of Marine Science and Engineering, 2020, 8(9): 642.
[15] 韓同剛, 童思友, 陳江欣, 等.海底羽狀流探測方法分析[J].地球物理學(xué)進(jìn)展, 2018, 33(5): 2113-2125.
Han Tong-gang, Tong Si-you, Chen Jiang-xin, et al.Analysis of Detection Methods for Submarine Plume[J].Progress in Geophysics, 2018, 33(5): 2113-2125.
[16] 馬媛媛, 辛洋, 蔣磊.海底熱液噴口流體中H2S濃度數(shù)據(jù)統(tǒng)計及其探測技術(shù)進(jìn)展[J].海洋科學(xué), 2020, 44(2): 146-160.
Ma Yuan-yuan, Xin Yang, Jiang Lei.Concentration Statistics and Detection Technology of Hydrogen Sulfide in Submarine Hydrothermal Vent Fluids[J].Marine Science, 2020, 44(2): 146-160.
[17] 劉國棟, 王焱.環(huán)境水力學(xué)[M].北京: 中國水利水電出版社, 2018.
[18] Petillo S M, Schmidt H.Autonomous and Adaptive Underwater Plume Detection and Tracking with AUVs: Concepts, Methods, and Available Technology[J].IFAC Proceedings Volumes, 2012, 45(27): 232-237.
[19] 曾志剛, 陳祖興, 張玉祥, 等.海底熱液活動的環(huán)境與產(chǎn)物[J].海洋科學(xué), 2020, 44(7): 143-155.Zeng Zhi-gang, Chen Zu-xing, Zhang Yu-xiang, et al.Seafloor Hydrothermal Activities and Their Geological Environments and Products[J].Marine Science, 2020, 44(7): 143-155.
[20] 李燦蘋, 尤加春, 朱文娟.氣泡羽狀流的識別及其與資源環(huán)境相關(guān)性分析[J].地球物理學(xué)進(jìn)展, 2016, 31(6): 2747-2755.
Li Can-ping, You Jia-chun, Zhu Wen-juan.Identification of Bubble Plumes and Analysis of Its Correlation with Resource Environment[J].Progress in Geophysics, 2016, 31(6): 2747-2755.
[21] Leifer I, Patro R K.The Bubble Mechanism for Methane Transport from the Shallow Sea Bed to the Surface: A Review and Sensitivity Study[J].Continental Shelf Research, 2002, 22(16): 2409-2428.
[22] Petillo S M, Schmidt H.Autonomous and Adaptive Underwater Plume Detection and Tracking with AUVs: Concepts, Methods, and Available Technology[J].IFAC Proceedings Volumes, 2012, 45(27): 232-237.
[23] 黃遠(yuǎn)奕.我國工業(yè)廢水重金屬灰水足跡的分布特征及驅(qū)動因子研究[D].北京: 北京科技大學(xué), 2020.
[24] 中華人民共和國生態(tài)環(huán)境部.地表水環(huán)境質(zhì)量標(biāo)準(zhǔn): GB 3838-2002[S].北京: 中國標(biāo)準(zhǔn)出版社, 2002.
[25] Rogowski P, Terrill E, Otero M, et al.Mapping Ocean Outfall Plumes and Their Mixing Using Autonomous Underwater Vehicles[J].Journal of Geophysical Research Atmospheres, 2012, 117(C7): 1-12.
[26] Cannell C J, Gadre A S, Stilwell D J.Boundary Tracking and Rapid Mapping of a Thermal Plume Using an Autonomous Vehicle[C]//OCEANS 2006.Boston, MA, USA: IEEE, 2006: 1-6.
[27] Fahad M, Saul N, Yi G, et al.Robotic Simulation of Dynamic Plume Tracking by Unmanned Surface Vessels[C]//2015 IEEE International Conference on Robotics and Automation (ICRA).Seattle, WA, USA: IEEE, 2015.
[28] Petillo S M.Autonomous & Adaptive Oceanographic Feature Tracking on Board Autonomous Underwater Vehicles[C]//OCEANS 2015.Genova: IEEE, 2015: 1-10.
[29] Pang S, Farrell J A.Chemical Plume Source Localization [J].IEEE Transactions on Systems, Man, and Cybernetics, Part B(Cybernetics), 2006, 36(5): 1068-1080.
[30] Tian Y, Kang X, Li Y, et al.Identifying Rhodamine Dye Plume Sources in Near-shore Oceanic Environments by Integration of Chemical and Visual Sensors[J].Sensors, 2013, 13(3): 3776-3798.
[31] Mysorewala M F, Cheded L, Popa D O.A Distributed Multi-robot Adaptive Sampling Scheme for the Estimation of the Spatial Distribution in Widespread Fields[J].EURASIP Journal on Wireless Communications and Networking, 2012, 2012(1): 1-19.
[32] Camilli R, Reddy C M, Yoerger D R, et al.Tracking Hydrocarbon Plume Transport and Biodegradation at Deepwater Horizon[J].Science, 2010, 330(6001): 201-204.
[33] Gildner M L.Framework for Multi-vehicle Adaptive Sampling of Jets and Plumes in Coastal Zones[D].USA: Massachusetts Institute of Technology, 2013.
[34] Kukulya A L, Bellingham J G, Stokey R P, et al.Autonomous Chemical Plume Detection and Mapping Demonstration Results with a COTS AUV and Sensor Package[C]//MTS/IEEE Charleston OCEANS Conference.Charleston, USA: IEEE, 2018: 1-6.
[35] Soares D A R, Miguel J.Formation-based Odour Source Localisation Using Distributed Terrestrial and Marine Robotic Systems[R].Lausanne: EPFL, 2016.
[36] 糾海峰.基于水下機(jī)器人的熱液羽狀流自主搜尋定位方法研究[D].哈爾濱: 哈爾濱工程大學(xué), 2016.
[37] Farrell J A, Murlis J, Long X, et al.Filament-based Atmospheric Dispersion Model to Achieve Short Time-scale Structure of Odor Plumes[J].Environmental Fluid Mechanics, 2002, 2(1): 143-169.
[38] Balkovsky E, Shraiman B I.Olfactory Search at High Reynolds Number[J].Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(20): 12589-12593.
[39] 王陽.動態(tài)氣流環(huán)境下氣味煙羽仿真與氣味源定位[D].天津: 天津大學(xué), 2013.
[40] Boufadel M C, Socolofsky S, Katz J, et al.A Review on Multiphase Underwater Jets and Plumes: Droplets, Hydrodynamics, and Chemistry[J].Reviews of Geophysics, 2020, 58(3).
[41] Lesieur M, Metais O.New Trends in Large-eddy Simulations of Turbulence[J].Annual Review of Fluid Mechanics, 1996, 28(1): 45-82.
[42] Meneveau C, Katz J.Scale-invariance and Turbulence Models for Large-eddy Simulation[J].Annual Review of Fluid Mechanics, 2000, 32(1): 1-32.
[43] 溫竹青.基于FLUENT的深海熱液羽狀流流動模擬[D].北京: 中央民族大學(xué), 2011.
[44] Liu Z, Lu T F.A Simulation Framework for Plume-tracing Research[C]//Proceedings of the 2008 Australasian Conference on Robotics and Automation.Canberra, Australia: ARAA, 2008: 3-5.
[45] Garg S, Afzulpurkar S, Kumar A.Adaptive Biased Random Walk Algorithm for Ocean Chemical Feature Tracking Using an Autonomous Underwater Vehicle[C]// MTS/IEEE Charleston OCEANS Conference.Charleston, USA: IEEE, 2019: 1-8.
[46] 糾海峰, 龐碩, 韓冰.熱液羽狀流模型的建立與仿真[J].計算機(jī)仿真, 2015, 32(9): 404-408.
Jiu Hai-feng, Pang Shuo, Han Bing.Modeling and Simulation of Hydrothermal Plume Model[J].Computer Simulation, 2015, 32(9): 404-408.
[47] Fisher M, Dock M.Trace Chemical Sensing of Explosives[M].New Jersey: John Wiley & Sons, 2006.
[48] Soares D A R, Miguel J.Formation-based Odour Source Localisation Using Distributed Terrestrial and Marine Robotic Systems[D].Lausanne: EPFL, 2016.
[49] Branch A, Guangyu X, Jakuba M V, et al.Autonomous Nested Search for Hydrothermal Venting[C]//International Conference on Automated Planning and Scheduling (ICAPS) 2018, Delft, The Netherlands: AAAI Press, 2018.
[50] Hwang J, Bose N, Nguyen H D, et al.Oil Plume Mapping: Adaptive Tracking and Adaptive Sampling from an Autonomous Underwater Vehicle[J].IEEE Access, 2020, 8: 198021-198034.
[51] 田宇, 王昊, 張進(jìn), 等.深海熱液探測水下機(jī)器人技術(shù):感知、規(guī)劃與控制[M].北京: 科學(xué)出版社, 2020.
[52] Han B, Jiu H, Pang S, et al.Hydrothermal Plume Simulation for Autonomous Hydrothermal Vent Discovery[C]//2012 Oceans-Yeosu.Yeosu, Korea(south): IEEE, 2012: 1-7.
[53] Sutton J, Li W.Development of CPT_M3D for Multiple Chemical Plume Tracing and Source Identification[C]// 2008 Seventh International Conference on Machine Learning and Applications.San Diego, CA, USA: IEEE, 2008: 470-475.
[54] Tian Y, Zhang A.Simulation Environment and Guidance System for AUV Tracing Chemical Plume in 3-dimensions[C]//2010 2nd International Asia Conference on Informatics in Control, Automation and Robotics (CAR 2010).Wuhan: IEEE, 2010: 407-411.
[55] Arkin R C.Behavior-based Robotics[M].Cambridge, MA: MIT Press, 1998.
[56] Burian E, Yoerger D, Bradley A, et al.Gradient Search with Autonomous Underwater Vehicles Using Scalar Measurements[C]//Proceedings of Symposium on Autonomous Underwater Vehicle Technology.Monterey, CA, USA: IEEE, 1996: 86-98.
[57] Li Z, You K, Song S.AUV Based Source Seeking with Estimated Gradients[J].Journal of Systems Science and Complexity, 2018, 31(1): 262-275.
[58] Naeem W, Sutton R, Chudley J.Chemical Plume Tracing and Odour Source Localisation by Autonomous Vehicles[J].Journal of Navigation, 2007, 60(2): 173-190.
[59] Hill J, Szewczyk R, Woo A, et al.System Architecture Directions for Network Sensors[J].ACM SIGOPS Operating Systems Review, 2000, 35(5): 93-104.
[60] Dhariwal A, Sukhatme G S, Requicha A A G.Bacterium- inspired Robots for Environmental Monitoring[C]//IEEE International Conference on Robotics and Automation, 2004.New Orleans, LA, USA: IEEE, 2004: 1436-1443.
[61] Grasso F W, Basil J A, Atema J.Toward the Convergence: Robot and Lobster Perspectives of Tracking Odors to Their Source in the Turbulent Marine Environment[C]// Proceedings of the 1998 IEEE International Symposium on Intelligent Control(ISIC) Held Jointly with IEEE International Symposium on Computational Intelligence in Robotics and Automation(CIRA) Intell.Gaithersburg, MD, USA: IEEE, 1998: 259-264.
[62] Jakuba M, Yoerger D, Bradley A, et al.Multiscale, Multimodal AUV Surveys for Hydrothermal Vent Localization[C]//Proceedings of the Fourteenth International Symposium on Unmanned Untethered Submersible Technology (UUST05).2005.
[63] Mason J C, Branch A, Xu G Y, et al.Evaluation of AUV Search Strategies for the Localization of Hydrothermal Venting.[EB/OL].(2020-10-16)[2021-07-07].https://ica ps20subpages.icaps-conference.org/wp-content/uploads/2020/10/16-PlanRob_2020_paper_13.pdf
[64] Ferri G, Jakuba M V, Yoerger D R.A Novel Method for Hydrothermal Vents Prospecting Using an Autonomous Underwater Robot[C]//2008 IEEE International Conference on Robotics and Automation.Pasadena, California: IEEE, 2008: 1055-1060.
[65] Wang L, Pang S, Xu G.3-Dimensional Hydrothermal Vent Localization Based on Chemical Plume Tracing[C]//Global Oceans 2020: Singapore-US Gulf Coast.Online: IEEE, 2020: 1-7.
[66] Ai X, You K, Song S.A Source-seeking Strategy for an Autonomous Underwater Vehicle via On-line Field Estimation[C]//2016 14th International Conference on Control, Automation, Robotics and Vision(ICCARV).Phuket, Thailand: IEEE, 2016: 1-6.
[67] Kramer E.A Tentative Intercausal Nexus and Its Computer Model on Insect Orientation in Windborne Pheromone Plumes[M]//Insect Pheromone Research.Boston, MA: Springer, 1997: 232-247.
[68] Farrell J A, Pang S, Li W, et al.Chemical Plume Tracing Experimental Results with a REMUS AUV[C]//Oceans 2003.Celebrating the Past Teaming Toward the Future.San Diego, CA, USA: IEEE, 2003: 962-968.
[69] Farrell J A, Pang S, Wei L.Chemical Plume Tracing via an Autonomous Underwater Vehicle[J].IEEE Journal of Oceanic Engineering, 2005, 30(2): 428-442.
[70] Li W, Farrell J A, Pang S, et al.Moth-inspired Chemical Plume Tracing on an Autonomous Underwater Vehicle[J].IEEE Transactions on Robotics, 2006, 22(2): 292-307.
[71] Grasso F W, Atema J.Integration of Flow and Chemical Sensing for Guidance of Autonomous Marine Robots in Turbulent Flows[J].Environmental Fluid Mechanics, 2002, 2(1): 95-114.
[72] Farrell J A, Pang S, Li W.Plume Mapping via Hidden Markov Methods[J].IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics, 2003, 33(6): 850-863.
[73] Jiu H, Chen Y, Deng W, et al.Underwater Chemical Plume Tracing Based on Partially Observable Markov Decision Process[J].International Journal of Advanced Robotic Systems, 2019, 16(2): 1-12.
[74] Pang S.Reactive Planning and on-line Mapping for Chemical Plume Tracing[D].CA, USA: University of California, Riverside, 2004.
[75] Jakuba M, Yoerger D R.Autonomous Search for Hydrothermal Vent Fields with Occupancy Grid Maps[C]//Proc.of ACRA.2008, 8: 2008.
[76] Pang S.Plume Source Localization for AUV Based Autonomous Hydrothermal Vent Discovery[C]//OCEANS 2010 MTS/IEEE SEATTLE.Seattle: IEEE, 2010: 1-8.
[77] 鄧薇, 韓端鋒, 糾海峰.基于嗅覺的水下機(jī)器人化學(xué)羽狀物追蹤定位方法[J].電機(jī)與控制學(xué)報, 2016(1): 110-118.Deng Wei, Han Duan-feng, Jiu Hai-feng.Chemical Plume Tracing and Localization Method Based on Olfaction for
Underwater[J].Journal of Electric Machines and Control, 2016(1): 110-118.
[78] Wang L, Pang S.Chemical Plume Tracing Using an AUV Based on POMDP Source Mapping and A-star Path Planning[C]//OCEANS 2019 MTS/IEEE SEATTLE.Seattle: IEEE, 2019: 1-7.
[79] Sutton R, Barto A.Reinforcement Learning: An Introduction[M].Cambridge, MA: MIT Press, 1998.
[80] 李金龍.部分觀測馬爾可夫決策過程下的深海熱液自主探測研究[D].哈爾濱: 哈爾濱工程大學(xué), 2013.
[81] 白雙.基于強(qiáng)化學(xué)習(xí)蟻群算法的主動嗅覺[D].天津: 天津大學(xué), 2009.
[82] Niu L, Song S, You K.A Plume-tracing Strategy via Continuous State-action Reinforcement Learning[C]//2017 Chinese Automation Congress.Jinan, China: IEEE, 2017: 759-764.
[83] Hu H, Song S, Chen C L P.Plume Tracing via Model-free Reinforcement Learning Method[J].IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(8): 2515-2527.
[84] Wang L, Pang S, Li J.Olfactory-based Navigation via Model-based Reinforcement Learning and Fuzzy Inference Methods[J].IEEE Transactions on Fuzzy Systems, 2021, 29(10): 3014-3027.
[85] Tang S, Guo A.Choice Behavior of Drosophila Facing Contradictory Visual Cues[J].Science, 2001, 294(5546): 1543-1547.
Progress of Underwater Plume Tracking Methods
XU Xue-han, MENG Qing-hao, LIU Ke-xian, JING Tao
(Institute of Robotics and Autonomous Systems, School of Electrical Automation and Information Engineering, Tianjin University, Tianjin 300072, China)
There has been significant research on underwater plume for marine resource exploitation and environmental protection.Based on underwater plume dispersion modeling and tracking methods, the existing relevant research results, research progress, and development trend of underwater plume tracking were summarized.Firstly, the classification of underwater plumes and application background of plume tracking were presented.Subsequently, the research status of underwater plume dispersion modeling was reviewed from two aspects: The dispersion model and simulation platform.Thirdly, the current underwater plume tracking methods were divided into three categories, namely the reactive, probability estimation, and reinforcement learning methods, and the representative research were reviewed.Finally, the development trend of underwater plume tracking research was discussed.This review could provide a reference for further research on underwater plume tracking.
underwater plume; dispersion modeling; plume tracking
徐雪寒, 孟慶浩, 劉科顯, 等.水下羽流追蹤方法研究進(jìn)展[J].水下無人系統(tǒng)學(xué)報, 2022, 30(1): 1-14.
TP29; TP242.6
R
2096-3920(2022)02-0001-14
10.11993/j.issn.2096-3920.2022.01.001
2021-07-07;
2021-08-26.
國家重點研發(fā)計劃項目資助(2017YFC0306200).
徐雪寒(1993-), 女, 在讀博士, 主要研究方向為水下羽流追蹤.
(責(zé)任編輯: 吳 攀)