關鍵詞:字典學習;稀疏約束;海洋污染;二維海表流場重建
中圖分類號:X55 文獻標志碼:B
前言
海洋污染的復雜性和多樣性使其成為一個充滿挑戰(zhàn)的領域,而有效的污染預報對于采取及時的應對措施至關重要。字典學習作為一種基于數(shù)據(jù)的信號表示方法,在處理復雜數(shù)據(jù)中展現(xiàn)出了顯著的優(yōu)勢。通過構建適當?shù)淖值?,可以更好地捕捉海洋污染?shù)據(jù)中的潛在結構和特征,從而提高對其的理解和預測能力。同時,引入稀疏約束可有效地減少數(shù)據(jù)的維度,降低冗余信息,使得海洋污染數(shù)據(jù)的分析更加精細化和高效。數(shù)據(jù)同化作為污染預報中不可或缺的一環(huán),通過將模型模擬結果與實際觀測數(shù)據(jù)相結合,可以彌補模型的不足,提高預報的準確性。此研究通過將字典學習和稀疏約束引入數(shù)據(jù)同化過程,旨在克服傳統(tǒng)方法在處理海洋污染數(shù)據(jù)中遇到的問題,如高維度、噪聲干擾等,從而為海洋環(huán)境管理和保護提供更可靠的科學支持。
1字典學習
1.1字典學習
字典學習是一種通過樣例數(shù)據(jù)構建特征向量矩陣的技術,其中特征矩陣的每行構成字典的基。在滿足重構誤差準則的基礎上,目標是以最少的基底近似表示原始數(shù)據(jù),如式(1)所示:
式(1)中,X為原始數(shù)據(jù);A為稀疏矩陣;D為待學習字典。
基需要具備較強泛化表達能力,以降低冗余并提升表達水平,同時確保字典內容豐富,以捕捉樣例數(shù)據(jù)的多樣性和復雜性。隨著基減少,字典能更精確地捕獲廣泛信息,實現(xiàn)高效且精密的表示。
1.2數(shù)據(jù)驅動緊框架
數(shù)據(jù)驅動緊框架(Data-driven tight frame,DDTF)理論為處理具有相似特性的數(shù)據(jù)集合提供高效且自適應的字典學習技術。其基于優(yōu)化和稀疏表達構建,針對數(shù)據(jù)集進行訓練,并建立包含多元性質和結構的緊框架。
針對以二維實數(shù)值圖像為主要研究對象的情況,涉及到的二維離散框架具有有限的支撐區(qū)域。目標泛函通過使用二維小波濾波器對圖像進行濾波處理,目標函數(shù)如式(2)所示:
3.1動力學模型及同化實驗設置
為模擬示蹤物的移動軌跡,采用式(14)和式(15)構建動力學模型,并采用Leap-frog法對時間軸進行二階離散化。鑒于可能的云層遮蓋導致實驗數(shù)據(jù)缺失,引入部分缺失觀測算子H,驗證方法是否適應處理非線性逆問題。
在控制變量方面,起始速度選擇為零速度場,代表水流的平穩(wěn)狀態(tài);初期高度場取平均高度水平,作為參照基調環(huán)境。整個試驗中,時間步長為0.01s,每0.25s采集一張圖像。為全面比較提出的同化方法、傳統(tǒng)同化策略和最小梯度正則化方法(MG),采用以上方法進行重復實驗,并對比實驗結果。
3.2流場重建的同化測試與結果
3.2.1含有時空域缺失的觀測數(shù)據(jù)仿真
空間域觀測匱乏的情況下,同化算法在重構二維流動場方面的準確性和有效性上限。通過設計正渦旋狀流動場模型(VOtrue)并構建相應的高程場(htrue0),人為地創(chuàng)建了空缺的空間域觀測數(shù)據(jù)。采用MG同化算法及其他方法進行測試,包括哈爾小波框架、離散余弦框架、多層樣條小波框架、曲波多尺度緊框架和渦量結構緊框架等。
從定量分析來看,固定基變換方法相對不足,可能陷入局部最小值。相比之下,MG方法的全局搜索能力明顯提升,但在大規(guī)模數(shù)據(jù)集和強不適定性反問題下可能收斂速度較慢,存在偽像信息。以渦量結構字典為核心的稀疏約束型同化方法在全局搜索能力上改進,并在30次左右的迭代后實現(xiàn)了收斂,見圖1。
3.2.2含有混合結構的觀測數(shù)據(jù)仿真
如圖2所示兩種同化方法的流場模擬結果,MG方法監(jiān)測結果不理想,而混合方法能夠更好地重建真實情況。如圖3所示重建誤差、保真度及梯度的ι2范數(shù)隨著迭代次數(shù)的變化,結果表明混合方法在大約40次迭代后達到穩(wěn)定的收斂?;旌戏椒ň哂邪菪?,解決了觀測數(shù)據(jù)中不同結構信息帶來的挑戰(zhàn),使其在處理非線性反問題時具備優(yōu)勢。
3.2.3二維流場重建同化測試
采用Coriolis旋轉平臺模擬大氣環(huán)境中渦旋演化過程,通過施加Coriolis在極淺薄的水層上,深度模擬渦旋輸出移動的各個環(huán)節(jié)。實驗中,水池自轉大約60s完成,相對地球一個完整周期的運轉,時間步驟精確控制在0.01s。為實時觀察水流渦旋構造,加入熒光物質,配置精密觀測儀器記錄和分析熒光指示劑濃度移動路徑。
在數(shù)據(jù)處理階段,傳統(tǒng)同化方法受觀測圖像和數(shù)值離散誤差影響,包括奇異點和未消噪問題,但用MG模型優(yōu)化雖然提高了穩(wěn)定性,但是存在偽像和不光滑的渦旋結構。
為解決該問題,用渦量構型驅動的稀疏約束同化方法,減小偽影影響,強化流場連續(xù)性。采用不同階數(shù)的渦量構型驅動緊框架驗證,階數(shù)達到12或16時,實現(xiàn)高精度重建效果,保持了模型原有的連續(xù)性。
4結束語
此研究探討了基于字典學習和稀疏約束型數(shù)據(jù)同化方法的海洋流場重構問題。通過正則化方法,考慮數(shù)據(jù)精確性、先驗假設和觀測物理特性,提升了重構穩(wěn)定性和透明度。在立體圖像重構中,結合直接圖像同化和渦量結構字典,使用曲波、小波變換及Lyapunov算法提取Lagrangian結構,優(yōu)化流場形態(tài)和位置,與觀測圖像保持一致。算法采用分裂Bregman迭代和有限存儲擬牛頓法L-BFGS,提高收斂效率和適用性。通過稀疏約束型同化方法,反推海洋動力學模型的初始速度場與高度場,為海底地形流場重構提供途徑。數(shù)值模擬中,新提出的混合方法(MG+SSD)顯著提高運算效率,處理不同結構信息,實現(xiàn)高精度流場重建。研究為海洋污染預報等實際應用提供理論支持,解決相關困難。