張永霖,王海斌,李 超,汪 俊,臺玉朋
(1.中國科學(xué)院聲學(xué)研究所聲場聲信息國家重點實驗室,北京 100190;2.中國科學(xué)院大學(xué),北京 100190)
由于海水的吸收作用,電磁波在海水中衰減十分嚴(yán)重,聲波是目前水下可以進(jìn)行遠(yuǎn)距離信息傳輸?shù)淖钣行лd體[1-3]。多年來,水聲通信技術(shù)不斷發(fā)展,從非相干通信到相干通信,從單載波通信到以正交頻分復(fù)用技術(shù)(Orthogonal Frequency Division Multiplexing,OFDM)為代表的多載波通信,水下通信對速率及帶寬的需求與日俱增[4-8]。與此同時,水下組網(wǎng)技術(shù)蓬勃發(fā)展,多點組網(wǎng)能夠有效實現(xiàn)信息互通、共享的目的,既可以大范圍地獲取海洋信息,也可以快速、便捷地傳遞和控制組網(wǎng)信息[9-10]。然而,由于水聲傳播特性復(fù)雜多變,導(dǎo)致水聲信道面臨強(qiáng)多途、快衰落、強(qiáng)背景噪聲等一系列問題,這也給水下聲信息傳輸帶來了極大的困難與挑戰(zhàn)[11-12]。綜上所述,隨著水下通信需求的劇增,基于模塊化、模型化驅(qū)動的傳統(tǒng)通信技術(shù)面臨著瓶頸。具體而言,當(dāng)未來水下通信面臨更加復(fù)雜的環(huán)境變化以及多維度的網(wǎng)絡(luò)資源需要通過細(xì)粒度精確配置時,傳統(tǒng)的水聲通信技術(shù)將面臨精度以及魯棒性的嚴(yán)峻考驗,而基于專家知識所建立的、廣泛適用的通信模型也具有一定的局限性。
近年來以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)技術(shù)飛速發(fā)展,在諸多領(lǐng)域得到廣泛應(yīng)用,取得了矚目的成果,為解決上述水聲通信中的挑戰(zhàn)提供了新的思路[13-14]。機(jī)器學(xué)習(xí)在水聲通信技術(shù)中的應(yīng)用盡管稍遲于在水聲探測及水聲目標(biāo)定位[15-22]領(lǐng)域中的應(yīng)用,但依然被賦予了高度期望,受到各國學(xué)者的廣泛關(guān)注[23],成為了當(dāng)前海洋信息科學(xué)研究的熱點。
水聲通信與機(jī)器學(xué)習(xí)交叉研究的示意圖如圖1所示。交叉研究中的重點發(fā)展方向及優(yōu)勢結(jié)合點。水聲通信與機(jī)器學(xué)習(xí)的典型應(yīng)用包括:(1)以節(jié)點間通信為主的物理層,包括水聲信道估計與均衡、水聲自適應(yīng)調(diào)制、頻譜感知與分配、通信質(zhì)量預(yù)測等[24-31];(2)以組網(wǎng)為應(yīng)用場景的網(wǎng)絡(luò)層,包括網(wǎng)絡(luò)拓?fù)浞执亍⒐?jié)點功率分配、水聲網(wǎng)絡(luò)路由設(shè)計、水聲網(wǎng)絡(luò)安全等[32-37]。隨著水下通信技術(shù)研究的不斷深入,上述研究方向正伴隨水下裝備智能化、一體化的需求,逐漸表現(xiàn)出新的發(fā)展趨勢,具體體現(xiàn)在數(shù)據(jù)量、節(jié)點的迅速增長,運算效率以及安全性要求不斷提高,而機(jī)器學(xué)習(xí)為解決這些問題提供了新的解決方案,水聲通信與機(jī)器學(xué)習(xí)方法的具體結(jié)合思路如下:
圖1 水聲通信與機(jī)器學(xué)習(xí)交叉研究的示意圖 Fig.1 Schematic diagram of the intersection research on UWA communication and machine learning
(1)大數(shù)據(jù):隨著水下信息獲取技術(shù)的發(fā)展,實驗過程中積累了大量的實驗數(shù)據(jù)。海量信息亟需進(jìn)一步融合、蒸餾、提純。深度學(xué)習(xí)方法能夠有效整合數(shù)據(jù)并充分挖掘數(shù)據(jù)中的信息量[13,38]。
(2)多智能體:水下組網(wǎng)引發(fā)的多智能體間的信息融合與智能博弈。借助強(qiáng)化學(xué)習(xí),水下多智能體通過與環(huán)境直接互動,學(xué)習(xí)到利益最大化的習(xí)慣性行為,進(jìn)而實現(xiàn)在高維且動態(tài)的真實場景中通過交互和決策完成更錯綜復(fù)雜的任務(wù)[39-40]。
(3)快速學(xué)習(xí):海洋環(huán)境瞬息萬變,機(jī)器學(xué)習(xí)模型應(yīng)具有強(qiáng)魯棒性,以快速實現(xiàn)對未知環(huán)境的響應(yīng),進(jìn)而實現(xiàn)泛化場景的水聲通信。少樣本學(xué)習(xí)相較深度學(xué)習(xí),強(qiáng)調(diào)模型利用以往知識經(jīng)驗來指導(dǎo)新任務(wù)學(xué)習(xí)[41-43],即具備學(xué)會學(xué)習(xí)的能力,該類機(jī)器學(xué)習(xí)方法被視為實現(xiàn)通用人工智能的基礎(chǔ),也是突破固定場景下水聲通信的主要手段。
(4)數(shù)據(jù)保護(hù):水聲組網(wǎng)及通信數(shù)據(jù)隱私保護(hù)與安全至關(guān)重要。聯(lián)邦學(xué)習(xí)作為一種高效率的隱私保護(hù)手段被提出[44-47],該種分布式的機(jī)器學(xué)習(xí)方法可以在不直接獲取數(shù)據(jù)源的前提下,通過參與方的 本地訓(xùn)練和參數(shù)傳遞,得到一個無損的學(xué)習(xí)模型。
綜上,機(jī)器學(xué)習(xí)方法具備推動水聲通信技術(shù)進(jìn)一步發(fā)展的巨大潛力。此類方法在使用形式上具有較高的通用性,可在水聲信息處理多處節(jié)點形成潛在技術(shù)方案,涉及通信可靠性、速率、信息安全等諸多方面。傳統(tǒng)水聲學(xué)研究和大量實踐表明,物理層技術(shù)的發(fā)展水平對推動整個領(lǐng)域的突破具有重要意義,在學(xué)科發(fā)展中率先受到關(guān)注,是現(xiàn)階段的重點突破方向。而水聲信道的準(zhǔn)確估計是物理層實現(xiàn)高質(zhì)量通信的保障,是貫穿物理層各模塊的重要環(huán)節(jié)。水聲通信中信道估計研究面臨的樣本不足、標(biāo)簽標(biāo)定困難以及環(huán)境失配等問題,這也是機(jī)器學(xué)習(xí)與水聲通信技術(shù)在跨學(xué)科研究中所面臨的科學(xué)、技術(shù)難題。本文將聚焦水聲通信物理層中信道估計與機(jī)器學(xué)習(xí)的結(jié)合,圍繞相關(guān)研究的進(jìn)展、難點及解決方案展開分析與討論。最后,對該領(lǐng)域的研究進(jìn)行展望。
水聲傳播特性的復(fù)雜多變,導(dǎo)致水聲信道面臨強(qiáng)多途,快衰落,復(fù)雜噪聲干擾等一系列問題,這給水下信息傳輸帶來了極大的困難和挑戰(zhàn)。水聲信道估計及均衡可以有效獲取信道信息并在接收端恢復(fù)發(fā)射信號,是實現(xiàn)水下綜合信息感知和信息交互的重要一環(huán),具有十分重要的研究意義。
在傳統(tǒng)水聲通信系統(tǒng)中,通常需要在發(fā)射端發(fā)射固定先導(dǎo)序列,并在接收端通過一定的技術(shù)手段對信道進(jìn)行準(zhǔn)確的估計,進(jìn)而實現(xiàn)對數(shù)據(jù)信號的恢復(fù)。常用的信道估計及均衡方法包括最小二乘(Least Squares,LS)算法以及最小均方誤差(Minimum Mean Square Error,MMSE)算法[48-49]。LS算法雖然實現(xiàn)簡單,但是整體性能欠佳,而MMSE算法雖然能夠逼近統(tǒng)計意義上的最優(yōu)解,但是需要先驗的信道狀態(tài)作為前提,因此實際應(yīng)用中的可操作性不強(qiáng)。除此之外,該類算法由于并不具備自適應(yīng)的特點,因此對先導(dǎo)序列的依賴性很大,在一定程度上影響了水聲通信的傳輸效率。
近年來,基于機(jī)器學(xué)習(xí)的水聲通信系統(tǒng)設(shè)計成為新興研究課題。該研究方向探索性強(qiáng),前期研究成果及可參考文獻(xiàn)較少。典型的工作包括,2018 年Chen 等[50]提出了一種基于多層感知機(jī)的水聲通信接收機(jī)設(shè)計,Zhang 等[24]于2019 年搭建了更為稠密的 5 層神經(jīng)網(wǎng)絡(luò)模型(每層神經(jīng)元個數(shù)分別為1 024,1500,600,128,32)用于水聲信道估計及均衡,該模型在基于BELLHOP 的仿真信道中進(jìn)行離線的訓(xùn)練和在線測試,結(jié)果表明了基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)的網(wǎng)絡(luò)模型相較傳統(tǒng)算法具有明顯優(yōu)勢,尤其在OFDM 通信導(dǎo)頻數(shù)量有限的場景下優(yōu)勢更明顯。同年Jiang 等[51]通過仿真實驗對比分析了不同尺寸DNN 結(jié)構(gòu)在水聲通信誤碼率以及運算量上的表現(xiàn),并進(jìn)一步提出了一種更輕的模型結(jié)構(gòu),顯著降低了運算時間以及存儲負(fù)擔(dān),更加適用于實際的在線水聲通信體系。此外,Zhang 等[52]也提出了一種聯(lián)合水聲OFDM 解調(diào)、信道估計以及均衡的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)了接收端的一體化。Zhao 等[53]于2021 年提出一種基于多任務(wù)學(xué)習(xí)的水聲通信接收機(jī),通過對信道估計、均衡以及解調(diào)的聯(lián)合優(yōu)化,實現(xiàn)了通信整體性能的提升。同年,新加坡科技設(shè)計大學(xué)Lee-Leon等[54]提出一種基于深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)的水聲接收系統(tǒng),有效緩解了通信中多普勒效應(yīng)及多途傳播引起的性能衰退,仿真及海上試驗結(jié)果驗證了該方法的有效性。中國科學(xué)院聲學(xué)(簡稱:聲學(xué)所)在該方向的前期研究中,由Zhang等[55]提出了一種基于一維卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的水聲OFDM接收系統(tǒng),該研究還重點討論了模型中跨層連接的性能增益,并對水聲環(huán)境失配情況下模型的魯棒性進(jìn)行了考察,初步歸納了神經(jīng)網(wǎng)絡(luò)模型性能與水聲環(huán)境之間的潛在關(guān)聯(lián)。
基于上述已有研究,可以將基于機(jī)器學(xué)習(xí)的水聲信道估計歸納為圖2 所示的基本結(jié)構(gòu)。水聲信道可以看作是多徑時變信道的線性組合:
其中:δ激響應(yīng);r代表多徑的個數(shù);hi以及τi分別代表多徑強(qiáng)度以及多徑時延。因此,相應(yīng)的接收信號可表示為
其中:?表示卷積運算,x(n)和w(n)分別表示發(fā)送信號及加性高斯白噪聲。OFDM 是一種典型的多載波水聲通信方式,本文以此為例進(jìn)行機(jī)器學(xué)習(xí)模型設(shè)計,其在頻域的接收信號通常表示為
如圖2 所示,基于機(jī)器學(xué)習(xí)的DNN 信道估計模塊由輸入層、隱層以及輸出層構(gòu)成,其中相鄰兩層之間通過神經(jīng)元的權(quán)重進(jìn)行調(diào)節(jié)。L層神經(jīng)網(wǎng)絡(luò)模型以發(fā)送及接收的訓(xùn)練序列(或?qū)ьl符號)作為輸入信息,輸出為信道估計結(jié)果。以時域信道估計為例,模型通常可以表示為
其中:M為模型訓(xùn)練中的批大?。˙atch size)。通常采用的優(yōu)化器包括隨機(jī)梯度下降算法(Stochastic Gradient Descent,SGD)[56]、前向均方根梯度下降算法(Root Mean Square Propagation,RMSProp)[57]、自適應(yīng)梯度算法(Adaptive Gradient,AdaGrad)[58]以及自適應(yīng)矩估計算法(Adaptive Moment Estimation,Adam)[59]等。
雖然現(xiàn)有研究已證明機(jī)器學(xué)習(xí)方法能夠有效提升水聲信道估計的整體性能,但考慮到具體的水聲應(yīng)用場景,仍存在諸多關(guān)鍵問題有待解決?,F(xiàn)將主要有以下三點:
(1)樣本不足:水聲通信受限于海試條件等因素,導(dǎo)致水聲環(huán)境中采集效率較低,水聲通信數(shù)據(jù)的獲取成本較高。因此,水聲通信在有限時間內(nèi)采集的樣本量通常難以支撐模型的有效訓(xùn)練,因此會造成模型的過擬合。
(2)數(shù)據(jù)標(biāo)定困難:現(xiàn)有模型通常將真實信道沖激響應(yīng)作為訓(xùn)練標(biāo)簽。然而,真實的水聲通信中難以實時地獲取信道的真值,即無法實現(xiàn)訓(xùn)練標(biāo)簽的標(biāo)定,因此模型的學(xué)習(xí)通常需要離線進(jìn)行。
(3)環(huán)境失配:水聲信道時變、空變明顯,會造成離線訓(xùn)練得到的模型無法在環(huán)境失配的情況下在線部署?,F(xiàn)有基于機(jī)器學(xué)習(xí)的水聲通信系統(tǒng)設(shè)計中,模型的訓(xùn)練方法均采用傳統(tǒng)的分步式(Step-by-step)迭代方法,訓(xùn)練得到的模型可移植性較差。因此當(dāng)水聲通信環(huán)境改變時,又需要大量來自新環(huán)境中數(shù)據(jù)進(jìn)行重新訓(xùn)練或微調(diào)(Fine-tune),從而導(dǎo)致模型的通用性大大降低。
下文將針對以上三點問題展開討論,提供相應(yīng)的初步解決思路。
針對上文提及的水聲信道樣本不足、數(shù)據(jù)標(biāo)定困難以及環(huán)境失配的問題,本文將分別探討基于數(shù)據(jù)增強(qiáng)、無標(biāo)簽學(xué)習(xí)以及少樣本學(xué)習(xí)的技術(shù)思路。值得注意的是,上述三類問題在實際的水聲通信中往往是同時存在的,本文通過對具體問題的拆解、分析,為解決實際通信場景中的復(fù)雜問題提供了范例。同時,所提方法在應(yīng)用中具有一定的可融合性,即各項技術(shù)路線之間可以實現(xiàn)進(jìn)一步的相互整合、協(xié)同優(yōu)化。
數(shù)據(jù)增強(qiáng)(Data Augmentation)是一種借助有限的數(shù)據(jù)產(chǎn)生更多等價數(shù)據(jù)的技術(shù)[60-61]。該方法是克服模型訓(xùn)練數(shù)據(jù)不足的有效手段,目前廣泛應(yīng)用于機(jī)器學(xué)習(xí)的各個領(lǐng)域。結(jié)合水聲通信的應(yīng)用場景及物理含義,本研究將可應(yīng)用于水聲信道擴(kuò)展的數(shù)據(jù)增強(qiáng)算法分為三類:(1)基于原始水聲信道分布統(tǒng)計特性的重放技術(shù);(2)基于通信信號處理技術(shù)的數(shù)據(jù)增強(qiáng)方法;(3)基于深度學(xué)習(xí)的數(shù)據(jù)增強(qiáng)方法。下面將具體介紹上述三類方法。
2.1.1 水聲信道重放技術(shù)
信道重放技術(shù)能夠基于少量實測水聲信道,無限生成具有相同統(tǒng)計特性的數(shù)據(jù),因此可作為一類數(shù)據(jù)增強(qiáng)方法使用。已有相關(guān)研究提出了一種由測量數(shù)據(jù)驅(qū)動的水聲信道模擬器,該方法假設(shè)在一個特定的時間窗內(nèi),通信信道是一個各態(tài)遍歷的隨機(jī)過程[62]?;诖?,該方法能夠?qū)崿F(xiàn)對該過程的無限重放。此后,有更多的研究基于實測水聲信道的統(tǒng)計特性展開,并依據(jù)此提出了更加普適的信道重放方法。文獻(xiàn)[63]利用經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)技術(shù),首先將信道拆解為確知部分以及隨機(jī)部分[64],該方法在最大程度保證水聲信道固有特性的基礎(chǔ)上,通過信道重放的方法對后者進(jìn)行擴(kuò)展并與確知部分重新組合生成新的水聲信道數(shù)據(jù)。借助水聲信道重放技術(shù),可以對少量帶標(biāo)簽的信道樣本進(jìn)行擴(kuò)展,生成分布特性一致的大數(shù)據(jù)樣本,進(jìn)而輔助模型的訓(xùn)練,基于數(shù)據(jù)增強(qiáng)的水聲OFDM 系統(tǒng)框圖如圖3 所示。
圖3 基于數(shù)據(jù)增強(qiáng)的水聲OFDM 系統(tǒng) Fig.3 A data augmentation aided UWA-OFDM system
目前,聲學(xué)所的研究人員就基于數(shù)據(jù)增強(qiáng)方法 的水聲OFDM 通信開展了實驗驗證。初步的仿真實驗結(jié)果表明,基于增強(qiáng)信道的模型誤碼率性能相較基礎(chǔ)信道模型提高了50%以上。同時,所提的數(shù)據(jù)增強(qiáng)方法能夠有效緩解基礎(chǔ)水聲信道樣本不足造成的模型過擬合問題。
2.1.2 基于通信信號處理技術(shù)的數(shù)據(jù)增強(qiáng)
借助水聲通信場景中經(jīng)常出現(xiàn)的擾動及干擾,如同步誤差、多普勒偏移、噪聲干擾等,基于通信信號處理技術(shù)的數(shù)據(jù)增強(qiáng)能夠?qū)崿F(xiàn)對數(shù)據(jù)的擴(kuò)展。典型工作包括文獻(xiàn)[65]中對原始數(shù)據(jù)施加符號時間偏移以及多普勒偏移實現(xiàn)數(shù)據(jù)增強(qiáng),具體方法為:
(1)符號時間偏移:為了保證模型能夠?qū)ν秸`差信號具有較好的魯棒性,該研究在構(gòu)造數(shù)據(jù)集時考慮了時間偏移量:
其中:ε表示由于時間同步不準(zhǔn)確造成的偏移量。為了實現(xiàn)數(shù)據(jù)的擴(kuò)展,該偏移量ε隨機(jī)采樣自一定的時間偏移區(qū)間內(nèi)。
(2)多普勒偏移:水聲通信中由于平臺移動造成的頻譜偏移,可以表示為
其中,時間尺度上的變化量σ展開為
其中:v和c分別表示平臺相對移動速度以及聲波在水中的傳播速度。通過考慮一定范圍內(nèi)的多普勒偏移,可以進(jìn)一步實現(xiàn)基礎(chǔ)數(shù)據(jù)集的擴(kuò)展增強(qiáng)。
基于上述思路,該研究借助仿真數(shù)據(jù),分析了數(shù)據(jù)增強(qiáng)前后的性能提升,驗證了方法的有效性。
2.1.3 基于深度學(xué)習(xí)的數(shù)據(jù)增強(qiáng)方法
數(shù)據(jù)增強(qiáng)算法在深度學(xué)習(xí)的諸多應(yīng)用領(lǐng)域都存在需求,從深度學(xué)習(xí)視角所開展的研究為機(jī)器學(xué) 習(xí)水聲信道估計提供了可借鑒的思路。其中典型算法包括特征空間增強(qiáng)(Feature Space Augmentation,FSA)以及對 抗生成網(wǎng)絡(luò)(Generative Adversarial Network,GAN)數(shù)據(jù)增強(qiáng)[61,66]。特征空間增強(qiáng)方法首的低維向量,進(jìn)而可以在特征空間進(jìn)行數(shù)據(jù)增強(qiáng)操作,常采用合成少數(shù)類過采樣技術(shù)(Synthetic Minority Oversampling Technique,SMOTE)對k個近鄰合并以形成新實例來緩解類不平衡問題[67]。GAN 數(shù)據(jù)增強(qiáng)方法使用GAN 模型的生成網(wǎng)絡(luò)生成新的水聲信道樣本,而同時GAN 判別網(wǎng)絡(luò)需要對生成樣本及真實樣本進(jìn)行甄別,二者通過相互博弈的方式進(jìn)行學(xué)習(xí)。該數(shù)據(jù)增強(qiáng)方法得到的合成水聲信道數(shù)據(jù)和真實數(shù)據(jù)相比既具有語義上的相似性,同時又能夠呈現(xiàn)文本上的多樣性,因此是一種提升機(jī)器學(xué)習(xí)在水聲通信領(lǐng)域應(yīng)用價值的潛在方法。但需要注意的是,受到神經(jīng)網(wǎng)絡(luò)可解釋性水平的制約,該類方法目前只能進(jìn)行籠統(tǒng)的定性分析,尚缺乏堅實的物理機(jī)理的支撐。從目前的實驗結(jié)果來看,該類方法的模型魯棒性欠佳,且難以實現(xiàn)穩(wěn)定的訓(xùn)練。
基于數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)架構(gòu)通常需要大量帶標(biāo)簽的水聲信道數(shù)據(jù)進(jìn)行訓(xùn)練,而真實的信道信息在實際應(yīng)用中往往是未知的,且大批量地進(jìn)行信道標(biāo)簽的標(biāo)注將造成大量的時間成本損耗。為此,ZHANG 等[68]提出了一種基于無標(biāo)簽學(xué)習(xí)的水聲OFDM 信道估計方法,其模型結(jié)構(gòu)如圖4 所示。
圖4 基于無標(biāo)簽學(xué)習(xí)的水聲OFDM 系統(tǒng)[68] Fig.4 A machine learning label-free based UWA-OFDM system[68]
區(qū)別于現(xiàn)有的有監(jiān)督學(xué)習(xí)方法,本研究中的優(yōu) 化目標(biāo)并非最小化,而是計算實際接收導(dǎo)頻信號Y(k)與之間的距離,計算公式為
該研究基于WATERMARK 水聲實測信道數(shù)據(jù)庫進(jìn)行了信道估計性能測試[69],其中頻域信道的跟蹤結(jié)果如圖5 所示(信噪比為0 dB)。
圖5 無標(biāo)簽學(xué)習(xí)網(wǎng)絡(luò)信道跟蹤結(jié)果[68]Fig.5 UWA channel tracking results with label-free network[68]
基于信道估計結(jié)果,均衡后的發(fā)射信號估計值可以通過迫零(Zero Forcing,ZF)算法得到,進(jìn)而各算法的性能可以通過通信誤碼率(Bit Error Rate,BER)進(jìn)行評價,實驗結(jié)果如圖6 所示。
圖6 無標(biāo)簽學(xué)習(xí)網(wǎng)絡(luò)誤碼率性能[68]Fig.6 BER performance with label-free network[68]
該實驗結(jié)果表明:所提出的無標(biāo)簽網(wǎng)絡(luò)模型相較傳統(tǒng)的LS 算法能夠取得更加穩(wěn)定的信道跟蹤結(jié)果,同時觀察到所提方法可以逼近統(tǒng)計意義最優(yōu)解。由于該網(wǎng)絡(luò)模型突破了帶標(biāo)簽樣本的限制,因此可以實現(xiàn)模型的在線學(xué)習(xí),更加適用于實際水聲通信的應(yīng)用場景。
水聲信道復(fù)雜多變,這往往會造成機(jī)器學(xué)習(xí)模型訓(xùn)練階段和部署階段的環(huán)境出現(xiàn)失配現(xiàn)象,而環(huán)境的失配將會導(dǎo)致前期訓(xùn)練得到的模型參數(shù)在目標(biāo)環(huán)境中的性能出現(xiàn)明顯下降。近期,聲學(xué)所研究人員提出一種解決實際應(yīng)用中源域、目標(biāo)域失配問題的思路,通過將少樣本學(xué)習(xí)(Few-Shot Learning,FSL)中的元學(xué)習(xí)(Meta-learning)方法引入到水聲信道估計與均衡中,實現(xiàn)了模型在環(huán)境失配情況下對未知水聲環(huán)境的快速響應(yīng)[70]。
元學(xué)習(xí)也稱為“學(xué)會學(xué)習(xí)”,即通過多任務(wù)的訓(xùn)練實例來設(shè)計能夠快速適應(yīng)新環(huán)境的神經(jīng)網(wǎng)絡(luò)模型[71]。元學(xué)習(xí)的基本思路是通過前期在各種學(xué)習(xí)任務(wù)上訓(xùn)練,得到一組泛化能力強(qiáng)的基礎(chǔ)模型參數(shù),再通過快速地遷移微調(diào)形成可應(yīng)用于未知任務(wù)的模型。
基于元學(xué)習(xí)的訓(xùn)練策略,該研究首先搭建了如圖7 所示的水聲OFDM 多任務(wù)訓(xùn)練平臺,其中訓(xùn)練任務(wù)來源于已知的不同環(huán)境下的水聲通信任務(wù)數(shù)據(jù)集(仿真或歷史數(shù)據(jù)),目標(biāo)任務(wù)來源于未知水聲通信環(huán)境中的通信采樣數(shù)據(jù)。
如圖7 所示,在每個元訓(xùn)練周期,該方法在訓(xùn)練任務(wù)全集H中隨機(jī)選擇L個水聲環(huán)境作為子任務(wù)。依照上述操作,可以分別得到支撐集Ctr=,l=1,…,L以及查詢集,l=1,…,L用于元學(xué)習(xí)的嵌套訓(xùn)練結(jié)構(gòu)。
圖7 基于元學(xué)習(xí)的水聲OFDM 通信系統(tǒng)[70]Fig.7 Met a-learning based UWA-OFDM communication system[70]
常規(guī)的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練策略是在一個訓(xùn)練周期內(nèi)根據(jù)梯度下降方向進(jìn)行一步迭代。而元學(xué)習(xí)的訓(xùn)練過程分為兩個階段,即針對具體任務(wù)的快速訓(xùn)練和跨任務(wù)的漸進(jìn)訓(xùn)練,二者滿足嵌套關(guān)系。
(1)內(nèi)層快速訓(xùn)練:快速訓(xùn)練發(fā)生在獨立的每一個任務(wù)上,即本文中的L個信道環(huán)境?;诘趌個任務(wù)的支撐集Ctr,我們利用梯度下降法進(jìn)行模型參數(shù)迭代:
其中:α為內(nèi)部學(xué)習(xí)率,更新后的模型參數(shù)?l應(yīng)滿足針對具體任務(wù)的最優(yōu)表達(dá)。通過內(nèi)層快速訓(xùn)練,我們共得到針對L個任務(wù)的模型參數(shù)。
(2)外層漸進(jìn)訓(xùn)練:漸進(jìn)訓(xùn)練通過跨任務(wù)實現(xiàn),參數(shù)更新利用梯度下降法得到:
其中:β為外部學(xué)習(xí)率,??表示對模型參數(shù)求偏導(dǎo)數(shù)。
通過上述元學(xué)習(xí)訓(xùn)練過程,神經(jīng)網(wǎng)絡(luò)模型能夠在參數(shù)空間中尋找到一組快速應(yīng)用于未知任務(wù)的參數(shù)解,因此在目標(biāo)任務(wù)上相較傳統(tǒng)訓(xùn)練方法具有更強(qiáng)的表達(dá)能力。
該研究基于WATERMARK 數(shù)據(jù)庫,搭建了如圖8 所示的水聲多任務(wù)訓(xùn)練平臺用于元學(xué)習(xí)模型的性能驗證?;诖似脚_,研究對比了元學(xué)習(xí)方法與常規(guī)機(jī)器學(xué)習(xí)訓(xùn)練方法在目標(biāo)環(huán)境上的遷移速度及誤碼 率性能,結(jié)果如圖9 所示。
圖8 基于WATERMARK 的元訓(xùn)練/測試平臺[70] Fig.8 WAT ERMARK based dataset for meta training/testing platform[70]
圖9 基于元學(xué)習(xí)的模型收斂及誤碼率性能[70]Fig.9 Convergence and BER performance of meta-learning based model[70]
實驗結(jié)果表明:基于元學(xué)習(xí)的模型僅通過100步迭代即可實現(xiàn)對未知環(huán)境的收斂,而基于傳統(tǒng)訓(xùn)練方法的模型則需要約5 000 步的迭代才能實現(xiàn)收斂。所提方法大幅提升了響應(yīng)速度上實現(xiàn)了,有效緩解了水聲失配對機(jī)器學(xué)習(xí)方法的影響,是實現(xiàn)水聲泛化場景通信的一次有力嘗試。為了進(jìn)一步考察元學(xué)習(xí)方法的有效性,研究選取了2017 年某湖試數(shù)據(jù)作為目標(biāo)樣本,圖10 為湖試環(huán)境與水聲信道結(jié)構(gòu),該次實驗中通信中心頻率7.5 kHz,帶寬5 kHz。相應(yīng)實驗結(jié)果如圖11 所示,元學(xué)習(xí)模型可以通過100 步迭代快速實現(xiàn)對目標(biāo)湖試環(huán)境的收斂,而傳統(tǒng)訓(xùn)練方法則需要約5 000 步迭代才能實現(xiàn)收斂。同時,所提方法在誤碼率性能上相較常規(guī)機(jī)器學(xué)習(xí)以及傳統(tǒng)算法均有較大的優(yōu)勢。
圖10 湖試環(huán)境及水聲信道結(jié)構(gòu)[70]Fig.10 Schematic sketch of the Fuxian Lake experiment and the UWA channel structure[70]
圖11 湖試得出的元學(xué)習(xí)模型收斂及誤碼率性能[70]Fig.11 Convergence and BER performances of meta-learning based model obtained in the Fuxian lake experiment[70]
本文首先梳理了水聲通信與機(jī)器學(xué)習(xí)的結(jié)合點,此后針對基于機(jī)器學(xué)習(xí)的水聲信道估計問題進(jìn)行綜述,并就這一研究方向中的重難點問題進(jìn)行分析,最后結(jié)合近期的研究進(jìn)展給出了初步的探索及解決思路。
然而,機(jī)器學(xué)習(xí)領(lǐng)域取得的矚目成果為水聲通信技術(shù)帶來的發(fā)展契機(jī)不僅僅停留在水聲信道估計方向。結(jié)合本項研究的啟發(fā)和傳統(tǒng)水聲學(xué)面臨的諸多問題,對于這一前沿課題未來的發(fā)展方向可以進(jìn)行如下展望:
(1)建構(gòu)泛化場景的水聲通信,充分挖掘水聲信道的特點,進(jìn)一步探索水聲物理知識與機(jī)器學(xué)習(xí)模型的有機(jī)耦合,對神經(jīng)網(wǎng)絡(luò)的可遷移性及魯棒性進(jìn)行深入考察,強(qiáng)化模型的泛化能力。
(2)水聲組網(wǎng)背景下,多維度節(jié)點資源需要細(xì)粒度的精確配置以滿足各種不同的通信需求,引入機(jī)器學(xué)習(xí)或?qū)⒋蟠缶徑鈧鹘y(tǒng)方法面臨的優(yōu)化參數(shù)的指數(shù)級增長。
(3)構(gòu)建標(biāo)準(zhǔn)化的水聲通信數(shù)據(jù)平臺及評價準(zhǔn)則,這將更有利于研究人員對各算法的有效性進(jìn)行高效對比,消弭數(shù)據(jù)孤島問題造成的信息不對稱。該類平臺的建立將促進(jìn)相關(guān)研究,形成聚合效應(yīng)。
(4)水聲組網(wǎng)及通信間的數(shù)據(jù)隱私保護(hù)與安全性更加重要。一方面,水聲通信的數(shù)據(jù)量隨著水下節(jié)點的與日俱增而不斷積累;另一方面,依托于云計算、物聯(lián)網(wǎng)技術(shù)的水下智能平臺更加強(qiáng)調(diào)數(shù)據(jù)的互通。在二者的交叉研究中,如何對數(shù)據(jù)中可能包含的敏感及隱私信息進(jìn)行保護(hù),將成為未來研究的重點。