陳 翔 汪連棟 許 雄 申緒澗 馮蘊(yùn)天
(電子信息系統(tǒng)復(fù)雜電磁環(huán)境效應(yīng)國家重點(diǎn)實(shí)驗(yàn)室 洛陽 471003)
輻射源組成器件的生產(chǎn)和裝配等存在一定的差異,這種硬件差異[1]使得同型號、同批次的輻射源具有一種固有的、區(qū)別于[2]其他個(gè)體的屬性,這種屬性會(huì)作用于無線電信號上,產(chǎn)生無意調(diào)制,但又不會(huì)影響輻射源實(shí)現(xiàn)其原有的通信或探測功能。通過一定的方法表征這種屬性就可以推斷無線電信號與輻射源之間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)個(gè)體識別,稱之為射頻指紋識別(Radio Frequency Fingerprinting,RFF)[3]或特定輻射源識別(Specific Emitter Identification,SEI)[4]。人們起初將這種屬性描述為一種能夠區(qū)分輻射源個(gè)體的“細(xì)微特征”,進(jìn)一步期望能夠如“指紋”,甚至“基因”一樣,具有很好的穩(wěn)定性和魯棒性,只與輻射源的硬件差異相關(guān),與無線信道、調(diào)制樣式、協(xié)議、接收機(jī)、溫度、時(shí)間等因素?zé)o關(guān)。因此,“細(xì)微特征”“射頻指紋”“電磁波信號基因”[5]等名稱可理解為人們期望輻射源個(gè)體識別能力達(dá)到的層次,而究竟達(dá)到哪個(gè)層次,還需進(jìn)行實(shí)驗(yàn)驗(yàn)證,本文統(tǒng)一使用“射頻指紋”討論。
隨著網(wǎng)絡(luò)化、信息化、智能化的推進(jìn),無線電設(shè)備數(shù)量激增、電磁頻譜資源越來越稀缺,為了充分利用有限的頻譜資源,新的信號調(diào)制樣式和傳輸協(xié)議不斷出現(xiàn),而智能化賦予無線電設(shè)備更強(qiáng)的頻譜感知[6]和自主調(diào)整載頻、調(diào)制方式等參數(shù)的能力,尤其在充滿對抗與博弈的領(lǐng)域中,將對電磁頻譜的爭奪推向了新的高度,這些因素導(dǎo)致無線電設(shè)備工作的電磁環(huán)境更加復(fù)雜,電磁頻譜的利用和管控更加困難,維護(hù)電磁空間安全面臨的挑戰(zhàn)更加嚴(yán)峻。射頻指紋來源于輻射源硬件差異,具有難以模仿和克隆的特性,可以增強(qiáng)無線網(wǎng)絡(luò)安全、保護(hù)數(shù)據(jù)隱私[7],提高全球定位系統(tǒng)、廣播自動(dòng)相關(guān)監(jiān)視(Automatic Dependent Surveillance-Broadcast,ADS-B)系統(tǒng)等關(guān)鍵民用領(lǐng)域的抗欺騙能力[8],提升電子情報(bào)偵察和電磁頻譜態(tài)勢感知等能力[9],是維護(hù)國家電磁空間安全的關(guān)鍵技術(shù)之一,在民用和軍用領(lǐng)域都有著廣闊的應(yīng)用前景[10]。如何在一個(gè)復(fù)雜、多變的電磁環(huán)境下,對非合作的未知信號進(jìn)行射頻指紋識別是一個(gè)亟待解決的難題。
特征工程方法以特定領(lǐng)域?qū)I(yè)知識為支撐,提取的特征具有較好的可解釋性,但手工設(shè)計(jì)特征費(fèi)時(shí)費(fèi)力,而且依賴復(fù)雜且特定于協(xié)議的知識[11],缺乏靈活性;深度學(xué)習(xí)方法則以數(shù)據(jù)為驅(qū)動(dòng),能夠自動(dòng)學(xué)習(xí)特征,快速靈活地隨任務(wù)調(diào)整,但可解釋性偏弱。深度學(xué)習(xí)方法在圖像處理、文本翻譯等領(lǐng)域已表現(xiàn)出超越特征工程方法的優(yōu)勢,與圖像等數(shù)據(jù)不同,無線電信號沒有可直觀理解的視覺形式,需要使用接收機(jī)將射頻信號轉(zhuǎn)換為復(fù)基帶信號,并常保存為同向/正交(In-phase/Quadrature,I/Q)數(shù)據(jù),I/Q數(shù)據(jù)尺寸一般為2×N,第1個(gè)維度為2,代表同向分量I和正交分量Q,第2個(gè)維度為N,代表沿時(shí)間方向的序列長度,與圖像格式類比,可看作狹長的灰度圖片,I/Q數(shù)據(jù)可以直接或經(jīng)預(yù)處理后送入深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)模型處理[12]。早期基于深度學(xué)習(xí)的射頻指紋識別方法更傾向于先采用變換域處理方法將I/Q數(shù)據(jù)轉(zhuǎn)換為時(shí)頻圖等其他表示形式,然后再利用深度學(xué)習(xí)方法進(jìn)行處理,但這種方式需要一些先驗(yàn)知識,在非合作條件下存在限制。在無線電信號調(diào)制識別任務(wù)中,O’shea等人[12]在2016年首次證實(shí)了使用卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)模型直接處理I/Q數(shù)據(jù)的可行性,之后又在更大規(guī)模的數(shù)據(jù)集上驗(yàn)證了該類方法的優(yōu)勢[13]。2017年,DARPA啟動(dòng)了射頻機(jī)器學(xué)習(xí)(Radio Frequency Machine Learning,RFML)項(xiàng)目,該項(xiàng)目直接利用原始RF數(shù)據(jù)作為機(jī)器學(xué)習(xí)技術(shù)的輸入,從而減少專家定義特征和先驗(yàn)知識數(shù)量[9],射頻指紋識別技術(shù)是該項(xiàng)目的關(guān)鍵應(yīng)用之一。在射頻指紋識別任務(wù)中,受RFML項(xiàng)目支持的Riyaz等人[14]在2018年證實(shí)可使用CNN直接處理I/Q數(shù)據(jù)實(shí)現(xiàn)射頻指紋識別,并展示了端到端(End to End)的深度學(xué)習(xí)范式和不需要頻偏補(bǔ)償、協(xié)議格式等先驗(yàn)知識及特定領(lǐng)域知識的優(yōu)點(diǎn)。公開資料表明,使用CNN模型學(xué)習(xí)的特征來區(qū)分輻射源個(gè)體,比手工設(shè)計(jì)特征更可靠[15,16],并且在大規(guī)模WiFi數(shù)據(jù)集[17]、ADS-B數(shù)據(jù)集[18]上的實(shí)驗(yàn)進(jìn)一步證實(shí),深度學(xué)習(xí)方法相比特征工程方法的精度有大幅提升,且在低信噪比下仍能保持很高的正確率。越來越多的研究表明,直接使用I/Q數(shù)據(jù)作為DNN模型輸入的方法,在實(shí)現(xiàn)未知信號、未知信道環(huán)境下的射頻指紋識別方面具有巨大潛力。
雖然深度學(xué)習(xí)方法在射頻指紋識別中取得了較好效果,但仍然有很多難題需要解決,如訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)分布之間的差異會(huì)導(dǎo)致深度學(xué)習(xí)模型性能惡化,造成這種數(shù)據(jù)分布差異的混雜因素(Confounding Factors)[19]有:訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)不在同一天采集、無線信道發(fā)生變化、環(huán)境溫度變化導(dǎo)致振蕩器頻率發(fā)生漂移、使用不同接收機(jī)采集數(shù)據(jù)等等,如果在訓(xùn)練時(shí)不采取額外措施,DNN模型更傾向于學(xué)習(xí)混雜因素表現(xiàn)的特征,得到一個(gè)特定于無線信道或時(shí)間的射頻指紋識別模型,而不是特定于硬件差異的射頻指紋識別模型。研究還發(fā)現(xiàn),DNN模型會(huì)通過學(xué)習(xí)信號中潛在的標(biāo)示輻射源ID的片段實(shí)現(xiàn)個(gè)體識別[20],最終得到一個(gè)特定于協(xié)議的射頻指紋識別模型,而且DNN模型更傾向于利用這些特定信號片段作弊,產(chǎn)生虛高的正確率,因此,正確地使用深度學(xué)習(xí)方法是獲得特定于硬件差異的射頻指紋的關(guān)鍵。
本文將討論問題聚焦于如何利用深度學(xué)習(xí)方法直接處理I/Q數(shù)據(jù),實(shí)現(xiàn)端到端的射頻指紋識別,從網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)兩方面對基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法的相關(guān)研究進(jìn)行回顧,厘清其發(fā)展脈絡(luò)和研究趨勢。本文首先對射頻指紋識別研究進(jìn)行概覽,重點(diǎn)對基于Raw I/Q的DNN模型進(jìn)行分析,然后對射頻指紋識別的開源數(shù)據(jù)集、數(shù)據(jù)表示方法和數(shù)據(jù)增強(qiáng)(Data Augmentation,DA)方法進(jìn)行總結(jié),最后進(jìn)行全文總結(jié)和展望。
輻射源的硬件差異包括DAC (Digital-to-Analog Converter)、I/Q調(diào)制器、濾波器、功率放大器等制造公差和組裝差異,這些硬件差異會(huì)作用于無線電信號,最終發(fā)射的無線電信號Tx(t)可表示為
其中,htx是輻射源的系統(tǒng)函數(shù),反映了一種與輻射源個(gè)體硬件差異相關(guān)的無意調(diào)制特性,X(ω)是不包含硬件信息的有意調(diào)制信號x(t)的頻譜,W是信號帶寬,ωc是載波頻率,?表示卷積。
無線電信號Tx(t)在被接收機(jī)轉(zhuǎn)換為基帶信號Rx(t)之前,會(huì)受到信道衰落、頻率漂移、接收機(jī)非線性等混雜因素的影響,從而產(chǎn)生硬件差異導(dǎo)致的無意調(diào)制和信號的有意調(diào)制之外的失真,受混雜因素影響的基帶信號Rx(t)表示為
圖1比較了深度學(xué)習(xí)方法在射頻指紋識別應(yīng)用中的一些差異,根據(jù)是否將I/Q數(shù)據(jù)轉(zhuǎn)換為專家特征,分為基于專家特征和深度學(xué)習(xí)的射頻指紋識別方法、基于I/Q和深度學(xué)習(xí)的射頻指紋識別方法兩大類。專家特征變換是指短時(shí)傅里葉變換、小波變換、星座圖等方法,不同于DNN模型中的參數(shù),專家特征變換需要手動(dòng)設(shè)置參數(shù),不能通過訓(xùn)練得到。在基于I/Q和深度學(xué)習(xí)的射頻指紋識別方法中,專家特征變換的功能由DNN模型承擔(dān),并且根據(jù)數(shù)據(jù)預(yù)處理的差異有兩種處置方案。方案1的預(yù)處理方式包含了“預(yù)處理①”和“預(yù)處理②”兩類,方案2僅使用了“預(yù)處理①”。“預(yù)處理①”是指無需先驗(yàn)知識的數(shù)據(jù)預(yù)處理,如歸一化、切片、抽樣、插值、FFT (Fast Fourier Transformer)等操作,“預(yù)處理②”是需要先驗(yàn)知識的數(shù)據(jù)預(yù)處理,如時(shí)間同步、載頻偏移和相位偏移補(bǔ)償?shù)炔僮?。本文將無需先驗(yàn)知識的方案2稱為“基于Raw I/Q和深度學(xué)習(xí)方法”,并將FFT等看作I/Q數(shù)據(jù)的不同表示形式。
圖1 基于深度學(xué)習(xí)的射頻指紋識別方法對比Fig.1 Comparison of RFF methods based on deep learning
由圖1可看出,從基于專家特征和深度學(xué)習(xí)的射頻指紋識別方法到基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法,需要專家特征變換和預(yù)處理②的步驟逐漸減少,對先驗(yàn)知識的依賴逐漸減弱,這一方面將深度學(xué)習(xí)端到端的處理流程向原始數(shù)據(jù)端推移,提升了方法的適用范圍、靈活性,另一方面對如何設(shè)計(jì)適合于射頻指紋識別的DNN模型提出了更高的挑戰(zhàn),而且在沒有先驗(yàn)知識可用時(shí),只能直接利用Raw I/Q進(jìn)行個(gè)體識別。下面分別對基于專家特征和深度學(xué)習(xí)的射頻指紋識別方法、基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法進(jìn)行討論。
2.2.1 基于專家特征和深度學(xué)習(xí)的射頻指紋識別方法
基于專家特征的深度學(xué)習(xí)方法,在具有一定先驗(yàn)知識時(shí),可首先對信號進(jìn)行同步、載頻偏移補(bǔ)償?shù)阮A(yù)處理操作,緩解無線信道等不利影響,然后進(jìn)行短時(shí)傅里葉變換、小波變換、星座圖等專家特征變換操作,將I/Q數(shù)據(jù)轉(zhuǎn)換為時(shí)頻特征圖、雙譜特征圖、星座圖等專家特征表示形式,最后將變換后的專家特征饋入DNN模型進(jìn)行特征提取和分類識別。
2019年,Baldini等人[21]分別使用短時(shí)傅里葉變換(Short-Time Fourier Transform,STFT)、連續(xù)小波變換(Continous Wavelet Transform,CWT)和循環(huán)圖(Recurrence Plots,RP)方法將采集并幅度歸一化后的時(shí)間序列信號轉(zhuǎn)換為圖像形式,然后使用CNN進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明CWT方法優(yōu)于其他兩種方法。同年,Pan等人[22]首先對信號進(jìn)行希爾伯特-黃變換(Hilbert-Huang Transform,HHT),然后將希爾伯特譜轉(zhuǎn)換為灰度圖像,最后利用殘差網(wǎng)絡(luò)(ResNet)實(shí)現(xiàn)分類。同年,Peng等人[23]提出先將I/Q數(shù)據(jù)轉(zhuǎn)換為差分星座軌跡圖(Differential Constellation Trace Figure,DCTF),然后再使用CNN實(shí)現(xiàn)分類,DCTF圖的生成不需要先驗(yàn)信息進(jìn)行同步,但需要根據(jù)經(jīng)驗(yàn)手動(dòng)設(shè)置一些參數(shù)。2020年,Lin等人[24]提出先將Raw I/Q數(shù)據(jù)轉(zhuǎn)為具有統(tǒng)計(jì)意義的等勢星球圖(Contour Stellar Image,CSI)表示形式,然后再利用CNN模型進(jìn)行分類,取得了很好的效果。2021年,袁澤霖[25]將時(shí)頻特征圖和雙譜特征圖融合之后,作為ResNet模型的輸入,實(shí)驗(yàn)表明融合特征比單一特征好,但會(huì)占用更多計(jì)算資源。同年,Shen等人[26]使用STFT時(shí)頻圖作為輸入,使用CNN模型完成了分類,在利用載頻偏移(Carrier Frequency Offset,CFO)補(bǔ)償信息后,分類正確率得到進(jìn)一步提升。
基于專家特征的深度學(xué)習(xí)方法在射頻指紋識別中已有大量效果很好的研究工作,在已知信號協(xié)議等先驗(yàn)信息時(shí),能夠針對特定問題,利用特定領(lǐng)域知識設(shè)計(jì)專家特征,最大化個(gè)體間差異,但該方法也存在一些不足,如需要領(lǐng)域知識的支撐、需要根據(jù)具體問題選擇合適的參數(shù)完成I/Q數(shù)據(jù)到專家特征的轉(zhuǎn)換、從I/Q數(shù)據(jù)到專家特征的轉(zhuǎn)換需要額外的計(jì)算量、專家特征可能特定于協(xié)議等。
2.2.2 基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法
Raw I/Q指未經(jīng)處理的I/Q數(shù)據(jù),這既表明接收機(jī)輸出的I/Q數(shù)據(jù)未發(fā)生信息的流失,也意味著沒有對其中不利于射頻指紋識別的混雜因素進(jìn)行抑制。Shen等人[27]和Gritsenko等人[28]先利用關(guān)于信號的先驗(yàn)知識對Raw I/Q數(shù)據(jù)進(jìn)行載頻偏移補(bǔ)償、相位補(bǔ)償、時(shí)間同步等預(yù)處理,然后將預(yù)處理后的I/Q數(shù)據(jù)作為DNN模型的輸入,認(rèn)為預(yù)處理在抑制無線信道衰落等混雜因素的同時(shí),保留了I/Q數(shù)據(jù)中的射頻指紋。但Cekic等人[19]提出質(zhì)疑,認(rèn)為預(yù)處理后留在I/Q數(shù)據(jù)中的殘差可能會(huì)淹沒I/Q數(shù)據(jù)中的射頻指紋,不如使用數(shù)據(jù)增強(qiáng)方法來提升DNN模型對各種混雜因素的魯棒性。事實(shí)上,在非合作條件下,難以進(jìn)行載頻偏移補(bǔ)償、時(shí)間同步等預(yù)處理,幾乎只有I/Q數(shù)據(jù)可利用。從目前的研究情況看,基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法至少具有以下一些優(yōu)點(diǎn):
(1) 不依賴特定領(lǐng)域知識和先驗(yàn)知識,具有端到端的特點(diǎn),使用數(shù)據(jù)驅(qū)動(dòng)自動(dòng)學(xué)習(xí)特征。
(2) 具有學(xué)習(xí)協(xié)議無關(guān)的射頻指紋的潛力,提取的射頻指紋更難偽造。依賴于特定領(lǐng)域知識和先驗(yàn)知識的射頻指紋識別方法,一般是針對某一種協(xié)議進(jìn)行設(shè)計(jì),提取的射頻指紋可能特定于協(xié)議。而基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法,在使用相同的DNN模型時(shí),能夠進(jìn)行不同協(xié)議下的射頻指紋識別[29],提取的射頻指紋獨(dú)立于物理層協(xié)議和調(diào)制方案[30,31]。還有研究指出手工設(shè)計(jì)特征可能被偽造,如通過對基帶信號的操作可改變載波頻率偏移[32]和相位偏移[33],而深度學(xué)習(xí)方法提取的特征并沒有顯式表示,更難偽造。
(3) 可擴(kuò)展性更好,部署靈活。采用預(yù)訓(xùn)練或者遷移學(xué)習(xí)的方法,在一個(gè)預(yù)訓(xùn)練模型的基礎(chǔ)上,能夠在少量樣本甚至零樣本的情況下,快速實(shí)現(xiàn)對未知環(huán)境下測試數(shù)據(jù)的射頻指紋識別,對不同協(xié)議或設(shè)備類型下測試數(shù)據(jù)[34,35]的射頻指紋識別。而且隨著研究的深入,有可能實(shí)現(xiàn)“一次訓(xùn)練,隨處使用”的效果。
(4) 大規(guī)模和超大規(guī)模數(shù)量個(gè)體識別的潛力。深度學(xué)習(xí)方法擅長在高維特征空間下進(jìn)行分類任務(wù),深度學(xué)習(xí)方法已經(jīng)能夠?qū)?shù)百個(gè)設(shè)備[17]甚至一萬個(gè)設(shè)備[11]進(jìn)行個(gè)體識別,而傳統(tǒng)的特征工程方法一般是幾十個(gè)[36]到一百多個(gè)設(shè)備左右的規(guī)模[1],深度學(xué)習(xí)方法更適合大規(guī)模個(gè)體識別問題。
以上對射頻指紋識別方法進(jìn)行了概覽,分析了兩類方法的特點(diǎn)和適用范圍,并將問題聚焦于非合作條件下的射頻指紋識別?;赗aw I/Q和深度學(xué)習(xí)的射頻指紋方法對先驗(yàn)知識的依賴更小、更符合端到端的學(xué)習(xí)范式,能夠利用DNN模型的非線性映射能力和復(fù)雜高維特征學(xué)習(xí)能力,在從數(shù)據(jù)中挖掘射頻指紋及各混雜因素間潛在關(guān)系方面似乎比其他方法更具優(yōu)勢。深度學(xué)習(xí)研究中,可以從模型結(jié)構(gòu)、訓(xùn)練方法和數(shù)據(jù)3個(gè)方面提升性能,下面以僅有Raw I/Q為限定條件,對能夠直接使用Raw I/Q進(jìn)行射頻指紋識別的DNN模型進(jìn)行回顧分析,然后對射頻指紋識別的開源數(shù)據(jù)集、數(shù)據(jù)表示形式和數(shù)據(jù)增強(qiáng)方法進(jìn)行總結(jié)討論。
深度學(xué)習(xí)是從數(shù)據(jù)中學(xué)習(xí)表示的數(shù)學(xué)框架,通常包含數(shù)十個(gè)甚至上百個(gè)連續(xù)的表示層,這些表示層幾乎總是使用神經(jīng)網(wǎng)絡(luò)模型來學(xué)習(xí)[37]。全連接層、卷積層、循環(huán)層、Transformer等是構(gòu)造DNN模型的基礎(chǔ)模塊,由這些基礎(chǔ)模塊組合可以構(gòu)建出全連接神經(jīng)網(wǎng)絡(luò)(Full Connected Neural Network,FCNN)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和Transformer模型等以及各種改進(jìn)的DNN模型。生成對抗網(wǎng)絡(luò)(Generative Adversarial Nets,GAN)和自編碼器(Auto-Encoders,AE)也在射頻指紋識別中應(yīng)用,屬于生成類網(wǎng)絡(luò),其基礎(chǔ)模塊仍然由全連接層、卷積層等組成,常用于數(shù)據(jù)增強(qiáng)、降噪等處理,其中GAN模型還被用來探測和識別對抗性的流氓輻射源[38,39],本文不對生成類網(wǎng)絡(luò)進(jìn)行討論。圖2將目前基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法及文獻(xiàn)出處按照FCNN模型、CNN模型、RNN模型、Transformer模型以及幾何深度學(xué)習(xí)方法的類別進(jìn)行了歸類。FCNN模型采用全連接方式,是一種早期的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),雖然也可以使用Raw I/Q作為輸入進(jìn)行射頻指紋識別[39],但是全連接結(jié)構(gòu)不能提取和保持?jǐn)?shù)據(jù)中的特征結(jié)構(gòu),難以獲得魯棒的射頻指紋,這一不足在小規(guī)模數(shù)據(jù)集上并不明顯,但隨著數(shù)據(jù)集規(guī)模的增大,F(xiàn)CNN模型的劣勢越來越顯著[29]。在現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,通常使用卷積層提取特征,使用全連接層在后端負(fù)責(zé)分類,本文不單獨(dú)對采用FCNN模型的射頻指紋識別方法進(jìn)行介紹。CNN模型和RNN模型在射頻指紋識別中的引入較早,關(guān)于CNN模型的研究工作最多,Transformer模型和幾何深度學(xué)習(xí)方法的引入較晚,研究也很少,幾何深度學(xué)習(xí)方法是一種從對稱性、幾何穩(wěn)定性和尺度分離角度對深度學(xué)習(xí)方法進(jìn)行幾何統(tǒng)一的嘗試[40],目前應(yīng)用在射頻指紋識別中的是群等變卷積神經(jīng)網(wǎng)絡(luò)模型。
圖2 基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法分類Fig.2 Classification of RFF methods based on Raw I/Q and deep learning
基于Raw I/Q和深度學(xué)習(xí)的射頻指紋識別方法雖然對專家特征和先驗(yàn)知識依賴更少,但是對神經(jīng)網(wǎng)絡(luò)建模的要求更高,文獻(xiàn)[62]指出增大射頻指紋識別數(shù)據(jù)集的規(guī)模和樣本多樣性,并不總能提高模型的泛化性能,需要更具有洞察力的神經(jīng)網(wǎng)絡(luò)建模方法才能繼續(xù)提升模型性能,DNN模型的設(shè)計(jì)在射頻指紋識別中至關(guān)重要,下面按照圖2的分類對各種模型進(jìn)行詳細(xì)回顧分析。
CNN模型是射頻指紋識別中應(yīng)用最多、最早的網(wǎng)絡(luò)結(jié)構(gòu),卷積和池化是其關(guān)鍵操作,CNN模型具有局部感受野、權(quán)值共享的特點(diǎn)。CNN模型首先在圖像處理領(lǐng)域應(yīng)用和發(fā)展,在射頻指紋識別領(lǐng)域中的應(yīng)用也按照類LeNet模型、類AlexNet模型、類VGG模型、殘差網(wǎng)絡(luò)、注意力機(jī)制等的路線發(fā)展,下面對各種使用Raw I/Q進(jìn)行射頻指紋識別的CNN模型進(jìn)行回顧分析。
3.1.1 基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)模型
(1) 類LeNet模型
能夠直接處理Raw I/Q的CNN模型首先于2016年應(yīng)用在信號調(diào)制樣式識別[12]中,該CNN模型類似于LeNet模型,由2個(gè)卷積層和2個(gè)全連接層組成,這啟發(fā)了射頻指紋識別相關(guān)的工作。2018年,Riyaz等人[14]提出了RFF-CNN1模型(圖3(a)),由2個(gè)卷積層和1個(gè)全連接層組成。2019年,Sankhe等人[63]提出了ORACLE模型(圖3(b)),由2個(gè)卷積層和2個(gè)全連接層組成,第1個(gè)卷積層有50個(gè)1×7卷積核,每個(gè)卷積核分別提取I,Q兩路特征;第2個(gè)卷積層使用50個(gè)2×7卷積核,將I,Q兩路特征合并,經(jīng)最大池化后送入全連接層分類,全連接層使用了Dropout層和L2正則化技術(shù)防止過擬合。圖3(a)和圖3(b)都是類LeNet模型[15,48,56],通常只有兩三個(gè)卷積層,適合于解決小規(guī)模射頻指紋識別問題,常作為基準(zhǔn)模型,是早期處理Raw I/Q的CNN模型。
(2) 類AlexNet模型
2019年,Restuccia等人[17]提出了DeepRadioID模型(圖3(c)),其網(wǎng)絡(luò)更深,是一種類AlexNet模型,可實(shí)現(xiàn)更大規(guī)模的射頻指紋識別問題。2020年,Sankhe等人[30]在50~500個(gè)設(shè)備的不同規(guī)模WiFi數(shù)據(jù)集上測試了DeepRadioID模型,實(shí)驗(yàn)發(fā)現(xiàn)對于50個(gè)設(shè)備的WiFi數(shù)據(jù)集,當(dāng)訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)不在同一天時(shí),識別率從85%下降到46%。同年,Al-Shawabka等人[57]對DeepRadioID模型進(jìn)行了簡單修改,重復(fù)堆疊了5次圖3(c)中的基本單元塊,并增加了一個(gè)全連接層,在DARPA超大規(guī)模數(shù)據(jù)集上的研究表明無線信道會(huì)顯著影響分類精度。
(3) 類VGG模型
2020年,Elmaghbub等人[58]設(shè)計(jì)了RFF-CNN2模型(圖3(d)),是一種類VGG模型,基本單元塊由16個(gè)1×4卷積核的卷積層、批量歸一化(Batch Normalization,BN)層和最大池化層組成,通過重復(fù)堆疊基本單元塊完成特征提取,并使用一個(gè)平均池化層將特征聚合,然后通過分類全連接層和Softmax層輸出分類結(jié)果。2021年,崔天舒等人[59]提出了IQCNet模型,結(jié)構(gòu)如圖3(e)所示,基本單元塊由2個(gè)卷積層和1個(gè)最大池化層組成,其特點(diǎn)是首先使用了32個(gè)2×1卷積核提取I,Q兩路的相關(guān)特征,有效降低了模型參數(shù)量和計(jì)算量,更適合輕量化部署。
圖3 使用Raw I/Q進(jìn)行射頻指紋識別的基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)模型Fig.3 The basis CNN model inputted with Raw I/Q for RFF
以上回顧了幾種直接使用Raw I/Q進(jìn)行射頻指紋識別的基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)模型,其設(shè)計(jì)主要受到LeNet等經(jīng)典網(wǎng)絡(luò)模型啟發(fā),由1~2個(gè)卷積層與最大池化層串聯(lián)組成基本單元塊,然后通過重復(fù)堆疊這種基本單元塊完成自動(dòng)特征提取。卷積核沿著時(shí)間的方向滑動(dòng)提取I/Q信號的局部時(shí)間關(guān)系,卷積核在整個(gè)信號切片上共享參數(shù),符合射頻指紋的唯一性和不變性特點(diǎn);池化層用于提高網(wǎng)絡(luò)在時(shí)間維度上的魯棒性并實(shí)現(xiàn)下采樣。在完成逐級特征提取之后,可以使用多個(gè)級聯(lián)的全連接層,也可以使用平均池化層進(jìn)行特征聚合后再饋入分類全連接層,最終完成射頻指紋識別任務(wù)。
3.1.2 殘差設(shè)計(jì)
殘差設(shè)計(jì)[64]能夠很好地緩解網(wǎng)絡(luò)退化問題,降低梯度消失的風(fēng)險(xiǎn),訓(xùn)練更深的網(wǎng)絡(luò)。2019年,Gritsenko等人[28]參考ResNet-50模型,并根據(jù)I/Q數(shù)據(jù)的一維時(shí)間序列特點(diǎn),設(shè)計(jì)了一種ResNet-50-1D模型(圖4(a))。ResNet-50-1D模型使用一維卷積層,標(biāo)識模塊和卷積塊是基本單元塊,并配置有跳躍連接。在500個(gè)設(shè)備的WiFi數(shù)據(jù)集和ADS-B數(shù)據(jù)集上的實(shí)驗(yàn)表明,ResNet-50-1D模型的性能比DeepRadioID模型分別提升了15%和7%。在超大規(guī)模(10000個(gè)設(shè)備)WiFi和ADS-B數(shù)據(jù)集上的實(shí)驗(yàn)表明[11]:訓(xùn)練集數(shù)據(jù)越多,ResNet-50-1D模型和DeepRadioID模型越準(zhǔn)確;環(huán)境和信道條件會(huì)影響分類準(zhǔn)確性;在ADS-B數(shù)據(jù)集上的準(zhǔn)確性更高;在訓(xùn)練前去除信道效應(yīng)并不總是能帶來更好的結(jié)果;某些時(shí)候Deep-RadioID模型的性能會(huì)優(yōu)于ResNet-50-1D,更深層次的網(wǎng)絡(luò)并不一定更好。2020年,翁琳天然等人[45]設(shè)計(jì)了一種ResNet模型,并與雙譜特征工程方法和基于Raw I/Q的CNN模型方法進(jìn)行了對比,研究表明,深度學(xué)習(xí)方法對噪聲具有更強(qiáng)的魯棒性,且ResNet模型比CNN模型的性能更好。2021年,Zhang等人[46]設(shè)計(jì)了一種RFFResNet模型(圖4(b)),其參數(shù)數(shù)量為ResNet-34-1D模型的一半左右,使用手機(jī)信號的實(shí)驗(yàn)表明,網(wǎng)絡(luò)的規(guī)模并不是越大越好,需要與數(shù)據(jù)集相匹配;在高信噪比下使用足夠規(guī)模的數(shù)據(jù)訓(xùn)練,才能學(xué)習(xí)到魯棒的射頻指紋而不產(chǎn)生過擬合。
圖4 使用Raw I/Q進(jìn)行射頻指紋識別的ResNet模型Fig.4 The ResNet model inputted with Raw I/Q for RFF
殘差設(shè)計(jì)是一種即插即用且簡單有效的方法,能夠方便地與其他方法集成,如在復(fù)數(shù)網(wǎng)絡(luò)中就能夠看到殘差設(shè)計(jì)的例子,隨著網(wǎng)絡(luò)層數(shù)的加深,模型的學(xué)習(xí)能力將進(jìn)一步提升,更適合于解決大型數(shù)據(jù)集問題。
3.1.3 復(fù)數(shù)改造
復(fù)數(shù)是無線電信號的自然表示形式,復(fù)數(shù)DNN模型[65]可以直接處理復(fù)數(shù),理論上可以獲得更好的效果,在射頻指紋識別問題中,Chen等人[66]在真實(shí)的LoRa (Long Range)和WiFi數(shù)據(jù)集上,進(jìn)行了不同網(wǎng)絡(luò)層、網(wǎng)絡(luò)層的組件(卷積濾波器或其輸出)和網(wǎng)絡(luò)層輸出的實(shí)部、虛部分量等情況的消融(Ablation)實(shí)驗(yàn),證實(shí)了在模型參數(shù)量大致相同時(shí),復(fù)數(shù)DNN模型能夠更有效地利用I路和Q路的特征信息,復(fù)數(shù)DNN模型的性能始終優(yōu)于實(shí)數(shù)DNN模型。
2019年,Gopalakrishnan等人[20]設(shè)計(jì)了一種復(fù)數(shù)CNN模型(圖5(a)),該模型由2個(gè)復(fù)數(shù)卷積層和2個(gè)全連接層組成,首先使用2個(gè)復(fù)數(shù)卷積層提取特征,然后使用模值提取層將復(fù)數(shù)表征轉(zhuǎn)換為實(shí)數(shù)表征,并送入時(shí)間平均(temporal averaging)層。實(shí)驗(yàn)表明,相比實(shí)數(shù)CNN模型,復(fù)數(shù)CNN模型在ADS-B數(shù)據(jù)集上性能提升了6.66%,在WiFi數(shù)據(jù)集上性能提升了1.64%;在訓(xùn)練信號中添加高斯白噪聲能夠迫使網(wǎng)絡(luò)學(xué)習(xí)更魯棒的射頻指紋;訓(xùn)練數(shù)據(jù)中應(yīng)去除包含輻射源標(biāo)識的信號片段,防止網(wǎng)絡(luò)學(xué)習(xí)信號中蘊(yùn)含的輻射源ID等標(biāo)識身份信息。Agadakos等人[29]和Stankowicz等人[42]也設(shè)計(jì)了復(fù)數(shù)CNN模型,在DARPA數(shù)據(jù)集上的實(shí)驗(yàn)表明,復(fù)數(shù)CNN模型在射頻指紋識別任務(wù)中具有更強(qiáng)的表示能力和潛在的泛化優(yōu)勢,在多種協(xié)議、信道衰落影響和信噪比變化的情況下具有更高的正確率,同等情況下所需網(wǎng)絡(luò)參數(shù)更少,對噪聲具有抑制作用。2020年,Cekic等人[19]繼續(xù)使用文獻(xiàn)[20]中的復(fù)數(shù)CNN模型研究了不同采集時(shí)間(訓(xùn)練與測試不在同一天)、時(shí)鐘漂移和無線信道變化等混雜因素對射頻指紋的影響。結(jié)果表明,除非主動(dòng)采取一些手段阻止深度神經(jīng)網(wǎng)絡(luò),否則神經(jīng)網(wǎng)絡(luò)會(huì)主動(dòng)學(xué)習(xí)混雜因素表現(xiàn)的顯著特征,而不是硬件的射頻指紋特征,并提出使用數(shù)據(jù)增強(qiáng)方法來提升網(wǎng)絡(luò)的泛化性能。2020年,Gu等人[43]設(shè)計(jì)了一種復(fù)數(shù)CNN模型(圖5(b)),其在每個(gè)復(fù)數(shù)卷積層和復(fù)數(shù)全連接層之后增加了1個(gè)復(fù)數(shù)BN層和1個(gè)Dropout層,可以加快訓(xùn)練速度、避免過擬合,在無人機(jī)遙控實(shí)測數(shù)據(jù)集上的實(shí)驗(yàn)表明,復(fù)數(shù)CNN模型優(yōu)于實(shí)數(shù)CNN模型、FCNN模型。2020年,Wang等人[44]設(shè)計(jì)了一種復(fù)數(shù)ResNet模型(圖5(c)),其通過8個(gè)堆疊的復(fù)數(shù)殘差塊提取特征,然后使用3個(gè)全連接層分類,在20個(gè)設(shè)備WiFi數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,復(fù)數(shù)ResNet模型比復(fù)數(shù)CNN模型和基于等勢星球圖的實(shí)數(shù)CNN模型性能都好,其推理耗時(shí)在13.6 ms以內(nèi),比復(fù)數(shù)CNN模型的計(jì)算時(shí)間稍長,但遠(yuǎn)小于基于等勢星球圖的實(shí)數(shù)CNN模型推理耗時(shí),復(fù)數(shù)ResNet模型即使不進(jìn)行載頻偏移和相位偏移補(bǔ)償也能夠達(dá)到很高的精度。
圖5 使用Raw I/Q進(jìn)行射頻指紋識別的復(fù)數(shù)深度神經(jīng)網(wǎng)絡(luò)模型Fig.5 The complex-valued DNN model inputted with Raw I/Q for RFF
在射頻指紋識別問題上,同等條件下復(fù)數(shù)DNN模型比實(shí)數(shù)DNN模型的性能更好,而且復(fù)數(shù)DNN模型對信噪比變化、時(shí)間、時(shí)鐘漂移和信道變化等混雜因素的魯棒性更好,對不同協(xié)議、個(gè)體數(shù)量規(guī)模等變化的適應(yīng)性和擴(kuò)展性更好。
3.1.4 其他改進(jìn)方法
(1) 添加注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型
注意力機(jī)制能夠有選擇地加強(qiáng)重要信息的通道,抑制無效信息的通道,Peng等人[51]在CNN模型中引入了注意力機(jī)制SE (Squeeze-and-Excitation)模塊,在WiFi數(shù)據(jù)集上的實(shí)驗(yàn)表明,添加了SE模塊的CNN模型在低信噪比下,正確率更高、性能更為魯棒。此外,如果能夠稍微利用一些先驗(yàn)知識,還能夠進(jìn)一步提升網(wǎng)絡(luò)的性能,如Weng等人[52]提出了一種利用消息結(jié)構(gòu)的先驗(yàn)信息輔助的注意力卷積網(wǎng)絡(luò)(Message Structure aided Attentional Convolution Network,MSACN),該網(wǎng)絡(luò)將具有不同波形分布的信號部分分離并饋入識別網(wǎng)絡(luò),然后對多個(gè)數(shù)據(jù)塊中的特征圖進(jìn)行提取和合并,并且為低維離散信號設(shè)計(jì)了一種空間注意力機(jī)制。實(shí)驗(yàn)表明,MSACN模型的正確率優(yōu)于CNN模型[56]、ResNet模型[34]和卷積長短期記憶深度神經(jīng)網(wǎng)絡(luò)(Convolutional Long short-term Deep Neural Network,CLDNN)[49]模型。
(2) 多采樣卷積神經(jīng)網(wǎng)絡(luò)模型
2019年,Yu等人[54,55]提出了一種多采樣卷積神經(jīng)網(wǎng)絡(luò)(Multi-Sampling Convolutional Neural Network,MSCNN)模型,其通過使用多個(gè)下采樣變換自動(dòng)進(jìn)行多尺度特征提取和分類,不同的下采樣變換能夠捕獲反映局部區(qū)域細(xì)微變化的短期特征和反映總體趨勢的長期特征,從而得到不同長度的多采樣基帶信號。在54個(gè)ZigBee設(shè)備數(shù)據(jù)集上的實(shí)驗(yàn)表明,在視距、非視距和各種信噪比情況下,MSCNN模型都比CNN模型[56]的魯棒性更好。需注意的是MSCNN模型輸入的I/Q數(shù)據(jù)經(jīng)過了頻率偏移、相位偏移的補(bǔ)償以及對齊預(yù)處理操作,雖然這些預(yù)處理需要一些待識別信號的先驗(yàn)知識,但多采樣的處理方式具有很好的啟發(fā)性。
(3) 增強(qiáng)的擴(kuò)張因果卷積神經(jīng)網(wǎng)絡(luò)模型
2020年,Robinson等人[31]設(shè)計(jì)了一種增強(qiáng)的擴(kuò)張因果卷積(Augmented Dilated Causal Convolutional,ADCC)模型,作者認(rèn)為輻射源由具有因果關(guān)系的模擬組件組成,因果關(guān)系就是射頻指紋的屬性。ADCC模型使用堆疊的殘差塊從每個(gè)樣本的前1600個(gè)I/Q值中提取并產(chǎn)生2500個(gè)特征,然后使用較小的擴(kuò)張卷積核從剩余的20個(gè)子序列中提取2500個(gè)特征,最后將殘差塊和擴(kuò)展卷積核提取的特征串聯(lián),作為最終的輸入特征。從較小子序列提取的特征不會(huì)受編碼有標(biāo)定個(gè)體身份信息片段的影響,擴(kuò)張卷積在不增加網(wǎng)絡(luò)參數(shù)的情況下擴(kuò)大了感受野,這些優(yōu)點(diǎn)使得ADCC模型能夠?qū)W習(xí)與協(xié)議無關(guān)的硬件指紋,在訓(xùn)練數(shù)據(jù)與驗(yàn)證數(shù)據(jù)的分布相似的情況下能夠獲得很高的準(zhǔn)確率。作者進(jìn)一步指出,均衡信號的預(yù)處理方法可能同時(shí)消除信道效應(yīng)和輻射源的射頻指紋,不能推廣到所有的信號類型。
(4) 雙路卷積神經(jīng)網(wǎng)絡(luò)模型
2020年,Tian等人[53]提出了一種雙路CNN模型,將WiFi前導(dǎo)信號的短訓(xùn)練序列和長訓(xùn)練序列分別送入兩個(gè)并行的支路,支路的網(wǎng)絡(luò)結(jié)構(gòu)與ORACLE模型的卷積層基本一致,并在卷積層之后增加了BN層,經(jīng)過兩個(gè)卷積層的特征提取之后,將兩個(gè)支路的特征圖融合,作為全連接層的輸入。
除了以上討論的基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)及其改進(jìn)方法之外,研究者還利用DenseNet[67]、3D卷積神經(jīng)網(wǎng)絡(luò)[68]、降噪自編碼器[69]、離散小波變換池化[70]等方法進(jìn)行射頻指紋識別,為我們提供了開闊的思路。
卷積和池化是CNN模型的核心,它賦予了CNN模型平移等變性和局部感受野,是CNN模型解決問題的歸納偏好(inductive bias)[71],是其能夠提取具有唯一性和不變性的射頻指紋特征的保證。通過加深網(wǎng)絡(luò)層次、改進(jìn)訓(xùn)練方法、進(jìn)行復(fù)數(shù)化改造、引入殘差設(shè)計(jì)等手段可以進(jìn)一步提升網(wǎng)絡(luò)的多層次特征提取和聚合能力。在具備待識別信號部分先驗(yàn)知識的情況下,還可以利用先驗(yàn)知識進(jìn)一步對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),提升網(wǎng)絡(luò)針對特定信號的射頻指紋提取能力。此外,有研究者指出輸入端數(shù)據(jù)的平移,縮放等的微小差異可能導(dǎo)致CNN模型輸出概率的顯著變化[72],CNN模型的平移等變性并不具有一般性,在一些情況下并不滿足平移等變性,CNN模型本身仍然需要改進(jìn)。
RNN模型擅長提取數(shù)據(jù)的時(shí)間相關(guān)性特征,在視頻處理、語音識別等方面已得到了成功應(yīng)用,簡單的RNN模型存在長期信息保存和短期輸入跳躍之間的矛盾,長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)模型則很好地克服了這個(gè)不足,下面主要介紹RNN模型中的LSTM網(wǎng)絡(luò)等模型在射頻指紋識別中的應(yīng)用。
3.2.1 長短期記憶網(wǎng)絡(luò)模型
2018年,Wu等人[49]提出使用LSTM模型進(jìn)行射頻指紋識別,該網(wǎng)絡(luò)由1個(gè)LSTM層和1個(gè)Softmax層組成,在多個(gè)USRP數(shù)據(jù)集上的實(shí)驗(yàn)表明,LSTM網(wǎng)絡(luò)模型在低信噪比時(shí)可取得很好的效果。同年,Jafari等人[48]也設(shè)計(jì)了一種LSTM模型,該網(wǎng)絡(luò)由3個(gè)堆疊的LSTM層和1個(gè)全連接層組成,在6個(gè)同型號的ZigBee設(shè)備上的實(shí)驗(yàn)表明,F(xiàn)CNN模型和CNN模型的正確率明顯優(yōu)于LSTM網(wǎng)絡(luò)模型。2021年,Al-Shawabka等人[50]設(shè)計(jì)了一種RFFLSTM模型(圖6(a)),該模型由3個(gè)堆疊的LSTM層和1個(gè)全連接層組成,每個(gè)LSTM層的神經(jīng)元個(gè)數(shù)為輸入數(shù)據(jù)的長度,每個(gè)LSTM層之后使用概率為0.5的Dropout操作減少過擬合,在100個(gè)LoRa設(shè)備數(shù)據(jù)集上的實(shí)驗(yàn)表明,總體上CNN模型[57]在所有場景中都比LSTM網(wǎng)絡(luò)模型工作得更好。
與CNN模型相比,RNN模型在射頻指紋識別中的研究工作相對較少。在小規(guī)模數(shù)據(jù)集上LSTM模型的性能優(yōu)于CNN模型,而在大規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)表明,CNN模型優(yōu)于LSTM模型。LSTM模型效果不如CNN模型的原因可能是LSTM模型提取的是時(shí)間相關(guān)特征,而沒有關(guān)注空間相關(guān)特征,而這些時(shí)間相關(guān)特征并不是輻射源的射頻指紋,可能是特定于某種混雜因素的特征,比如網(wǎng)絡(luò)模型使用某一段時(shí)內(nèi)的信道特征進(jìn)行個(gè)體識別,當(dāng)信道環(huán)境發(fā)生變化時(shí),模型的性能就會(huì)顯著下降。
3.2.2 聯(lián)合CNN和RNN模型
聯(lián)合CNN和RNN模型可以同時(shí)利用CNN模型提取空間相關(guān)特征和RNN模型提取時(shí)間相關(guān)特征的優(yōu)點(diǎn),在無線電信號調(diào)制識別研究[73]中,已證實(shí)CLDNN模型比單獨(dú)使用CNN模型性能上有大幅提升。2019年,Roy等人[60]設(shè)計(jì)了一種RFF-Conv-LSTM2D模型(圖6(b)),該模型由2個(gè)ConvLSTM2D層和2個(gè)全連接層組成,在8個(gè)同型號USRP B210數(shù)據(jù)集上的實(shí)驗(yàn)表明,RFF-ConvLSTM2D模型的正確率達(dá)到了97.2%,高于GRU模型(95.3%)和LSTM網(wǎng)絡(luò)模型(92%)。2020年,Soltani等人[61]設(shè)計(jì)了一種RFF-ConvRNN模型(圖6(c)),該模型由卷積單元模塊、RNN單元模塊和全連接單元模塊組成,其中卷積單元模塊由7個(gè)重復(fù)堆疊的卷積層和最大池化層組成。首先使用卷積單元模塊提取空間相關(guān)特征,然后使用SimpleRNN層提取時(shí)間相關(guān)特征,最后使用全連接層完成分類,在DARPA數(shù)據(jù)集(50個(gè)WiFi輻射源)上的實(shí)驗(yàn)表明,在未使用數(shù)據(jù)增強(qiáng)方法的時(shí)候,RFF-ConvRNN模型正確率要優(yōu)于DeepRadioID模型[57],而當(dāng)使用數(shù)據(jù)增強(qiáng)方法時(shí),DeepRadioID模型的正確率反而略優(yōu)于RFF-ConvRNN。2020年,Liu等人[33]設(shè)計(jì)了一種混合網(wǎng)絡(luò)模型(圖6(d)),該模型由具有擴(kuò)展卷積和SE模塊的一維殘差卷積網(wǎng)絡(luò)(one-dimensional residual convolution network with dilated convolution and squeeze-and-excitation block,Conv-OrdsNet)和深度雙向長短期記憶(Deep BidirectionalLong Short-Term Memory,DBi-LSTM)網(wǎng)絡(luò)組成,輸入數(shù)據(jù)為固定長度且有3個(gè)通道,即I路、Q路和相位值,相位值用于輔助提取特征和加快收斂,在16個(gè)同型號USRP數(shù)據(jù)集[63]上的實(shí)驗(yàn)表明,該模型不需要利用信號中的特定片段,在低信噪比條件下仍能保持高準(zhǔn)確率,在相同正確率下需要的I/Q樣本更短;在消除了信號中功率、頻率偏移、相位偏移等不利影響后,該模型仍可以從信號中提取與身份相關(guān)的其他隱藏特征,具有更強(qiáng)的抗干擾能力和更好的魯棒性。
圖6 使用Raw I/Q進(jìn)行射頻指紋識別的循環(huán)神經(jīng)網(wǎng)絡(luò)模型Fig.6 The RNN model inputted with Raw I/Q for RFF
聯(lián)合CNN和RNN模型的特征提取能力,在一些問題上能夠獲得更好的性能,但也有研究指出,在測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)分布不一致時(shí),CNN模型的性能會(huì)略優(yōu)于聯(lián)合CNN和RNN模型,導(dǎo)致這種反直覺結(jié)果的原因可能有兩個(gè)方面:一是CNN模型能夠捕獲信號中存在的具有平移不變性的特征,RNN模型能更進(jìn)一步捕捉到不同尺度上重復(fù)出現(xiàn)的模式在時(shí)間上的相關(guān)性,這可能是頻率漂移類的長時(shí)特征,也可能是波形上升沿突變部分的短時(shí)特征,還有可能是無線信道等混雜因素所表現(xiàn)的時(shí)間相關(guān)特征,而且在不同場景下無線信道等混雜因素所引起的特征很可能比輻射源固有特征更為顯著,這將導(dǎo)致RNN模型的引入反而使得混合模型的性能惡化;二是CNN模型通過加深網(wǎng)絡(luò)層數(shù),能夠獲得更大的感受野,從而具有挖掘更大時(shí)間尺度上模式相關(guān)性的潛力,這一定程度上彌補(bǔ)了CNN模型在時(shí)間關(guān)聯(lián)特征提取方面的劣勢。聯(lián)合CNN和RNN模型的一些實(shí)驗(yàn)結(jié)果表明,設(shè)計(jì)更強(qiáng)大神經(jīng)網(wǎng)絡(luò)模型的同時(shí),還應(yīng)時(shí)刻注意在數(shù)據(jù)集、數(shù)據(jù)增強(qiáng)方法、訓(xùn)練方法等方面加以約束和驗(yàn)證,否則可能造成過擬合,導(dǎo)致網(wǎng)絡(luò)泛化性能的下降。
Transformer模型是不同于FCNN模型、CNN模型、RNN模型的結(jié)構(gòu),其完全基于注意力機(jī)制,通過編碼器和解碼器操作提取特征,2017年首次應(yīng)用在文本翻譯[74]中,2020年首次使用純Transformer模塊構(gòu)建的ViT (Vision Transformer)模型[75]實(shí)現(xiàn)了圖像識別,目前利用Transformer模型進(jìn)行射頻指紋識別的研究較少。2021年,Xu等人[41]提出使用改進(jìn)的Transformer模型和類內(nèi)分割方法(Intra Class Splitting,ICS)進(jìn)行未知輻射源識別,只使用Transformer模型的編碼器部分提取射頻指紋,該模型利用無線信號的符號率和采樣率作為先驗(yàn)知識來修改self-attention中的節(jié)點(diǎn)連通性,用以降低計(jì)算復(fù)雜度和提取更魯棒的特征,在30個(gè)USRP數(shù)據(jù)集上的實(shí)驗(yàn)表明,該方法能夠以高精度拒絕來自未知發(fā)射器的信號,分類精度優(yōu)于現(xiàn)有的其他開集識別(Open-Set Recognition,OSR)方法。2021年,Shen等人[27]使用Transformer模型實(shí)現(xiàn)了可變信號長度下10個(gè)同型號LoRa設(shè)備的個(gè)體識別,但是該Transformer模型的輸入數(shù)據(jù)表示形式為STFT時(shí)頻譜圖,本文將使用STFT數(shù)據(jù)表示形式歸類到基于專家特征的一類方法,詳細(xì)討論見4.2節(jié)。
相較于CNN模型和RNN模型,Transformer模型具有全局視野和更好的并行計(jì)算能力,CNN模型和RNN模型一般只能處理固定長度的輸入數(shù)據(jù),而Transformer模型能夠處理可變長度的輸入數(shù)據(jù),這一特點(diǎn)使Transformer模型具有更好的靈活性和可擴(kuò)展性。Transformer模型的應(yīng)用也存在一些限制,如Transformer模型的歸納偏好更少,幾乎完全從數(shù)據(jù)中學(xué)習(xí),而CNN模型和RNN模型具有局部感受野、空間等變性、時(shí)間等變性等較強(qiáng)的歸納偏好,達(dá)到相同性能,Transformer模型需要更多的訓(xùn)練數(shù)據(jù)。在文本、圖像等領(lǐng)域已有不少開源、大規(guī)模、高質(zhì)量數(shù)據(jù)集,在射頻指紋識別領(lǐng)域還較少,這限制了Transformer模型在射頻指紋識別中的應(yīng)用。
雖然深度學(xué)習(xí)方法成功應(yīng)用于很多領(lǐng)域,并形成了各種網(wǎng)絡(luò)結(jié)構(gòu),但DNN模型的設(shè)計(jì)并沒有統(tǒng)一的指導(dǎo)原則,似乎更倚重于經(jīng)驗(yàn)。2021年,Bronstein等人[40]提出以對稱性和不變性為第一原則,從中導(dǎo)出不同的歸納偏好和網(wǎng)絡(luò)架構(gòu),并將這種幾何化的嘗試稱為“幾何深度學(xué)習(xí)”。
對稱是一種保持某種性質(zhì)或結(jié)構(gòu)的變換,對一個(gè)給定的結(jié)構(gòu),所有變換的集合形成一個(gè)對稱群,如卷積層的平移等變性就是一種對稱性,輸入到卷積層的移動(dòng)會(huì)在輸出特征圖中產(chǎn)生相同數(shù)量的移動(dòng),這在圖像處理中就是一種合理的幾何先驗(yàn),對應(yīng)的直觀理解就是物體的類別與其在圖片中出現(xiàn)的位置無關(guān)。類比之,從無線電信號的不同時(shí)間片段中提取的射頻指紋應(yīng)當(dāng)保持一致,CNN模型的平移等變性對于射頻指紋識別問題是一種合理的對稱性假設(shè),CNN模型在射頻指紋識別中的成功應(yīng)用也證實(shí)這一假設(shè)的合理性。但實(shí)際中無線電信號會(huì)受到無線信道衰落、溫度變化引起的頻率偏移等混雜因素的影響而產(chǎn)生幅度、相位上的變化,這使得測試數(shù)據(jù)分布相對訓(xùn)練數(shù)據(jù)分布發(fā)生了改變,可能導(dǎo)致了網(wǎng)絡(luò)模型性能的下降。如果能在平移等變性的基礎(chǔ)上,繼續(xù)賦予網(wǎng)絡(luò)合適的、額外的對稱性,那么就能進(jìn)一步加強(qiáng)網(wǎng)絡(luò)模型針對射頻指紋提取的歸納偏好,提升網(wǎng)絡(luò)模型利用數(shù)據(jù)的效率,從另一個(gè)角度來說更強(qiáng)的歸納偏好等價(jià)于更多的訓(xùn)練數(shù)據(jù)。另外,研究發(fā)現(xiàn)利用多個(gè)不同時(shí)間采集的數(shù)據(jù)、不同接收機(jī)采集的數(shù)據(jù)、數(shù)據(jù)增強(qiáng)方法、多樣化的輸入數(shù)據(jù)表示等訓(xùn)練網(wǎng)絡(luò),能夠提高網(wǎng)絡(luò)對輸入數(shù)據(jù)變化的魯棒性、有效降低測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)分布不一致時(shí)的網(wǎng)絡(luò)模型性能的降級,但是這種依賴于數(shù)據(jù)多樣性的方法并不總是可行,比如采集的數(shù)據(jù)不可能覆蓋所有應(yīng)用環(huán)境、數(shù)據(jù)增強(qiáng)方法中只能在一定范圍內(nèi)對信號進(jìn)行頻率偏移、相位偏移等操作,最終還是需要新的數(shù)據(jù)驅(qū)動(dòng)方法[47],如從幾何深度學(xué)習(xí)角度探索如何賦予網(wǎng)絡(luò)額外對稱性的方法就是一種有效的思路。假設(shè)我們期望從接收機(jī)輸出信號Rx(t)中提取一種不受信道等混雜因素影響的射頻指紋,這需要特征提取器f對Rx(t)及其變換)能夠保持不變。
其中,(t)是Rx(t)受到混雜因素影響后發(fā)生的某種變換,如信道衰落對無線電信號的作用。
以多徑信道衰落為例,接收信號Rx(t)的極坐標(biāo)形式為reiθ,r∈R+,θ∈R,徑向分量r和角分量θ各自形成獨(dú)立的李群,徑向分量是標(biāo)量乘法下的阿貝爾李群 R+,角分量是阿貝爾李群θ ∈R/2πZ},與SO(2)群同構(gòu),則李群R+×U(1)可以捕獲幅度衰減(信道的增益)和角旋轉(zhuǎn)(信號相位的偏移)。
2021年,Brown等人[47]設(shè)計(jì)了一種信道魯棒表示網(wǎng)絡(luò)(Channel Robust Representation Networks,ChaRRNets)模型,該模型對群等變卷積神經(jīng)網(wǎng)絡(luò)[76](Group equivariant Convolutional Neural Networks,G-CNNs)進(jìn)行了復(fù)數(shù)改造,并引入了wFM運(yùn)算[77],使其適用于無線電信號處理。當(dāng)信號帶寬小于信道相干帶寬時(shí),可看作平坦衰落信道,此時(shí)可假設(shè)信號在每個(gè)頻率上都位于同一個(gè)流形上,每個(gè)頻率上受到的信道擾動(dòng)都符合 R+×U(1),即在每個(gè)頻率上的擾動(dòng)具有不變性。仿真實(shí)驗(yàn)表明,ChaRRNets模型具有對多徑衰落的魯棒性,并且模型中包含的域偏移大大增加了模型對訓(xùn)練數(shù)據(jù)中不存在的多徑信道環(huán)境的泛化能力;DARPA數(shù)據(jù)集上的實(shí)驗(yàn)表明,在大規(guī)模個(gè)體數(shù)量和較少訓(xùn)練樣本情況下,ChaRRNets模型比復(fù)數(shù)CNN模型具有更好的分布外泛化能力,這將減輕數(shù)據(jù)收集的負(fù)擔(dān)。
目前幾何深度學(xué)習(xí)在射頻指紋識別中的研究工作很少,從群等變卷積神經(jīng)網(wǎng)絡(luò)在射頻指紋識別中的應(yīng)用效果看,合理的對稱性假設(shè),能夠賦予網(wǎng)絡(luò)特殊的歸納偏好,從而大幅提升網(wǎng)絡(luò)對特定問題的特征提取能力,實(shí)現(xiàn)更高效的數(shù)據(jù)利用,得到泛化能力更強(qiáng)的模型,具有很大的潛力。
至此,本文對使用Raw I/Q進(jìn)行射頻指紋識別的DNN模型進(jìn)行了系統(tǒng)回顧,并對各研究結(jié)果進(jìn)行了討論。從以上各研究工作的結(jié)論中也可以注意到,網(wǎng)絡(luò)模型與建模數(shù)據(jù)和訓(xùn)練方法等是一個(gè)相互關(guān)聯(lián)的整體,提升射頻指紋識別能力還需要其他方面的配合,下面將對近年來射頻指紋識別研究在數(shù)據(jù)集、數(shù)據(jù)表示形式和數(shù)據(jù)增強(qiáng)方面的工作進(jìn)行總結(jié)。
數(shù)據(jù)、算法和算力是深度學(xué)習(xí)的3大支柱,高質(zhì)量、大規(guī)模和開源的數(shù)據(jù)集是推動(dòng)深度學(xué)習(xí)發(fā)展的重要力量。在無線電信號處理方面,由于其相對小眾的特點(diǎn)和對特定領(lǐng)域知識的依賴,無線電信號數(shù)據(jù)集的規(guī)模、數(shù)量和開源程度都很小。目前,在無線電信號調(diào)制識別中,RML2016.10a[12]和RML2018.01a[13]兩個(gè)數(shù)據(jù)集使用較為廣泛。而在射頻指紋識別中,雖然也存在一些開源數(shù)據(jù)集,但是由于射頻指紋識別相對調(diào)制識別的差異性,如射頻指紋更容易受無線信道等多種混雜因素的影響,導(dǎo)致建立射頻指紋識別數(shù)據(jù)集考慮的因素更多,投入更加巨大。另外,由于射頻指紋數(shù)據(jù)集具有潛在的應(yīng)用價(jià)值,導(dǎo)致DARPA等建立的超大規(guī)模射頻指紋識別數(shù)據(jù)集并未開源,現(xiàn)有的開源射頻指紋數(shù)據(jù)集還遠(yuǎn)不能滿足研究的需求。
表1列出了部分現(xiàn)有的開源射頻指紋數(shù)據(jù)集,并按照發(fā)射端配置,環(huán)境、信道、采集時(shí)間等配置,接收端配置3個(gè)部分進(jìn)行了總結(jié),以供后續(xù)數(shù)據(jù)集的建立提供參考。發(fā)射端通常選擇較為常見、數(shù)量巨大、獲取方便的WiFi信號、ADS-B信號、LoRa信號、ZigBee信號等作為研究對象。接收端一般使用USRP作為接收機(jī),采樣率需覆蓋待識別信號的有效帶寬,并保持過采樣。根據(jù)研究目的進(jìn)行環(huán)境、信道等配置,例如配置收發(fā)機(jī)之間直視和非直視的傳輸環(huán)境,在不同時(shí)間進(jìn)行數(shù)據(jù)采集,改變收發(fā)機(jī)之間的距離,在實(shí)際工作環(huán)境或電波暗室中采集等。
表1 開源的射頻指紋數(shù)據(jù)集Tab.1 Open source dataset of radio frequency fingerprint
在早期的一些射頻指紋數(shù)據(jù)集上,深度學(xué)習(xí)方法已達(dá)到了很高的精度,但這并不能說明已經(jīng)提取了魯棒的射頻指紋,在小規(guī)模、直視信道環(huán)境數(shù)據(jù)集上建立的模型并不能外推到大規(guī)模、非直視傳輸環(huán)境和不同時(shí)間段的測試環(huán)境。RMFL項(xiàng)目組在DARPA超大規(guī)模數(shù)據(jù)集上的研究[11,61]證實(shí)了這一點(diǎn),輻射源數(shù)量的增加、不同時(shí)間采集的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)、不同的接收機(jī)等情況都會(huì)使個(gè)體識別率顯著下降。因此,在構(gòu)建射頻指紋數(shù)據(jù)集時(shí),需要考慮輻射源個(gè)體數(shù)量、收發(fā)機(jī)距離、多徑效應(yīng)、溫度、不同接收機(jī)等各種因素,已有研究者按照SigMF標(biāo)準(zhǔn)[78]建立了多個(gè)射頻指紋數(shù)據(jù)集[79],其使用元數(shù)據(jù)詳細(xì)描述采集I/Q數(shù)據(jù)時(shí)的發(fā)射端設(shè)置、環(huán)境和信道等配置、接收端參數(shù)配置等詳細(xì)信息。另外,在未知輻射源識別研究中,用于檢驗(yàn)?zāi)P陀?xùn)練數(shù)據(jù)分布外泛化能力的數(shù)據(jù)必須是未知數(shù)據(jù),而且數(shù)據(jù)集中個(gè)體數(shù)量必須足夠多才能開展開集識別研究。樂波等人[80]的研究表明接收機(jī)畸變會(huì)對射頻指紋產(chǎn)生嚴(yán)重影響,目前大多數(shù)射頻指紋識別研究都是保持接收機(jī)不變,從而忽略接收機(jī)對射頻指紋的影響。但是,在射頻指紋識別應(yīng)用的部署階段,我們更希望一次采集和訓(xùn)練得到的模型能夠部署到不同的接收機(jī)上,而不是為每個(gè)接收機(jī)建立模型,因此建立多接收機(jī)的數(shù)據(jù)集也很有必要。
一個(gè)開源的、有一定規(guī)模的、高質(zhì)量的射頻指紋數(shù)據(jù)集能夠讓研究者在同一基線上客觀地對比各自方法,在構(gòu)建射頻指紋數(shù)據(jù)集時(shí),還應(yīng)考慮無線信道環(huán)境、溫度、采集時(shí)間和接收機(jī)等多種混雜因素的影響,以便為研究射頻指紋的魯棒性、模型的訓(xùn)練數(shù)據(jù)分布外泛化能力、不同接收機(jī)上的射頻指紋識別部署等多種問題提供支持。
使用深度學(xué)習(xí)進(jìn)行無線電信號處理是一個(gè)較新的研究方向,網(wǎng)絡(luò)輸入的最佳數(shù)據(jù)表示形式可能取決于DNN模型架構(gòu)、學(xué)習(xí)目標(biāo)和損失函數(shù)的選擇[88],在無線電信號調(diào)制識別和在無線信號干擾檢測任務(wù)中發(fā)現(xiàn),數(shù)據(jù)表示形式與任務(wù)和SNR相關(guān)[89],合適的數(shù)據(jù)表示形式可提升DNN模型的性能。在射頻指紋識別中數(shù)據(jù)表示形式有I/Q、A/φ、FFT、自然對數(shù)(Nature Logarithm,NL)、差分I/Q等。表2列出了無先驗(yàn)知識時(shí),射頻指紋識別中有關(guān)數(shù)據(jù)表示形式研究的文獻(xiàn)及其結(jié)論,并給出了各項(xiàng)研究中使用的網(wǎng)絡(luò)模型、信號類型和設(shè)備數(shù)量。表2的STFT作為一種數(shù)據(jù)表示形式,為了實(shí)現(xiàn)較好的時(shí)頻特征提取,實(shí)際上需要一些知識來設(shè)置合適的參數(shù)。
表2 數(shù)據(jù)表示形式的研究Tab.2 Research of data representation
文獻(xiàn)[42]發(fā)現(xiàn),在使用復(fù)數(shù)CNN模型時(shí),采用I/Q+FFT表示形式比I/Q表示形式更好。文獻(xiàn)[90]發(fā)現(xiàn),在使用LSTM模型時(shí),采用I/Q+NL表示形式相比NL表示形式?jīng)]有顯著提升,但是結(jié)果更加穩(wěn)定。文獻(xiàn)[51]發(fā)現(xiàn),在低信噪比下,F(xiàn)FT表示形式比I/Q表示形式更好。文獻(xiàn)[91]發(fā)現(xiàn),差分I/Q表示形式比I/Q表示形式更好,需注意雖然差分處理能夠減輕相位旋轉(zhuǎn)、載頻偏移和多普勒效應(yīng)的影響,但是合適的延遲參數(shù)仍需要手工設(shè)置。文獻(xiàn)[85]發(fā)現(xiàn),在使用CNN模型時(shí),I/Q表示形式和A/φ表示形式更好,對變化信道更具魯棒性,可推測在頻域中信道對射頻指紋的影響比時(shí)域中更大。文獻(xiàn)[26]發(fā)現(xiàn),STFT表示形式比I/Q表示形式和FFT表示形式都好,在采取頻偏補(bǔ)償后,3種表示形式的模型正確率都得到了顯著提升。文獻(xiàn)[50]發(fā)現(xiàn),在設(shè)備數(shù)量少于10個(gè)時(shí),LSTM網(wǎng)絡(luò)模型與A/φ表示形式和STFT表示形式的結(jié)合優(yōu)于其他組合方式;在設(shè)備數(shù)量為10~49個(gè)時(shí),A/φ表示形式優(yōu)于幾乎其他所有情況;在設(shè)備數(shù)量大于50時(shí),I/Q,A/φ,STFT 3種表示形式時(shí)模型的性能都很差。文獻(xiàn)[66]發(fā)現(xiàn),在使用CNN模型時(shí),在LoRa數(shù)據(jù)集上,I/Q表示形式更好;在Wired和WiFi數(shù)據(jù)集上,A/φ表示形式更好;在使用復(fù)數(shù)CNN模型時(shí),在LoRa和WiFi數(shù)據(jù)集上,I/Q表示形式更好,在Wired數(shù)據(jù)集上,A/φ表示形式更好。
綜上所述,射頻指紋識別的最佳數(shù)據(jù)表示形式與深度學(xué)習(xí)架構(gòu)、信號類型和任務(wù)規(guī)模相關(guān),如文獻(xiàn)[50]的研究中發(fā)現(xiàn),3種數(shù)據(jù)表示形式和兩種網(wǎng)絡(luò)模型的不同組合產(chǎn)生的性能就有很大不同,文獻(xiàn)[26]和文獻(xiàn)[50]的研究都發(fā)現(xiàn)對于LoRa這種線性調(diào)頻信號,針對時(shí)頻特征提取的STFT表示形式更具優(yōu)勢。因此,所設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)盡可能利用I/Q及其衍生的其他數(shù)據(jù)表示形式,且當(dāng)數(shù)據(jù)表示形式與網(wǎng)絡(luò)模型相適合時(shí)才會(huì)獲得較好效果,通過某種簡明的判別條件在多種數(shù)據(jù)表示形式或其組合中快速搜索最優(yōu)數(shù)據(jù)表示形式,也許是一種兼顧正確率與效率的方法。
非合作條件下,有效數(shù)據(jù)少,DNN模型得不到充分訓(xùn)練,容易發(fā)生過擬合,而且非合作還意味著需要在未知環(huán)境下進(jìn)行射頻指紋識別,由此導(dǎo)致的訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)分布不一致也是一大挑戰(zhàn)。使用信號協(xié)議知識均衡信道可能同時(shí)消除信道環(huán)境和射頻指紋特征,但均衡不能推廣到所有的信號類型[31],數(shù)據(jù)增強(qiáng)(Data Augmentation,DA)方法是一種緩解以上問題的有效措施。數(shù)據(jù)增強(qiáng)方法能夠在一定程度上彌補(bǔ)訓(xùn)練樣本匱乏的問題,并且通過賦予數(shù)據(jù)多樣性,能夠緩解過擬合問題,降低對某些混雜因素的敏感性,提高DNN模型的泛化能力。數(shù)據(jù)增強(qiáng)方法可以看作一種對深度學(xué)習(xí)模型的正則化處理[92]手段,與Dropout、權(quán)重衰減等顯式手段不同,數(shù)據(jù)增強(qiáng)方法并沒有降低網(wǎng)絡(luò)模型的容量和增加計(jì)算復(fù)雜度。數(shù)據(jù)增強(qiáng)方法已在圖像識別等任務(wù)中獲得成功應(yīng)用,在無線電信號調(diào)制識別任務(wù)中,有疊加高斯噪聲[93]、施加信道衰落效應(yīng)等數(shù)據(jù)增強(qiáng)方法。與信號調(diào)制特征不同,射頻指紋特征更容易受信道等混雜因素影響,如何進(jìn)行數(shù)據(jù)增強(qiáng)、提高射頻指紋在混雜因素下的魯棒性是值得研究的問題。下面對射頻指紋識別的數(shù)據(jù)增強(qiáng)方法進(jìn)行回顧討論。
(1) 高斯白噪聲
添加不同信噪比的高斯白噪聲可以模擬收發(fā)機(jī)間不同距離的衰減,是最常用的數(shù)據(jù)增強(qiáng)方法,該方法可以使模型在不同信噪比下都具有較好的性能。Shen等人[27]使用高斯白噪聲進(jìn)行射頻指紋數(shù)據(jù)增強(qiáng),分別采用在線、離線和無增強(qiáng)策略訓(xùn)練了Transformer模型,實(shí)驗(yàn)表明在線增強(qiáng)策略訓(xùn)練的模型在噪聲魯棒性方面更好,訓(xùn)練時(shí)間比離線增強(qiáng)策略的時(shí)間長。
(2) 信道衰落模型
特定信道環(huán)境下訓(xùn)練數(shù)據(jù)建立的模型可能隨著信道環(huán)境的變化而惡化[19],無線信道衰落模型是對實(shí)際無線信道統(tǒng)計(jì)上的仿真,包含了實(shí)際無線信道的知識,通過在訓(xùn)練數(shù)據(jù)添加信道衰落效應(yīng)可以提升模型對特定信道變化的魯棒性,如Merchant等人[94]使用Rayleigh信道模型進(jìn)行數(shù)據(jù)增強(qiáng),在訓(xùn)練數(shù)據(jù)中引入了多徑效應(yīng),使得模型在多徑環(huán)境下的性能下降更?。籄l-Shawabka等人[50]通過同時(shí)使用ITU-R信道衰落模型和高斯白噪聲,將測試與訓(xùn)練數(shù)據(jù)集為同一天情況下的正確率從82%提高到91%,將測試與訓(xùn)練數(shù)據(jù)集不在同一天的正確率從19%提高到36%;Shen等人[84]同時(shí)使用信道衰落模型和高斯白噪聲進(jìn)行數(shù)據(jù)增強(qiáng),其中信道衰落模型同時(shí)考慮了多徑效應(yīng)和多普勒效應(yīng),將高速場景(多普勒頻移為100 Hz)下的正確率從68.6%提升到80%以上。
(3) 頻率偏移模擬
發(fā)射機(jī)和接收機(jī)之間振蕩器的頻率失配會(huì)產(chǎn)生載波頻率偏移,溫度、器件老化等因素都可能產(chǎn)生頻率偏移,而且采用高精度的發(fā)射機(jī)也可以對頻率偏移進(jìn)行模擬,因此頻率偏移并不是可靠的射頻指紋,可以通過在信號中引入頻率偏移和相位偏移來緩解由此產(chǎn)生的誤分類[33]。Cekic等人[19]采用了同時(shí)使用信道衰落模型和載波頻率偏移(Carrier Frequency Offset,CFO)的數(shù)據(jù)增強(qiáng)方法,發(fā)現(xiàn)隨著訓(xùn)練數(shù)據(jù)集中包含的不同時(shí)間段訓(xùn)練樣本的增多,該數(shù)據(jù)增強(qiáng)方法的效果越來越接近于采用載波頻率偏移補(bǔ)償和數(shù)據(jù)增強(qiáng)的組合方法,也即在沒有先驗(yàn)知識的情況下可以通過豐富數(shù)據(jù)多樣性來彌補(bǔ)先驗(yàn)知識的不足。
(4) 復(fù)數(shù)濾波器
采用信道衰落模型的數(shù)據(jù)增強(qiáng)方法實(shí)際上對所使用的信道衰落模型有一個(gè)要求,即所施加的信道衰落模型與未知信道環(huán)境存在一定的相似性,當(dāng)對信道環(huán)境未知時(shí),該選擇哪一種信道衰落模型是一個(gè)難題。Soltani等人[61]利用復(fù)數(shù)FIR濾波器模擬無線信道對無線電信號幅度和相位的影響,引入類似信道衰落和噪聲失真來進(jìn)行數(shù)據(jù)增強(qiáng),使模型對未知的噪聲和信道變化具有魯棒性,該方法不需要有關(guān)波形的先驗(yàn)知識,實(shí)驗(yàn)表明使用數(shù)據(jù)增強(qiáng)后,CNN模型的分類正確率得到了至少35%的提升。
此外,還有利用變分自動(dòng)編碼器(Variational AutoEncoders,VAE)[95]、生成對抗網(wǎng)絡(luò)(GAN)[39]和偽隨機(jī)積分[96]等進(jìn)行射頻指紋識別的數(shù)據(jù)增強(qiáng)方法,并且不同的數(shù)據(jù)增加方法可以組合使用。
目前,在合作條件下或已具備部分先驗(yàn)信息的條件下,并且訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)的信道環(huán)境變化較小時(shí),射頻指紋識別能夠取得很好的效果,并且在一些大規(guī)模數(shù)據(jù)集上進(jìn)行了驗(yàn)證。但是在信道環(huán)境未知,信號調(diào)制方案等先驗(yàn)信息匱乏時(shí),開展射頻指紋識別仍然是一件困難的任務(wù),而且隨著輻射源個(gè)體數(shù)量的增加,難度還會(huì)不斷提升。本文從非合作條件下的射頻指紋識別需求出發(fā),首先對射頻指紋識別研究的總體情況進(jìn)行概覽,剖析了特征工程方法和深度學(xué)習(xí)方法在射頻指紋識別中的優(yōu)缺點(diǎn),在跟蹤和查閱了近年來國內(nèi)外研究動(dòng)態(tài)的基礎(chǔ)上,指出基于Raw I/Q和深度學(xué)習(xí)的方法是解決非合作條件下射頻指紋識別的一條非常有潛力的技術(shù)途徑。然后按照CNN模型、RNN模型、Transformer模型以及幾何深度學(xué)習(xí)方法的分類,對已提出的各種直接使用Raw I/Q進(jìn)行射頻指紋識別的DNN模型進(jìn)行總結(jié)分析,討論了各模型的優(yōu)缺點(diǎn)和適用范圍,厘清了各種模型的發(fā)展脈絡(luò),并指出通過對網(wǎng)絡(luò)模型進(jìn)行合理的對稱性假設(shè),賦予網(wǎng)絡(luò)歸納偏好能夠更高效的利用數(shù)據(jù)、減輕數(shù)據(jù)搜集的負(fù)擔(dān)、提升網(wǎng)絡(luò)模型的泛化能力。最后,對目前分散于各項(xiàng)研究中有關(guān)射頻指紋識別的開源數(shù)據(jù)集資源、數(shù)據(jù)表示方法和數(shù)據(jù)增強(qiáng)方法進(jìn)行了系統(tǒng)的分類、整理和歸納,為后續(xù)研究工作提供一個(gè)較為清晰的方向。
將深度學(xué)習(xí)引入射頻指紋識別研究中,能夠簡化處理流程、形成統(tǒng)一的處理框架、降低對特定領(lǐng)域知識的要求。雖然在無線信道、頻率偏移等混雜因素影響下的射頻指紋識別研究已取得了一定進(jìn)展,并初步探索了協(xié)議無關(guān)、信道彈性的射頻指紋識別方法,但是射頻指紋面臨的混雜因素多且難以控制,深度學(xué)習(xí)方法還在持續(xù)完善和更新,仍然存在許多難點(diǎn)問題需要深入研究,仍然有大量的基礎(chǔ)性研究工作有待推動(dòng)。如深度學(xué)習(xí)具有黑盒建模的特點(diǎn),其可解釋性偏弱,關(guān)于深度學(xué)習(xí)的可解釋性研究是一個(gè)值得注意的方向;各種混雜因素會(huì)導(dǎo)致數(shù)據(jù)分布的變化,進(jìn)而導(dǎo)致深度學(xué)習(xí)模型性能的惡化,而遷移學(xué)習(xí)[97]能夠根據(jù)任務(wù)和環(huán)境的變化進(jìn)行源域到目標(biāo)域的遷移,是應(yīng)對數(shù)據(jù)分布變化的一種有效手段;目前大部分射頻指紋識別是研究閉集分類問題,即研究如何在一個(gè)有限集合內(nèi)進(jìn)行射頻指紋識別,而如何對未知輻射源進(jìn)行開集識別[41]是一個(gè)更貼近實(shí)際應(yīng)用的問題;多輻射源下的射頻指紋識別是一個(gè)典型的工作場景,在多信號混合[98]時(shí),如何在不損失各個(gè)信號射頻指紋的情況下,可靠、高效地分離多個(gè)信號是一個(gè)難點(diǎn);接收機(jī)也會(huì)引入相位噪聲、時(shí)鐘偏移、IQ不平衡等畸變,從而對發(fā)射機(jī)的射頻指紋產(chǎn)生不利影響,如何減小接收機(jī)對射頻指紋的影響,實(shí)現(xiàn)射頻指紋在不同接收機(jī)之間的傳遞是一個(gè)值得研究的方向。此外,元學(xué)習(xí)[35]、聯(lián)邦學(xué)習(xí)[99]、孿生神經(jīng)網(wǎng)絡(luò)[100]等方法也逐漸被應(yīng)用在射頻指紋識別中,射頻指紋識別算法的邊緣計(jì)算節(jié)點(diǎn)部署工作[101,102]也已開展研究,隨著深度學(xué)習(xí)方法在理論、算法、模型、應(yīng)用等方面的不斷進(jìn)步,射頻指紋識別面臨的各種難題也將有所突破。