劉壯 李陸 楊軒
摘? 要: 計算機電磁泄漏引發(fā)的信息安全問題日益嚴峻。計算機除了會通過電磁波泄漏處理的信息內容之外,也會泄漏反映計算機個體唯一性的指紋特征,稱為電磁指紋。由于內部硬件結構與工藝差異,不同計算機個體具有不同的電磁指紋。為此,分析了計算機電磁指紋產生的原因及表現(xiàn)形式,構建簡化的計算機電磁泄漏信號產生模型,并基于產生模型將線性預測分析算法應用于計算機電磁指紋提取,最后基于電磁指紋實現(xiàn)計算機身份唯一性鑒別。分析結果表明,利用線性預測系數(shù)可以在復雜電磁環(huán)境中成功鑒別出計算機個體。
關鍵詞: 電磁信息安全; 電磁泄漏; 電磁指紋; 線性預測分析; 計算機個體識別
中圖分類號:TN924;TP309? ? ? ? ? 文獻標識碼:A? ? ? 文章編號:1006-8228(2022)05-19-06
Research on electromagnetic fingerprint extraction and
identification technology of computer
Liu Zhuang Li Lu Yang Xuan
Abstract: The information security issues caused by computer electromagnetic leakage are increasingly serious. In addition to the information content leakage by the electromagnetic wave, the computer will also leak the fingerprint feature information that reflects the uniqueness of the computer which called electromagnetic fingerprint. Different computers have different electromagnetic fingerprints due to the internal hardware structure and process difference. In this paper, the causes and manifestations of computer electromagnetic fingerprints are analyzed, and a simplified computer electromagnetic leakage signal generating model is constructed. Based on this model, the linear prediction analysis algorithm is used to extra the computer electromagnetic fingerprint and identify computer individual. Results show that computer individuals can be successfully identified in complex electromagnetic environments by using linear prediction coefficients.
Key words: electromagnetic information security; electromagnetic leakage; electromagnetic fingerprint; linear prediction analysis; computer identification
引言
以計算機為主的信息設備在工作時會產生不同程度的電磁泄漏信號,這類信號中可能含有設備處理的敏感信息,通過一定的設備和算法可將其接收還原,因此對計算機電磁泄漏發(fā)射的安全防護尤為重要。計算機電磁泄漏信號中除了包含其處理的信息內容外,還包含能反映出設備身份唯一性的指紋特征,即電磁指紋。研究計算機電磁指紋提取與計算機個體唯一性鑒別,可應用于電磁信號監(jiān)測、信息泄漏發(fā)射源確定、惡意改裝設備和惡意硬件植入設備檢測,實現(xiàn)對計算機有針對性地管控和防護,這對我國信息安全保密具有重要的意義。
基于計算機電磁泄漏信號提取電磁指紋進而識別計算機個體與基于電磁信號識別無線通信設備類似,后者稱為特定輻射源識別(Specific emitter identification,SEI)。輻射源識別技術是通過信號處理方法從接收的電磁信號中提取出不同輻射源的本質差異信息,從而分辨通信輻射源個體,這一概念最早由美國軍方提出。在國內外傳統(tǒng)的輻射源識別研究中,多提取設備的開機瞬態(tài)電磁信號特征或穩(wěn)態(tài)電磁信號特征,所用算法多為分形維數(shù)、小波變換、時頻分析等算法[1],這些算法大都基于由設備主動發(fā)射的調制信號。與通信輻射源電磁指紋提取不同的是,計算機電磁指紋的提取是基于計算機在工作時無意識泄漏出去的寬帶信號,其信號微弱、頻率成分復雜,同時又容易受到背景噪聲和環(huán)境響應的影響[5]。計算機電磁泄漏信號從檢測、接收、采集到特征分析都和通信輻射源有巨大差異,相關公開的研究工作也較少。
最近兩年在RFID領域出現(xiàn)了類似的研究,研究人員試圖提取各種電子產品固有的電磁指紋來取代額外的RFID身份標簽[6],C.Yang和A.P.Sample利用近場天線采集各種電子玩具、手機和筆記本在0~500KHz頻段的低頻電磁噪聲信號,利用高維余弦相似度對各種設備進行鑒別,正確率從70%~90%不等。Mo Fan等采用支持向量機的方法以頻譜幅度為特征對LCD顯示器進行分類[7];2017年,Sun-Degang和Shi Jun等分別研究了高階累積量和頻譜質心兩種指紋特征在計算機主機和LCD顯示屏個體識別中的應用,在一定的信噪比下,識別率達到了90%[8]。2021年,裴林聰?shù)热嘶谏疃葘W習模型實現(xiàn)對不同分辨率來源電磁泄漏信號的識別[9]。
目前對計算機電磁指紋提取的研究整體較少,所提出的電磁指紋主要針對內容相關(顯示器顯示的內容保持不變)下的計算機識別,無法應對復雜多變電磁環(huán)境以及內容無關(顯示器顯示不同內容)時的計算機個體識別。為了能從復雜的電磁泄漏信號中提取計算機電磁指紋,本文分析了計算機電磁泄漏信號中與個體身份唯一性有關的特征,構建出簡化的電磁泄漏信號產生模型;基于此模型從電磁泄漏信號中提取出不受計算機視頻信息影響的電磁指紋,最后實現(xiàn)計算機個體識別。
1 計算機電磁指紋產生機理分析
1.1 計算機視頻信號對電磁泄漏信號的影響
計算機顯示輸出視頻信號的包絡是具有一定周期的脈沖波形[10],如圖1所示。由于脈沖信號具有一定的上升沿和下降沿時間[τr],該周期脈沖實為周期梯形波。其中A為脈沖幅度,[τ]為梯形波脈沖寬度,為顯示器掃描一行所需時間;顯示器從一行掃描到下一行時會有一段消隱時間,因此脈沖周期T要略大于脈沖寬度。
這里直接給出計算機視頻信號的對數(shù)功率譜[11]。
梯形波功率譜包絡大致可分成三部分:第一部分近似一條水平直線,第二部分和第三部分為斜率不同的直線,如圖2所示,兩個拐點頻率分別為[1/τ]和[1/τr]。
通過對計算機電磁泄漏信號的接收還原可以恢復計算機屏幕顯示的信息[12]。因此,電磁泄漏信號直接攜帶計算機顯示輸出的視頻信息。如圖3所示,在相同頻段下同一計算機在顯示三種不同內容時電磁泄漏信號功率譜存在明顯差異。
1.2 計算機整機輻射性能對電磁泄漏信號的影響
計算機電磁泄漏信號是計算機視頻信號通過主機、視頻線纜和顯示器的共同作用輻射出去,而不同材質、長度的視頻線纜的輻射能力存在差異,不同的主機和顯示器個體對于視頻線纜來說相當于不同的負載,對視頻線纜的輻射也會產生一定影響[13],如圖4所示,在相同頻段下不同計算機在顯示同樣內容時的電磁泄漏信號功率譜也存在明顯差異,這類差異可以歸結于計算機整機輻射性能差異,由計算機硬件結構、生產工藝等計算機固有特性所影響。因此,計算機整機輻射性能特征是一種計算機身份唯一性標識。
綜上,計算機電磁泄漏信號中既攜帶了計算機視頻圖像特征,又包含計算機整機輻射性能特征。其中視頻圖像特征是和計算機個體身份唯一性無關的特征,在后續(xù)特征提取中應消除其影響;計算機整機輻射性能是計算機電磁指紋產生的原因。因此,本文構建以下電磁泄漏信號產生模型,如圖5所示。
圖5中[u(n)]代表計算機視頻信號,[h(n)]表示計算機整機作用的沖擊響應,[s(n)]為直接觀測到得電磁泄漏信號。這里將計算機整機作用看做一個線性系統(tǒng),電磁泄漏信號是計算機視頻信號混雜著背景噪聲,經(jīng)過計算機整機的輻射而產生。
2 基于線性預測分析的電磁指紋提取
根據(jù)上述分析,計算機視頻信號[u(n)]包含了與電磁指紋無關的信息內容特征,[hn][h(n)]只包含計算機整機輻射性能特征,因此提取[h(n)]特征也就提取出一種計算機電磁指紋。根據(jù)上一章分析計算機電磁泄漏信號可簡化為一個周期梯形波經(jīng)過一個線性系統(tǒng)所產生,根據(jù)線性系統(tǒng)的原理,計算機電磁泄漏信號在某個時刻的采樣值可以用之前時刻的采樣值線性組合來逼近,從而對電磁泄漏信號的波形進行估計和預測,這就是線性預測分析的原理。
為了確定一個電磁泄漏信號樣本的預測系數(shù),需要讓線性預測值和實際信號采樣值之間的均方誤差最小,這一組系數(shù)即為線性預測系數(shù)(Linear Prediction Coefficient, LPC)。
根據(jù)上述思想,如果用某一時刻n的前p個采樣值[{s(n-1),s(n-2),...,s(n-p)}]的線性組合來預測這一時刻的取樣值[s(n)],得到的預測信號[s(n)]為:
其中[ak]即為線性預測系數(shù)。為了使預測效果最優(yōu),需要使預測誤差均方值最小,基于此設定建立方程,求解方程就可以求得線性預測系數(shù)[ak],它消除了計算機視頻信號的影響,是計算機整機輻射特性參數(shù)的表征,因此線性預測系數(shù)可以用來計算機電磁指紋提取。
3 計算機個體識別算法
3.1 基于支持向量機(Support Vector Machine,SVM)的計算機個體識別算法
圖6為計算機電磁泄漏信號采集與電磁指紋提取流程。使用雙錐天線接收計算機電磁泄漏信號,通過IQ變換采集到時域電磁泄漏信號,經(jīng)過分幀、加窗等預處理操作,對每一幀信號提取LPC,最后再將各幀LPC組合,即可得到每一個采樣樣本的電磁指紋。最后基于提取的電磁指紋選擇合適的分類器進行判別分析。
本文和文獻[8]中提出的頻譜質心(SC)算法進行對比,分別進行了單一時間地點下內容相關(情況1)、內容無關(情況2)的個體識別、多時間多地點內容無關(情況3)的個體識別。表1是采用SVM對五臺計算機的識別結果:對于單一時間環(huán)境下內容相關的計算機個體識別(測試時計算機顯示的信息內容和訓練時顯示的信息內容一致),兩個特征的平均識別率在90%以上;對于單一時間環(huán)境下內容無關的個體識別(測試時計算機顯示的信息內容和訓練時顯示的信息內容不一致),兩種特征的識別率都有所下降,相比之下本文采用的LPC特征效果更好;對于多時間、多地點采集的計算機電磁泄漏信號,兩類特征的識別性能都大幅降低至75%以下。
究其原因,計算機電磁泄漏信號不僅會受到背景噪聲的干擾,同時信號采集設備、電磁波在房間中的多徑效應都會帶來非線性干擾,這些干擾都可以看作是“信道無關項”。為了消除信道無關項的干擾,本文采用高斯混合模型-身份認證矢量-概率線性判別分析(UBM-i-vector-PLDA)算法來對計算機電磁指紋識別。UBM-i-vector-PLDA算法可以有效消除信道無關項的干擾,已成功應用于聲紋識別等領域[14]。
3.2 基于UBM-i-vector-PLDA的計算機個體識別算法
一個基于UBM-i-vector-PLDA的計算機個體識別系統(tǒng)應該包括如下三個階段。
⑴ 首先要訓練高斯混合-通用背景模型(GMM-UBM)。所謂UBM模型是將所有背景設備的電磁信號數(shù)據(jù)看成同一臺設備的,將其訓練成一個大的GMM模型,目標設備的GMM模型則是在UBM模型上進行個性適應得到。這種UBM模型很好地解決了電磁信號樣本不足情況下訓練的GMM模型階數(shù)較低無法有效擬合電磁信號特征的空間概率密度分布的問題。
在背景訓練階段,采集大量計算機電磁信號數(shù)據(jù)作為背景訓練數(shù)據(jù),這里可以將主機、顯示器和視頻線纜相互組合形成更多數(shù)量的計算機個體以解決訓練樣本不足的問題。本文將5臺計算機主機、5臺顯示器和10條計算機視頻線纜隨機組合,然后利用背景計算機電磁信號提取LPC特征,再訓練GMM-UBM模型得到背景計算機的均值超矢量。
⑵ 注冊階段,對新的若干計算機個體提取LPC特征,在已經(jīng)訓練好的UBM的基礎上,通過最大后驗概率算法進行參數(shù)微調,最后求注冊計算機的身份認證矢量i-vector,這里用model_iv表示。已經(jīng)注冊好的計算機便存在于電磁指紋庫中。
⑶ 測試階段,對一臺已經(jīng)存在于電磁指紋庫中但型號未知的計算機,采用同樣的方法提取特征求i-vector,用test_iv表示。最后再利用概率線性判別分析(Probabilistic Linear Discriminant Analysis,PLDA)對test_iv和model_iv進行打分判決。
整個系統(tǒng)框圖如圖7所示。
4 實驗結果分析
UBM-i-vector-PLDA系統(tǒng)在訓練和測試的流程中涉及到一些參數(shù),下面將研究這些參數(shù)對系統(tǒng)性能的影響。
4.1 訓練樣本采樣時長、采樣率對系統(tǒng)性能影響
樣本信號采樣時間越長包含的信息量越多,系統(tǒng)性能越好。而當采樣時間超過0.016S時,系統(tǒng)性能幾乎不再變化,主要原因就是測試時計算機顯示器場刷新頻率為60Hz,0.016S已經(jīng)接近一場視頻信號的時長,因此采樣時間大于0.016S時信號存在冗余。因此樣本采樣時長取一場視頻信號的時長最合適。
信號采樣帶寬越大,頻率分量越豐富。對于計算機電磁泄漏信號還原的最低帶寬通常為5MHz,此時電磁泄漏信號已經(jīng)可以還原出視頻信息,即可滿足訓練樣本的最低采樣率要求;而受限于接收機的性能,采樣率最高只能達到40M,因此最佳帶寬選取20MHz;隨著帶寬的增加,采樣率成倍增加,每條樣本占用內存也成倍增加,嚴重影響系統(tǒng)效率。
4.2 UBM計算機個數(shù)和測試計算機個數(shù)對系統(tǒng)性能影響
背景訓練階段采用7臺計算機主機、7臺顯示器和10條視頻線纜隨機組合,每種組合方式代表一個計算機個體;注冊和測試階段需采用不同于訓練階段的組合方式。實驗中UBM計算機個數(shù)分別為20、30、40、50,注冊、測試計算機個體數(shù)分別為2、3、4、5、6、8、10、15,下面將研究不同UBM計算機個數(shù)對系統(tǒng)性能的影響。
如圖8所示,圖的橫坐標表示訓練和測試計算機個數(shù),縱坐標表示平均等錯誤率(Equal Error Rate,EER),不同折線表示不同的UBM計算機個數(shù)。由圖可以看出,當注冊和測試樣本個數(shù)保持一定時,隨著UBM計算機個數(shù)的增加,系統(tǒng)EER在不斷降低;當UBM計算機個數(shù)達到40 時,系統(tǒng)性能趨于穩(wěn)定,若繼續(xù)增加訓練樣本個數(shù)性能提升效果可能并不明顯。當UBM計算機個數(shù)保持一定時,隨著注冊和測試樣本的增加,系統(tǒng)EER逐漸上升,即性能逐漸下降;而當UBM計算機個數(shù)較多(不少于40)時,測試計算機個數(shù)的增加對系統(tǒng)EER影響較小。因此,UBM計算機個數(shù)選取40為最佳。
為了測試信道干擾對系統(tǒng)性能的影響,本文從不同時間段、不同實驗環(huán)境下采集電磁信號進行訓練。圖9是單日采集的數(shù)據(jù)和多日采集的數(shù)據(jù)訓練和識別效果(采樣時常0.016S,采樣帶寬20MHz,UBM計算機個數(shù)為40,注冊計算機個數(shù)為5):
電磁泄漏信號識別結果混淆矩陣
圖9分別是同一天三個房間采集的電磁信號和不同天三個房間采集的電磁信號提取LPC特征在內容無關的情況下訓練和測試的結果。從混淆矩陣中可以看出,單日多地點采集的信號由于房間響應、環(huán)境噪聲等并無變化,因此系統(tǒng)的平均識別率較高,達到90.68%;對于多日、多地點采集的數(shù)據(jù)訓練識別結果雖然有所降低,但依然保持了88.95%的平均識別率。因此本文提取的LPC特征和采用的UBM-i-vector-PLDA模型可對計算機個體唯一性進行有效鑒別。
5 結束語
本文基于電磁信息安全的角度研究了計算機電磁泄漏信號電磁指紋提取方法和基于電磁指紋的計算機個體唯一性鑒別。本文首先定性分析了計算機視頻信號和計算機整機輻射性能對電磁泄漏信號的影響,確定影響計算機電磁指紋產生的因素,并構建計算機電磁泄漏信號產生模型;基于構建的模型,采用線性預測系數(shù)分析電磁泄漏信號特征,提取計算機電磁指紋;最后采集不同時間、不同環(huán)境的計算機電磁泄漏信號提取電磁指紋,利用UBM-i-vector-PLDA算法對電磁指紋進行分類識別。
實驗結果證明,本文提出的電磁指紋提取算法可有效鑒別出計算機個體。后續(xù)應進一步研究計算機電磁指紋產生機理,給出計算機電磁指紋定量化地描述,以便更有加針對性地提取電磁指紋。此外,本文的研究都是針對單個計算機采集的信號,不存在多臺計算機電磁泄漏信號混淆在一起的情況。因此需要進一步結合信號分離技術對多計算機信號混淆的情況進行分離和識別。
參考文獻(References):
[1] H. Choe, C.E. Poole, A.M. Yu. Novel Identification of
Intercepted Signals from Unknown Radio Transmitters[C]. Proceedings of SPIE, the International Society for Optical Engineering,1995, 2491:504-516
[2] D. Shaw, W. Kinsner. Multifractal Modelling of Radio
Transmitter Transients for Classification[C]. IEEE Proceedings of ICCPC97,1997:306-312
[3] GILLESPIE B W, ATLAS L E. Optimizing time-frequency
kernels for classification[J]. IEEE transactions on signal processing,2001,49(3):485-496
[4] 許丹.輻射源指紋機理及識別方法研究[D].國防科技大學,
2008
[5] Yukio Yamanaka, and Kaori Fukunaga. Method for
Determining Whether or Not Information is Contained in Electromagnetic Disturbance Radiated From a PC Display[J].IEEE transactions on Electromagnetic Compatibility,2011,53(2):318-324
[6] C.Yang ,A.P.Sample. "EM-ID: Tag-less identification of
electrical devices via electromagnetic emissions"[C]. Proc. IEEE Int. Conf. RFID (RFID). Orlando,2016(5):1-8
[7] Mo Fan,Luyinghua, Zhangjinling, et al.Support vector
machine foridentification of monitors based on their unintended electromagneticemanation[J],Progress In Electromagnetics Research M,2013,46(3):211-224
[8] Sun Degang, Shi Jun, Wei Dong, Zhang Meng. A New
method to recognize computer through electromagnetic radiation[C].Asia-Pacific international symposium on electromagnetic compatibility. Shenzhen,2016
[9] 裴林聰,張游杰,馬通邊,等.基于深度學習的計算機顯示器電
磁信息泄漏識別[J].計算機系統(tǒng)應用,2021, 30(8):7
[10] Kuhn M G. Electromagnetic Eavesdropping Risks of
Flat-Panel Displays[C].Proceedings of the 4th international conference on Privacy Enhancing Technologies. Springer Berlin Heidelberg,2004.
[11] Wang L,Yu B. Research on the compromising
electromagnetic emanations from digital signals[C]. International Conference on Automatic Control & Artificial Intelligence. IET,2013
[12] 徐艷云,郭佳,李怡偉,等.信息設備電磁泄漏還原圖像的文
本識別研究[J].信息安全研究,2016(2):6
[13] 霍宏艷,張曉剛,葉暢,等.HDMI電纜對受試設備輻射騷擾
場強的影響[J].安全與電磁兼容,2018(6):77-80,89
[14] P Kenny. A small footprint I-Vector extractor[C].
Proceedings of Odyssey Speaker and Language Recognition Workshop, Singapore,2012(6)
收稿日期:2021-10-26
作者簡介:劉壯(1994-),男,安徽人,碩士,助理工程師,主要研究方向:電磁信息安全、物理空間安全、網(wǎng)絡安全測評。