王威,安騰飛,歐建平
?
無人機被動音頻探測和識別技術(shù)研究
王威1,安騰飛1,歐建平2
(1. 長沙理工大學(xué)計算機與通信工程學(xué)院綜合交通運輸大數(shù)據(jù)智能處理湖南省重點實驗室,湖南長沙 410114; 2.國防科技大學(xué)電子科學(xué)與工程學(xué)院,湖南長沙 410073)
為解決近場空域低、慢、小旋翼無人機的安全威脅,提出基于音頻信號分析的無人機探測識別方法。該方法采用改進流程和參數(shù)的梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coeffi-cients, MFCC)和其一階差分作為無人機音頻的特征參數(shù),結(jié)合提出的多距離分段采集法,通過訓(xùn)練高斯混合模型(Gaussian Mixture Model, GMM),建立多特征的無人機音頻“指紋庫”,最后用特征匹配算法實現(xiàn)無人機的探測和識別。實驗結(jié)果表明,所提出的方法在典型郊區(qū)環(huán)境中可實現(xiàn)150 m距離內(nèi)無人機的探測和識別,識別率達(dá)到84.4%。
無人機;探測和識別;梅爾頻率倒譜系數(shù);高斯混合模型
2016年被稱為消費級無人機元年,無人機在各行業(yè)廣泛應(yīng)用的同時也帶了很大的負(fù)面影響。近年來,國內(nèi)外常報道無人機用于走私、恐怖襲擊、侵占航線、侵犯隱私等非法用途。湖北日報微信號2017年06月21日報道:據(jù)民航部分公布的數(shù)據(jù),2015年,全國發(fā)生無人機干擾民航飛行事件4起,2016年則發(fā)生23起,2017年僅僅上半年已經(jīng)發(fā)生超過40起。對于無人機的探測和監(jiān)管已迫在眉睫,因此,對無人機的探測和識別也顯得尤為重要。
國內(nèi)對于消費級無人機探測的研究較少,日本、法國、美國、俄羅斯等國家則已經(jīng)相繼推出了無人機探測和反制系統(tǒng)。目前已有基于紅外、圖像、無線信號、音頻等技術(shù)來探測無人機的方法[1-4]。József Mezei等[5]利用互相關(guān)法證明了音頻探測無人機的可行性,文獻(xiàn)[6]在音頻信號處理方面,使用了基于距離的思想實現(xiàn)近距離無人機探測和識別。文獻(xiàn)[7-9]使用傳聲器陣列技術(shù),基于波束形成及到達(dá)時間差 (Time Difference of Arrival,TDOA) 探測無人機,但只做到了大致的定向。
隨著語音識別方法的逐漸成熟,考慮到語音和無人機音頻的一些共性,很多專家和學(xué)者也嘗試著將一些語音識別的方法應(yīng)用于無人機探測。C Asensio等[10]使用MFCC來分辨無人機聲音以及非無人機聲音,在近距離和信噪比較高的情況下,具有很好的識別率,但沒有考慮不同距離情況下無人機信號所表現(xiàn)的差異性。Louise Hauzenberger等[11]使用了線性預(yù)測系數(shù)(Linear Predictive Coefficient, LPC)結(jié)合短時過零率和短時能量的方法,可以在消音室環(huán)境下實現(xiàn)類型識別。Sungho Jeon等[12]針對特定條件下使用MFCC特征作為神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù),達(dá)到了較好的識別率,但需要大量的環(huán)境模擬數(shù)據(jù),訓(xùn)練樣本是無人機信號和環(huán)境信號的人工混合信號,并要求無人機信號比環(huán)境峰值高出5%,雖然增加了訓(xùn)練樣本量,但不能完全反映無人機飛行的真實環(huán)境狀況。
目前常用的音頻特征識別有隱馬爾科夫模型(Hidden Markov Model,HMM)、支持向量機模型(Support Vector Machine,SVM)以及高斯混合模型。本文結(jié)合無人機飛行特點和傳聲器實際響應(yīng)距離,提出訓(xùn)練數(shù)據(jù)采集法,改進流程,優(yōu)化MFCC參數(shù),最后使用GMM模型來實現(xiàn)對無人機音頻信號的檢測和識別。
以某型無人機為例進行特征分析。通過實際采集的時域信號可知,信號幅度隨著無人機的接近逐漸增大,隨著無人機的遠(yuǎn)離而逐漸減小,如圖1(a)所示。
如圖1(b)所示,無人機時頻圖音頻信號主要集中在低頻部分,當(dāng)無人機經(jīng)過錄音設(shè)備正上方時其高頻成分明顯加強。隨著無人機相對距離的變化,其頻率呈現(xiàn)出一定的多普勒效應(yīng)。
從圖1(c)可以看出,其頻率信號具有一定的倍頻關(guān)系。
通過分析多種類型的無人機音頻信號(無人機音頻噪聲)得知,無人機的音頻噪聲主要為氣動噪聲和機械噪聲。氣動噪聲主要來源于旋翼切割空氣及機體與空氣摩擦,該部分噪聲主要分布于聲音信號的低頻部分,在空氣中衰減慢,傳播距離較遠(yuǎn);機械噪聲則主要由電機以及傳動部件造成,該部分噪聲主要分布在信號的高頻部分,在空氣中衰減較快。
對于大多消費級無人機,高頻部分噪聲在距離地面50~80 m之后衰減很大,幾乎可以忽略不計,為了探測更遠(yuǎn)距離的無人機音頻信號,本文重點研究無人機音頻信號低頻部分的探測和識別方法。
不同于武裝直升機的氣動噪聲頻率范圍(30~400 Hz)[13],本文通過大量數(shù)據(jù)分析得知,無人機的氣動噪聲頻率范圍主要在130~2 000 Hz之間。頻率范圍與無人機電機類型(有刷電機和無刷電機)、外形結(jié)構(gòu)、旋翼個數(shù)、旋翼大小和長度、電機轉(zhuǎn)速等有關(guān)。
使用單傳聲器采集信號的情況下,遠(yuǎn)距離飛行的無人機的多普勒效應(yīng)和諧波現(xiàn)象不太明顯,旋翼個數(shù)對頻率的變化影響不大,這一特點對構(gòu)建無人機音頻“指紋庫”具有一定的指導(dǎo)意義。
另外,不同飛行狀態(tài)下的無人機特點表現(xiàn)有所不同,而大多數(shù)文獻(xiàn)中分析的是懸停狀態(tài)下的無人機音頻信號,故在實際應(yīng)用中效果并不理想。
本文提出的音頻信號探測和識別系統(tǒng)框圖如圖2所示。
圖2 無人機音頻探測和識別系統(tǒng)框圖
具體步驟如下:
(1) 預(yù)處理:對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進行預(yù)處理,包括降噪、帶通濾波、分幀和加窗;
(2) 特征提?。禾崛o人機音頻的靜態(tài)特征和動態(tài)特征;
(3) 模型訓(xùn)練:訓(xùn)練數(shù)據(jù)的GMM模型,構(gòu)建無人機音頻模板庫;
(4) 特征匹配:提取測試數(shù)據(jù)特征,通過特征匹配算法和無人機音頻模板庫進行匹配,得出識別結(jié)果。
在實際生活環(huán)境中,噪聲分布范圍較廣,對無人機的音頻信號具有全頻帶覆蓋的影響,由于無人機的音頻信號的低頻部分主要分布于130~2 000 Hz,因此,識別過程中先使用sym8小波對其進行三層分解,再選取200~1 800 Hz范圍的帶通濾波,濾除絕大部分高頻噪聲,最后對無人機音頻信號分幀,幀長為60 ms,幀移為30 ms,并選用漢寧窗減少頻譜泄漏。
Mel頻率能夠反映人耳對于不同頻率語音的感知能力,而Mel頻率倒譜系數(shù)(MFCC)利用了人耳聽覺原理和倒譜的相關(guān)特性,被廣泛應(yīng)用于音頻相關(guān)的識別任務(wù)中。因此實驗采用MFCC作為無人機音頻信號的基本特征參數(shù)。
為了更好地體現(xiàn)無人機音頻信號特點,本文在傳統(tǒng)求取MFCC基礎(chǔ)上對流程進行改進,使用幅度譜代替能量譜,具體流程如圖3所示。
圖3 改進的求解MFCC特征流程圖
根據(jù)得出的無人機音頻信號特征,基于無人機飛行特點和傳聲器實際響應(yīng)距離,本文提出多距離分段采集法。
在采集過程中,按照傳聲器實際響應(yīng)距離采集無人機訓(xùn)練數(shù)據(jù),每種型號的無人機至少在三種距離條件下分別采集懸停狀態(tài)和飛行狀態(tài)的音頻數(shù)據(jù),每個樣本的數(shù)據(jù)長度范圍30~50 s。三種距離分別是:
(1) 近距離樣本,采樣距離范圍為20~30 m;
(2) 半距離樣本,即按照傳聲器實際響應(yīng)距離的一半采集;
(3) 2/3距離樣本。
訓(xùn)練各種類型無人機的GMM模型參數(shù)的過程,也就是建立無人機音頻模板庫的過程。本文使用GMM模型來擬合無人機音頻特征數(shù)據(jù)。通過期望最大化(Expectation-Maximization,EM)[14]迭代算法迭代計算GMM模型中混合權(quán)重、每個高斯模型的均值和方差。如果高斯混合模型中高斯模型的個數(shù)過多則會出現(xiàn)“過擬合”現(xiàn)象,因此需選用合適的高斯模型個數(shù)。
將參數(shù)帶入后可得:
實驗軟件環(huán)境基于MATLAB8.0平臺實現(xiàn),采用i7雙核2.5 GHz CPU、4 GB內(nèi)存的普通筆記本電腦。所使用的音頻數(shù)據(jù)均采用DC-900拾音器配備音頻采集卡進行采集,采集地點在湖南省長沙市岳麓區(qū),實驗數(shù)據(jù)來自于DJI2、DJI3、DJI4、MavicPro、FPV250、ProMark P70、DJIS1000和某型植保無人機共8種大小結(jié)構(gòu)不同、型號各異、旋翼個數(shù)有所差別的市面上常用的消費級無人機。
訓(xùn)練數(shù)據(jù)在樓頂相對安靜的條件下按照2.3節(jié)的設(shè)定要求進行采集,測試數(shù)據(jù)在公園環(huán)境下采集(在采集部分測試樣本期間有戰(zhàn)斗機轟鳴聲和強烈鳥鳴聲),以驗證系統(tǒng)對無人機的識別性能。每種類型無人機測試數(shù)據(jù)保存規(guī)則如表1所示。
表1 測試數(shù)據(jù)保存規(guī)則
測試數(shù)據(jù)的采集規(guī)則如表2所示,根據(jù)無人機型號和限制飛行高度的實際情況按照規(guī)則進行采集,為了更貼近實際情況,使實驗更具有代表性,具體的高度信息和飛行狀態(tài)均是大概估計。
測試數(shù)據(jù)采用不同環(huán)境條件下不同距離段和不同飛行狀態(tài)的無人機音頻數(shù)據(jù),共采集到115個測試文件,總時間長度為65 min。為得出最小探測時間,本文把測試文件按照時間長度進行切分,再對切分后的文件進行識別。圖4為不同時間長度、不同高斯模型個數(shù)時系統(tǒng)的識別率。
表2 測試數(shù)據(jù)采集規(guī)則
圖4 不同時間長度和高斯模型個數(shù)條件下的識別率
由圖4可以看出,不同的時間長度下,當(dāng)高斯模型個數(shù)為3時,識別率最高。系統(tǒng)取高斯模型個數(shù)為3,再測定不同時間長度下的識別率,識別結(jié)果如表3所示。
表3 不同時間長度的測試樣本識別率(M=3)
從表3中可以看出,在樣本時間長度為2 s時,識別率為84.37%。
通過綜合分析可以看出,高斯模型個數(shù)為3,測試樣本時間長度大于1.5 s時,系統(tǒng)識別率可以達(dá)到80%以上;當(dāng)測試樣本長度達(dá)到2.5 s以上時,系統(tǒng)識別率超過85%。系統(tǒng)用時相對合理,達(dá)到了接近實時探測和識別的效果,可以在郊區(qū)環(huán)境中探測和識別無人機,也為以后無人機探測和識別提供了新思路。
本文提出了基于音頻特征的無人機探測和識別方法,通過對數(shù)據(jù)的測試和分析,表明該方法易于實現(xiàn),準(zhǔn)確性高,能夠滿足150 m距離內(nèi)對市面上常用無人機探測和類型識別的要求。在實際應(yīng)用中,可以進一步通過調(diào)整傳聲器高度及朝向來減少大部分來自地面的噪音干擾,提升系統(tǒng)的整體性能。今后的研究重點是使用波束形成技術(shù)實現(xiàn)無人機的定位、定向和更遠(yuǎn)距離的探測。
[1] POPOVIC V, OTT B, WELLIG P, et al. Near-infrared high-resolution real-time omnidirectional imaging platform for drone detection[C]//SPIE Security+ Defence. International Society for Optics and Photonics, 2016: 999706-999706-7.
[2] VASQUEZ J R, TARPLEE K M, RIGLING B D. Multisensor 3D tracking for counter small unmanned air vehicles (CSUAV)[J]. Proceedings of SPIE-The International Society for Optical Engineering, 2008(6971): 11.
[3] BUSSET J, PERRODIN F, WELLIG P, et al. Detection and tracking of drones using advanced acoustic cameras[C]//SPIE Security +Defence. International Society for Optics and Photonics, 2015: 96470F-96470F-8.
[4] SHI W, BISHOP B, ARABADJIS G, et al. Detecting, tracking, and identifying airborne threats with netted sensor fence[M]. London: INTECH Open Access Publisher, 2011.
[5] MEZEI J, MOLNáR A. Drone sound detection by correlation[C]//2016 IEEE 11th International Symposium on Applied Computational Intelligence and Informatics(SACI), Timisoara, 2016: 509-518.
[6] HEARING B, FRANKLIN J. Drone detection and classification methods and apparatus: U.S. 9275645[P]. 2016-3-1.
[7] BENYAMIN M, GOLDMAN G H. Acoustic detection and tracking of a class I UAS with a small tetrahedral microphone array[R]. Army Research Lab Adelphi Md, 2014.
[8] GENESCà M, ROMEU J, PàMIES T, et al. Real time aircraft fly-over noise discrimination[J]. Journal of Sound and Vibration, 2009, 323(1): 112-129.
[9] CASE E E, ZELNIO A M, RIGLING B D. Low-cost acoustic array for small UAV detection and tracking[C]//Aerospace and Electronics Conference, 2008. NAECON 2008. IEEE National. IEEE, 2008: 110-113.
[10] ASENSIO C, RUIZ M, RECUERO M. Real-time aircraft noise likeness detector[J]. Applied Acoustics, 2010, 71(6): 539-545.
[11] HAUZENBERGER L, HOLMBERG Ohlsson E. Drone detection using audio analysis[J]. Geostandards & Geoanalytical Research, 2011, 35(3): 369-385.
[12] JEON S, SHIN J W, LEE Y J, et al. Empirical study of drone sound detection in real-life environment with deep neural networks[J]. arXiv preprint arXiv: 1701.05779, 2017.
[13] 葛欣宏. 飛行器被動音頻探測與識別技術(shù)研究[D]. 長春: 長春理工大學(xué), 2006.
[14] DEMPSTER A P, LAIRD N M, RUBIN D B. Maximum likelihood from incomplete data via the EM algorithm[J]. Journal of the Royal Statistical Society. Series B (methodological), 1977, 39(1): 1-38.
Research on audio detection and recognition of UAV
WANG Wei1, AN Teng-fei1, OU Jian-ping2
(1. Hu’nan Provincial Key Laboratory of Intelligent Processing of Big Data on Transportation, School of Computer & Communication Engineering, Changsha University of Science & Technology, Changsha 410114, Hu’nan, China;2. School of Electronic Science and Engineering, National University of Defense Technology, Changsha 410073, Hu’nan, China)
In order to solve the security threat from low, slow and small rotor UAV (unmanned aerial vehicle) in the near field airspace, a method of analyzing the UAV audio signal is proposed. In this method, the Mel-Frequency Cepstral Coefficients (MFCC) and its first-order difference with improved solving flowchart and optimized parameters are used as the characteristic parameters of the UAV audio signal. The multi-distance segmentation method is used to train Gaussian mixture model (GMM) for the establishment of multi-feature “fingerprint library” of UAV audio signals, and finally the UAV detection and identification is achieved with the feature matching algorithm. The experimental results show that the proposed method can realize the UAV detection and recognition within 150m distance in typical suburban environment with an accuracy rate of 84.4%.
unmanned aerial vehicle (UAV); detection and identification; mel-frequency cepstral coefficients (MFCC); Gaussian mixture model (GMM)
TB53
A
1000-3630(2018)-01-0089-05
10.16300/j.cnki.1000-3630.2018.01.016
2017-05-20;
2017-07-26
國防973基金贊助項目(613XXX0301)
王威(1974-), 男, 山東青島人, 教授, 研究方向為智能信息處理。
安騰飛, E-mail: anyuanjing@stu.csust.edu.cn