摘? 要:飛鳥是飛行物中典型的“低慢小”目標(biāo),具有低可觀測性,在很多場景中它又是巨大的安全隱患。所以對飛鳥進(jìn)行有效的檢測和驅(qū)趕是機(jī)場、高壓電站等高風(fēng)險(xiǎn)區(qū)域安保工作的重心。但飛鳥種類繁雜,其自身形態(tài)變化大且機(jī)動(dòng)性極強(qiáng)的特點(diǎn),讓飛鳥檢測的技術(shù)難度遠(yuǎn)高于傳統(tǒng)的目標(biāo)探測。文章對常見飛鳥目標(biāo)檢測技術(shù)的研究及發(fā)展進(jìn)行了梳理,介紹了其中各項(xiàng)解決方案的利弊,并提出了以幀間差分法和YOLOv5深度學(xué)習(xí)模型為基礎(chǔ)的新檢測方案。
關(guān)鍵字:飛鳥檢測;目標(biāo)檢測;運(yùn)動(dòng)檢測;深度學(xué)習(xí);YOLOv5
中圖分類號(hào):TP391.41;TP183;V279? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2021)01-0092-03
Bird Detection Algorithm Based on YOLO and Inter Frame Difference Method
YANG Luye
(Shanghai University,Shanghai? 200444,China)
Abstract:Bird is a typical “l(fā)ow,slow and small” target in flying objects,which has low observability,and it is also a huge safety hazard in many scenes. Therefore,the effective detection of bird and driving it away is the focus of security work in high-risk areas such as airports and high-pressure power stations. But the kinds of bird are complex,their characteristic in own shape changes greatly and the mobility is very strong,which makes the technology difficulty of birds detection is more higher than the traditional target detection. This paper sorts out the research and development of common bird target detection technology,introduces the advantages and disadvantages of various solutions,and proposes a new detection scheme based on the deep learning model of inter frame difference method and YOLOv5.
Keywords:bird detection;target detection;motion detection;deep learning;YOLOv5
0? 引? 言
“鳥擊”是指在航空器起落或飛行途中與鳥類等小型物體相撞的惡性事件。全球每年發(fā)生近21 000起鳥擊事件,造成的直接或間接經(jīng)濟(jì)損失超過10億。隨著疫情趨緩,全球旅游業(yè)開始復(fù)蘇,航班量的持續(xù)增長,使機(jī)場的“鳥擊”防范壓力愈發(fā)增大。傳統(tǒng)的機(jī)場安全監(jiān)測依賴于人力觀測來預(yù)防“鳥擊”,但若遇到觀測點(diǎn)可見度低,觀測場地距離過遠(yuǎn),觀測背景復(fù)雜、干擾因素多等問題時(shí),簡單的肉眼檢測往往難以實(shí)現(xiàn)高效的鳥情安全預(yù)警。為實(shí)現(xiàn)全天候高效不間斷的鳥情監(jiān)測,經(jīng)過30余年的發(fā)展,國內(nèi)外相關(guān)機(jī)構(gòu)已經(jīng)研制出很多相對成熟的“雷達(dá)探鳥系統(tǒng)”,如美國Merlin雷達(dá)、加拿大Accipiter雷達(dá)、荷蘭Robin雷達(dá)以及中國民航科學(xué)技術(shù)研究院開發(fā)的“機(jī)場雷達(dá)探鳥與驅(qū)趕聯(lián)動(dòng)系統(tǒng)”。多數(shù)雷達(dá)產(chǎn)品采用了S波段水平掃描雷達(dá)和X波段垂直掃描雷達(dá)共同檢測的方式,但目前受限于檢測精度不高(大多低于75%),且誤報(bào)較多導(dǎo)致探測效果還不能完全滿足機(jī)場的安保需求。本文對近年來各種場景下的飛鳥目標(biāo)檢測及識(shí)別技術(shù)的研究發(fā)展進(jìn)程進(jìn)行歸納總結(jié),并結(jié)合深度學(xué)習(xí)模型及動(dòng)態(tài)檢測算法,建立全新的飛鳥識(shí)別解決方案。
1? 現(xiàn)有解決方案及前沿技術(shù)
1.1? 機(jī)場雷達(dá)飛鳥檢測系統(tǒng)
雷達(dá)主要利用S波段水平掃描整體覆蓋機(jī)場及周邊低空空域,輔以X波段垂直掃描所有航空器起降通道,采用鳥情信息提取算法獲取飛鳥目標(biāo)信息,典型探鳥雷達(dá)如美國Merlin雷達(dá)。Accipiter雷達(dá)在Merlin雷達(dá)基礎(chǔ)上增設(shè)X波段拋物面天線部分;Robin雷達(dá)則是在Merlin雷達(dá)基礎(chǔ)上增設(shè)了調(diào)頻連續(xù)波雷達(dá),用來增強(qiáng)對飛鳥目標(biāo)判定的準(zhǔn)確率[1-3]。
1.2? 基于微多普勒信號(hào)的飛鳥特征提取及判別
飛鳥的雙翅震動(dòng)會(huì)在由主體平動(dòng)產(chǎn)生的雷達(dá)回波多普勒頻移信號(hào)附近引入額外的調(diào)制邊帶,該信號(hào)稱為微多普勒信號(hào),產(chǎn)生微多普勒效應(yīng)[4]。微多普勒效應(yīng)反映的是多普勒頻移的瞬時(shí)特性,表征了被檢測目標(biāo)運(yùn)動(dòng)的瞬時(shí)徑向速度。
1.3? 基于深度學(xué)習(xí)的飛鳥特征提取及判別
基于深度學(xué)習(xí)模型高效的信息抽取和特征提取能力,不少最新的研究將傳統(tǒng)的鳥類雷達(dá)回波特征提取部分優(yōu)化為深度學(xué)習(xí)模型提取。相較于傳統(tǒng)機(jī)器學(xué)習(xí)模型和統(tǒng)計(jì)學(xué)方法,深度學(xué)習(xí)模型能夠通過高維網(wǎng)絡(luò)架構(gòu)挖掘原始數(shù)據(jù)中的隱藏特性,從而達(dá)到更好的泛化應(yīng)用能力,在實(shí)際檢測中獲得更強(qiáng)的魯棒性。
目前流行的幾大解決方案都有其局限性。在雷達(dá)飛鳥檢測系統(tǒng)中,其主要觀測目標(biāo)回波特征、頻率及其幅度還受到受檢測目標(biāo)姿態(tài)、回波傳遞中是否連續(xù)、環(huán)境中是否出現(xiàn)遮擋物等多方因素的影響。真實(shí)的回波模型遠(yuǎn)遠(yuǎn)復(fù)雜于理想建模,需要不斷優(yōu)化。在基于多普勒信號(hào)的特征提取系統(tǒng)中,常規(guī)外輻射源雷達(dá)工作效率較低,且由于飛鳥本身大小不一,其運(yùn)動(dòng)特性表現(xiàn)又不盡相同,精細(xì)化提取其特征進(jìn)展較為緩慢,難以得到能夠符合大部分場景的精細(xì)化分類通用特征庫。在基于深度學(xué)習(xí)的飛鳥特征提取中,尚缺乏多場景下長期的數(shù)據(jù)觀測結(jié)果作為底層網(wǎng)絡(luò)結(jié)構(gòu)建設(shè)的基礎(chǔ)依據(jù)。
2? 深度學(xué)習(xí)模型及動(dòng)態(tài)識(shí)別模型
2.1? 幀間差分法
對于定點(diǎn)采集的連續(xù)視頻序列,可以利用連續(xù)幀之間的差值來檢測運(yùn)動(dòng)物體所在區(qū)域。算法是通過計(jì)算前后幀同位置像素點(diǎn)之差得到差值圖。再將差值圖轉(zhuǎn)化為灰度圖,調(diào)整合適的閾值后進(jìn)行判別,找到變動(dòng)明顯的像素點(diǎn)群。將像素點(diǎn)群經(jīng)過聚類方法分化為若干個(gè)區(qū)域來排除噪聲點(diǎn)等環(huán)境干擾因素影響。劃選出所有可能區(qū)域后,再通過對場景目標(biāo)物的特點(diǎn)進(jìn)行分析和經(jīng)驗(yàn)建模篩出運(yùn)動(dòng)物體所在區(qū)域。
算法設(shè)計(jì)關(guān)鍵在于灰度圖時(shí)閾值的選取和差分法設(shè)計(jì)。若閾值選取過小將會(huì)導(dǎo)致噪點(diǎn)過多且無法排除背景干擾,閾值選取過高則會(huì)導(dǎo)致部分運(yùn)動(dòng)信息被忽略進(jìn)而導(dǎo)致動(dòng)態(tài)識(shí)別不準(zhǔn)。常見的差分法有兩幀差分法和三幀差分法:
(1)二幀差分法是通過每一像素點(diǎn)在前一時(shí)間間隔和后一時(shí)間間隔的絕對差值所得,轉(zhuǎn)化為灰度圖后再通過連通性分析得到判別結(jié)果。
(2)三幀差分法先獲得時(shí)序序列前后幀灰度差值序列,再由前后幀差值序列中的前后值結(jié)果圖像按位做“與”操作后得到對應(yīng)灰度圖,最后通過連通性分析得到判別結(jié)果。
兩種算法中二幀數(shù)差分法運(yùn)算速度更快,適合目標(biāo)數(shù)量多,檢測任務(wù)時(shí)效性要求高的場景,三幀差分法適合運(yùn)動(dòng)目標(biāo)移動(dòng)速度較快,環(huán)境噪音較大的場景。
2.2? YOLO v5網(wǎng)絡(luò)
YOLO深度學(xué)習(xí)框架(You Only Look Once)是由DIVVALA等人在2016年初提出的基于回歸的一種目標(biāo)識(shí)別算法,至今已經(jīng)發(fā)展到第五代YOLOv5[5]。YOLOv5在保留前幾版本極高的識(shí)別效率的前提下,通過引入殘差神經(jīng)網(wǎng)絡(luò)中殘差塊的概念,動(dòng)態(tài)調(diào)優(yōu)網(wǎng)絡(luò)層級(jí)關(guān)系和已有預(yù)測模塊邏輯,大大提升了對小型物體的識(shí)別準(zhǔn)確率。而且相較于之前的二版本,YOLOv5大大壓縮了算法模型規(guī)格,其中最小的模型YOLOv5s大小只有13 Mb,使得模型應(yīng)用場景可以推廣到小微型終端。
3? 方案設(shè)計(jì)
由于檢測目標(biāo)飛鳥的種類眾多、形態(tài)各異而且不同國家地區(qū)、不同地點(diǎn)鳥類形態(tài)差別極大,如我國鳥類常見種類為麻雀。而麻雀的主色灰白與水泥墻體背景色差距極小,所以在很多工業(yè)場合,很難將其直接識(shí)別出來。但若要訓(xùn)練能在日常環(huán)境中準(zhǔn)確判斷飛鳥位置的模型并保證其在多種環(huán)境下的魯棒性,則需要準(zhǔn)備大量標(biāo)注好的多類別多形態(tài)鳥類圖片。但是現(xiàn)有的所有已標(biāo)注圖像數(shù)據(jù)集大多為全類別標(biāo)注數(shù)據(jù)集,其中鳥類對應(yīng)的數(shù)據(jù)量都遠(yuǎn)遠(yuǎn)不足,即使像Microsoft COCO這樣的大型成熟數(shù)據(jù)集中鳥類對應(yīng)的圖片也不到一萬張。故若僅依靠累積數(shù)據(jù)量、標(biāo)注完備數(shù)據(jù)集、訓(xùn)練成熟的深度學(xué)習(xí)模型來達(dá)到精確識(shí)別飛鳥的目標(biāo),則需要投入大量的人力物力。需要安排眾多檢測員對每個(gè)可能場景逐一進(jìn)行針對性數(shù)據(jù)采集和標(biāo)注。這樣的方案不僅費(fèi)時(shí)費(fèi)力,而且訓(xùn)練出來的模型缺乏泛化解釋能力,若轉(zhuǎn)換新場景則需要重新采集數(shù)據(jù)訓(xùn)練。為達(dá)到高識(shí)別效率和多場景適應(yīng)性,在觀察飛鳥特有的多局部運(yùn)動(dòng)特點(diǎn)(真實(shí)場景中鳥類有非常多的局部運(yùn)動(dòng),幾乎沒有完全靜止的時(shí)刻,即使是在停立狀態(tài)下仍有鳥喙,鳥翼,鳥頭等位置的局部運(yùn)動(dòng))后,我們引入動(dòng)態(tài)檢測算法幀間差分法作為輔助檢測判斷,用YOLOv5獲得的鳥類識(shí)別結(jié)果圖和幀間差分法獲得的動(dòng)態(tài)檢測結(jié)果圖綜合判斷以獲得飛鳥所在區(qū)域,如圖1所示。
其中K為0到1之間的正實(shí)數(shù),是模型輔助判斷的超參數(shù),代表深度學(xué)習(xí)檢測結(jié)果和動(dòng)態(tài)檢測結(jié)果之間權(quán)重。當(dāng)視頻清晰度較高,背景無過多噪音,鳥類整體識(shí)別度較高時(shí),K可適當(dāng)取大值以提升深度學(xué)習(xí)檢測結(jié)果權(quán)重;當(dāng)背景噪音較高,同類干擾物較多,鳥類目標(biāo)難以正常識(shí)別時(shí),可以適當(dāng)縮小K值以提升動(dòng)態(tài)檢測權(quán)重,消除干擾物影響。
4? 算法測試
在測試中的高壓電站場景,背景雜音較小且飛鳥運(yùn)動(dòng)軌跡比較簡單,移動(dòng)速度較低,故我們選擇二幀差分法作為動(dòng)態(tài)檢測算法,用已訓(xùn)練好的YOLOv5s輕量物體識(shí)別算法模型[5]作為物體識(shí)別部分算法其中YOLOv5和幀間差分法的檢測結(jié)果分別如圖2、圖3、圖4所示。
由動(dòng)態(tài)檢測和物體識(shí)別兩部分算法得到置信度像素點(diǎn)級(jí)網(wǎng)格結(jié)果圖,其中動(dòng)態(tài)檢測置信度像素點(diǎn)網(wǎng)格圖為動(dòng)態(tài)檢測后獲得的二值結(jié)果圖,代表該像素點(diǎn)在該時(shí)間間隔內(nèi)是否有變化,0代表物體沒有運(yùn)動(dòng),1代表物體發(fā)生了變化。物體識(shí)別置信度網(wǎng)格結(jié)果圖則是0到1區(qū)間內(nèi)的正常數(shù),代表由YOLO算法給出的當(dāng)前像素點(diǎn)歸屬于鳥類的置信度,0代表最不可能,1代表最可能。分別賦予物體檢測模型和動(dòng)態(tài)檢測模型K與(1-K)的超參數(shù),將兩種模型檢測出的可信度量化矩陣分別乘以K和(1-K)后相加。對于給定區(qū)域,如果其加總可信度值超過閾值(0.7)則判定為含有飛鳥的區(qū)域。
分別取超參數(shù)K=0.55/0.65/0.75/0.85/0.95,測試五個(gè)測試視頻流下的檢測準(zhǔn)確率和測試效率(以FPS計(jì))得到下表1,K在0.85時(shí)取得最大準(zhǔn)確率94.4%和相對較高的檢測效率24FPS。
5? 結(jié)? 論
本文以識(shí)別機(jī)場、高壓電站等區(qū)域的飛鳥,排除安全隱患為目的,基于YOLOv5卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的物體識(shí)別算法和幀間差分法的動(dòng)態(tài)檢測算法,對視頻流信息進(jìn)行分析,能夠在保持高檢測效率的前提下對復(fù)雜環(huán)境中的飛鳥進(jìn)行識(shí)別。且由于在模型中加入動(dòng)態(tài)檢測算法,減輕了整體方案對已標(biāo)注數(shù)據(jù)量的依賴,可以很快推廣到安防工作中的其他智能檢測中,如機(jī)場無人機(jī)檢測,電站防護(hù)以及智慧校園中的安防檢測。未來隨著增加更多如光流法、背景減法等動(dòng)態(tài)檢測模塊和嘗試Detectron等成熟的物體識(shí)別深度學(xué)習(xí)框架,我們可以進(jìn)一步優(yōu)化這個(gè)“動(dòng)靜結(jié)合”的檢測方案,將本方案切實(shí)推廣到工業(yè)級(jí)應(yīng)用里。
參考文獻(xiàn):
[1] 王維,項(xiàng)洪達(dá).鳥擊風(fēng)險(xiǎn)計(jì)算方法研究 [J].中國民航大學(xué)學(xué)報(bào),2019,37(5):21-24.
[2] 于飛,劉東華,賀飛揚(yáng).無人機(jī)“黑飛”對電磁空間安全的挑戰(zhàn) [J].中國無線電,2018(8):43-44.
[3] 陳唯實(shí).輕小型無人機(jī)監(jiān)管、探測與干擾技術(shù) [J].中國民用航空,2017(7):33-34.
[4] 張群,胡健,羅迎,等.微動(dòng)目標(biāo)雷達(dá)特征提取、成像與識(shí)別研究進(jìn)展 [J].雷達(dá)學(xué)報(bào),2018,7(5):531-547.
[5] REDMON J,DIVVALA S,GIRSHICK R,et al. You Only Look Once:Unified,Real-Time Object Detection [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas:IEEE,2016:779-788.
作者簡介:楊陸野(1993—),男,漢族,上海人,初級(jí)工程師,碩士,研究方向:計(jì)算機(jī)視覺。