摘 要:目標(biāo)檢測(cè)作為圖像處理中的一個(gè)重要應(yīng)用領(lǐng)域,在軍民多領(lǐng)域都擁有重要的研究和應(yīng)用價(jià)值。隨著網(wǎng)絡(luò)和傳感器技術(shù)的發(fā)展,圖像、視頻等多媒體媒介也與之俱增,為目標(biāo)檢測(cè)提供了豐富的樣本數(shù)據(jù)。尤其是隨著深度學(xué)習(xí)方法的應(yīng)用,目標(biāo)檢測(cè)精度得以大幅提高并得到了廣泛應(yīng)用。本文首先介紹了目標(biāo)檢測(cè)技術(shù);然后重點(diǎn)介紹了目前深度學(xué)習(xí)技術(shù)在遙感圖像目標(biāo)檢測(cè)中的應(yīng)用進(jìn)展;最后討論了深度學(xué)習(xí)方法應(yīng)用于目標(biāo)檢測(cè)時(shí)存在的困難和挑戰(zhàn),并對(duì)今后的發(fā)展趨勢(shì)進(jìn)行展望。
關(guān)鍵詞:目標(biāo)檢測(cè);深度學(xué)習(xí);自動(dòng)檢測(cè);特征提取
DOI:10.12249/j.issn.1005-4669.2020.26.314
1 引言
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域中一個(gè)非常重要的研究問(wèn)題。隨著通信網(wǎng)絡(luò)和傳感器技術(shù)的快速發(fā)展,生活中每時(shí)每刻都在產(chǎn)生大量的數(shù)字圖像數(shù)據(jù),如何精確快速的對(duì)圖像中的目標(biāo)進(jìn)行識(shí)別檢測(cè)變得越來(lái)越重要。由于我們不僅關(guān)注對(duì)圖像的簡(jiǎn)單分類(lèi),而且希望能夠準(zhǔn)確獲得圖像中存在的感興趣目標(biāo)及其位置,并將這些信息應(yīng)用到現(xiàn)實(shí)任務(wù)中,因此目標(biāo)檢測(cè)技術(shù)受到了廣泛關(guān)注。
目標(biāo)檢測(cè)其主要目標(biāo)是從給定的圖像或者視頻中定位感興趣的標(biāo)并進(jìn)行目標(biāo)分類(lèi),這就需要從圖像中對(duì)目標(biāo)進(jìn)行特征提取從而進(jìn)行目標(biāo)分類(lèi),而且需要對(duì)目標(biāo)進(jìn)行邊界框的提取。近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展及其在目標(biāo)檢測(cè)領(lǐng)域的廣泛應(yīng)用,目標(biāo)檢測(cè)在速度和精度上都有了較大的進(jìn)步。相比于人工設(shè)計(jì)的特征,通過(guò)模型自動(dòng)提取和學(xué)習(xí)的特征可以更好的表達(dá)圖像中的目標(biāo)。而且在傳統(tǒng)的方法中,手動(dòng)提取的特征泛化能力較弱,不能很好的適應(yīng)大規(guī)模的目標(biāo)檢測(cè)任務(wù)。隨著深層次的卷積神經(jīng)網(wǎng)絡(luò)的廣泛應(yīng)用,通過(guò)多層級(jí)的卷積核,實(shí)現(xiàn)由低層次抽象到高層抽象的組合,從而將圖像的特征進(jìn)行更精確的提取。即使在復(fù)雜背景下,深度學(xué)習(xí)依然可以高頻次的提取低層特征,比如邊界、輪廓、形狀、顏色、旋轉(zhuǎn)角等,同時(shí)深度學(xué)習(xí)還可以組合低層特征,得到更有區(qū)分性和魯棒性的特征。
2 應(yīng)用進(jìn)展
深度學(xué)習(xí)技術(shù)在遙感圖像目標(biāo)檢測(cè)中的應(yīng)用很廣泛,主要對(duì)土地覆蓋分類(lèi)、道路提取、建筑物提取、小目標(biāo)檢測(cè)、變化檢測(cè)等這幾個(gè)方面進(jìn)行總結(jié)闡述。
1)土地覆蓋分類(lèi)。利用深度學(xué)習(xí)做遙感影像的分割需要大量的標(biāo)簽信息,但是這通常是一個(gè)耗時(shí)耗力的工作,為了克服缺少大量標(biāo)簽數(shù)據(jù)的問(wèn)題,Scott等人提出了通過(guò)模型微調(diào)和數(shù)據(jù)增強(qiáng)進(jìn)行遷移學(xué)習(xí),在土地利用分類(lèi)中達(dá)到了97%-98%的分類(lèi)精度。在土地利用分類(lèi)中,針對(duì)樣本類(lèi)別不均衡和錯(cuò)誤標(biāo)記的情況,Alexander等人在U-Net結(jié)構(gòu)上,采用Lovasz-Softmax損失函數(shù)成功緩解了這些問(wèn)題。Xiwei Yao等人更關(guān)注于在高分辨率衛(wèi)星影像上自動(dòng)標(biāo)注樣本,通過(guò)結(jié)合具有判別性的高級(jí)特征和弱監(jiān)督特征遷移提出了統(tǒng)一的標(biāo)注框架,與完全的監(jiān)督分類(lèi)方法表現(xiàn)的更有競(jìng)爭(zhēng)力。
2)植被覆蓋分類(lèi)。植被覆蓋制圖是監(jiān)測(cè)自然資源的必要任務(wù),在農(nóng)業(yè)方面可以輔助估算農(nóng)作物產(chǎn)量。Zhang等在卷積神經(jīng)網(wǎng)絡(luò)CNN的基礎(chǔ)上構(gòu)造了由兩層構(gòu)成的卷積編碼神經(jīng)網(wǎng)絡(luò),第一層由兩套卷積核分別提取耕地和林地特征,第二層由兩個(gè)編碼器組成,它們使用非線(xiàn)性函數(shù)來(lái)編碼學(xué)習(xí)的特征,將編碼結(jié)果映射到相應(yīng)的類(lèi)別號(hào)。該模型在GF-2影像的測(cè)試結(jié)果達(dá)到了0.91的精度。Kussul等采用深度學(xué)習(xí)的方法,做小麥、玉米、大豆等農(nóng)作物類(lèi)型的識(shí)別達(dá)到了85%以上的精度。
3)道路提取。道路信息對(duì)城市交通規(guī)劃,導(dǎo)航數(shù)據(jù)更新具有重要的作用。利用遙感影像提取道路是遙感領(lǐng)域的一項(xiàng)基本任務(wù),在過(guò)去十年間一直是一個(gè)熱門(mén)話(huà)題。利用深度學(xué)習(xí)的技術(shù)提取道路相比于傳統(tǒng)方法具有很大的提高。在2018 CVPR DeepGlobe競(jìng)賽中,Lichen Zhou等人提出了D-LinkNet的語(yǔ)義分割網(wǎng)絡(luò),并獲得了第一的成績(jī)。D-LinkNet采用編碼器-解碼器結(jié)構(gòu),通過(guò)擴(kuò)張卷積和預(yù)訓(xùn)練編碼器進(jìn)行道路提取任務(wù),在一定程度上可以處理道路的窄、連通、復(fù)雜和跨度等問(wèn)題,但是仍然有一些道路連通性的問(wèn)題需要解決。
4)建筑物提取。遙感影像中建筑物提取也是一項(xiàng)基本任務(wù),但是由于我國(guó)各個(gè)地方的建筑風(fēng)格迥異,導(dǎo)致建筑物在遙感影像上呈現(xiàn)的形態(tài)各式各樣,對(duì)計(jì)算機(jī)自動(dòng)提取是很大的挑戰(zhàn)。Bittner等人融合了多種數(shù)據(jù)源,提出了一種端到端的全卷積神經(jīng)網(wǎng)絡(luò),它能夠結(jié)合不同數(shù)據(jù)源的光譜和高度信息,自動(dòng)生成建筑物的輪廓。在DeepGlobe建筑物提取挑戰(zhàn)賽中,Zhao等人使用基于Mask R-CNN的實(shí)例分割算法來(lái)提取建筑輪廓,但是提取的建筑邊界也實(shí)際不太相同,因此提出了Mask R-CNN與建筑物邊界規(guī)則化相結(jié)合的方法,得到了很好的可視化效果。
5)小目標(biāo)檢測(cè)。近年來(lái)利用深度學(xué)習(xí)進(jìn)行目標(biāo)檢測(cè)已經(jīng)達(dá)到了很高的精度,在飛機(jī)識(shí)別方面,Hu等驗(yàn)證了Fast R-CNN模型和SSD模型可用于檢測(cè)高分辨率遙感影像中的飛機(jī),在檢測(cè)速度上,SSD更有優(yōu)勢(shì),但是對(duì)于小飛機(jī)來(lái)說(shuō)R-CNN模型具有更大的優(yōu)勢(shì),并且更適合于復(fù)雜場(chǎng)景的檢測(cè)。為了讓網(wǎng)絡(luò)更適應(yīng)于密集的小目標(biāo)檢測(cè),Ding等采用多尺度改進(jìn)和多種改進(jìn)方案組合的密集卷積網(wǎng)絡(luò),來(lái)增強(qiáng)VGG16網(wǎng)絡(luò)結(jié)構(gòu)。通過(guò)實(shí)驗(yàn)驗(yàn)證,本方法對(duì)飛機(jī)和車(chē)輛的檢測(cè)精度分別達(dá)到了90.7%和87.9%。為了解決小目標(biāo)檢測(cè)的問(wèn)題,Chen等提出了混合深度神經(jīng)網(wǎng)絡(luò)(HDNN),通過(guò)將DNN的最后卷積層和最大池化層劃分成可變感受野或最大池化大小的多個(gè)塊,使得HDNN能夠提取可變尺度特征,在檢測(cè)城市等復(fù)雜背景下的車(chē)輛表現(xiàn)優(yōu)異。
6)變化檢測(cè)。變化檢測(cè)在遙感中具有重要意義,高分辨率遙感圖像的出現(xiàn)大大提高了我們從空間監(jiān)測(cè)土地利用和土地覆蓋變化的能力,同時(shí),高分辨率遙感影像相比于其他衛(wèi)星影像提出了新的挑戰(zhàn)。Wang等人將Faster R-CNN應(yīng)用于變化檢測(cè),得到了比傳統(tǒng)方法更高的精度。Zhao等人構(gòu)造一個(gè)兩側(cè)具有相同耦合層數(shù)的近似對(duì)稱(chēng)深度神經(jīng)網(wǎng)絡(luò),將兩幅圖像變換成相同的特征空間,使兩幅圖像的特征更具有區(qū)分性,通過(guò)逐像素比較特征配對(duì)可以生成差異圖像。
3 思考與展望
深度學(xué)習(xí)技術(shù)在目標(biāo)檢測(cè)中的應(yīng)用范圍迅猛發(fā)展,但是還是存在著一些無(wú)法忽視的困難:
1)目標(biāo)的隱蔽性。鑒于目標(biāo)隱蔽性的特點(diǎn),深度學(xué)習(xí)技術(shù)作為一種計(jì)算機(jī)視覺(jué)工具,很多隱藏目標(biāo)無(wú)法識(shí)別,還需要結(jié)合其他手段,使目標(biāo)在圖像或視頻中凸顯出來(lái)。
2)深度學(xué)習(xí)在目標(biāo)應(yīng)用中的理論不完善。深度學(xué)習(xí)技術(shù)是近些年來(lái)人工智能的關(guān)鍵技術(shù)。在目標(biāo)檢測(cè)中的應(yīng)用尚不成熟,況且目標(biāo)的敏感性比較高,在很多時(shí)候受到的限制比較多。
3)大規(guī)模數(shù)據(jù)樣本集缺乏。雖然來(lái)源于多種平臺(tái)、多源傳感器獲取的圖像、視頻等數(shù)據(jù)有很多,但是這些數(shù)據(jù)并不能直接提供需要的目標(biāo)類(lèi)別、位置信息,為明智決策提供情報(bào)。深度學(xué)習(xí)技術(shù)起初訓(xùn)練數(shù)據(jù)的時(shí)候,需要大量的標(biāo)記樣本數(shù)據(jù)集支持,但是鑒于數(shù)據(jù)的保密性,對(duì)于目標(biāo)檢測(cè)模型,缺乏大量的多樣性標(biāo)記樣本集。
針對(duì)不同的問(wèn)題,解決的辦法不盡相同。鑒于目標(biāo)的隱蔽性,結(jié)合不同的數(shù)據(jù)源將目標(biāo)地物凸顯出來(lái),然后進(jìn)行樣本制作,用于訓(xùn)練模型。結(jié)合傳統(tǒng)的目標(biāo)檢測(cè)技術(shù),彌補(bǔ)深度學(xué)習(xí)目標(biāo)檢測(cè)技術(shù)理論的不完善,同時(shí)考慮虛擬環(huán)境下虛擬數(shù)據(jù)的大規(guī)模應(yīng)用。標(biāo)記樣本需要大量的人力物力,對(duì)于海量樣本支撐的目標(biāo)檢測(cè)技術(shù)基本無(wú)法實(shí)現(xiàn),所以無(wú)標(biāo)記樣本的目標(biāo)檢測(cè)技術(shù)會(huì)成為重點(diǎn)研究目標(biāo)。
參考文獻(xiàn)
[1]李曉斌,江碧濤,楊淵博等.光學(xué)遙感圖像目標(biāo)檢測(cè)技術(shù)綜述[J].光學(xué)遙感圖像目標(biāo)檢測(cè)技術(shù)綜述,2019,0(4):95-104.
[2]王倫文,馮彥卿,張孟伯.光學(xué)遙感圖像目標(biāo)檢測(cè)方法[J].系統(tǒng)工程與電子技術(shù),2019(10):2163-2169.
作者簡(jiǎn)介
趙明衍(1990-),男,山東濟(jì)南人,研究生,助教,火箭軍士官學(xué)校。