洪 倩,陳楓楠,梁 冬,李 晉,陳曉楓,戚國輝
(1.國網(wǎng)經(jīng)濟(jì)技術(shù)研究院有限公司,北京102209;2.紫光軟件系統(tǒng)有限公司,北京100084)
快速準(zhǔn)確監(jiān)控施工擾動區(qū)域?qū)Ψ乐谓ㄔO(shè)項(xiàng)目水土流失具有重要意義。高分2號衛(wèi)星屬于民用衛(wèi)星,其空間分辨率較高而影像資料獲取費(fèi)用較低,可用于施工擾動區(qū)域的快速識別。建設(shè)項(xiàng)目施工擾動區(qū)域遙感監(jiān)測的傳統(tǒng)解譯方法主要是目視解譯,計(jì)算機(jī)自動分類技術(shù)方法目前還不是特別成熟。近年來,將人工智能算法應(yīng)用到圖像識別中是一個(gè)研究熱點(diǎn),而圖像識別中最廣泛的學(xué)習(xí)模式是卷積神經(jīng)網(wǎng)絡(luò)算法,該算法在目標(biāo)監(jiān)測、圖像分類、語音識別及行為識別等領(lǐng)域引發(fā)了一場研究與應(yīng)用熱潮。特高壓輸變電工程與一般建設(shè)項(xiàng)目不同,具有線路長、地形地貌復(fù)雜、施工標(biāo)段多、擾動范圍分散、造成的水土流失嚴(yán)重、監(jiān)督管理困難等特點(diǎn)[1]。筆者對基于卷積神經(jīng)網(wǎng)絡(luò)算法的圖像識別方法進(jìn)行研究,并利用高分2號衛(wèi)星遙感影像對榆橫—濰坊特高壓輸變電工程塔基施工擾動區(qū)域進(jìn)行自動識別,以期探索開發(fā)建設(shè)項(xiàng)目施工擾動區(qū)域和人為水土流失快速監(jiān)測方法。
榆橫—濰坊1 000 kV特高壓交流輸變電工程(簡稱榆橫—濰坊工程)起于陜西省榆橫交流變電站、止于山東省濰坊變電站,途經(jīng)陜西、山西、河北、山東四省,是國家大氣污染防治行動計(jì)劃“四交四直”特高壓工程中第5條輸電通道,是國家“三縱三橫”特高壓東西主干網(wǎng)架、華北特高壓交直流主網(wǎng)架的重要組成部分,線路全長 2×1 048.5 km,其中陜西省境內(nèi)約 2×151.5 km、山西省境內(nèi)約 2×318.0 km、河北省境內(nèi)約2×215.0 km、山東省境內(nèi)約 2×364.0 km。 該項(xiàng)目涉及平原農(nóng)作物區(qū)、山地林區(qū)、丘陵草地區(qū)、平原草地區(qū)等不同地類,急需開展擾動區(qū)域監(jiān)測。
高分2號衛(wèi)星是國家高分辨率對地觀測系統(tǒng)重大專項(xiàng)首批啟動研制的衛(wèi)星,于2014年8月19日發(fā)射成功[2],是目前我國研制的空間分辨率最高、觀測幅寬最大、設(shè)計(jì)壽命最長的民用遙感衛(wèi)星。該衛(wèi)星遙感數(shù)據(jù)突破亞米級高分辨率大幅寬成像、長焦距大F數(shù)輕小型相機(jī)設(shè)計(jì)、高穩(wěn)定度快速姿態(tài)側(cè)擺、圖像高精度定位、低軌道遙感衛(wèi)星長壽命高可靠設(shè)計(jì)等關(guān)鍵技術(shù),大幅提升了我國遙感衛(wèi)星觀測效能,打破高分辨率對地觀測數(shù)據(jù)依賴進(jìn)口的被動局面,推動了植被、土地利用、水土保持等方面的遙感監(jiān)控。
高分2號衛(wèi)星遙感數(shù)據(jù)具有4個(gè)多光譜波段、1個(gè)全色波段,多光譜分辨率達(dá)到3.24 m、全色波段分辨率達(dá)到0.81 m。從該數(shù)據(jù)光譜波段來看,適合對特高壓塔基施工擾動區(qū)域植被、土壤和施工材料的監(jiān)測;從空間分辨角度看,能夠滿足水土保持行業(yè)對施工擾動面積監(jiān)控的精度要求。此外獲取數(shù)據(jù)成本較低、適合廣泛使用,因此選擇高分2號衛(wèi)星遙感數(shù)據(jù)進(jìn)行特高壓塔基擾動區(qū)域監(jiān)控研究。
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)算法
卷積神經(jīng)網(wǎng)絡(luò)最早出現(xiàn)于Yann Le Cun設(shè)計(jì)的LeNet-5中(LeNet-5包含了2個(gè)卷積層、2個(gè)池化層和3個(gè)全連接層),用于手寫字符識別,取得了較好的效果[3]。 此后陸續(xù)出現(xiàn)了 AlexNet、VggNet、GoogLeNet和 ResNet[4-7],其中:AlexNet有 8 層網(wǎng)絡(luò),包含 5 個(gè)卷積層和3個(gè)全連接層,使用兩塊GPU并行加速訓(xùn)練,用Relu作為激活函數(shù),通過數(shù)據(jù)增強(qiáng)、DropOut以及設(shè)置局部響應(yīng)歸一化層(Local Response Normalization,簡稱LRN)防止過擬合問題;VggNet包含不同級別的網(wǎng)絡(luò),常用的是 VggNet-16和 VggNet-19,VggNet使用3×3和1×1的卷積核,使用小卷積核改善了網(wǎng)絡(luò)的分類效果;GoogLeNet首次出現(xiàn)在ILSVRC14比賽中,在當(dāng)時(shí)獲得了第一名,GoogLeNet團(tuán)隊(duì)提出Inception網(wǎng)絡(luò)結(jié)構(gòu),將全連接變?yōu)橄∈柽B接,使得不同的卷積核可以提取不同尺度的特征信息;ResNet(全稱Residual Neural Network)由He K等提出,該模型有不同的網(wǎng)絡(luò)層數(shù)、使用殘差模塊(見圖1),常用的有50層、101層和152層,主要代表網(wǎng)絡(luò)類型有 ResNet50和ResNet101。在ResNet中通過使用殘差模塊,能夠?qū)⑿畔妮斎肜@道傳到輸出,簡化學(xué)習(xí)的復(fù)雜度。本研究使用ResNet50進(jìn)行網(wǎng)絡(luò)訓(xùn)練,見圖2。
圖1 殘差模塊示意
圖2 ResNet50的結(jié)構(gòu)
本研究將 224×224×3(長度×寬度×通道數(shù),長、寬均為像素?cái)?shù))的圖像作為輸入,進(jìn)入第一個(gè)卷積層conv1(conv1中包括 64個(gè) 7×7的卷積核),步長為2(像素?cái)?shù)),接下來進(jìn)入BatchNorm層。ResNet使用BatchNorm加速訓(xùn)練,以獲得穩(wěn)定的訓(xùn)練結(jié)果,能夠?qū)γ恳粋€(gè)batch的均值和方差做歸一化處理;激活函數(shù)使用Relu,采用最大池化,使用softmax進(jìn)行輸出。
2.1.2 參數(shù)訓(xùn)練
本研究采用的硬件設(shè)備為 Ubuntu16.04系統(tǒng)(Intel Xeon E52603處理器,8G內(nèi)存,NVIDIA Quadro K620 顯卡),軟件為 Tensorflow1.12.0。 對樣本圖像進(jìn)行假彩色合成,使用labelImg工具制作訓(xùn)練樣本,用3 000張作為訓(xùn)練集、測試集和驗(yàn)證集,樣本比例為3∶1∶1。設(shè)置分類數(shù)為4,batch size為16,最小學(xué)習(xí)率為0.000 1,平均學(xué)習(xí)率為 0.002,權(quán)重衰減速率為0.000 2,每個(gè)殘差組內(nèi)殘差單元數(shù)量為5,泄露修正線性單元(Leaky ReLU)參數(shù)為0.1,優(yōu)化策略為Adaptive Moment Estimation方法,對模型進(jìn)行50 000次訓(xùn)練,最終精度為90.4%。
2.2.1 平原農(nóng)作物區(qū)分類結(jié)果
使用的高分二號衛(wèi)星遙感影像全色和多光譜融合后空間分辨率為1 m,可清晰識別平原農(nóng)作物區(qū)特高壓施工擾動區(qū)域并準(zhǔn)確計(jì)算擾動面積。對平原農(nóng)作物區(qū)9S120號塔基施工擾動區(qū)域解譯分類結(jié)果見圖3,對平原農(nóng)作物區(qū)8個(gè)典型樣點(diǎn)(塔基)擾動面積解譯計(jì)算結(jié)果見表1??梢钥闯觯矸e神經(jīng)網(wǎng)絡(luò)分類計(jì)算結(jié)果可信度較高,與目視解譯結(jié)果幾乎相等,相對誤差最大為 7.28%、最小為 1.20%,平均誤差為 4.43%。
表1 平原農(nóng)作物區(qū)典型樣點(diǎn)擾動面積解譯計(jì)算結(jié)果統(tǒng)計(jì)
2.2.2 山地林區(qū)分類結(jié)果
山地林區(qū)14R067號塔基施工擾動區(qū)域解譯分類結(jié)果見圖4,9個(gè)典型樣點(diǎn)(塔基)擾動面積解譯計(jì)算結(jié)果見表2??梢钥闯?,在山地林區(qū)利用卷積神經(jīng)網(wǎng)絡(luò)分類方法從高分2號衛(wèi)星遙感影像提取擾動面積的準(zhǔn)確度較高,與目視解譯效果相當(dāng),相對誤差最大為11.77%、最小為 4.84%。
圖4 山地林區(qū)14R067號塔基擾動區(qū)域解譯結(jié)果
2.2.3 丘陵草地區(qū)分類結(jié)果
丘陵草地區(qū)14S079號塔基施工擾動區(qū)域解譯分類結(jié)果見圖5,7個(gè)典型樣點(diǎn)(塔基)擾動面積解譯計(jì)算結(jié)果見表3??梢钥闯觯酶叻?號衛(wèi)星遙感影像可清晰識別丘陵草地區(qū)特高壓施工擾動區(qū)域,并可較準(zhǔn)確地提取施工擾動面積,卷積神經(jīng)網(wǎng)絡(luò)分類計(jì)算相對誤差最大為7.68%、最小為5.37%,可信度較高。
表2 山地林區(qū)典型樣點(diǎn)擾動面積解譯計(jì)算結(jié)果統(tǒng)計(jì)
圖5 丘陵草地區(qū)14S079號塔基擾動區(qū)域解譯結(jié)果
表3 丘陵草地區(qū)典型樣點(diǎn)擾動面積解譯計(jì)算結(jié)果統(tǒng)計(jì)
2.2.4 平原草地區(qū)分類結(jié)果
平原草地區(qū)2S37號塔基施工擾動區(qū)域解譯分類結(jié)果見圖6,9個(gè)典型樣點(diǎn)(塔基)擾動面積解譯計(jì)算結(jié)果統(tǒng)計(jì)見表4??梢钥闯?,卷積神經(jīng)網(wǎng)絡(luò)分類計(jì)算結(jié)果可信度較高,與目視解譯效果相當(dāng),相對誤差最大為 7.21%、最小為 4.32%。
圖6 平原草地區(qū)2S37號塔基擾動區(qū)域解譯結(jié)果
表4 平原草地區(qū)典型樣點(diǎn)擾動面積解譯計(jì)算結(jié)果統(tǒng)計(jì)
利用卷積神經(jīng)網(wǎng)絡(luò)算法和高分2號衛(wèi)星遙感影像可以快速識別平原農(nóng)作物區(qū)、山地林區(qū)、丘陵草地區(qū)、平原草地區(qū)等不同地形地貌區(qū)施工擾動區(qū)域(范圍),并準(zhǔn)確提取施工擾動面積,對各類地貌區(qū)典型樣點(diǎn)(特高壓輸變電工程塔基)施工擾動面積的分類計(jì)算結(jié)果與目視解譯結(jié)果基本一致,與實(shí)測值相比,相對誤差最大值為11.77%、最小值為1.20%,準(zhǔn)確率較高,表明其可用于水土保持監(jiān)測和管理。
基于殘差網(wǎng)絡(luò)ResNet50識別施工擾動區(qū)取得了較好的效果,但仍有一些需要改進(jìn)的地方。由于Res-Net50模型網(wǎng)絡(luò)層數(shù)較多、需要大量的參數(shù),因此訓(xùn)練過程中參數(shù)調(diào)整的時(shí)間長、訓(xùn)練難度較大、泛化能力不夠強(qiáng)。本研究使用ResNet50的預(yù)訓(xùn)練模型進(jìn)行網(wǎng)絡(luò)訓(xùn)練,并未對算法進(jìn)行細(xì)節(jié)方面的優(yōu)化,后續(xù)研究可考慮使用多種模型并結(jié)合空洞卷積、語義分割等方法進(jìn)行網(wǎng)絡(luò)訓(xùn)練,以提高識別精度。