文/石松
近年來,隨著衛(wèi)星傳感器、4G5G 信息通信技術的發(fā)展,可以快速獲取和存儲海量的高分辨率遙感影像已經成為人們觀察和研究地球最重要的數據來源之一[1]。高分辨遙感數據呈現出明顯的“大數據”特征,遙感大數據具有容量大、難辨識、多維度和非平穩(wěn)等特點,如何通過遙感大數據的智能分析和數據挖掘來破解對地觀測面臨的問題,從而實現人類視野最大限度的延伸,已經成為研究熱點[2,3]。目前,通過對航天衛(wèi)星遙感影像的人工判讀是目前國土資源監(jiān)測采用的主要方法之一。但新型的國土資源監(jiān)測需要需要開展基于不同分辨率、多時相的連續(xù)監(jiān)測,對于所采集的大量不同來源的影像難以全部通過人工判讀的手段進行,因為這種方式不僅需要消耗大量的人力、物力,而且對監(jiān)測目標狀態(tài)變化實時感知性差。由此可見,一方面是光譜信息越來越豐富、數據量越來越大的多源遙感影像數據,另一方面是越來越精細,越來越廣泛、實時性要求越來越高的監(jiān)測要求,這一矛盾已經成為制約國土資源監(jiān)測質量和水平提升的重要瓶頸。因此,如何擺脫單純依靠人工影像解譯方式,實現對海量的多時相、非同源的遙感影像中智能解譯,對創(chuàng)新國土資源監(jiān)測及城市監(jiān)管具有重要意義。
早期的影像智能解譯,不少研究者將傳統(tǒng)的機器學習技術引入到影像的自動判讀中,取得了一定的成果。但是這種方法最大難點在于機器難以自主學習樣本特征,而需要有豐富經驗的業(yè)務專家參于確定關鍵特征,且不同區(qū)域、不同地物的特征有很大差異,因此這種方法難以大規(guī)模推廣。近年來,在神經網絡基礎上快速發(fā)展起來的深度學習技術在影像識別中取得重要進展,同時大規(guī)模分布式并行集群計算技術的發(fā)展為深度學習推向實用提供了重要基礎條件。深度學習最重要的優(yōu)勢是,理論上只要神經網絡的層數足夠,樣本數量與質量滿足,通過機器能夠自動學習訓練影像樣本的特征,從而大幅度降低人工介入的工作量。深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據。
圖1:遙感影像自動分析平臺系統(tǒng)結構
圖2:基于深度學習的格網化的地物變化檢測技術路線
圖3:基于金字塔場景解析網絡的遙感圖像語義分割
基于此,本平臺設計的出發(fā)點在于通過深度學習技術從實時采集的高分辨率、多光譜的國土資源影像中自動提取監(jiān)測目標信息,并自動分析監(jiān)測對象的狀態(tài)變化,做到精準定位與實時預警,創(chuàng)新國土資源監(jiān)測新方式。
平臺系統(tǒng)結構如圖1所示。至下而上共分為5 個層,分別是:
提供海量遙感影像存儲以及對遙感影像進行智能提取的計算能力,由分布式存儲集群和分布式計算集群組成。
存儲和管理基礎地理信息(如行政區(qū)劃等)、多分辨遙感影像數據庫、業(yè)務數據庫以及用于對數據進行描述的元數據庫。
包括ARCGIS空間數據引擎、消息中間件、服務注冊與發(fā)布、應用服務器等。
平臺服務層用以實現平臺對外服務。包括目標檢測、對監(jiān)測對象的變化檢測、遙感影像的語義分割、空間分析(如空間疊加和緩沖分析)、影像查詢服務等。
平臺應用層是指平臺提供給業(yè)務系統(tǒng)的服務調用,包括實現土地利用、執(zhí)法監(jiān)察、地災監(jiān)測等。
在國土資源智能監(jiān)測中,監(jiān)測地物因時間的變化是一個關鍵應用。由不同的時間點衛(wèi)星拍攝的遙感影像,來判斷地物目標的變化,這是屬于語義級的變化監(jiān)測。本文提出先將不同時間點的影像進行配準,然后使用分類的方法對配準的影像塊的地物類型進行分類及確定是否變化和變化類型,為了利于計算,以格網為單位。在遙感影像地物目標的分類問題上,一個必須利用到的重要線索是地物目標的上下文信息,地物的上下文信息利用可以輔助地物目標的分類。本文設計可以提取不同尺寸大小的上下文信息的神經網絡結構,以更好的對地物目標分類。在同一區(qū)域,不同時間點拍攝的遙感影像網格對齊和分類基礎上,根據神經網絡的輸出,來對地物的變化進行推斷。如圖2所示。
遙感影像的語義分割是根據圖像內容對指定區(qū)域進行標記的計算機視覺任務,在遙感影像應用于國土資源監(jiān)測中,需要最常見的農田、道路、農房、建筑物、植被、林地、水體的智能提取,即以像素為基元,在同一張影像中明確每類實體的不同邊界,以實現對遙感影像像素級的理解。
在遙感影像的實體分割上,考慮到遙感影像地物實體上下文的復雜的強關聯(lián)性,本文采用了業(yè)界主流的PSPNET[4](即金字塔場景解析網絡)算法,這種算法與經典的FCN(全卷積網絡)相比,實現了全局場景信息的利用,而PSPnet解決了這個問題,其概述如圖3所示:
(1)輸入需要預測的圖像。
(2)通過基礎層即(帶有空洞卷積的與預訓練ResNet)提取特征圖,大小是輸入圖像的1/8。
(3)在卷積層設計上,采用四種不同金字塔尺度的特征,第一行紅色的是最粗糙的特征,即全局池化生成單個輸出,后面的三行是不同尺度的池化特征。為了保證全局特征的權重,如果金字塔一共有N 個級別,則每個級別后使用1×1 的卷積層來將對應的語義特征的通道數降為原始1/N,再通過上采樣(雙線性插值)來將特征圖恢復至未池化前的尺寸,并concat 到一起。
圖4:建筑物、水體、農田的提取實例
圖5:道路提取實例
(4)經過金字塔池化模塊來獲取語義信息,使用四種不同的層級的金字塔分別獲取不同尺度的分割結果,并以上采樣方式將其融合為原始特征圖大小,從而完成語義分割。
根據上述設計,筆者所帶領的團隊自主研發(fā)了基于AI 的遙感影像分析平臺,目前深度學習算法主要采用了PSPNET 來實現。地理信息基礎軟件采用ARCGIS 10.5,算法開發(fā)采用Python3.5。以下采用的遙感影像數據是福州市倉山區(qū)2018年的高分二號遙感影像數據,分辨率是0.8M。如圖4、圖5所示,目前識別精度>70%。
本文論述了基于深度學習的遙感影像分析平臺的設計和實現,重點包括了遙感影像分析平臺的系統(tǒng)結構以及基于語義分割提取遙感信息的關鍵技術路線。下一步將繼續(xù)完善平臺功能和算法調優(yōu),推動國土資源監(jiān)測實現周期性調查到動態(tài)性監(jiān)測的轉型升級。