金笑天,張振川
(1.遙導通(上海)信息有限公司,上海 210702;2.上海市信息技術研究中心,上海 210702)
近年來,在大數(shù)據(jù)技術的成熟應用、圖形處理器(GPU)硬件的不斷升級和神經網(wǎng)絡算法搭上深度學習的快車等諸多因素推動下,人工智能在自然語言處理、人臉識別、圖像識別、圖像搜索、聲紋識別、文字識別和機器翻譯等諸多應用領域已經達到甚至超過人類平均水平,這標志著人工智能研究迎來了第三次高潮[1]。人工智能的發(fā)展給各個行業(yè)和領域帶來了新的機遇和挑戰(zhàn)。
近年來隨著遙感技術的發(fā)展,遙感數(shù)據(jù)空間分辨率、時間分辨率、光譜分辨率和輻射分辨率越來越高,數(shù)據(jù)類型越來越豐富。遙感數(shù)據(jù)每天以TB級別的速度增長,而遙感數(shù)據(jù)的總量則達到了TB/PB級別。如此龐大的遙感數(shù)據(jù)也出現(xiàn)了大容量、高效率、多類型、難辨識、高價值、高維度、多尺度和非平穩(wěn)等特征。遙感行業(yè)急需新的技術方法來存儲和分析如此海量的數(shù)據(jù)。
人工智能在遙感領域的主要關鍵技術為:神經網(wǎng)絡技術、遙感大數(shù)據(jù)的異構數(shù)據(jù)庫技術、遙感圖像地表/地物智能分類技術和遙感數(shù)據(jù)建筑變化自動檢測技術等。
一個神經網(wǎng)絡是一個由簡單處理元構成的規(guī)模宏大的并行分布處理器,具有存儲經驗知識和使之可用的特性。神經網(wǎng)絡中的神經元模型是一個包含輸入、輸出與計算功能的模型,神經網(wǎng)絡則是將多個“神經元”連接起來,他們都有各自的輸入和輸出,神經元中最重要的東西是連接,每一個連接都代表著某一個權重,多個神經元連接起來形成了神經網(wǎng)絡,這樣才能夠發(fā)揮輸入、處理、輸出的一系列功能。比如在監(jiān)督學習中我們可以首先設定一個訓練用的樣本集(x i,y i)(xi,yi),然后根據(jù)我們設定的目標和策略進行訓練和擬合,訓練目標是通過神經網(wǎng)絡的訓練算法讓各個權重參數(shù)的值調整到最佳,從而使得神經網(wǎng)絡整體的預測效果達到最佳。神經網(wǎng)絡算法目前能夠支持非線性的假設模型h W,b(x)hW,b(x),針對事先準備好的訓練數(shù)據(jù)通過b,W參數(shù)進行擬合。
如圖1所示,兩層神經網(wǎng)絡不僅包含一個輸入層和輸出層,還包括一個中間層,此時輸出層和中間層都發(fā)揮計算層的作用,中間層也常被稱為“隱藏層”,當然我們也可以增加多個隱藏層,而我們在進行樣本訓練的時候,通常感知不到它們的值。
圖1 兩層神經網(wǎng)絡示意圖
在給定訓練數(shù)據(jù)集的情況下,可以構建一個神經網(wǎng)絡來對這些數(shù)據(jù)進行擬合。構建過程主要分為2步:(1)前向傳播;(2)反向求導。在前向傳播過程中,給定權值和bias矩陣,可以得到給定樣本對應的預測值(激活值);在反向求導過程,通過樣本預測值與樣本真實值之間的誤差來不斷修正網(wǎng)絡參數(shù),直至收斂。
神經網(wǎng)絡算法技術是人工智能的基礎算法技術,可用于遙感影像的各類學習和智能分類、自動檢測等。
遙感大數(shù)據(jù)的原始數(shù)據(jù)主要為巨大的非結構化的文件數(shù)據(jù),這些原始數(shù)據(jù)的存儲、處理需要以文件系統(tǒng)的非結構化存儲系統(tǒng)作為支撐,經處理后的結果數(shù)據(jù),通常需要導入數(shù)據(jù)庫用于后期查詢和應用。遙感大數(shù)據(jù)的數(shù)據(jù)來源多樣化,且具有數(shù)據(jù)格式多樣、數(shù)據(jù)類型復雜、結構化和半結構化數(shù)據(jù)并存等特點。同時因為遙感影像數(shù)據(jù)歷史信息在持續(xù)積累保存、新的數(shù)據(jù)在不停匯集和入庫,對于數(shù)據(jù)庫的操作比較頻繁,所以需要充分發(fā)揮整合多源異構遙感數(shù)據(jù)的時空數(shù)據(jù)庫的能力,并且需要重點解決多源異構數(shù)據(jù)整合、大數(shù)據(jù)存儲、數(shù)據(jù)分類和標簽化與數(shù)據(jù)檢索等諸多難題和挑戰(zhàn)。利用遙感大數(shù)據(jù)和AI技術方法,進行遙感數(shù)據(jù)的匯集、分類、聚類、標簽化、檢索和多維分析等,可以有效解決這些難題和挑戰(zhàn)。
遙感大數(shù)據(jù)的異構數(shù)據(jù)庫技術通常采用Hadoop/Spark大數(shù)據(jù)平臺,該平臺支持分布式集群和海量數(shù)據(jù)搜索引擎,包括來自于海量數(shù)據(jù)庫的結構化信息和來自于非結構化內容的信息,建立合適的索引,并通過數(shù)據(jù)分片技術,把這些索引信息分片存儲在不同的物理節(jié)點上。該系統(tǒng)對外提供JAVA/.NET編程接口,或者RESTful的服務,支持索引和搜索任務的產生、調度和結果合并,支持優(yōu)化的多階段任務管理,支持模糊查詢、組合查詢、相似查詢和特征統(tǒng)計(Facet)等高級搜索功能。通過AI技術進行數(shù)據(jù)分類、聚類和自動標簽化,建立快速索引和查詢機制為后面的遙感數(shù)據(jù)解譯、分析和應用打下良好基礎。
遙感衛(wèi)星影像具有載荷手段多、獲取信息快、更新周期短、能夠動態(tài)監(jiān)測以及受限制條件少等優(yōu)勢,已經在很多行業(yè)得到廣泛應用。但是高空間分辨率遙感圖像具有海量數(shù)據(jù)、復雜細節(jié)和尺度依賴的特點,使得圖像信息智能快速提取成為應用瓶頸,影響遙感數(shù)據(jù)使用的效率和深度。遙感影像分類的主要流程是基于提前設定好的類別和特征庫,解譯分析遙感圖片,并通過特定的算法提取相應的地物類別,可以通過大數(shù)據(jù)和AI的技術實現(xiàn)自動化和半自動化的圖像語義分析,實現(xiàn)智能分類和標簽化,隨著算力和算法的不斷提高,基于AI的地表地物的智能分類技術和效率已經走向實用化的階段。在很多已經成熟應用遙感技術的領域,如自然資源(水田林濕礦等)的變化監(jiān)測中均有重要應用價值。
遙感圖像反映了自然地物和人工設施在地表的分布,沒有明顯的“前景”與“背景”的差別,也沒有明顯的“中央?yún)^(qū)域”與“邊緣區(qū)域”的差別,難以對遙感圖像進行語義分割。針對遙感圖像語義分割的任務,有FCN、U-Net、SegNet和DeepLab等多種經典模型,而通過研究表明,U-Net能夠有效地進行遙感圖像信息提取。
全卷積神經網(wǎng)絡模型中經常使用U-net網(wǎng)絡,它是一個U型狀的網(wǎng)絡,包括擴張網(wǎng)絡和收縮網(wǎng)絡這兩大類,U-net網(wǎng)絡和傳統(tǒng)FCN網(wǎng)絡相比,具有在上采樣的時候整合更多層次的特點和優(yōu)勢,好處在于能夠充分保存采樣過程中的重要特征信息。模型架構如圖2所示[2]。
圖2 U-net架構示意圖
圖2代表了端-端的圖像處理,輸入和輸出都是一副圖像。核為1X1的卷積操作用conv 1X1來表示,該網(wǎng)絡只包含了下采樣和卷積,并沒有實現(xiàn)全連接。
目前,建筑物變化檢測的方法多種多樣,其中以圖像匹配的變化檢測方法、圖像匹配和高程信息分析相結合的變化檢測方法等最為經典。我們可以使用人工智能的幾何結構特征搜索分析法來提高建筑物變化自動檢測的精度和效率,利用人工智能技術進行特征標注和訓練,進而采用特征搜索分析法,對比不同時相的遙感圖像,基于特定算法自動化地進行建筑物的特征提取,然后將不同時相圖像所提取的線段特征等進行對照和分析,判別新建建筑物、拆除建筑物、毀壞建筑物以及改建建筑物等。
城市植被覆蓋的類型、生物量、生態(tài)功能及綠化效應都不盡相同,所以很難單純通過簡單的解譯分析得到城市的實際“綠量”數(shù)據(jù),通過遙感圖像地表智能分類技術,識別地表植被類型和覆蓋面積,從而間接體現(xiàn)城市植被的生物總量和實際綠化效應??梢圆捎贸鞘兄脖痪G地提取監(jiān)測算法快速自動化提取不同時相遙感影像中林地變化區(qū)域的矢量結果,快速實現(xiàn)植被綠地變化圖斑提取,效率相比人工提升超百倍,為植被綠地智能化監(jiān)測預警提供有力技術支撐。
張友靜、高云霄等學者采用高分衛(wèi)星遙感影像IKONOS,以城市植被類型信息為對象[3],構建了基于支持向量機(SVM)決策樹的城市植被綠地分類模型,SVM模型方法在通用分類方法的基礎上,分析了SVM的核函數(shù)。該方法和傳統(tǒng)分類方法比較,對城市植被綠地分類的準確度可以達到80%以上,而對于綠化面積的識別精度可以達到95%。
遙感為監(jiān)測城市土地利用變化提供了重要手段,通過對遙感影像進行可視化解譯,應用遙感數(shù)據(jù)建筑變化自動檢測技術,實現(xiàn)土地利用情況信息的獲取和監(jiān)測。城市用地監(jiān)測的一個主要工作內容是“兩違監(jiān)測”(即違法用地和違法建設),傳統(tǒng)上利用人工方式進行巡查進而發(fā)現(xiàn)“兩違”的方法和流程,具有取證難、工作周期長、成本高和效率低等特點,無法滿足“兩違”監(jiān)測的實際業(yè)務需求?;诖髷?shù)據(jù)和人工智能的“兩違監(jiān)測”方法,具備較高的準確率和工作效率。
高誠鵬提出運用多源遙感手段,綜合衛(wèi)星遙感、大飛機航攝與無人機航拍的方式,獲取福清市的數(shù)字正射影像(DOM)、數(shù)字高程模型(DEM)等工作底圖,并基于事先設定好的“兩違”疑似圖斑判別規(guī)則和標準,充分發(fā)揮遙感技術的實時性和動態(tài)性,疊加和對比不同時間段的遙感影像,采用人工智能檢測技術進行圖斑的自動化比對,并通過人機交互解譯方式,解譯判讀“兩違”疑似圖斑,實現(xiàn)“兩違”監(jiān)測的自動化作業(yè)并形成專題專業(yè)產品。
道路是城市發(fā)展的主要構成要素,對于道路路網(wǎng)的監(jiān)測和管理是城市管理的重要工作內容。傳統(tǒng)的城市道路的路網(wǎng)繪制和監(jiān)測,基本都是依據(jù)線下測量和制圖的方式來進行,具有人工費時、更新速度慢、效率不高的特點。隨著近年來我國經濟的高速發(fā)展,城市內的路網(wǎng)變化也日益加速,為了能夠確保路網(wǎng)監(jiān)測、路網(wǎng)繪制的實時性和現(xiàn)勢性,需要采用新技術方法來保證路網(wǎng)信息的高頻更新,能夠更迅速、更高效地進行路網(wǎng)的監(jiān)測、提取、制圖、輸出和應用等。
王俊強、李建勝等學者把Deeplabv3+語義分割模型應用于道路網(wǎng)格的提取,通過采用遷移學習、數(shù)據(jù)增強和預測結果融合等技術方法,實現(xiàn)了對于道路路網(wǎng)的迅速提取和優(yōu)化。通過提前設計和調整網(wǎng)格劃分規(guī)則、設計海量路網(wǎng)數(shù)據(jù)存儲方式等,進一步實現(xiàn)廣域路網(wǎng)的劃分分割、分析提取、高效存儲和檢索等功能。所以利用AI技術對遙感影像進行自動化提取和分析,可以更有效地識別街道、高速路和橋梁等路網(wǎng)信息,形成城市路網(wǎng)監(jiān)測產品,也可以進一步有效監(jiān)測和跟蹤非法資源占用等。
人工智能技術的發(fā)展給遙感行業(yè)帶來了新的機遇和挑戰(zhàn),人工智能在神經網(wǎng)絡技術、遙感大數(shù)據(jù)的異構數(shù)據(jù)庫技術、遙感圖像地表/地物智能分類技術、遙感數(shù)據(jù)建筑變化自動檢測技術上為時空大數(shù)據(jù)和數(shù)據(jù)建模處理提供技術支持,不斷推動著遙感技術的發(fā)展與變革。給城市植被綠地監(jiān)測、城市用地監(jiān)測、城市路網(wǎng)監(jiān)測和重大工程監(jiān)測等應用帶來了技術上的革新,大幅度提高了遙感影像提取、識別、解譯和輸出的效率。未來隨著人工智能技術的不斷進步,將進一步給遙感行業(yè)的更新帶來源源不斷的動力。