蔣 巍,張淑霞,馬小燕,薛 青
(1. 寧夏回族自治區(qū)自然資源成果質(zhì)量檢驗(yàn)中心,寧夏 銀川 750004;2. 西安銳思數(shù)智科技股份有限公司,陜西 西安 710000)
深度學(xué)習(xí)方法是對復(fù)雜圖像場景識別解析的重要方法之一,已被廣泛應(yīng)用于計算機(jī)視覺任務(wù)。盡管基于深度學(xué)習(xí)在地圖要素提取方面取得了一些成果,但是在比例尺有差異的地圖中,比對地圖的幾何特征研究時,還沒有更加全面的智能化算法及技術(shù)[1-8]。本文以深度學(xué)習(xí)為技術(shù)手段,以人工標(biāo)注的地圖的線性要素走向數(shù)據(jù)為依據(jù),分析判定待審地圖的線性要素走向的正確性。在以寧夏回族自治區(qū)行政地圖的線狀要素提取為實(shí)際案例,其中包括行政邊界和河流,來驗(yàn)證算法的有效性,期望為地圖審查中各類要素的地理位置確定提供參考。
地圖審圖依據(jù)的參考是標(biāo)準(zhǔn)地圖集,為實(shí)現(xiàn)待審地圖中線性要素走向的正確性,具體流程如圖1所示。
圖1 線性要素走向判定流程圖
通常我們將標(biāo)準(zhǔn)地圖集作為參考地圖,它的尺寸和分辨率往往與待審地圖不同,因此首先需要對2 幅地圖進(jìn)行配準(zhǔn)對齊。本文利用地圖中重要的地理目標(biāo)作為配準(zhǔn)的控制點(diǎn),使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行地理控制點(diǎn)的識別和定位。
選擇的地理目標(biāo)如表1所示,在樣本地圖上標(biāo)注省會城市、地級市和機(jī)場等地理目標(biāo)樣本數(shù)據(jù),生成目標(biāo)檢測訓(xùn)練樣本,所選地圖可以是待審地圖或標(biāo)準(zhǔn)地圖集,使用YOLOV7目標(biāo)識別算法訓(xùn)練地理目標(biāo)識別神經(jīng)網(wǎng)絡(luò)模型。通過訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)等提取圖像的高級語義特征,采用分類方法對輸入圖像的區(qū)域特征進(jìn)行識別和提取,采用梯度下降算法優(yōu)化模型輸出。在定位地理目標(biāo)時借助文字提取和識別算法,并采用OCR相關(guān)技術(shù)輔助定位,簡化目標(biāo)查找難度并提高算法魯棒性。
表1 地圖地理目標(biāo)識別模型的類型定義
在地圖審圖過程中,有標(biāo)準(zhǔn)地圖集作為參考,也存在因?yàn)楸壤邌栴}導(dǎo)致待審地圖與標(biāo)準(zhǔn)地圖的分級地圖級別、范圍不能一一對應(yīng),因此需要將二者配準(zhǔn)對齊。具體地圖配準(zhǔn)步驟包括以下5點(diǎn)。
1)匹配標(biāo)準(zhǔn)地圖:通過待審地圖的比例尺、尺寸、分辨率(dots per inch,DPI)等,匹配標(biāo)準(zhǔn)地圖庫中相應(yīng)級別的標(biāo)準(zhǔn)地圖圖像數(shù)據(jù)。
2)提取地理目標(biāo)點(diǎn):通過已訓(xùn)練的深度學(xué)習(xí)目標(biāo)檢測模型與計算機(jī)視覺圖像算子,如角點(diǎn)檢測等,提取待審地圖中的地理目標(biāo)位置集合和標(biāo)準(zhǔn)地圖圖像中的地理目標(biāo)位置集合。地圖地理目標(biāo)包括市鎮(zhèn)鄉(xiāng)村的位置、河流分叉點(diǎn)、河流匯聚點(diǎn)、道路起止點(diǎn)和道路交叉口等關(guān)鍵點(diǎn)。當(dāng)標(biāo)準(zhǔn)地圖中地理目標(biāo)的坐標(biāo)已知時可直接利用其坐標(biāo)參數(shù)。
3)地理目標(biāo)點(diǎn)匹配:在已提取的待審地圖地理目標(biāo)位置與標(biāo)準(zhǔn)地圖地理目標(biāo)位置之間建立映射關(guān)系,進(jìn)行地圖地理關(guān)鍵點(diǎn)對的匹配。將關(guān)鍵點(diǎn)特征中,包括名稱、圖像特征和幾何特征等做矢量化。通過距離函數(shù)計算得到不同關(guān)鍵點(diǎn)矢量的距離,距離小于閾值的點(diǎn)對作為匹配的關(guān)鍵點(diǎn)對。將關(guān)鍵點(diǎn)對依據(jù)特征距離進(jìn)行降序排序,找到前n個(n≥3)最接近的關(guān)鍵點(diǎn)對,從而確定幾何變換的控制點(diǎn)。
4)地圖幾何變換:采用仿射變換的幾何變換方法將映射關(guān)系作為控制點(diǎn),通過公式(1)和(2)將待審地圖和標(biāo)準(zhǔn)地圖進(jìn)行配準(zhǔn)。
式中,變換前坐標(biāo)x,y;變換后坐標(biāo)x’,y’;系數(shù)矩陣M為變換矩陣。
5)獲得幾何變換后配準(zhǔn)對齊的地圖對。
通過DeeplabV3神經(jīng)網(wǎng)絡(luò)算法,對表2所示地圖中省市縣區(qū)行政邊界、雙線河流、單線河流、高速公路、高速鐵路、各級公路、國鐵等線性要素進(jìn)行提取。將輸出的推理結(jié)果作為線性要素的掩膜,得到線性要素的感興趣(region of interest,ROI)區(qū)域,在ROI區(qū)域獲得線性地物的邊緣并提取中心線。對中心線上的點(diǎn)密集采樣,獲得一系列中心線采樣點(diǎn)坐標(biāo)(x,y)。
表2 地圖線性要素分類模型的類型定義
建立標(biāo)注地圖線性要素中心線樣本庫,作為待審地圖中線性要素走向判定的標(biāo)準(zhǔn)參考。利用上述線性要素輪廓提取和中心點(diǎn)采樣方法,對標(biāo)準(zhǔn)地圖中的省市縣區(qū)行政邊界、雙線河流、單線河流、高速公路、高速鐵路、各級公路和國鐵等線性要素做輪廓提取,并獲得中心點(diǎn)坐標(biāo)(x,y),構(gòu)建標(biāo)準(zhǔn)參考庫。
如式(3)所示,在獲得待審地圖線性要素中心點(diǎn)S坐標(biāo)(xs,ys)和標(biāo)準(zhǔn)地圖中心參考點(diǎn)R坐標(biāo)(xr,yr)后,地圖線性要素走向偏差判定依據(jù)參考點(diǎn)S與其最近待審地圖中心點(diǎn)R的歐氏距離d進(jìn)行判定,設(shè)定閾值t,作為分類的判斷標(biāo)準(zhǔn)。
待審地圖線性要素中心點(diǎn)定位算法是通過參考點(diǎn)R坐標(biāo)(xr,yr)計算周邊偏移量以內(nèi)的點(diǎn)距離,在計算過程中記錄最小距離點(diǎn)N的坐標(biāo)(xn,yn)。
如圖2 所示,紅色圓圈是待審地圖中心點(diǎn),綠色圓點(diǎn)是配準(zhǔn)后的標(biāo)準(zhǔn)地圖參考點(diǎn),距離不超過一定閾值則被判定為走向正確。閾值根據(jù)圖像分辨率設(shè)置,本文定義為3個像素。
圖2 待審地圖線性要素中心點(diǎn)示意圖
為準(zhǔn)確評價本文所采用深度學(xué)習(xí)方法對地圖線性要素的識別能力,選取常用評價方法準(zhǔn)確率(pixel accuracy, PA)、 召回率(Recall)、F1 測度值(F1-Score) 和平均交并比(mean intersection over union,MIoU)4個參數(shù)對模型性能進(jìn)行評價。
式中,TP為真實(shí)標(biāo)簽為正確分類且預(yù)測結(jié)果也為正確分類的個數(shù);FP為真實(shí)標(biāo)簽為錯誤分類但預(yù)測結(jié)果為正確分類的個數(shù);FN為真實(shí)標(biāo)簽為正確分類但預(yù)測結(jié)果為錯誤分類的個數(shù);TN為真實(shí)標(biāo)簽為錯誤分類且預(yù)測結(jié)果也為錯誤分類的個數(shù);P為預(yù)測值;G為真實(shí)值;K為總類別個數(shù)。
采用深度學(xué)習(xí)方法對寧夏回族自治區(qū)行政地圖提取自治區(qū)界與清水河走向,其中結(jié)果如圖3、4所示。
圖3 寧夏回族自治區(qū)行政地圖與寧夏回族自治區(qū)界走向提取結(jié)果圖審圖號:寧S(2022)第001號
圖4 寧夏回族自治區(qū)行政地圖與清水河走向提取結(jié)果圖審圖號:寧S(2022)第001號
利用模型評價參數(shù)對目標(biāo)識別方法和語義分割方法的識別與提取結(jié)果做精度評價,由表3 可知,目標(biāo)識別方法的準(zhǔn)確率、召回率和F1 測度值分別為78.26%、87.97%和82.83%;語義分割方法的平均交并比(mean intersection over union,MIoU)為88.00%。
表3 識別結(jié)果統(tǒng)計分析
點(diǎn)緩沖區(qū)是以點(diǎn)對象為圓心,以給定的緩沖距離為半徑生成的圓形區(qū)域。在線性要素走向判定的過程中,采用設(shè)定點(diǎn)緩沖區(qū)的方法決定輸出線性要素的位置范圍,確定行政邊界和河流的走向偏差是否符合要求。點(diǎn)緩沖區(qū)數(shù)學(xué)表達(dá)式為:
即以線性要素中第i點(diǎn)Oi為圓心,對象Oi的半徑為r的緩沖區(qū);Bi為距Oi的距離d小于等于r的全部點(diǎn)的集合;d為最小歐氏距離。
其中,通過實(shí)驗(yàn)確定的經(jīng)驗(yàn)值,將行政邊界走向判定的緩沖區(qū)范圍設(shè)定為5 個像素,將河流走向判定的緩沖區(qū)范圍設(shè)定為5 個像素,其判定結(jié)果分析如表4所示。
表4 線性要素的閾值設(shè)定與分析
由上表可知,將行政邊界和清水河的緩沖區(qū)半徑設(shè)定為5 個像素,即以5 個像素為行政邊界的緩沖區(qū)的界內(nèi)認(rèn)定為正確的線性走向,溢出緩沖區(qū)則視為錯誤的邊界和走向。采用人工方法在行政地圖上選取寧夏回族自治區(qū)行政邊界樣本點(diǎn)1105 個,清水河樣本點(diǎn)542 個,對本文的方法進(jìn)行總體的精度評價,結(jié)果表明,行政邊界線性要素判定的準(zhǔn)確率(PA)和召回率(Recall)分別為91.86%和96.19%;清水河線性要素判定的準(zhǔn)確率(PA)和召回率(Recall)分別為94.68%和85.42%。
選擇銀川市、固原市、石嘴山市、吳忠市、中衛(wèi)市和寧夏回族自治區(qū)6個區(qū)域的82張行政區(qū)劃地圖和專題地圖,其中包括64 張正確地圖和18 張包含錯誤信息的地圖,采用本文的方法與傳統(tǒng)的人工目視解譯方法進(jìn)行對比,結(jié)果如表5所示。
表5 傳統(tǒng)的人工目視解譯方法與深度學(xué)習(xí)方法對比分析
由上表可知,采用傳統(tǒng)的人工目視解譯方法效率為180 s/幅,本文方法效率為15 s/幅。傳統(tǒng)的人工目視解譯方法采用抽樣的方式進(jìn)行審查,只關(guān)注易錯區(qū)域和包含敏感信息的區(qū)域,而本文方法全面審查地圖,能夠發(fā)現(xiàn)偶發(fā)錯誤,其審查面積占比明顯高于傳統(tǒng)的人工目視解譯方法。
由于本文選擇YOLOV7目標(biāo)識別方法定位地理標(biāo)志點(diǎn),具有較高的置信度和檢測速度且占用內(nèi)存較小,能夠快速為配準(zhǔn)提供高精度的控制點(diǎn)位置;選擇配準(zhǔn)方法對地圖進(jìn)行預(yù)處理,使得地圖與標(biāo)準(zhǔn)參考地圖的吻合度更高;DeeplabV3 語義分割方法具有更高的分割精度和處理效率,對地圖的細(xì)節(jié)特征提取能力更強(qiáng),其對地圖中的河流要素進(jìn)行了準(zhǔn)確的定位與提??;地圖線性要素走向偏差判定方法采用設(shè)定閾值的方式,能更靈活適應(yīng)對河流審查的定制化標(biāo)準(zhǔn)。因此,本文的方法不僅具有較高的查準(zhǔn)率和查全率,還可以廣泛運(yùn)用于復(fù)雜多樣的地圖要素審查中。
不同比例尺待審地圖的配準(zhǔn)是決定判定進(jìn)度的關(guān)鍵環(huán)節(jié),為降低配準(zhǔn)時的誤差對判定精度產(chǎn)生的影響,在標(biāo)準(zhǔn)參考地圖庫中準(zhǔn)備大、中、小3 種級別比例尺的參考地圖,選取與待審地圖最接近的參考圖使配準(zhǔn)過程中產(chǎn)生的誤差降低;其次,在多對配準(zhǔn)點(diǎn)中選擇至少3 對以上作為地理目標(biāo)點(diǎn),通常選取最常見的易定位的地理標(biāo)志,如省會城市、地級市和著名山峰等做參考,使獲取的候選點(diǎn)具有更高的魯棒性,且使得待審地圖上某些地理目標(biāo)點(diǎn)不存在或難以查找和準(zhǔn)確定位時,確保有其他候補(bǔ)地理目標(biāo)點(diǎn)可用;此外,地理目標(biāo)點(diǎn)的分布應(yīng)盡量離散或靠近待審線性要素對象,以降低地圖幾何變換后待審線性要素對象與標(biāo)準(zhǔn)參考圖中的先行要素對象的誤差。不同比例尺下標(biāo)準(zhǔn)地圖選取以及地圖配準(zhǔn)帶來的判定精度影響的定量分析還需進(jìn)一步研究。
本文通過訓(xùn)練目標(biāo)識別和語義分割深度神經(jīng)網(wǎng)絡(luò),識別和提取寧夏回族自治區(qū)行政區(qū)劃地圖的地理目標(biāo)和線性要素,在深度神經(jīng)網(wǎng)絡(luò)的解譯結(jié)果基礎(chǔ)上對地圖線性要素走向進(jìn)行判定,實(shí)驗(yàn)結(jié)果表明具有較好的提取效果。本文僅對地圖的線性要素走向進(jìn)行判定,且在線要素與點(diǎn)要素的位置關(guān)系判定中,對于不同復(fù)雜程度的地圖適用性未做進(jìn)一步的實(shí)驗(yàn),下一步研究將針對不同類型的地圖測試方法的泛化性能。