鐘 靜,劉星瑞,郭明強,,3,4*
(1.湖北地信科技集團股份有限公司,湖北 武漢 430200;2.中國地質大學(武漢)地理與信息工程學院,湖北 武漢 430074;3.中國地質大學(武漢)計算機學院,湖北 武漢 430074;4.國家地理信息系統(tǒng)工程技術研究中心,湖北 武漢 430200)
隨著大數(shù)據(jù)、云計算、人工智能等技術的不斷進步,深度學習技術在圖像識別方面取得了重大進展[1]。在遙感領域,近年也利用深度學習技術支持場景理解、地物目標檢測與土地覆蓋分類等任務。人們通過構建大量樣本數(shù)據(jù)訓練深度學習網(wǎng)絡,顯著提高了遙感影像特征提取成效[2-4]。人工智能在各個行業(yè)廣泛應用的過程中,對數(shù)據(jù)的完整性、數(shù)據(jù)標注效率、數(shù)據(jù)精準程度、數(shù)據(jù)維度和樣本復雜性的要求越來越高,這對樣本標注技術、標注平臺能力、樣本協(xié)同標注等都提出了挑戰(zhàn)。樣本標注是樣本庫建設的基礎工作[5],作為人工智能模型訓練過程直接與數(shù)據(jù)精度銜接的一環(huán),樣本標注更是整個工作流程的重中之重。
隨著AI行業(yè)的發(fā)展,優(yōu)質數(shù)據(jù)可能成為公司發(fā)展的壁壘。但無論大中小企業(yè),在面對樣本標注任務時,或多或少都會有技術或者資源上的問題,這歸因于樣本標注行業(yè)目前還沒有較好的在線數(shù)據(jù)協(xié)作標注平臺,也沒有一個樣本標注的統(tǒng)一標準。在這種行業(yè)狀況下,亟需一個能夠實現(xiàn)共享標注、樣本統(tǒng)一管理的在線標注平臺。本文以解決遙感影像深度學習樣本標注的實際問題為基準,設計并實現(xiàn)了一種基于Web-GIS的遙感影像深度學習樣本在線標注系統(tǒng)。
隨著互聯(lián)網(wǎng)技術飛速發(fā)展,人們的生產方式、思維方式、學習方式都發(fā)生了翻天覆地的變化,同時也加速了中國邁向學習型社會的步伐。深度學習作為一種新的學習方式,已越來越受到研究者和學習者的重視[6]。對遙感影像進行深度學習樣本采集并非新課題,在各大高校、研究所或相關單位中,可見許多專用的遙感影像深度學習樣本標注軟件。
互聯(lián)網(wǎng)的高共享,信息獲取快的特點為遙感影像深度學習樣本標注提供了更多的便利。目前市面上的深度學習樣本標注系統(tǒng)雖然都服務于數(shù)據(jù)標注工作,但其功能各有差異,解決的問題也各不相同。例如航天宏圖公司的PIE-Engine樣本協(xié)同標注平臺面向的是整個數(shù)據(jù)采集、標注、訓練、應用的過程,其數(shù)據(jù)格式和標注過程也更加偏向其對應的數(shù)據(jù)訓練模型[7];華為云的AI開發(fā)平臺ModelArts提供其原創(chuàng)的數(shù)據(jù)標注系統(tǒng),涵蓋圖片、音頻、文本、視頻等多種介質的分類方法以及海量的數(shù)據(jù)處理功能,但需要依賴華為云提供的云服務器,操作較為復雜,不利于團隊協(xié)作標注;杭州景聯(lián)文科技有限公司和北京倍賽科技有限公司的樣本標注品平臺均提供2D、3D融合標注,點云標注及OCR轉寫功能,其中景聯(lián)文公司的數(shù)據(jù)標注偏向于指紋識別方向,而倍賽公司的數(shù)據(jù)標注偏向于醫(yī)學研究,對于遙感影像的標注沒有一套完整有效的標準。其他大部分的深度學習樣本標注系統(tǒng)也都具有類似問題。但不可否認的是,現(xiàn)有的深度學習樣本標注技術已經較為成熟,為遙感影像深度學習樣本標注系統(tǒng)的構建提供了寶貴的案例和技術支持。
國外在深度學習領域起步早,研究者眾多,在數(shù)據(jù)標注方向相關研究領先我國。面向數(shù)據(jù)標注工作的專業(yè)軟件就有十余種。其中,可應用于遙感領域的具有多用戶在線協(xié)同功能的有CVAT、Labelstudio、Scalabel等。在本地運行的單機標注軟件有LabelMe、Vatic、Sloth、Annotorious等。但無論是國內還是國外,在Web端的多用戶協(xié)作標注平臺發(fā)展并不成熟,做得比較完備的如CVAT使用的是Django框架管理用戶,在Web端上傳數(shù)據(jù)并創(chuàng)建標注任務,且需要Docker容器環(huán)境運行,安裝復雜且數(shù)據(jù)上傳不穩(wěn)定,等待時間甚至多于工作時間。
總體來看,亟需研究并開發(fā)遙感影像深度學習樣本在線標注平臺,提升樣本標注團隊的工作效率,提高遙感影像深度學習樣本質量,最大程度減輕樣本標注復雜程度。
經過分析,樣本在線標注系統(tǒng)需要滿足如下特點:標注工具部署在Web端,能即開即用;數(shù)據(jù)最好放在服務器端統(tǒng)一的樣本數(shù)據(jù)庫中,避免本地數(shù)據(jù)二次上傳浪費人力物力;有公開的樣本數(shù)據(jù)可供參考、學習;用戶之間能夠分享自己標注的樣本。
作為一個樣本在線標注系統(tǒng),至少需具備在線協(xié)作樣本標注基本功能。從標注用戶角度出發(fā),需考慮樣本的呈現(xiàn)方式,簡化協(xié)作標注過程,對已標注的樣本考慮是否需要可視化展示及如何展示;從管理員角度出發(fā),應了解如何進行用戶信息管理和平臺樣本管理。對上述需求分析,系統(tǒng)功能規(guī)劃為影像地圖基礎功能、樣本標注核心功能、數(shù)據(jù)管理功能、網(wǎng)站業(yè)務功能四大模塊,系統(tǒng)整體功能需求如圖1所示。
由于遙感影像深度學習的在線標注系統(tǒng)是面向大規(guī)模樣本進行標注的,涉及到的人員范圍較廣,這就要求該系統(tǒng)能夠支持大規(guī)模的人員登錄,同時也可以防止由于并行操作而造成的系統(tǒng)信息差錯。
管理員登錄人數(shù)少,但是要處理海量的數(shù)據(jù),對本系統(tǒng)服務的容量有較高要求,否則會導致網(wǎng)頁出現(xiàn)卡頓,從而影響用戶的體驗感。同時,如果與相關部門合作,會利用政府的內部資料,進行必要的安全防護,以避免信息外泄。
綜上所述,系統(tǒng)需具備性能高,操作簡單,數(shù)據(jù)安全性高,統(tǒng)維護便捷,可用性好等特點。
本文設計的遙感影像深度學習樣本在線標注系統(tǒng)采用B/S架構,REST服務風格設計,前后端分離的開發(fā)風格,利用瀏覽器完成對工作頁的訪問。極少部分的業(yè)務邏輯存在于瀏覽器端,從而降低了服務器的負荷,也降低了后期的升級和維護費用。在后臺使用MapGIS IGServer,為用戶提供統(tǒng)一的數(shù)據(jù)存取界面。而在前端則是Vue架構,采用element-UI來調整網(wǎng)頁的外觀樣式,讓使用者獲得更好的體驗感。利用所述的界面?zhèn)魉虷ttp要求、作業(yè)命令及接收用戶反饋,并在前端網(wǎng)頁上呈現(xiàn)數(shù)據(jù)。
系統(tǒng)前端劃分為視圖層和邏輯操作層,視圖層主要是Vue框架將處理好的數(shù)據(jù)渲染到頁面上進行相應的顯示以及用戶信息和網(wǎng)站業(yè)務信息顯示的圖層[8]。邏輯操作層主要是針對用戶的操作進行相應處理,發(fā)送網(wǎng)絡請求,以及獲取后臺發(fā)送回來的數(shù)據(jù),對其進行相應處理,使得其符合數(shù)據(jù)顯示的要求。后臺劃分數(shù)據(jù)邏輯操作層和數(shù)據(jù)層。數(shù)據(jù)邏輯操作層主要是后臺獲取網(wǎng)絡請求后,按照要求設置數(shù)據(jù)的操作指令,以及發(fā)送數(shù)據(jù)操作后的結果。數(shù)據(jù)層是指數(shù)據(jù)庫層次,指數(shù)據(jù)存儲和對數(shù)據(jù)庫中的數(shù)據(jù)進行修改、獲取、刪除等操作。
系統(tǒng)角色設計為普通用戶和管理員兩種。普通用戶是系統(tǒng)的主要使用者,系統(tǒng)大量的樣本數(shù)據(jù)是由普通用戶上傳并提交審核。在用戶個人創(chuàng)建的項目中,項目創(chuàng)建者擁有對所標注的所有樣本進行操作權限,而項目參與者只能夠修改自己標注的樣本。在公開樣本集中,普通用戶只有瀏覽下載公開樣本集的權限,管理員則擁有變更這些信息的權限。
系統(tǒng)數(shù)據(jù)庫采用IGServer平臺的數(shù)據(jù)服務層,提供基礎的影像、矢量、三維等數(shù)據(jù)支持。其中,GIS數(shù)據(jù)庫包括本地的HDF文件數(shù)據(jù)庫,以及基于其他數(shù)據(jù)庫存儲的網(wǎng)絡數(shù)據(jù)源數(shù)據(jù)。在IGServer平臺中,使用空間數(shù)據(jù)庫引擎技術(SDE)與中間件技術,通過數(shù)據(jù)中心對海量、多源、異構數(shù)據(jù)進行一體化管理[9]。遙感影像深度學習樣本在線標注系統(tǒng)數(shù)據(jù)庫共有3個數(shù)據(jù)庫表,分別為用戶信息表、待審核信息表、系統(tǒng)項目信息表。其中用戶信息表包括普通用戶信息表和管理員用戶信息表,系統(tǒng)項目信息表包括項目信息表和系統(tǒng)消息信息表。
本文設計的遙感影像深度學習樣本在線標注系統(tǒng)基于Visual Studio Code×64開發(fā)環(huán)境和MapGIS IGServer 10.2互聯(lián)網(wǎng)GIS服務平臺實現(xiàn),系統(tǒng)包括登錄、首頁、影像地圖、樣本標注、數(shù)據(jù)管理、網(wǎng)站業(yè)務管理等模塊。
用戶首先需要注冊賬號,擁有賬號的用戶輸入正確的密碼可直接登錄系統(tǒng),系統(tǒng)登錄成功后,首頁界面示意圖如圖2所示。然后需要創(chuàng)建項目,填寫相關信息以及將待標注的影像數(shù)據(jù)上傳,待管理員審核后發(fā)布在個人標注任務中。審核通過后,用戶選擇要標注的項目開始進行樣本標注所示。
圖2 系統(tǒng)首頁
樣本標注模塊實現(xiàn)樣本標注的全過程,該模塊是本系統(tǒng)的核心功能。首先,用戶選擇標注的圖層進行要素繪制,同時用戶對所選要素可以進行編輯操作,如圖3所示。標注繪制完成后,樣本生成并打包提交審核。管理員讀取并審核完樣本后,如圖4所示,將樣本添加為壓縮包,通過Node Package Manager發(fā)布至服務器,生成相應的超鏈接供用戶點擊下載。如圖5所示,用戶自行選取導出樣本區(qū)域,裁剪合適大小調用后臺進行批量下載,生成深度學習樣本。用戶可以使用已經標注好的公開數(shù)據(jù)集進行樣本生成,以用于學習樣本標注過程和統(tǒng)一樣本標注標準。
圖3 樣本標注
圖4 坐標選擇審核范圍
圖5 樣本下載
遙感影像樣本標注專業(yè)性較強,目前樣本采集主要采用專業(yè)人員手工采集,效率低、成本高,且由于樣本標注者的專業(yè)認知差異導致標注質量不均[5]。為提高樣本采集效率和質量,本系統(tǒng)支持樣本眾包協(xié)同采集標注、在線校驗。用戶將待采集遙感影像樣本共享至系統(tǒng),將地理信息數(shù)據(jù)公開,將大區(qū)域的標注任務發(fā)放至平臺。通過發(fā)放眾包任務,讓多個專業(yè)用戶在線協(xié)同標注及上傳,管理員統(tǒng)一審核后將滿足要求的樣本補充至樣本庫。
信息化的標注平臺不需要標注人員手工進行樣本的標注統(tǒng)計,系統(tǒng)通過樣本標注可視化功能全方位多角度地展示項目的完成情況及各類樣本的占比??梢酝ㄟ^項目參與者各自標注的樣本數(shù)量柱狀圖,近一周項目樣本標注走勢折線圖,樣本來源環(huán)狀圖,不同類別樣本占比餅狀圖在線查看樣本情況,如圖6所示。
圖6 樣本統(tǒng)計
本文從建設背景、需求分析、設計、實現(xiàn)4個方面介紹了遙感影像深度學習樣本在線標注系統(tǒng)。筆者通過對目前的國內外現(xiàn)存的深度學習樣本在線標注網(wǎng)站進行調查研究,結合參與過的深度學習樣本標注例子和面臨的實際問題,充分對標注用戶和管理人員的操作流程和習慣進行分析后構建出的管理系統(tǒng)。對標注用戶來說,采用網(wǎng)頁瀏覽的方式,界面友好,且操作形式和業(yè)務邏輯與傳統(tǒng)的地圖網(wǎng)站相似,操作簡單易懂。業(yè)務方面,將遙感影像進行在線協(xié)作標注能大幅減輕標注團隊的工作量,提高了樣本標注效率,減少了人力消耗。