李連營(yíng) 彭楚驕 郭邦祁 聶晨依
1 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢,430079 2 武漢大學(xué)地理信息系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢,430079 3 自然資源部數(shù)字制圖與國(guó)土信息應(yīng)用重點(diǎn)實(shí)驗(yàn)室,湖北 武漢,430079 4 華中科技大學(xué)光學(xué)與電子信息學(xué)院,湖北 武漢,430074
專題地圖在反映國(guó)家經(jīng)濟(jì)、社會(huì)人文、自然資源等方面有著不可替代的作用[1]。海洋地圖作為專題地圖的一種重要形式,隨著海洋發(fā)掘的重視,制圖需求急速增加,其智能制作技術(shù)成為專題制圖的一大研究熱點(diǎn)。然而,由于制圖知識(shí)涉及到制圖員的個(gè)人經(jīng)驗(yàn)、素養(yǎng)和審美等多種因素,具有不易把握、難以進(jìn)行形式化表達(dá)的特點(diǎn)[2],人工智能與專題制圖的結(jié)合在發(fā)展過(guò)程中屢遭瓶頸[3]。如專家系統(tǒng)[4,5]、人工神經(jīng)網(wǎng)絡(luò)[6,7]、規(guī)則庫(kù)和模板制圖[8,9]等,都因制圖知識(shí)的抽象特性未能得到大范圍推行。
知識(shí)圖譜是一種用來(lái)描述實(shí)體與實(shí)體間關(guān)系的語(yǔ)義網(wǎng)絡(luò)[10],能將世界普遍地聯(lián)系起來(lái),在引擎優(yōu)化、知識(shí)工程、自然語(yǔ)言處理等領(lǐng)域均有應(yīng)用[11,12]。其特點(diǎn)在于能夠以結(jié)構(gòu)化的方式表達(dá)知識(shí)節(jié)點(diǎn)及它們之間的語(yǔ)義關(guān)系,是一種重要的知識(shí)聚合、儲(chǔ)存工具。本文通過(guò)構(gòu)建海洋地圖可視化方法的知識(shí)圖譜,將制圖知識(shí)進(jìn)行結(jié)構(gòu)化表達(dá),實(shí)現(xiàn)制圖知識(shí)的具象化、形式化,解決其“只可意會(huì)不可言傳”的問(wèn)題。
1)知識(shí)圖譜。知識(shí)圖譜是一種圖結(jié)構(gòu)的有向網(wǎng)狀知識(shí)庫(kù)。在知識(shí)圖譜中,節(jié)點(diǎn)表示客觀世界中的實(shí)體或概念;節(jié)點(diǎn)之間的邊表示實(shí)體之間的關(guān)系或?qū)傩?。知識(shí)圖譜中的每一條知識(shí)都用“實(shí)體-關(guān)系-實(shí)體”或“實(shí)體-屬性-屬性值”的三元組形式進(jìn)行表示。作為知識(shí)數(shù)據(jù)庫(kù),知識(shí)圖譜在多領(lǐng)域都扮演著重要角色,如知識(shí)挖掘、智能檢索、智能問(wèn)答、智能推薦、風(fēng)控系統(tǒng)等[13,14]。在地學(xué)領(lǐng)域,知識(shí)圖譜的研究目前主要集中在地學(xué)知識(shí)圖譜構(gòu)建[15]、知識(shí)挖掘[16]、虛擬地理環(huán)境服務(wù)[17-19]等方面,關(guān)于知識(shí)圖譜與專題制圖結(jié)合的研究尚且較為匱乏。
2)海洋地圖與可視化。海洋地圖的描繪對(duì)象是海洋及其毗鄰的陸地,常用于海洋交通運(yùn)輸、國(guó)際交往、國(guó)防事業(yè)、海圖歷史研究等。海洋地圖與專題地圖的可視化方法類似,主要分為兩類:①傳統(tǒng)專題地圖表示方法,如定點(diǎn)符號(hào)法、質(zhì)底法、定位圖表法和分區(qū)統(tǒng)計(jì)圖法等[20];②隨著時(shí)代發(fā)展而日益豐富、多樣的信息圖表法,如折線圖、直方圖、散點(diǎn)圖(氣泡圖)、環(huán)形圖(餅圖)、雷達(dá)圖、和弦圖和漏斗圖等[21]。海洋地圖與可視化方法之間的對(duì)應(yīng)關(guān)系是制圖領(lǐng)域的一大核心知識(shí),包含制圖人員極高的腦力活動(dòng),是知識(shí)及經(jīng)驗(yàn)的表達(dá)結(jié)果。
1)構(gòu)建流程。作為大量海洋地圖制圖知識(shí)的凝聚,海洋地圖可視化方法知識(shí)圖譜需要滿足專業(yè)性強(qiáng)、結(jié)構(gòu)完善、準(zhǔn)確度高等要求。本文從本體層和數(shù)據(jù)層兩方面構(gòu)建海洋地圖可視化方法知識(shí)圖譜。其中,本體層的構(gòu)建包括本體層要素分析和選取以及本體層規(guī)則設(shè)計(jì);數(shù)據(jù)層的構(gòu)建包括數(shù)據(jù)獲取、數(shù)據(jù)處理、知識(shí)儲(chǔ)存,具體的流程見(jiàn)圖1。
圖1 海洋地圖可視化方法知識(shí)圖譜構(gòu)建流程Fig.1 Flow Chart of Constructing Knowledge Map of Marine Map Visualization Method
知識(shí)圖譜的構(gòu)建有自上而下和自下而上兩種方法。本文采用的是先定義好本體層與數(shù)據(jù)模式,再將實(shí)體數(shù)據(jù)填充到知識(shí)庫(kù)中的自上而下構(gòu)建方法。
2)本體層構(gòu)建。本體層定義知識(shí)圖譜中數(shù)據(jù)的類型和不同類型數(shù)據(jù)之間的關(guān)系,是構(gòu)建一份知識(shí)圖譜的核心,能起到規(guī)范數(shù)據(jù)層中的實(shí)體類型、關(guān)系和屬性的作用。在海洋地圖制圖領(lǐng)域,海洋地圖數(shù)量海量,可視化方法組合情況復(fù)雜,海洋地圖數(shù)據(jù)與可視化方法之間的對(duì)應(yīng)關(guān)系多樣,是一個(gè)蘊(yùn)含著豐富知識(shí)的體系。因此,在構(gòu)建海洋地圖可視化方法知識(shí)圖譜的本體層時(shí),本文選取了海洋地圖的數(shù)據(jù)、數(shù)據(jù)特征、數(shù)據(jù)來(lái)源、可視化方法4 類要素為核心,抽象出它們的概念層次和彼此間的語(yǔ)義關(guān)聯(lián),以實(shí)現(xiàn)形式化的表達(dá)。它們的語(yǔ)義關(guān)聯(lián)關(guān)系見(jiàn)圖2。
圖2 本體要素之間的語(yǔ)義關(guān)聯(lián)關(guān)系Fig.2 Semantic Relationships Among Ontology Elements
確定本體層要素后,為了更詳細(xì)地描述海洋地圖數(shù)據(jù)特征與可視化方法,本文對(duì)各要素的概念層進(jìn)行了細(xì)化。在常見(jiàn)統(tǒng)計(jì)數(shù)據(jù)特征的基礎(chǔ)上對(duì)海洋地圖數(shù)據(jù)的特征進(jìn)行了歸納,總結(jié)為空間特征、時(shí)間特征、數(shù)量特征、類別數(shù)、指標(biāo)數(shù)、指標(biāo)深度和指標(biāo)關(guān)系。其中,類別數(shù)、指標(biāo)數(shù)、指標(biāo)深度和指標(biāo)關(guān)系是對(duì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量特征的細(xì)化:類別數(shù)是描述統(tǒng)計(jì)數(shù)據(jù)中指標(biāo)類型數(shù)目的屬性;指標(biāo)深度是描述統(tǒng)計(jì)數(shù)據(jù)中指標(biāo)細(xì)分層次的屬性;指標(biāo)關(guān)系是描述統(tǒng)計(jì)數(shù)據(jù)各指標(biāo)之間相互關(guān)系的屬性。本文將可視化方法細(xì)分為傳統(tǒng)的10 種表示方法與信息圖表法,前者包括定點(diǎn)符號(hào)法、線狀符號(hào)法、質(zhì)底法等,后者包括折線圖、雷達(dá)圖、直方圖、熱力圖、?;鶊D等。更詳細(xì)的本體層規(guī)則設(shè)計(jì)見(jiàn)圖3。
圖3 知識(shí)圖譜本體層規(guī)則設(shè)計(jì)Fig.3 Rule Design of Ontology Layer of Knowledge Map
3)數(shù)據(jù)層構(gòu)建。數(shù)據(jù)層由現(xiàn)實(shí)中的數(shù)據(jù)組成,是在本體層的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行組合填充,填充內(nèi)容包括實(shí)體、實(shí)體屬性和實(shí)體之間的關(guān)系等信息。數(shù)據(jù)層的構(gòu)建分為數(shù)據(jù)獲取、知識(shí)抽取、知識(shí)儲(chǔ)存等步驟。在海洋地圖制圖領(lǐng)域,構(gòu)建知識(shí)圖譜所用數(shù)據(jù)源通常為社交網(wǎng)絡(luò)、地圖集及數(shù)據(jù)庫(kù)等,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等多種形式。如世界銀行、國(guó)家統(tǒng)計(jì)局等數(shù)據(jù)庫(kù)為結(jié)構(gòu)化數(shù)據(jù)源;《海洋地圖集2017》《世界航海地圖集》《21世紀(jì)海上絲綢之路沿線區(qū)域航海地圖集》等地圖集為半結(jié)構(gòu)化數(shù)據(jù)源;社交網(wǎng)站、網(wǎng)頁(yè)網(wǎng)絡(luò)等為非結(jié)構(gòu)化數(shù)據(jù)源。
知識(shí)抽取是指將蘊(yùn)含在數(shù)據(jù)源中的知識(shí)經(jīng)過(guò)識(shí)別、理解、篩選、歸納等一系列過(guò)程抽取出來(lái),儲(chǔ)存形成知識(shí)元庫(kù)[22]。由于專題制圖領(lǐng)域具有專業(yè)性強(qiáng)、標(biāo)準(zhǔn)嚴(yán)格、知識(shí)精度要求高等特點(diǎn),本文采用專家法進(jìn)行知識(shí)抽取,即根據(jù)專家經(jīng)驗(yàn)從多種形式的數(shù)據(jù)源中抽取有用知識(shí)[23],如圖4 所示。
圖4 知識(shí)抽取示意圖Fig.4 Diagram of Knowledge Extraction
在進(jìn)行知識(shí)儲(chǔ)存時(shí),本文選用的是簡(jiǎn)潔直觀、編輯功能強(qiáng)、操作便捷的圖數(shù)據(jù)庫(kù)Neo4j。Neo4j 以網(wǎng)絡(luò)子圖的形式儲(chǔ)存數(shù)據(jù),在Neo4j 圖數(shù)據(jù)庫(kù)中,每個(gè)節(jié)點(diǎn)都是一個(gè)實(shí)體,實(shí)體與實(shí)體之間的關(guān)系構(gòu)成一條邊,為知識(shí)數(shù)據(jù)提供了良好的存儲(chǔ)方式。
本文以《21世紀(jì)海上絲綢之路沿線區(qū)域航海地圖集》為例,采用自上而下的方法完成海洋地圖可視化方法知識(shí)圖譜的構(gòu)建。首先,通過(guò)分析知識(shí)圖譜核心要素及其相互關(guān)系,建立本體層模型;然后,利用專家法從地圖集中提取知識(shí)圖譜實(shí)體與實(shí)體的關(guān)系;最后,采用csv 語(yǔ)句的方式將知識(shí)導(dǎo)入Neo4j 數(shù)據(jù)庫(kù)。圖5 展示了海洋地圖可視化方法知識(shí)圖譜的部分結(jié)構(gòu),其中有4 種實(shí)體節(jié)點(diǎn):紅色代表海洋地圖數(shù)據(jù);粉紅色代表海洋地圖數(shù)據(jù)特征;橙色代表可視化方法;綠色代表海洋地圖數(shù)據(jù)來(lái)源。關(guān)系有3 種:“from”表示來(lái)源,頭實(shí)體為海洋地圖數(shù)據(jù),尾實(shí)體為海洋地圖數(shù)據(jù)來(lái)源;“suit”表示適合,頭實(shí)體為海洋地圖數(shù)據(jù),尾實(shí)體為可視化方法;“has”表示擁有,頭實(shí)體為海洋地圖數(shù)據(jù),尾實(shí)體為海洋地圖數(shù)據(jù)特征。
圖5 海洋地圖可視化方法知識(shí)圖譜(部分)Fig.5 Construction of Knowledge Map of Marine Map Visualization Method(Part)
知識(shí)圖譜與推薦系統(tǒng)相結(jié)合,可實(shí)現(xiàn)專題制圖可視化方法的自動(dòng)推薦。在海洋地圖可視化方法知識(shí)圖譜中,海洋地圖數(shù)據(jù)、海洋地圖數(shù)據(jù)特征、可視化方法、海洋地圖數(shù)據(jù)來(lái)源等多方面知識(shí)都實(shí)現(xiàn)了形式化與具象化,為后續(xù)知識(shí)圖譜與推薦系統(tǒng)的結(jié)合提供了準(zhǔn)備條件。兩者的結(jié)合將幫助制圖人員從海量圖表中快速篩選目標(biāo),縮短海洋地圖制圖周期,提高制圖效率,對(duì)可視化方法的選擇具有積極指導(dǎo)意義。
本文通過(guò)分析專題制圖與可視化方法選擇的影響因素,以海洋地圖數(shù)據(jù)、海洋地圖數(shù)據(jù)特征、可視化方法、海洋地圖數(shù)據(jù)來(lái)源為核心要素,構(gòu)建知識(shí)圖譜的本體層;在該概念框架的指導(dǎo)下,對(duì)不同格式的數(shù)據(jù)源進(jìn)行數(shù)據(jù)清洗、知識(shí)抽取和知識(shí)儲(chǔ)存等處理,篩選出大量符合要求的實(shí)體及關(guān)系,豐富知識(shí)圖譜的數(shù)據(jù)層,完成海洋地圖可視化方法知識(shí)圖譜的構(gòu)建。并以《21世紀(jì)海上絲綢之路沿線區(qū)域航海地圖集》為例進(jìn)行驗(yàn)證,結(jié)果表明,海洋地圖可視化方法知識(shí)圖譜能夠完整、清晰地表達(dá)海洋地圖數(shù)據(jù)、海洋地圖數(shù)據(jù)特征、可視化方法、海洋地圖數(shù)據(jù)來(lái)源等核心要素,詳細(xì)描述各要素之間的語(yǔ)義關(guān)聯(lián)和屬性。