閆李月 左小清 葛小三
摘? 要: 為了研究地理空間信息語義層次上的統(tǒng)一描述,文章在對地理空間信息特征分析的基礎上,基于本體論的語義構建思想,選取五元組GeO=
關鍵詞: 地理空間信息;語義;本體;出行計劃;應用本體
中圖分類號: TP391? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2019.01.024
【Abstract】: In order to study the unified description of the semantic level of geospatial information, based on the analysis of geospatial information characteristics, based on the semantic construction idea of ontology, the quintuple GeO=
【Key words】: Geospatial information; Semantics; Ontology; Travel planning; Application ontology
0? 引言
當前地理信息系統(tǒng)技術的發(fā)展要求,內容上不僅要有地理數(shù)據(jù)和地理信息,還要能更人性化表達地理知識,和人們的生活認知相符合,促進GIS的
大眾化和社會化;地理信息服務的數(shù)量在急劇增加,向網(wǎng)絡化方向發(fā)展;在信息交流方面,要求充分利用信息網(wǎng)絡中復雜多源的地理信息資源,從數(shù)據(jù)格式轉換與信息共享,發(fā)展到更智能化的、基于語義的互操作,滿足不同用戶的需求[28]。從這些需求和
發(fā)展趨勢可以看出,地理信息系統(tǒng)正在向著地理信息資源的智能化、網(wǎng)絡化發(fā)展,地理空間技術和語義網(wǎng)技術的發(fā)展推進了基于語義Web Service的地理信息服務和共享[1,11]。地理空間技術和語義網(wǎng)技術的發(fā)展推進了基于語義網(wǎng)服務的地理信息服務和共享。其中,語義目前是地理信息服務研究的一個關鍵問題,讓計算機識別地理信息所含的語義成為了研究的焦點[2]。
美國喬治梅森大學LAITS研究中心的DiLiping等[15-17]研究了地理信息服務鏈中自動服務發(fā)現(xiàn)和服務組合的方法,提出了使用“地理樹”和“地理對象”的概念表達服務鏈和特定地理信息服務,并建立地理信息服務領域本體,形成地理信息服務的語義描述,實現(xiàn)智能搜索與組合。Lutz使用本體來描述地理信息服務的語義描述,在此基礎上,深入研究了基于本體論與規(guī)則的地理信息服務發(fā)現(xiàn)與組合研究[4]。在國內,景東升等[2]對基于本體的地理空間信息語義表達和服務進行了研究,分析了從現(xiàn)實世界到地理元素的抽象過程的九個層次,提出了語義支持的地理空間查詢框架與流程,依據(jù)當時的網(wǎng)絡服務和語義網(wǎng)服務,結合基于特征的空間數(shù)據(jù)模型等,提出了包含語義信息的地理空間信息系統(tǒng)概念架構。鄭亮、李德仁[9]進行了空間服務語義模式的地理信息服務發(fā)現(xiàn)的研究,完整的構建出了地理信息服務語義描述的層次模型。張瑞[14]研究了基于情景演算的交通信息服務動態(tài)組合發(fā)布方法,創(chuàng)造性的構建了本題庫和情境庫,還有支持語義分析和推理的模型庫。同時,李德仁、柳來星[10]進行了上下文感知的智慧城市空間信息服務組合的研究,拓展了OWL-S本體,重點研究上下文相關類,結合智能規(guī)劃和語義增強等技術,實現(xiàn)了“智慧旅游”案例。
總結發(fā)現(xiàn),地理信息組合服務面臨的現(xiàn)有挑戰(zhàn)重點是空間資源的發(fā)現(xiàn)和檢索。當前已有的描述地理空間信息數(shù)據(jù)的標準、注冊地理信息服務的OGC目錄服務,都面臨一個缺陷:語義的發(fā)現(xiàn)與表達。信息及服務概念層次的知識標注,即表示數(shù)據(jù)語義的形式化和明確的描述模式,是構建地理信息服務語義發(fā)現(xiàn)和組合支撐環(huán)境的基礎[5]。地理空間語義網(wǎng)的出現(xiàn)為基于語義的地理信息服務的研究一大進展,提供了一套框架、方法與應用模型。伴隨著語義網(wǎng)技術的不斷研究,語義結合的信息服務已經(jīng)在生活、娛樂、軍事等領域擴大應用。但國內針對地理空間信息的語義發(fā)現(xiàn)與表達技術的研究并不多,對語義的挖掘仍有局限。本文在已有的語義和地理空間信息發(fā)現(xiàn)與表達的研究成果基礎上,對基于本體的地理空間信息語義表達進行進一步的研究。
1? 地理空間信息語義特征分析
1.1? 地理空間信息特性
地理信息系統(tǒng)是一種具體的空間信息系統(tǒng),研究的基本問題是如何理解和理解地理空間,如何查詢和分析環(huán)境信息,為用戶提供地理信息的支持和服務。地理空間信息是與地理空間位置有關的信息,其載體為空間數(shù)據(jù)。由地理學和地理信息系統(tǒng)的本質決定了地理空間信息表現(xiàn)形式的復雜性,其空間數(shù)據(jù)也往往是異構的、需要經(jīng)過重新組織的。地理空間信息具有空間定位性和多維結構性,特征是時序和動態(tài)變化等[11]。
地理空間信息當下所具有的特性和特征決定了地理數(shù)據(jù)多種多樣的表達方式,地理信息系統(tǒng)的研究對象的大范圍和多類別的特點也決定了地理空間信息的語義復雜性。對于同一個客觀存在的地理信息表達,在現(xiàn)實世界里它的幾何特征相同,但屬性上卻可能對應有大不相同的語義信息,像地貌、土壤、地理位置、氣候、海拔高度等自然特點,還有經(jīng)濟社會信息,像行政區(qū)劃、人口等。簡單來說,地理空間信息的傳統(tǒng)表現(xiàn)形式通常為地名或空間坐標,但是這兩類常見的地理空間信息會由于區(qū)域、文化等語境的不同而代表內容各異。隨著人類對地理信息研究的不斷深入和地理空間信息解決方案的不斷完善,地理空間信息的表達逐漸多元化。比如“焦作”這一地理信息,可以直接按照人們習慣例如:“焦作”、“山陽”、“懷州”、“JiaoZuo”等名稱來表達,也可以使用計算機圖形例如:“矢量地圖”、“影像地圖”或者“柵格地圖”等來表達;還可以用一些間接形式例如:“行政區(qū)劃代碼”、“電話區(qū)號”、“郵政編碼”等來表述;甚至可以用人文現(xiàn)象以代表,如“中國太極拳發(fā)源地”、“云臺山風景區(qū)所在地”“司馬懿、韓愈故里”等。
地理信息屬于信息資源中重要的一部分,所含的信息量具大,同時具有空間屬性整合的特點。隨著3S等技術的興起,計算機和網(wǎng)絡上提供的空間數(shù)據(jù)增長迅速,形式不再僅是元數(shù)據(jù),更多的是衛(wèi)星圖象、航攝影像、普通地圖和專題地圖等,數(shù)據(jù)的海量性與其表現(xiàn)形式的多樣性導致了空間信息的搜索也越來越復雜。地理空間信息的表現(xiàn)形式的多樣性導致了對地理信息準確描述的困難性、地理空間關系提取與搜索的復雜性,由此推進了地理空間信息的語義研究。
1.2? 地理空間信息與事件語義學
事件的語義性是指事件是一個語義單位,其介于詞和句子之間,比詞組意義完整,通過事件語義分析與計算,可以透徹研究其所在句子的意義,進而研究所在篇章意義[13,23]。在事件語義學中,動詞表示的是事件的集合,其分類是由事件的性質所決定的,但動詞分類同時決定了不同事件結構的性質。因此事件可以分為對應的四種:狀態(tài)事件、活動事件、達成事件、完成事件。Bach等將狀態(tài)同事件合并,共稱為事態(tài),只有后三類,為計算機語義學領域所接受。事件語義的決定要素是事件謂詞的意義,如事件“小明計劃在焦作旅游”和“2017年的端午節(jié)三天假期,在河南理工大學讀大三的男生小明計劃在焦作及其周邊的著名景點放松旅游”,雖然后者比前者多了幾個語義成分,但兩個事件的事件謂詞都是“旅游”,并且在兩個事件中事件謂詞的語義相同,在不考慮語境的情況下,它們?yōu)橥粋€事件。
《基于認知與計算的事件語義學研究》中提到,語義角色可以大致分為主事(theme)、接收者(recipient)、時間(time)、原因(cause)、方式(manner)、目的(purpose)等,這是本文在后邊進行地理信息本體的構建的思路來源。事件語義角色的層次結構如圖2-1所示。及物動詞的施事跟受事或結果相對應,致事跟結果相對應,主事跟系事相對應,因而可以由施事預測受事和結果,致事預測結果,主事預測系事。施事、致事和主事被當作原型施事的典型小類,而受事、與事、結果和系事被當作是原型受事的典型小類??臻g在地理學和天文學中指的是地球表面的一部分,分為絕對空間和相對空間兩個概念,絕對空間是指其自身的特征,其他一切外在事物是無關緊要的,無處不在,永不改變;相對空間是可以在絕對空間中移動的結構,或是通過其與物體的相對位置可以感知的絕對空間的度量,通常作為不可移動的空間,包括大氣、地表、地下的空間,都是根據(jù)和地球的相互關系決定?;谙鄬臻g的考慮,空間類事件語義角色除地點外,還包括能標示事件方向特性的源點和終點兩個事件語義角色,其中源點是指事件所表示的動作行為開始的地點,而終點是指事件表示的動作行為的結束地點。事件語義角色層次結構如圖1。
我們將地理空間信息資源和事件語義學內容結合起來,剖析地理事件的空間語義特征,表示出完整的包含語義信息的地理行為,表達出一個具有完整意義的事件,特點是具有地理屬性。例如,在河南理工大學讀大三的小明提出問題:“清明節(jié)在焦作去哪里玩比較好”。其中,“清明節(jié)”是時間語義成分,等價于“踏青節(jié)”或“4月4日-6日”;“焦作”是空間語義成分,包含焦作市和焦作市周邊一定范圍內的目標地點,源點是焦作市,終點是“去玩”的目標地點;“哪里”即指代目標地點;“玩”是一個動作,在本句中的語義等價于“旅游”、“出行”等;“比較好”的約束性不強,可以為“可達”、“合適”、“最佳”不同層級。整句話等同于“查找4月4日-6日焦作出發(fā)可旅行的地點或項目”,這就是一個具有地理屬性的完整意義的事件,是基于本體的語義分析方法的基礎。
2? 基于本體的地理空間信息語義分析方法
2.1? 基于本體的語義分析
本體(Ontology)最早是哲學領域的概念,被用來闡明事物的本質。Studer給出了本體的完整計算機概念,同時是迄今為止為學術界普遍承認的定義:“本體是共享概念模型的明確的形式化說明”。在這個定義中,“共享(share)”是指本體是領域內共同接受的概念集,體現(xiàn)的是共同承認的認識,面向的是集團而不是單個人;“概念模型(conceptua lization)”是指通過對客觀世界中某些概念進行抽象得到的模型;“明確(explicit)”是說所使用的概念和對這些概念的限定條件的定義是明確的;“形式化(formal)”即計算機可讀的,能被計算機識別和處理。對于特定一個領域而言,本體表達其一套術語,實體,對象,類,屬性和關系,提供限制這些術語解釋的正式定義和公理。本體其實可以看做為傳統(tǒng)軟件中的面向對象提供的對象模式,和其延伸出來的類的定義。
語義分析方法主要包括基于句法規(guī)則的語義分析方法、基于相似度計算的語義分析方法、本體構建語義分析和本體推理語義分析等。其中,本體構建語義分析方法是將領域本體的構建過程看作語義分析過程,對領域本體的概念、屬性、公理關系進行定義,從而實現(xiàn)語義信息的形式化表達,而本體構建的重要內容是確定領域本體的邏輯結構[22]。目前本體結構的定義并沒有統(tǒng)一的規(guī)范,由于研究對象的不同,學者提出的本體結構相互之間差異比較明顯,如崔巍[24]提出了由圖節(jié)點、邊、規(guī)則集組成的三元組本體集合,景東升[2]提出了由概念、關系、函數(shù)、公理、實例5部分組成的地理本體結構體系,還有譚永濱等[25]、易茹蘭[26]、黃茂軍[27]等則分別提出四元組、七元組本體邏輯結構。
3? 旅游出行計劃本體構建
地理空間信息本體中,地理概念是地理信息語
義共享的基礎,本體間相對獨立,不會因為實際語境的不同而造成結構上的改變,且其對現(xiàn)實世界現(xiàn)象及關系進行形式化定義,可以通過對一套行業(yè)標準進行概念化產生。而地理信息應用本體則與具體的應用語境緊密相連,反映的是特定任務,例如“城鎮(zhèn)道路建設規(guī)劃”或“地震災區(qū)救援”等某一個任務內公共擁有的知識,是應用語境內普遍承認的概念集,能讓幾個地理應用或產品同用。特定領域應用本體繼承了地理空間信息本體中的概念,再根據(jù)地理元素的應用特征擴展出具體的屬性。特定領域應用本體的構建可以簡單概括為6個步驟:(1)確定地理空間信息具體的應用領域和范圍;(2)已有模型的利用;(3)對應用領域內相關概念的識別和標注;(4)確定描述概念的屬性;(5)確定概念間的關系和層次;(6)確定應用于地理概念和地理關系之上的約束條件。
3.1? 旅游出行本體的定義
3.2? 旅游出行本體的表達
基于以上對旅游出行本體概念、關系、函數(shù)、公理、實例的分析,可以構建旅游出行本體。依據(jù)形式化本體結構,使用本體描述語言OWL對其中的概念、關系、函數(shù)進行描述。對本體進行構建操作時,可以用一些編輯工具或者集成工具等等,使用較多的是斯坦福大學的Protégé軟件系統(tǒng)。Protégé是一種可視化的構建本體的工具,是一個可擴展的建立OWL本體的集成環(huán)境,可用于語義網(wǎng)中本體的構建。Protégé為創(chuàng)建并可視化、應用各種描述形式的本體,創(chuàng)造了豐富的知識模型的框架和程序,是當前構建本體的首選工具。
文章用Protégé創(chuàng)建“Travel Plan”項目,增加并命名“scenic spot”類,建立相應屬性并與類關聯(lián),然后構造實例并與相應屬性關聯(lián),如圖4所示。
4? 結論
隨著人類獲取地理信息數(shù)據(jù)能力的不斷提升,計算機和網(wǎng)絡上提供的地理空間數(shù)據(jù)增長迅速,數(shù)據(jù)的表現(xiàn)形式越來越復雜,形成了海量的地理大數(shù)據(jù)集合。但是由于地理空間信息大數(shù)據(jù)集合的多源
性和異構性等原因,至今尚未有令人滿意的地理空間數(shù)據(jù)組合服務可視化表達工具,因此對特定領域地理空間信息組合的語義可視化表達研究有著非常重要的意義。為此,本文借助空間語義事件與本體的知識,基于五元組的地理空間信息本體組織結構,通過特定應用領域的擴展,形成了特殊的六元組旅游出行本體結構,為旅游出行計劃知識的組織提供了一種規(guī)范框架體系。
文章的研究為針對特定應用領域的地理空間信息語義表達研究提供了一種思路,下一步可在基于本體的地理空間信息數(shù)據(jù)組織模型基礎上,深入對語義相似度計算方法、地理信息服務的組合形式、地理信息服務鏈的觸發(fā)等方面的研究,以期為現(xiàn)代地理信息服務的智能化提供理論和方法支撐。
參考文獻
陳美伊. 基于GIS 的旅游景區(qū)虛擬實現(xiàn)技術的研究[J]. 軟件, 2015, 36(10): 30-32.
景東升. 基于本體的地理空間信息語義表達和服務研究[D]. 中國科學院研究生院(遙感應用研究所), 2005.
李世祥. 基于語義的地理信息服務發(fā)現(xiàn)與組合的關鍵技術研究[D]. 武漢大學, 2010.
馮衛(wèi)東, 孫顯, 王宏琦. 基于空間語義模型的高分辨率遙感圖像目標檢測方法[J]. 電子與信息學報, 2013(10): 2518-2523.
梁汝鵬, 李宏偉, 李文娟, 等. 空間語義學與地理信息語義服務研究進展[J]. 測繪科學, 2013.
劉茂福, 胡慧君. 基于認知與計算的事件語義學研究. [M]. 北京: 科學出版社, 2013
張東. 基于語義相似度的地理信息檢索技術研究[D]. 山東農業(yè)大學, 2011.
陳科. 語義支持的空間信息服務組合關鍵技術研究[D]. 解放軍信息工程大學, 2012.
鄭亮, 李德仁. 空間服務語義模式的地理信息服務發(fā)現(xiàn)[J]. 測繪科學, 2011, v. 36;No. 170(2): 130-132.
李德仁, 柳來星. 上下文感知的智慧城市空間信息服務組合[J]. 武漢大學學報(信息科學版), 2016, v. 41(7): 4-11.
梁秋實, 桑新柱, 邢樹軍. 利用多視點自由立體顯示系統(tǒng)實時顯示GIS 信息[J]. 軟件, 2016, 37(01): 44-47.
湯大權, 唐九陽, 肖衛(wèi)東. 地理信息本體開發(fā)方法及應用[J]. 地理空間信息, 2008.
張力生, 年歡, 宋輝, 等. 領域模型中關聯(lián)語義的描述邏輯表示與應用[J]. 軟件, 2015, 36(6): 66-74.
張瑞. 基于情境演算的交通信息服務動態(tài)組合發(fā)布[D]. 長安大學, 2016.
Di Liping. Geo Brain-A Web services based geospatial knowledge building system[C]. Proceedings of NASA Earth Science Technology Conference, 2004.
Di? Liping. A framework for developing Web-service-based intelligent geospatial knowledge? systems[J]. Journal of Geographic Information Sciences, 2005, 11(1): 24-28.
Aijun Chen, Liping Di, Yaxing Wei, et. al. Use of Grid Computing for Modeling Virtual Geospatial Products[J]. International Journal of Geographic Information Science, 2009, 23(5): 581-604.
Chen Jia, Wu Yue. Rules-based Object-relational Databases Ontology Construction[J]. Journal of Systems Engineering and Electronics, 2009, 20(1): 211-215.
Davide Buscaldi, Paolo Rosso, Emilio Sanchis. A Word Net-Based Indexing Technique for Geographical Information Retrieval[A]. Evaluation of Multilingual and Multi-modal Information Retrieval, Berlin: Springer, 2007: 954-957.
Yuan An, John Mylopoulos, Alex Borgida. Building Semantic Mappings from Databases to Ontologies[C]. In: Proceedings of the Twenty-First National Conference on Artificial Intelligence (AAAI-06), Boston, MA, July 16-20, 2006.
Christophe Claramunt, Serhei Levashkin Michela, Bertolotto. GeoSpatial Semantics[M]. Springer, 2011: 5-23.
李婷, 付雁, 季民, 等. 基于本體論的海洋流場語義分析與表達研究[J]. 地球信息科學學報, 2018, 20(10): 1373-1380.
張曉明, 尹鴻峰. 基于卷積神經(jīng)網(wǎng)絡和語義信息的場景分類[J]. 軟件, 2018, 39(01): 29-34.
崔巍. 用本體實現(xiàn)地理信息系統(tǒng)語義集成和互操作[D]. 武漢: 武漢大學, 2004.
譚永濱, 朱海紅, 李霖, 等. 數(shù)字城市框架下地理信息服務語義分析[J]. 地理與地理信息科學, 2012, 28(2): 5-8, 19.
易茹蘭. 基于地理本體的地理信息語義表達與查詢方法研究[D]. 長沙: 中南大學, 2009.
黃茂軍. 地理本體的形式化表達機制及其在地圖服務中的應用研究[D]. 武漢: 武漢大學, 2005.
梁子鑫. 探討新時代背景下新興技術在人工智能中的應用[J]. 軟件, 2018, 39(7): 166-169.