戚利娜
摘 要:為提高旅游信息資源的檢索效果,利用六步法以張家界為例研究了類的層次結(jié)構(gòu),采用OWL描述了類、實(shí)例以及相互之間的關(guān)系,并用Protégé構(gòu)建了張家界旅游本體。
關(guān)鍵詞:張家界旅游;本體;OWL
中圖分類號(hào):F592.7 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)28-0076-03
Abstract: In order to improve the retrieval effect of tourism information resources, this paper takes Zhangjiajie as an example to study the hierarchical structure of classes using the six-step method, describes classes, instances and the relationship between each other via OWL, and constructs the tourism ontology of Zhangjiajie using Protégé.
Keywords: tourism in Zhangjiajie; ontology; OWL
引言
旅游作為國(guó)家經(jīng)濟(jì)的支柱產(chǎn)業(yè),國(guó)家和社會(huì)都給予充分的關(guān)注[1]。因此為游客的旅游活動(dòng)提供支持服務(wù)活動(dòng)從而助力旅游發(fā)展是十分必要的。游客的旅游體驗(yàn)是旅游過(guò)程中,甚至是進(jìn)行下次旅游活動(dòng)的重要決策依據(jù)。良好的旅游體驗(yàn)可幫助游客體驗(yàn)景區(qū)的美好。而旅游體驗(yàn)離不開(kāi)旅游前對(duì)景區(qū)信息的搜索、歸納[2]。因?yàn)槁糜芜^(guò)程中,時(shí)間和精力有限,如果信息搜索不全就無(wú)法設(shè)計(jì)好旅游線路,容易導(dǎo)致精力浪費(fèi),疲憊不堪。進(jìn)一步說(shuō),旅游信息的搜索效果影響了旅游業(yè)的發(fā)展[3]。目前,旅游信息的檢索面臨查準(zhǔn)率和查全率不高的問(wèn)題,原因是檢索方法采用的關(guān)鍵詞搜索算法只能從關(guān)鍵詞字面進(jìn)行匹配,無(wú)法從語(yǔ)義上進(jìn)行搜索。為了提高旅游信息的檢索效果,部分學(xué)者提出將本體應(yīng)用到旅游信息檢索的搜索算法中,并取得了較好的檢索效果。鑒于上述原因,本文選擇張家界這座聞名國(guó)內(nèi)外的旅游城市作為對(duì)象,構(gòu)建張家界旅游本體,以幫助提高張家界旅游信息的檢索效果。
1 本體概述
本體最早源自于17世紀(jì)古希臘哲學(xué)領(lǐng)域的研究者提出,其被定義為對(duì)世界上客觀存在物的系統(tǒng)描述[4]。在計(jì)算機(jī)概念中開(kāi)始涉及本體也要從上世紀(jì)90年代開(kāi)始算起了。多名學(xué)者對(duì)其有過(guò)定義,但是總的來(lái)說(shuō),本體被認(rèn)為是對(duì)事物所表示的類以及類之間關(guān)系、類的屬性等要素的明確表示[5]。本體具有信息共享、分享語(yǔ)義關(guān)系、提供科學(xué)規(guī)范化信息描述標(biāo)準(zhǔn)等功能。雖然本體具有事務(wù)抽象,信息共享等功能,但是現(xiàn)實(shí)世界的每個(gè)領(lǐng)域具有不同的需求和特點(diǎn),因此對(duì)于本體的構(gòu)建而言,針對(duì)不同領(lǐng)域的需求,需要選擇合適的構(gòu)建方法來(lái)實(shí)現(xiàn)。本體的描述語(yǔ)言發(fā)生過(guò)一些變化,目前比較有典型的描述語(yǔ)言有OWL,XML,RDF等[6]。本文將選擇OWL描述構(gòu)建的張家界旅游本體。
2 本體構(gòu)建方法及步驟概述
目前本體構(gòu)建方法有骨架法、METHONTOLOGY法、IDEF5法等[4]。針對(duì)旅游領(lǐng)域的特點(diǎn),本文采用“六步法”來(lái)構(gòu)造旅游領(lǐng)域本體,該方法的具體步驟如下[7]:
(1)確定旅游領(lǐng)域的本體范圍。
(2)列出旅游領(lǐng)域的專業(yè)術(shù)語(yǔ)。
(3)對(duì)領(lǐng)域概念進(jìn)行分類。
(4)確定類之間的關(guān)系。
(5)定義類的屬性以及屬性值。
(6)為每個(gè)類確定一個(gè)對(duì)象實(shí)例。
3 張家界的旅游本體建模
3.1 確定旅游領(lǐng)域本體范圍
以“張家界”為例,分析在“張家界”還存在哪些子類。
3.2 列出旅游領(lǐng)域的專業(yè)術(shù)語(yǔ)
“張家界”的旅游本體的專業(yè)術(shù)語(yǔ)來(lái)源有三個(gè)方面:第一、相關(guān)文獻(xiàn),如《中國(guó)分類主題詞表》中與旅游相關(guān)的主題詞以及中國(guó)旅游國(guó)家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)的定義以及規(guī)范[5];第二、相關(guān)領(lǐng)域的專家,如張家界大峽谷的經(jīng)理,旅游局相關(guān)專家、高校旅游學(xué)科帶頭人;第三、網(wǎng)絡(luò)上與“張家界大峽谷”有關(guān)的標(biāo)簽。由于第一、第二方面的來(lái)源處理過(guò)程較為成熟,在此不再贅述。接下來(lái)主要描述如何處理第三方面的來(lái)源。處理過(guò)程如下:
第1步,根據(jù)網(wǎng)絡(luò)資源,列出與主題相關(guān)的詞匯,如表1所示。
第2步,整理表1的內(nèi)容,表1中部分詞匯表示的是具體的實(shí)例,如玻璃橋、小米粉蒸肉等,因此不適合作為類的專業(yè)詞匯。
第3步,結(jié)合文獻(xiàn)資源以及相關(guān)專家可將專業(yè)詞匯定為如下:旅游、自助游、跟團(tuán)游、游客、景區(qū)、旅游攻略、跟團(tuán)路線、周邊住宿、餐飲、酒店、交通線路、景區(qū)門(mén)票、聯(lián)系方式、自駕線路、公交線路、景區(qū)地址、散客、景區(qū)文化、游玩……等。
3.3 定義類以及類之間的層次
類是對(duì)張家界大峽谷相關(guān)旅游資源的抽象化表達(dá),本文構(gòu)建張家界旅游本體的目的是為提高信息檢索的效果,基于上述目標(biāo),從本節(jié)第3.2節(jié)確定的專業(yè)詞匯中選擇與旅游信息檢索關(guān)聯(lián)較大,抽象化程度高的專業(yè)詞匯為頂層類。根據(jù)上述準(zhǔn)則以及旅游領(lǐng)域核心概念確定了8個(gè)頂層類,它們分別是交通路線、景區(qū)、旅游路線、餐飲、住宿、游客、購(gòu)物、娛樂(lè)。而類之間具有層次關(guān)系,除了頂層類以外,其他類分別都是其父類的子類,所有的類構(gòu)成了一個(gè)樹(shù)狀結(jié)構(gòu)。構(gòu)建類層次的方法有自上而下法、自下而上法、綜合法[8]。自上而下法是指從頂層類開(kāi)始確定,逐層確定子類;自下而上法是指從最底層類開(kāi)始,逐層向上確定父類。綜合法基于上述兩種方法之間。本文采用綜合法,結(jié)合確定的頂層類,確定了張家界大峽谷旅游本體類的結(jié)構(gòu),如圖1所示。
3.4 定義類的屬性以及屬性值
類的屬性分為兩種:一種是對(duì)象屬性,表示該類的實(shí)例對(duì)象所具有的行為,如游客類有使用和決策等對(duì)象屬性;另一種是數(shù)據(jù)屬性,表示該類實(shí)例對(duì)象所具有的特征,如游客家庭住址、性別等數(shù)據(jù)屬性。本文根據(jù)獲取的旅游專業(yè)詞匯以及定義的類,確定張家界旅游本體所具有的對(duì)象屬性如下:
游客采用交通路線、交通路線供游客使用、游客游覽景區(qū),景區(qū)供游客瀏覽、景區(qū)包含餐飲、住宿、游客選擇住宿、選擇餐飲、景區(qū)提供旅游路線,旅游路線供游客選擇、游客選擇娛樂(lè)方式、游客選擇購(gòu)物手段,等等。
張家界旅游本體部分類所具有的數(shù)據(jù)屬性如表2所示。
接下來(lái)對(duì)屬性的取值類型進(jìn)行定義,具有包括確定賦值類型和允許的賦值。其中賦值類型包括整型和字符串類型以及浮點(diǎn)型等,如路費(fèi)是浮點(diǎn)型、酒店會(huì)員價(jià)是整型、名稱是字符串類型;允許的賦值指的是屬性是否允許為空值,如酒店名稱不能為空,但是酒店別稱可以為空。
3.5 定義本體中的關(guān)系
本體中的關(guān)系主要有以下四種[9]:part-of、kind-of、instance-of和attribute-of。其中part-of表示某個(gè)類是另一個(gè)類的部分,是部分與整體之間的關(guān)系,如自助游游客是屬于游客的一部分;kind-of表達(dá)是父類與子類的關(guān)系,如游客與人之間的關(guān)系;instance-of表達(dá)是具體實(shí)例,如張家界天門(mén)山就是張家界旅游景區(qū)的一個(gè)具體實(shí)例;attribute-of表達(dá)的是屬性與類之間的關(guān)系,如價(jià)格就是住宿這個(gè)類的屬性。
3.6 為每個(gè)類確定一個(gè)實(shí)例
張家界旅游本體中的類所代表的實(shí)例部分?jǐn)?shù)據(jù)如表3所示。
4 張家界旅游本體構(gòu)建
參考文獻(xiàn):
[1]劉澤.內(nèi)蒙古旅游產(chǎn)業(yè)發(fā)展財(cái)政政策研究[D].內(nèi)蒙古:內(nèi)蒙古旅游產(chǎn)業(yè)發(fā)展財(cái)政政策研究,2013.
[2]劉正芳,劉思正. 旅游概論[M].重慶:重慶大學(xué)出版社,2006.
[3]單浩杰. 旅游業(yè)發(fā)展對(duì)內(nèi)蒙古經(jīng)濟(jì)增長(zhǎng)的影響研究[D].內(nèi)蒙古:內(nèi)蒙古大學(xué),2011.
[4]宋朋.本體構(gòu)建最新研究進(jìn)展綜述[J].中國(guó)科技資源導(dǎo)刊,2005(3):73-83.
[5]李慶賽.旅游領(lǐng)域本體構(gòu)建研究[D].鄭州:鄭州大學(xué),2015.
[6]付夢(mèng).基于本體的主題網(wǎng)絡(luò)蜘蛛研究[D].武漢:武漢理工大學(xué),2010.
[7]張猛.基于Ontology的旅游黃頁(yè)語(yǔ)義檢索研究與應(yīng)用[D].北京:北京工業(yè)大學(xué),2013.
[8]王雙鳳.旅游目的地本體構(gòu)建研究[D].湘潭:湘潭大學(xué),2016.
[9]熊回香.面向Web 3.0的大眾分類研究[M].武漢:湖北科學(xué)技術(shù)出版社,2011.
[10]封玨.基于揚(yáng)州的旅游本體構(gòu)建研究[J].信息與電腦,2018(3):12-15.
[11]胡納納.基于本體的旅游信息系統(tǒng)研究與設(shè)計(jì)[D].南京:江蘇科技大學(xué),2013.
[12]毛平.基于領(lǐng)域本體的文本信息語(yǔ)義檢索研究[D].南京:南京理工大學(xué),2007.