引言:本文就構(gòu)建旅游個性化推薦知識庫的方法進(jìn)行了討論和研究,分析了為什么選用基于本體方法來構(gòu)建旅游個性化推薦知識庫。介紹了以本體為基礎(chǔ)的旅游個性化推薦知識庫的構(gòu)建及本體的構(gòu)建原則,重點介紹了采用骨架法構(gòu)建旅游資源本體知識庫的具體構(gòu)建方法及步驟。另外,對OWL語言進(jìn)行了簡要的介紹和舉例。
當(dāng)旅游市場發(fā)展到一個相對完善的水平時,旅游者對自己的旅游方式以及消費觀念就會提出更高的要求,這就表現(xiàn)在旅游過程中所追求的自由,高質(zhì)且量身訂制的個性化專業(yè)服務(wù)。
旅游是—個集吃、住、行、娛、游、購六大要素為一體的—個綜合性產(chǎn)業(yè),一次旅游活動涉及到眾多的旅游資源和服務(wù)設(shè)施,而旅游信息又有著豐富的空間和時間的內(nèi)涵,再加上旅游過程是—個受自然、人為等多種因素制約的復(fù)雜過程。如何組織并安排好各相關(guān)的服務(wù)設(shè)施和旅游資源,協(xié)調(diào)好各種旅游服務(wù)產(chǎn)業(yè)提供的各項服務(wù)。并根據(jù)客戶的需要進(jìn)行服務(wù)流程的描述,進(jìn)行功能、行為、策略和推理過程?,F(xiàn)在較為成熟的推薦方法也有很多,下表列出了幾種推薦方法的優(yōu)缺點比較:
通過對上表的分析可以看出,基于知識庫的推薦更適合完成我們所提出的個性化旅游推薦這一點。它是建立在用戶需求和偏好基礎(chǔ)上推薦的,因為在知識庫中,景區(qū)的各項屬性都與用戶的需求有了相應(yīng)的聯(lián)系,也就是所形成的知識。因此在獲得用戶的需求后,就能夠快捷準(zhǔn)確的從知識庫中獲得所需要的景區(qū)信息,并推它不需要用戶資料等信息,只需構(gòu)建旅游資源的知識庫,就可以與用戶產(chǎn)生互動,將用戶的需求映射到景區(qū)的潛在屬性上,完成對旅游項目的選擇。
傳統(tǒng)的旅游信息系統(tǒng)(TIS)一般是建立在數(shù)據(jù)庫系統(tǒng)基礎(chǔ)上的,歐洲的一些國家曾有過許多成功的例子,比較著名的有瑞士阿彭策爾信息系統(tǒng)、奧地利蒂羅爾信息系統(tǒng)等。數(shù)據(jù)庫系統(tǒng)管理的是數(shù)據(jù),而知識庫系統(tǒng)管理的是知識。[1]
二、知識庫的構(gòu)建方法
關(guān)于“知識”這一概念,還沒有一個準(zhǔn)確的定義,它被理解為“通過學(xué)習(xí)或經(jīng)歷所得到的理解和認(rèn)識”或理解為“所發(fā)現(xiàn)、理解或?qū)W到的東西的總和”。消息應(yīng)該被理解成對可用數(shù)據(jù)釋義的敘述。數(shù)據(jù)則應(yīng)該理解為:“附有數(shù)據(jù)的標(biāo)記”。所以,知識是一個三元組的一部分。這個三元組是:數(shù)據(jù)、信息、知識。[2]
從計算機科學(xué)的角度來說,知識是信息經(jīng)過分析和處理后得到的結(jié)果,在這一過程中數(shù)據(jù)經(jīng)分析、比較、綜合,最后結(jié)合成為有意義的資源---知識。這一過程如下圖2.1所示:
目前有很多知識庫的構(gòu)建方法:基于模型的知識構(gòu)建技術(shù)、基于關(guān)系數(shù)據(jù)庫的知識庫構(gòu)建方法;基于知識管理的知識庫建立;面向隱喻計算的實體概念知識庫構(gòu)建方法等;基于本體的知識庫構(gòu)建。[3]
其中,基于模型的知識構(gòu)建技術(shù)是以模型為核心來組織、管理、共享和應(yīng)用知識的體系,依據(jù)知識復(fù)用的原則,建立了基于模板與模型的知識復(fù)用技術(shù);基于知識管理的知識庫,它是以知識元挖掘為基礎(chǔ),通過揭示知識元之間的語義邏輯鏈接來構(gòu)建知識結(jié)構(gòu)體系;面向隱喻計算的實體概念知識庫構(gòu)建方法是利用屬性是屬性值與實體概念的中間橋梁這一思路來構(gòu)建實體概念知識庫的,其中涉及實體概念屬性值的抽取與實體概念庫的選擇以,最后由屬性的判定構(gòu)建了實體概念知識庫;基于本體的知識庫構(gòu)建是基于本體為知識庫的建立提供了基本的結(jié)構(gòu),本體提供了一套概念及術(shù)語來對某一領(lǐng)域進(jìn)行描述。知識庫就是利用這些術(shù)語來表達(dá)虛擬或現(xiàn)實世界中的知識。[4]
下面,本文就基于本體的旅游個性化推薦知識庫的構(gòu)建方法進(jìn)行具體討論。
三、基于本體的構(gòu)建方法
知識庫的構(gòu)建是為知識共享提供基礎(chǔ),也是關(guān)系到知識管理系統(tǒng)是否能平穩(wěn)、有效運行的關(guān)鍵。知識庫其實是一種對領(lǐng)域信息的模型化表示,利用本體來構(gòu)建知識庫已經(jīng)成為當(dāng)前知識庫構(gòu)建研究的熱點。本體是關(guān)系和概念的集合,是對領(lǐng)域知識概念的抽象和描述。利用本體我們可以在數(shù)據(jù)庫和應(yīng)用軟件來共享、重用領(lǐng)域知識。[5] 本體在知識庫系統(tǒng)的開發(fā)中較多應(yīng)用于開發(fā)領(lǐng)域模型,就比如本文所研究的旅游資源領(lǐng)域。下圖3.1描述了本體與知識庫之間的關(guān)系。
(一)基于骨架法的本體構(gòu)造
本體構(gòu)造的方法有很多種,這里本文討論研究骨架法。骨架法的過程為:(1)確定本體的應(yīng)用范圍和目的;(2)知識本體的分析;(3)本體的表示;(4)本體的評估;(5)本體的建立。[6]骨架法流程如下圖3.2所示:
(二)旅游資源領(lǐng)域本體分析
設(shè)計一個有效的知識表示系統(tǒng)以及對應(yīng)的詞匯表,要對該領(lǐng)域進(jìn)行有效的本體分析,如果本體分析沒做到位,則會導(dǎo)致知識庫的不一致。[7]
在對旅游領(lǐng)域本體所涉及概念范圍、概念關(guān)系、概念屬性等進(jìn)行分析后,得到旅游推薦所涉及到的主要事物包括:景點、地區(qū)、旅游路線、交通信息、酒店住宿、民風(fēng)民俗、天氣狀況、餐飲等。對旅游本體庫描述如下圖3.3所示:圖3.3 旅游本體庫分析
(三)本體的描述
本體描述語言有RDF Schema(8Dr2S)和RDF、DAML、OIL、OWL等。本文采用OWL對旅游本體進(jìn)行描述。OWL的全稱是Web Ontology Language,是語義互聯(lián)網(wǎng)中本體描述語言的標(biāo)準(zhǔn)。OWL采用的是面向?qū)ο蟮姆绞絹韺︻I(lǐng)域知識進(jìn)行描述,即使用類以及屬性來對對象進(jìn)行描述,并使用公理來對這些類及屬性的特征和關(guān)系進(jìn)行描述。[8]與其它語言相對比,OWL增加了更多用來描述屬性及類的詞匯,如類之問的不等價性、基數(shù)和相交性,擁有更為豐富的屬性特征(如對稱性)、屬性類型和枚舉類。OWL還有3個表達(dá)能力遞增的子語言:OWL Lite、OWL DL以及OWL Full,可以滿足不同用戶要求。
以下舉例說明OWL在旅游資源本體構(gòu)建中的一些實際應(yīng)用:
例如在本體的定義中可以將同級別的幾個詞匯定義成不同的類,這就可以使用不相交類來進(jìn)行定義:owl:disjiointWith,如下段的OWL定義的類就是不相交類:
在建立類屬性的時候,我們還會定義屬性的一些約束,如下面的OWL語言片段,allValuesFrom屬性約束,就描述的是酒店星級都包含在酒店星級這一類中。
(四)本體的評估
在建立了基于本體的旅游信息知識庫后,需要對該本體進(jìn)行評估。本體的評估指根據(jù)能力問題及需求描述等對本體及相關(guān)文檔、軟件環(huán)境進(jìn)行評價。這些評價因素需要包括詳細(xì)的文本需求規(guī)則和本體所具有的功能以及在實際應(yīng)用中對于知識的推理和檢查能力。由于旅游本體是建立在傳統(tǒng)旅游信息數(shù)據(jù)庫上的,在咨詢領(lǐng)域?qū)<乙约皡⒖紘鴥?nèi)外的開發(fā)案例后,可以進(jìn)一步的保證旅游信息系統(tǒng)所包含多個領(lǐng)域數(shù)據(jù)的有效性的和完備性。[9]
(五)本體知識庫的建立
將本體引入知識庫的知識建模,建立起領(lǐng)域本體知識庫,知識庫的構(gòu)建涉及知識的表示、推理、傳遞以及獲取。將本體引入知識庫系統(tǒng)中,可以采用概念或術(shù)語來對知識進(jìn)行表示,并能揭示這些知識之間所存在的內(nèi)在聯(lián)系。
下圖3.4就是基于本體的知識庫架構(gòu):
其中,表示層是語義web瀏覽器,提供接口用于用戶瀏覽和交互。用戶通過瀏覽器或者其他途徑訪問系統(tǒng),用戶界面接收并查詢請求,將服務(wù)端所檢索到的結(jié)果反饋給用戶。值得注意的是,雖然本體被我們引入了系統(tǒng)中,但本體在表示層中是對用戶屏蔽的。
數(shù)據(jù)層包括三個庫:資源數(shù)據(jù)庫、本體庫和資源描述庫。數(shù)據(jù)層是知識庫的存儲介質(zhì),由它創(chuàng)建和提取出結(jié)構(gòu)化的知識本體,知識檢索的直接來源就是數(shù)據(jù)層。[10]
應(yīng)用邏輯層用以完成對知識的檢索。應(yīng)用邏輯層由查詢組件、推理引擎、信息獲取組件、語義分析組件、和本體管理組件這五個部分構(gòu)成。由于旅游本體數(shù)據(jù)庫中還包含了多個領(lǐng)域的知識,為了讓用戶能夠得到供豐富完善、智能友好的旅游個性化推薦服務(wù),對旅游資源信息進(jìn)行語義查詢時還需要利用推理機來實現(xiàn)此功能。其中,旅游資源本體公理可以用一階謂詞來表示?!癆:(類)”表示A是一個類變量,A的表示是類中的一個實例;使用“A.S”表示A的槽S的值。S(A,B)表示A的槽S取值為B。要使本體知識庫中數(shù)據(jù)一致,還需要構(gòu)造公理庫。
如定義以下公理:
公理1:
所有A:酒店,存在B:交通路線[HasRoute (A,B)]
公理2:
所有A:交通路線,所有B:酒店[HasRoute(A,B)-connctHotel(A,B)]
將建立好的公理庫放入推理機中,在建立好的旅游資源本體知識庫的基礎(chǔ)上進(jìn)行推理,這樣可以根據(jù)用戶的要求更為方便準(zhǔn)確地推理查詢出用戶所期望的個性化旅游資源信息。
四、結(jié)束語
本文闡述了根據(jù)骨架方法構(gòu)造旅游領(lǐng)域本體的原則和步驟。對基于本體的知識庫系統(tǒng)和描述邏輯做了研究和探索工作。
由于知識庫系統(tǒng)及本體論本身的內(nèi)容的廣泛性及其復(fù)雜性,仍然有很多問題有待進(jìn)一步深入探討和研究。特別是對旅游資源本體的研究、描述、構(gòu)建以及發(fā)展等內(nèi)容。本人將在后續(xù)的研究過程中繼續(xù)鉆研,力爭取得更多更好的成果。
參考文獻(xiàn)
[1]本體知識庫的構(gòu)建與進(jìn)化方法研究[D].山東:中國海洋大學(xué),2008.
[2]張鑫.基于知識管理的知識庫構(gòu)建[D].黑龍江:黑龍江大學(xué),2009王璀民.
[3]馮欣.本體在旅游信息系統(tǒng)中的應(yīng)用研究[D].重慶:重慶大學(xué),2008.
[4]郭小芳,劉愛軍.知識獲取方法及實現(xiàn)技術(shù)[J].山西師范大學(xué)學(xué)報.2007,6(1):33~55.
[5]郭慶磊.基于本體的流程知識庫研究與設(shè)計[D].山東:山東大學(xué),2009.
[6]Paul C.jorgensen(美國).譯者:韓柯,杜旭濤等.軟件測試[M].北京:機械工業(yè)出版社.2008.159 ~187.
[7]陳銘,王英林.基于本體按需知識管理系統(tǒng)研究與實現(xiàn)[M].2006,23(1):236-240.
[8]張建華,劉仲英.當(dāng)前知識管理系統(tǒng)模型與對策分析[M].[J].2004,23(1):73-77.
[9]Maedche,Alexander,Motik,Boris,Stojanovic,Ljiljana,Studer,Rudi;Volz,Raphael.Ontologiesforenterpriseknowledgemanagement.IEEEIntelligentSystems[J],2003(18/2):26-33.
[10] Gruninger M.and Fox.M.S.Methodology for the Design and Evaluation of Ontologies,Workshop on Basic Ontological Issues in Knowledge Sharing[J].IJCAI-95,Montreal,1995:121-128.
(作者單位:貴州財經(jīng)大學(xué) 實驗教學(xué)部)
作者簡介:李小天(1987-),女,貴州貴陽人,碩士研究生,研究方向為數(shù)據(jù)庫技術(shù)與軟件工程。
基金項目:貴州省2008年省級信息化專項基金項目(0830)。