袁軍
摘要: 黔南地區(qū)是典型的少數(shù)民族地區(qū), 不同民族在長(zhǎng)期的生產(chǎn)、生活中形成了自己獨(dú)特的民族文化, 在經(jīng)濟(jì)文化快速發(fā)展的當(dāng)今世界,傳統(tǒng)少數(shù)民族文化面臨巨大的挑戰(zhàn)。許多民族文化研究學(xué)者利用現(xiàn)代信息技術(shù)對(duì)民族文化進(jìn)行挖掘和保護(hù)研究,建立了不少民族文化網(wǎng)絡(luò)資源,但是,這些已建設(shè)資源,沒有得到很好的共享和利用,成為了事實(shí)上的信息孤島,造成民族文化資源的重復(fù)建設(shè)與浪費(fèi)。該文從民族文化資源的利用與共享為主線,引入了語義WEB與WEB服務(wù)技術(shù),討論了民族文化資源如何利用語義WEB與WEB服務(wù)技術(shù)以提高分散、無序的已有民族文化網(wǎng)絡(luò)資源在Internet上的檢索效率與共享。
關(guān)鍵詞:基于語義WEB ;黔南民族文化資源檢索;共享;研究
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)07-0012-03
Abstract: Qiannan is a typical minority area, different nationality has formed its own unique culture in the long-term production and life in today's world, the rapid development of economy and culture, the traditional culture of ethnic minorities is facing a great challenge. Many scholars use modern information technology to mining and protection of national culture, they established many national culture cyber source, however, these resources do not share and use well, become in fact the islands of information, repeated construction and waste of resources caused by national culture. This article from the use of national culture resources and sharing as the main line, introduced the semantic WEB and WEB service technology, discussed in order to improve the retrieval efficiency of the existing scattered and disordered culture cyber source on Internet and sharing of semantic WEB and WEB service technology and how to use the resources of national culture.
Key words: based on semantic WEB; Qiannan ethnic cultural resources;retrieval; sharing; Research
1 前言
貴州的黔南地區(qū)是典型的少數(shù)民族地區(qū),黔南地區(qū)境內(nèi)生活著:布依族、苗族、水族、侗族、毛南族等36個(gè)少數(shù)民族,不同民族在長(zhǎng)期的生產(chǎn)、生活中形成了自己獨(dú)特的民族文化:苗族精美的銀飾、布依族鮮艷的刺繡、水族奇異的水書、侗族余音繞梁的大歌,構(gòu)成了絢麗的少數(shù)民族文化,是中華民族文化不可或缺的組成部分。在經(jīng)濟(jì)文化快速發(fā)展的當(dāng)今世界,傳統(tǒng)少數(shù)民族文化面臨巨大的挑戰(zhàn),為了對(duì)瀕危的民族文化進(jìn)行保護(hù)、研究,不少民族文化研究學(xué)者利用現(xiàn)代信息技術(shù)建立了許多民族文化資源庫,如:剪紙圖案數(shù)據(jù)庫、刺繡圖案數(shù)據(jù)庫、建筑圖案數(shù)據(jù)庫、民族古籍文獻(xiàn)數(shù)據(jù)庫等,但是這些民族文化資源庫在共享、開發(fā)、利用方面卻很不樂觀,少量處于應(yīng)用狀態(tài)的民族文化資源的使用,也基本局限在各校、所的二級(jí)單位,沒有公開在網(wǎng)絡(luò)上發(fā)布,成為了事實(shí)上的信息孤島,造成資源的重復(fù)建設(shè)與浪費(fèi)。本文從民族文化資源的利用與共享為主線,引入了語義WEB等技術(shù),討論了如何將語義WEB與WEB服務(wù)技術(shù)與少數(shù)民族文化資源共享平臺(tái)的建設(shè)相結(jié)合,以提高分散、無序的已有民族文化網(wǎng)絡(luò)資源在Internet上的共享。
2 語義WEB技術(shù)
2.1 語義WEB的產(chǎn)生
語義WEB,即:Semantic Web,是指計(jì)算機(jī)能理解信息語義的WEB,它是現(xiàn)今WEB技術(shù)的發(fā)展方向,它不是一個(gè)新型、獨(dú)立的WEB,而是傳統(tǒng)WEB的延伸;語義WEB的概念由萬維網(wǎng)發(fā)明人,蒂姆·伯納斯·李(Berners-Lee)2000年首次提出;語義WEB通過對(duì)傳統(tǒng)WEB信息資源進(jìn)行標(biāo)注,從而有利于計(jì)算機(jī)對(duì)信息語義的理解和處理以及判斷和推理能力的提升[1]。XML、RDF及本體(Ontology)是構(gòu)成語義WEB的三大核心技術(shù)[2]。
2.2 XML與RDF
XML:可擴(kuò)展標(biāo)記語言(Extensible Markup Language)。被用來實(shí)現(xiàn)信息的結(jié)構(gòu)化、存儲(chǔ)以及傳輸。XML是一種通用的結(jié)構(gòu)化描述語言,它允許用戶自行添加標(biāo)記來標(biāo)注網(wǎng)頁內(nèi)容,具有良好的靈活性和擴(kuò)展性[3];常用于實(shí)現(xiàn)不同網(wǎng)絡(luò)及異構(gòu)數(shù)據(jù)間的信息傳遞與交換。下面以苗族剪紙圖案《吹蘆笙的男子》為例,來說明如何用XML文件來表示民族文化網(wǎng)絡(luò)資源:
RDF(資源描述框架)是W3C(國際萬維網(wǎng)聯(lián)盟)在 XML基礎(chǔ)上推出的,表示W(wǎng)EB資源的標(biāo)準(zhǔn)以及WEB資源結(jié)構(gòu)與內(nèi)容的規(guī)范說明。RDF可用于表示任何資源信息,RDF通過:資源-屬性-屬性值,三元組的形式來表示W(wǎng)EB上的任意資源信息;在語義WEB中,信息以RDF句子的形式統(tǒng)一存儲(chǔ),以便于計(jì)算機(jī)及計(jì)算機(jī)之間對(duì)信息的理解。
3 基于語義WEB的民族文化資源網(wǎng)絡(luò)共享平臺(tái)
少數(shù)民族文化資源是中華民族傳統(tǒng)文化的有機(jī)組成部分,近幾年,各地民族文化研究者分別建設(shè)了不少民族文化網(wǎng)絡(luò)資源,如:剪紙圖案數(shù)據(jù)庫、刺繡圖案數(shù)據(jù)庫、建筑圖案數(shù)據(jù)庫等,但是,這些已建設(shè)資源,由于分布在不同地理位置的高校、院所、單位中,難以發(fā)現(xiàn)和利用;因此,通過建設(shè)民族文化資源共享平臺(tái),將分散的資源整合起來,利用語義WEB技術(shù)實(shí)現(xiàn)資源的全網(wǎng)語義檢索、利用WEB 服務(wù)技術(shù)實(shí)現(xiàn)資源的全網(wǎng)絡(luò)共享有著積極的現(xiàn)實(shí)意義。
3.1民族文化資源網(wǎng)絡(luò)共享平臺(tái)架構(gòu)與功能概述
民族文化資源網(wǎng)絡(luò)共享平臺(tái)組織架構(gòu)圖如上圖所示,其中各層功能敘述如下:
訪問層:是用戶及系統(tǒng)管理員與資源共享平臺(tái)交互的接口,這里的用戶有兩類,一類是需要共享資源的A類用戶;另一類是擁有資源的,希望資源被共享的B類用戶;A類用戶通過系統(tǒng)的語義檢索功能快速定位、查找所需資源,再通過系統(tǒng)的資源共享的WEB服務(wù)功能使用資源;B類用戶是指那些擁有資源的用戶,通過在共享平臺(tái)發(fā)布資源,來滿足A類用戶的共享需求。
服務(wù)本體層:接受訪問層的服務(wù)請(qǐng)求,實(shí)現(xiàn)相應(yīng)的檢索及資源共享服務(wù),并將服務(wù)結(jié)果返回給訪問層用戶;服務(wù)層要實(shí)現(xiàn)上述服務(wù),需要建立民族文化資源數(shù)據(jù)和平臺(tái)本體庫元數(shù)據(jù)間的對(duì)應(yīng)關(guān)系;資源共享采用WEB服務(wù)注冊(cè)和發(fā)現(xiàn)機(jī)制UDDI(Universal Description Discovery and Integration即統(tǒng)一描述、發(fā)現(xiàn)和集成協(xié)議)來實(shí)現(xiàn)。
領(lǐng)域本體層:民族族文化資源本體層的核心就是建立民族文化資源的本體知識(shí)庫。它是共享平臺(tái)進(jìn)行語義檢索與共享的基礎(chǔ),本體知識(shí)庫提供了民族文化領(lǐng)域相關(guān)的元數(shù)據(jù),通過元數(shù)據(jù)的標(biāo)注,民族文化資源能夠表達(dá)一定的語義,這是實(shí)現(xiàn)語義WEB相關(guān)智能服務(wù)的前提。
資源層:是指處于不同地理位置的、網(wǎng)絡(luò)服務(wù)器上的民族文化資源,包含文本、圖像、視頻、音頻、PPT等基本文件與素材,它們以無序及分布式的方式散布各地,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)。
3.2 民族文化資源共享平臺(tái)語義檢索功能流程
信息檢索在當(dāng)前Internet上使用非常普遍,是WEB的主要應(yīng)用之一,Google搜索引擎每天執(zhí)行的搜索次數(shù)大約是30億次,百度每天執(zhí)行的搜索次數(shù)大約是10億次。但是使用過網(wǎng)絡(luò)搜索功能的用戶都有這樣的印象,Internet網(wǎng)上的信息非常豐富,但檢索反饋回來的信息卻不一定都是我們想要的,因?yàn)閭鹘y(tǒng)的信息檢索從基本原理上來講,采用的依然是機(jī)械的關(guān)鍵字匹配方法,這種方法沒有從語義的角度對(duì)檢索信息進(jìn)行處理,只是簡(jiǎn)單地將包含相同關(guān)鍵字的信息詞條反饋給用戶,所以查準(zhǔn)率不高。例如:“公交車”與“bus”在搜索引擎中的結(jié)果是不同的。民族文化資源網(wǎng)絡(luò)共享平臺(tái)中的檢索功能要實(shí)現(xiàn)對(duì)不同地域的無序分布的文化資源站點(diǎn)進(jìn)行高效的智能檢索,需要采用基于語義WEB的檢索技術(shù),基于語義WEB的檢索技術(shù),從語義的角度來處理用戶用自然語言表達(dá)的檢索請(qǐng)求,并將用戶檢索請(qǐng)求與基于本體的信息知識(shí)庫中的內(nèi)容進(jìn)行語義的推理和匹配,這樣可以提高檢索的周全度與準(zhǔn)確率。
民族文化資源共享平臺(tái)語義檢索流程如下:
1) 用戶通過用戶代理軟件提交檢索查詢請(qǐng)求,同時(shí)用戶檢索請(qǐng)求還需按文化資源本體庫中的規(guī)則轉(zhuǎn)化為系統(tǒng)認(rèn)可的格式。
2) 用戶代理軟件將符合要求的檢索請(qǐng)求提交給檢索代理,檢索代理從民族文化資源庫中檢索出用戶需要的資源,交由用戶代理返回給用戶。
3) 資源代理軟件主要負(fù)責(zé)維護(hù)民族文化資源庫,并從Internet中將新的資源添加到庫中,充實(shí)資源庫內(nèi)容,滿足用戶檢索需求。
3.3 民族文化資源共享平臺(tái)資源網(wǎng)絡(luò)共享功能流程
近些年來,民族文化數(shù)字化研究者出于研究工作的需要,分別建設(shè)了諸如:剪紙、服飾、建筑等網(wǎng)絡(luò)數(shù)據(jù)庫資源,這些分布于不同地理位置、不同組織、不同網(wǎng)絡(luò)的民族文化資源,采用的數(shù)據(jù)組織形式不同、采用的操作系統(tǒng)不同,如何共享這些現(xiàn)有的、高度分布的民族文化網(wǎng)絡(luò)資源?WEB服務(wù)(WebService)是解決這一問題的良好方案。WEB服務(wù)是一種跨程序設(shè)計(jì)語言和跨操作系統(tǒng)平臺(tái)的遠(yuǎn)程調(diào)用技術(shù)??缯Z言,也就是說服務(wù)端與客戶端可以采用不同的語言一實(shí)現(xiàn)各自的程序功能,如:服務(wù)器端采用C語言來編寫程序,客戶端程序則可以采用JAVA、C#等其他編程語言來實(shí)現(xiàn);所謂跨操作系統(tǒng)平臺(tái)則是指服務(wù)端程序和客戶端程序可以在不同的操作系統(tǒng)上運(yùn)行,如服務(wù)器采用WIN2003客戶端可以采用LINUX都不會(huì)影響WebService 功能的實(shí)現(xiàn)[4]。
在上圖中文化資源服務(wù)注冊(cè)模塊提供共享資源的注冊(cè)功能,便于資源的請(qǐng)求者了解共享平臺(tái)上有哪些資源可供使用;服務(wù)提供模塊提供具體的文化網(wǎng)絡(luò)資源供請(qǐng)求者使用;資源請(qǐng)求者通過服務(wù)注冊(cè)模塊查找需要使用的資源,并與資源提供者綁定,使用資源。工作流程如下:
1) 民族文化資源提供者將可共享的資源通過平臺(tái)服務(wù)注冊(cè)模塊按UDDI要求進(jìn)行注冊(cè)發(fā)布。UDDI是通用描述、發(fā)現(xiàn)與集成服務(wù),是WEB服務(wù)注冊(cè)和發(fā)現(xiàn)的規(guī)范。
2) 民族文化資源服務(wù)請(qǐng)求者向資源共享平臺(tái)請(qǐng)求特定的資源,資源共享平臺(tái)對(duì)服務(wù)注冊(cè)中心進(jìn)行查詢,為請(qǐng)求者提供滿足要求的服務(wù)資源。
3) 民族文化資源共享平臺(tái)向請(qǐng)求者返回符合要求的資源信息,該信息使用WSDL(WEB服務(wù)描述語言)進(jìn)行說明。
4) 資源共享平臺(tái)根據(jù)WSDL生成的服務(wù)描述信息生成相應(yīng)的SOAP消息,并發(fā)送給資源提供者,以實(shí)現(xiàn)雙方的綁定操作。
5) 服務(wù)請(qǐng)求者通過綁定使用相應(yīng)的資源。
4 結(jié)束語
分散、無序的民族文化資源阻礙了資源的共享和利用,語義WEB技術(shù)能夠?yàn)槊褡逦幕W(wǎng)絡(luò)資源提供計(jì)算機(jī)能夠識(shí)別和處理語義信息,WEB服務(wù)技術(shù)能實(shí)現(xiàn)分散、無序民族文化資源的共享,將語義WEB與WEB服務(wù)技術(shù)與少數(shù)民族文化資源共享平臺(tái)的建設(shè)相結(jié)合,將分散的資源整合起來,對(duì)于實(shí)現(xiàn)黔南民族文化網(wǎng)絡(luò)資源的共享以及研究和開發(fā)利用有著積極的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] 梁曄,周海燕. 本體論與語義WEB [J]. 北京聯(lián)合大學(xué)學(xué)報(bào),2007(3):1-6.
[2] 劉柏嵩. 基于知識(shí)的語義網(wǎng):概念、技術(shù)和挑戰(zhàn)[J].中國圖書館學(xué)報(bào),2003(2):1-4.
[3] XML 簡(jiǎn)介[OL].http://www.w3school.com.cn/xml/xml_intro.asp
[4] Web Service工作原理及實(shí)例[OL].http://blog.csdn.net/yangwenxue_admin/article/details/51059125.