国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究

2016-02-12 22:10楊敏
圖書館研究與工作 2016年5期
關(guān)鍵詞:書目關(guān)聯(lián)語義

楊敏

(重慶工程職業(yè)技術(shù)學院圖書館 重慶 402260)

關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究

楊敏

(重慶工程職業(yè)技術(shù)學院圖書館 重慶 402260)

關(guān)聯(lián)數(shù)據(jù)在圖書館領(lǐng)域具有廣泛的應(yīng)用前景,是圖書館語義網(wǎng)建設(shè)中的關(guān)鍵性技術(shù)。文章介紹了目前關(guān)聯(lián)數(shù)據(jù)在圖書館中4個方面的應(yīng)用:書目記錄關(guān)聯(lián)數(shù)據(jù)化、實現(xiàn)語義檢索服務(wù)、擴展知識發(fā)現(xiàn)服務(wù)、跨機構(gòu)的數(shù)據(jù)的開放與復用以及其在用戶接口、法律許可、質(zhì)量評價方面面臨的挑戰(zhàn)。

關(guān)聯(lián)數(shù)據(jù);圖書館;語義網(wǎng)

1 引言

2006年Tim Berners-Lee在《關(guān)聯(lián)數(shù)據(jù)筆記》中提出了Linked Data這一概念,他提出關(guān)聯(lián)數(shù)據(jù)就是將一箱箱數(shù)據(jù)通過開放標準關(guān)聯(lián)在一起,從而萌發(fā)出很多新事物和新應(yīng)用。作為語義網(wǎng)構(gòu)建的關(guān)鍵性技術(shù)之一,關(guān)聯(lián)數(shù)據(jù)通過可鏈接的URI來實現(xiàn)數(shù)據(jù)的語義標注,并將實際語義相關(guān)的數(shù)據(jù)連接起來,以此來構(gòu)建一個可供計算機理解的結(jié)構(gòu)化和語義化的數(shù)據(jù)網(wǎng)絡(luò)。

關(guān)聯(lián)數(shù)據(jù)自提出以來,得到諸多學科領(lǐng)域的廣泛關(guān)注,目前已成為計算機科學、信息管理、圖書情報等領(lǐng)域的研究熱點。圖書館是數(shù)據(jù)的發(fā)布者,同時也是數(shù)據(jù)的消費者。關(guān)聯(lián)數(shù)據(jù)一方面可以作為跨網(wǎng)域數(shù)據(jù)整合的通用API(Application Programming Interface,應(yīng)用程序編程接口),重用或整合其他來源的數(shù)據(jù);另一方面可提供“可信網(wǎng)絡(luò)”的語義要素,保障整合數(shù)據(jù)網(wǎng)絡(luò)的可信度。國外圖書館界已對關(guān)聯(lián)數(shù)據(jù)的應(yīng)用作了諸多有益探索。如2008年美國國會圖書館和瑞典國家圖書館分別將LCSH(Library of Congress Subject Headings,美國國會圖書館標題表)和瑞典全國聯(lián)合目錄LIBRIS以關(guān)聯(lián)數(shù)據(jù)框架的形式在網(wǎng)上發(fā)布,并通過URI(Uniform Resource Identifier,統(tǒng)一資源標識符)實現(xiàn)了LIBRIS的瑞典語主題詞與LCSH之間的關(guān)聯(lián)。

2 圖書館什么數(shù)據(jù)可發(fā)布為關(guān)聯(lián)數(shù)據(jù)?

圖書館的數(shù)據(jù)成千上萬,并且有不同的類型,基本可分為基本數(shù)據(jù)與服務(wù)數(shù)據(jù)兩大類?;緮?shù)據(jù)包括[1]:①受控詞匯,如標題表、敘詞表等;②規(guī)范文檔,如人名、地名規(guī)范數(shù)據(jù)記錄等;③書目數(shù)據(jù),如瑞典聯(lián)合目錄等;④館藏單位,如瑞典各圖書館等。服務(wù)數(shù)據(jù)包括:①不同項目和活動建立的網(wǎng)頁;②整合數(shù)據(jù);③跨行業(yè)、機構(gòu)、數(shù)據(jù)源的數(shù)字資源等。

如此多的數(shù)據(jù)究竟哪種數(shù)據(jù)適合用來發(fā)布為關(guān)聯(lián)數(shù)據(jù)呢?Corey Harper 2008年給出了以下建議:圖書館數(shù)據(jù)工作中的任何“資源”都應(yīng)該在整個流程中盡早得到URI,這些URI都能提供有用的RDF(Resource Description Framework,資源描述框架)信息,并且這種URI都是能使用HTTP來訪問的。

W3C圖書館關(guān)聯(lián)數(shù)據(jù)(Library Linked Data)孵化小組收集了圖書館關(guān)聯(lián)數(shù)據(jù)的用例并探索關(guān)鍵問題,于2011年10月發(fā)布系列報告[2]。在報告中將收集到的58個用例分為書目數(shù)據(jù)、規(guī)范控制、詞匯匹配、檔案數(shù)據(jù)、參考引文、數(shù)字對象、文獻集、社會性應(yīng)用8個類別。從用例數(shù)量上看,書目數(shù)據(jù)是最多的一類,這也是最容易實現(xiàn)的一部分。因此在構(gòu)建關(guān)聯(lián)數(shù)據(jù)之初,書目數(shù)據(jù)成為大多數(shù)圖書館的首要選擇。書目數(shù)據(jù)的主要應(yīng)用目標包括:建立數(shù)據(jù)描述元素的語義標準;通過關(guān)聯(lián)數(shù)據(jù),實現(xiàn)數(shù)據(jù)記錄的去重與統(tǒng)一化;使用標準化書目術(shù)語來標注網(wǎng)絡(luò)資源;多個數(shù)據(jù)提供商提供集成化元數(shù)據(jù)搜索界面;不同形式的信息集和服務(wù)(查詢限定與擴展、提醒服務(wù)等);書目記錄的標注,等等。

3 圖書館關(guān)聯(lián)數(shù)據(jù)的應(yīng)用現(xiàn)狀

關(guān)聯(lián)數(shù)據(jù)在圖書館的應(yīng)用極大挖掘了原有信息資源的價值,進一步深化了知識發(fā)現(xiàn)服務(wù),同時提供了圖書館資源與外部機構(gòu)資源互聯(lián)互通的可能。目前,圖書館領(lǐng)域展開的關(guān)聯(lián)數(shù)據(jù)應(yīng)用主要體現(xiàn)在以下4個方面:

(1)書目記錄關(guān)聯(lián)數(shù)據(jù)化

關(guān)聯(lián)數(shù)據(jù)這一概念提出不久,一些歐美國家的圖書館就開始嘗試采用RDF和關(guān)聯(lián)數(shù)據(jù)來對本館的數(shù)據(jù)資源進行改造,并取得了顯著成效。其中書目數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化即以關(guān)聯(lián)數(shù)據(jù)形式來發(fā)布書目數(shù)據(jù)。技術(shù)上來講是指使用URI命名書目數(shù)據(jù),通過HTTP、URI定位鏈接書目數(shù)據(jù),即通過賦予主題詞、出版社、個人名稱等各書目數(shù)據(jù)唯一的名稱標識URI,將有語義關(guān)聯(lián)的URI鏈接起來,并建立其與主題規(guī)范、出版項、個人名稱規(guī)范等的關(guān)聯(lián)鏈接,形成書目數(shù)據(jù)語義網(wǎng),從而便于用戶從一條書目記錄能擴展檢索到更多的相關(guān)信息[3]。

2008年瑞典國家圖書館將LIBRIS中的書目數(shù)據(jù)、人名、地名等規(guī)范文檔記錄以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布,并將其與DBPedia①相關(guān)聯(lián)。LIBRIS的關(guān)聯(lián)數(shù)據(jù)化為圖書館界開展關(guān)聯(lián)數(shù)據(jù)應(yīng)用提供了寶貴的經(jīng)驗和思路。

美國國會圖書館將LCSH以關(guān)聯(lián)數(shù)據(jù)形式在網(wǎng)上發(fā)布,并與瑞典國家圖書館合作實現(xiàn)了LIBRIS的瑞典語主題詞與LCSH之間的關(guān)聯(lián)。

2010年德國國家圖書館建立和完善了PND(個人名稱規(guī)范)和SWD(主題詞規(guī)范),并建立其與Wikipedia、DBPedia和VIAF[4]的鏈接,通過OAI-PMH(Open Archive Initiative for Protocol Meta-data Harvesting,開放文檔先導—元數(shù)據(jù)收割協(xié)議)和SRU(Search and Retrieve via URL)訪問數(shù)據(jù)的方法,完善了URI/URL模式,從而實現(xiàn)了將這些數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù)。

2012年西班牙圖書館將館內(nèi)書目記錄、個人、題名及主題等規(guī)范記錄轉(zhuǎn)化為RDF三元組,并將其與DBPedia、德國、瑞典的國家圖書館目錄相關(guān)聯(lián)。

國內(nèi)圖書館目前尚未開展真正意義上的將書目數(shù)據(jù)關(guān)聯(lián)數(shù)據(jù)化的實踐。作為國內(nèi)研究關(guān)聯(lián)數(shù)據(jù)的先驅(qū),2008年,劉煒題為“語義操作與關(guān)聯(lián)數(shù)據(jù)”的報告引起了國內(nèi)圖書館界對關(guān)聯(lián)數(shù)據(jù)在圖書館實際工作中應(yīng)用的關(guān)注。隨后,2010年,“圖書館前沿技術(shù)論壇”將主題定為“關(guān)聯(lián)數(shù)據(jù)與書目數(shù)據(jù)的未來”[5],專門探討了相關(guān)方面的問題。國內(nèi)一些館藏書目記錄雖然能提供責任者、主題詞、出版社等鏈接,但相較而言較為簡單,并不能算真正意義上的關(guān)聯(lián)數(shù)據(jù)化。

將圖書館的書目數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù)還僅僅只是圖書館數(shù)據(jù)資源關(guān)聯(lián)數(shù)據(jù)化的初始階段,圖書館也不應(yīng)僅僅只滿足于實現(xiàn)書目數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化。圖書館的數(shù)據(jù)資源類型多種多樣,一些服務(wù)類型的數(shù)據(jù)同樣具有很高的價值,并且往往實現(xiàn)這些服務(wù)數(shù)據(jù)的關(guān)聯(lián)化將更有助于提升用戶的體驗。

(2)實現(xiàn)語義檢索服務(wù)

關(guān)聯(lián)數(shù)據(jù)的發(fā)展為語義網(wǎng)的構(gòu)建提供了新的方向和技術(shù)手段。通過關(guān)聯(lián)數(shù)據(jù)技術(shù)可建立實體之間的語義鏈接來支持用戶的語義檢索。從發(fā)展現(xiàn)狀和趨勢來看,關(guān)聯(lián)數(shù)據(jù)技術(shù)作為語義網(wǎng)實現(xiàn)的一種技術(shù)手段已經(jīng)得到眾多社區(qū)、機構(gòu)和政府部門的廣泛支持。

作為歐洲國家圖書館的數(shù)字資源門戶的Europeana采用 SKOS(Simple Knowledge OrganizationSystem,簡單知識組織系統(tǒng))等元數(shù)據(jù)模式聚合了圖書、視頻等圖書館對象的元數(shù)據(jù),數(shù)據(jù)間互操作性極強。目前,Europeana正在開發(fā)語義檢索服務(wù),通過在Europeana之上引入語義層,以實現(xiàn)在對象之間建立語義鏈接[6]。

(3)擴展知識發(fā)現(xiàn)服務(wù)

知識發(fā)現(xiàn)是人類知識活動的最終目標。進入網(wǎng)絡(luò)時代,人類知識工作的基礎(chǔ)是網(wǎng)絡(luò)環(huán)境;知識發(fā)現(xiàn)的工具是相應(yīng)的網(wǎng)絡(luò)技術(shù)與工具;知識發(fā)現(xiàn)的對象是網(wǎng)絡(luò)中的數(shù)據(jù);知識發(fā)現(xiàn)的結(jié)果是找到有用的數(shù)據(jù)組織為有效的信息,繼而將有效的信息,組織為人們感興趣的、新穎的、有效的知識。關(guān)聯(lián)數(shù)據(jù)是語義網(wǎng)的最佳實踐,促進了語義網(wǎng)的發(fā)展和演進。隨著關(guān)聯(lián)數(shù)據(jù)的理論、原則、方法和技術(shù)的發(fā)展,消費和使用關(guān)聯(lián)數(shù)據(jù)的各類工具也不斷研發(fā)和完善起來。在此基礎(chǔ)上,關(guān)聯(lián)數(shù)據(jù)得以迅速發(fā)展和廣泛應(yīng)用,語義網(wǎng)得以進一步實現(xiàn),資源極大豐富起來。李楠在博士論文中構(gòu)建了關(guān)聯(lián)數(shù)據(jù)的知識發(fā)現(xiàn)模型[7]。

圖書館利用關(guān)聯(lián)數(shù)據(jù)方法和技術(shù)可將本館資源和外部資源組織成為一個有效的網(wǎng)絡(luò),有利于挖掘資源之間原先不那么明顯但實際密切相關(guān)的聯(lián)系,從而促進用戶的知識發(fā)現(xiàn)。圖書館可利用現(xiàn)有的一些關(guān)聯(lián)數(shù)據(jù)倉儲庫和搜索引擎來擴展和深化自身的知識發(fā)現(xiàn)服務(wù)。

(4)跨機構(gòu)的數(shù)據(jù)的開放與復用

關(guān)聯(lián)數(shù)據(jù)是結(jié)構(gòu)化和語義化的,可以實現(xiàn)不同機構(gòu)間數(shù)據(jù)的開放與復用。如圖書館可利用出版社的一些圖書數(shù)據(jù),減輕自身的工作量,并可將自身數(shù)據(jù)與檔案館、博物館、互聯(lián)網(wǎng)上的數(shù)據(jù)關(guān)聯(lián)起來,從而擴展自身資源的范圍,同時也可將其與其他圖書館進行互聯(lián),共享數(shù)據(jù)。

英國哈德斯菲爾德大學圖書館在開放數(shù)據(jù)共享許可協(xié)議下向其他圖書館共享了本館的流通數(shù)據(jù)和薦購數(shù)據(jù),為他館了解讀者借閱傾向、館藏資源建設(shè)等提供有益借鑒。

4 面臨的挑戰(zhàn)

盡管已經(jīng)取得了不小的進展,但是圖書館界在應(yīng)用關(guān)聯(lián)數(shù)據(jù)時仍面臨著諸多考驗,表現(xiàn)在以下幾個方面:

(1)用戶接口問題

關(guān)聯(lián)數(shù)據(jù)可以使圖書館為用戶提供訪問廣泛的、分散的、異質(zhì)的數(shù)據(jù)資源的統(tǒng)一接口。圖書館采用現(xiàn)有的關(guān)聯(lián)數(shù)據(jù)搜索引擎雖然可以使用戶在不同數(shù)據(jù)對象間跳轉(zhuǎn)瀏覽,但在導航和結(jié)果顯示上還存在著諸多不足,可能會造成數(shù)據(jù)迷航,增加用戶負擔。特別是面對海量的網(wǎng)頁數(shù)據(jù),如何使關(guān)聯(lián)數(shù)據(jù)的應(yīng)用接口更加人性化是一個極具挑戰(zhàn)的問題。

因此,圖書館在構(gòu)建關(guān)聯(lián)數(shù)據(jù)之初就應(yīng)充分了解本館用戶的信息需求,從以文件為中心的瀏覽的服務(wù)模式轉(zhuǎn)變?yōu)橐詫嶓w為中心的瀏覽,完善關(guān)聯(lián)數(shù)據(jù)搜索引擎的導航和頁面布局,向用戶提供最精準、最全面的數(shù)據(jù)資源。

(2)法律許可問題

關(guān)聯(lián)數(shù)據(jù)實現(xiàn)了不同數(shù)據(jù)源之間的互聯(lián)互通,極大地提升了數(shù)據(jù)的利用率,但也面臨著一些風險,如侵犯他人的隱私、違反知識產(chǎn)權(quán)等。在關(guān)聯(lián)數(shù)據(jù)的構(gòu)建過程中需要技術(shù)手段和法律方面的綜合考量。

目前,國際上制定了一些與關(guān)聯(lián)數(shù)據(jù)開放有關(guān)的協(xié)議,代表性的有3種:開放數(shù)據(jù)公用、關(guān)聯(lián)協(xié)議及創(chuàng)作公用。這些協(xié)議明確了數(shù)據(jù)生產(chǎn)者和消費者在獲取、傳播、利用、再生產(chǎn)數(shù)據(jù)時的權(quán)利和義務(wù),目的是在法律許可的范圍內(nèi)實現(xiàn)數(shù)據(jù)的再利用。圖書館在整合關(guān)聯(lián)館外數(shù)據(jù)時,需根據(jù)這些協(xié)議深入研究,規(guī)避法律風險。

(3)質(zhì)量評價問題

圖書館采用關(guān)聯(lián)數(shù)據(jù)等新技術(shù)的根本目的是向用戶提供最需要或最合適的數(shù)據(jù)。因此圖書館需要對關(guān)聯(lián)數(shù)據(jù)網(wǎng)中的數(shù)據(jù)質(zhì)量進行評價,確保將完整、可靠、有效的信息呈現(xiàn)給用戶。但是目前的關(guān)聯(lián)數(shù)據(jù)技術(shù)提供數(shù)據(jù)構(gòu)建和檢索方法,并不提供數(shù)據(jù)評價方法。傳統(tǒng)的信息檢索評價方法如PageRank算法、HITS、VSM 等,不宜于直接應(yīng)用于語義網(wǎng)的質(zhì)量評價。圖書館在進行關(guān)聯(lián)數(shù)據(jù)構(gòu)建時,要適當對數(shù)據(jù)對象進行評價,確保數(shù)據(jù)質(zhì)量。

注釋:

①DBpedia是一個很特殊的語義網(wǎng)應(yīng)用范例,它從維基百科(Wikipedia)的詞條里擷取出結(jié)構(gòu)化的資料,以強化維基百科的搜尋功能,并將其他資料集連結(jié)至維基百科。

[1]曾蕾.關(guān)聯(lián)的圖書館數(shù)據(jù)[EB/OL].[2016-02-20].http://wenku.baidu.com/link?url=lMmotBMbRlaSFcH_ndX-rSmbMBl18Fd WzGnzgfs6JFTVCIk81oDJkKtB3cLFs0cTSewDWRlSIHhrKdbXagP6vHUN1wQ5kIWbU-DI-zB-aei.

[2]Daniel Vila Suero, Universidad Politécnica de Madrid,ES. Use-CaseReport[EB/OL].[2016-03-15].http://www.w3.org/ 2005/Incubator/lld /wiki /UseCaseReport.

[3]張海玲.圖書館書目數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化研究:以德國國家圖書館為例[J].圖書館論壇,2013(1):120-125.

[4]VIAF[EB/OL].[2016-09-01].http://www.viaf.it.

[5]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學圖書館學報,2011(2):5-12.

[6]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2010(5):1-7.

[7]李楠.基于關(guān)聯(lián)數(shù)據(jù)的知識發(fā)現(xiàn)研究[D].北京:中國農(nóng)業(yè)科學院,2012.

Research on the Application of Linked Data in Libraries

Linked data have broad application prospects in the library field.It's the key technology of semantic web construction in libraries.This paper introduces four aspects of application of linked data in the libraries at present:bibliographical record linked datamation,realization of semantic retrieval,expansion of knowledge discovery,openness of inter-agency data and the reuse as well as challenges in the user interface,legal permission and quality evaluation.

linked data;library;semantic web

G250.7

A

楊敏(1989—),女,助教,重慶工程職業(yè)技術(shù)學院圖書館。

2016-09-06

猜你喜歡
書目關(guān)聯(lián)語義
推薦書目《初春之城》
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
語言與語義
“一帶一路”遞進,關(guān)聯(lián)民生更緊
奇趣搭配
智趣
批評話語分析中態(tài)度意向的鄰近化語義構(gòu)建
“社會”一詞的語義流動與新陳代謝
“吃+NP”的語義生成機制研究
本刊郵購書目
马尔康县| 会泽县| 方山县| 灯塔市| 察雅县| 福州市| 永宁县| 开远市| 大丰市| 泸州市| 南安市| 德格县| 右玉县| 景德镇市| 万盛区| 巩留县| 西丰县| 台安县| 友谊县| 深州市| 奇台县| 北海市| 阳江市| 雷州市| 孟津县| 交口县| 海南省| 舒城县| 安顺市| 海林市| 聂荣县| 昆山市| 阿坝县| 安吉县| 岳池县| 无极县| 望江县| 太康县| 绩溪县| 丹阳市| 徐水县|