●管 進(jìn)(廣東醫(yī)學(xué)院 圖書館,廣東 湛江 524023)
關(guān)聯(lián)數(shù)據(jù)是一組共享數(shù)據(jù)的最佳集合,它強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)和相互聯(lián)系。采用RDF(Resource Description Framework) 資源描述框架,利用URI(統(tǒng)一資源標(biāo)識(shí)符)命名數(shù)據(jù),在網(wǎng)絡(luò)上發(fā)布和部署實(shí)例數(shù)據(jù)和類數(shù)據(jù),通過(guò)超文本傳輸協(xié)議(HTTP)揭示并獲取這些數(shù)據(jù)。[1]本文將通過(guò)對(duì)關(guān)聯(lián)數(shù)據(jù)的概念、應(yīng)用情況的論述,論證關(guān)聯(lián)數(shù)據(jù)對(duì)知識(shí)服務(wù)開展的影響以及策略。
關(guān)聯(lián)數(shù)據(jù)(Linked Data) 是萬(wàn)維網(wǎng)的發(fā)明人--蒂姆·伯納斯·李 (Tim Berners Lee) 于2006年提出的一種萬(wàn)維網(wǎng)上發(fā)布數(shù)據(jù)的方式,是國(guó)際互聯(lián)網(wǎng)協(xié)會(huì)(W3C)推薦用來(lái)發(fā)布和聯(lián)接各類數(shù)據(jù)、信息和知識(shí)的一種規(guī)范,其目的是構(gòu)建一個(gè)計(jì)算機(jī)能理解的具有結(jié)構(gòu)化和富含語(yǔ)義的數(shù)據(jù)網(wǎng)絡(luò),而不僅僅是人能讀懂的文檔網(wǎng)絡(luò)。[2]關(guān)聯(lián)數(shù)據(jù)強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)、相互聯(lián)系以及有益于人和計(jì)算機(jī)所能理解的語(yǔ)境信息,它可將兩個(gè)處于不同機(jī)構(gòu)的數(shù)據(jù)庫(kù)建立關(guān)系,或者是同一個(gè)機(jī)構(gòu)內(nèi)來(lái)自不同系統(tǒng),無(wú)法在數(shù)據(jù)層面進(jìn)行相互操作的數(shù)據(jù)進(jìn)行關(guān)聯(lián),甚至可鏈接至其它外部數(shù)據(jù),同樣也可被來(lái)自外部的數(shù)據(jù)所鏈接。
2009年 TED(Technology,Entertainment,Design)大會(huì)上,Berners Lee認(rèn)為創(chuàng)建關(guān)聯(lián)數(shù)據(jù)有4個(gè)原則必須遵循:[3]
原則一:使用URI作為任何事物的標(biāo)識(shí)名稱;原則二:使用HTTP URI使任何人都可以訪問這些標(biāo)識(shí)名稱;
原則三:當(dāng)有人訪問某個(gè)標(biāo)識(shí)名稱時(shí),提供有用的信息;
原則四:盡可能提供相關(guān)的URI,以使人們可以發(fā)現(xiàn)更多的事物。
由此可知,關(guān)聯(lián)數(shù)據(jù)允許用戶發(fā)現(xiàn)、關(guān)聯(lián)、描述并再利用各種數(shù)據(jù),用URI標(biāo)識(shí)網(wǎng)頁(yè)文件、RDF文件以及各類圖像、音視頻等特殊編碼的文件。與當(dāng)前的HTML網(wǎng)絡(luò)不同的是,URI除了具有標(biāo)識(shí)(命名)和定位資源對(duì)象的作用之外,還能以此“關(guān)聯(lián)”數(shù)據(jù),對(duì)網(wǎng)絡(luò)上的資源進(jìn)行選擇和定位,進(jìn)而形成很多新的應(yīng)用和事物。
關(guān)聯(lián)數(shù)據(jù)可以是W3C推薦的數(shù)據(jù)規(guī)范,用來(lái)聯(lián)接和發(fā)布各類數(shù)據(jù)、信息和知識(shí),使互聯(lián)網(wǎng)上的服務(wù)器能夠基于內(nèi)容進(jìn)行檢索而不是簡(jiǎn)單的全文檢索,它的作用是基礎(chǔ)性的和多方面的,正在使萬(wàn)維網(wǎng)發(fā)生深刻的改變。一些媒體公司、企業(yè)、政府部門,如BBC、紐約時(shí)報(bào)等,已經(jīng)把他們的海量數(shù)據(jù)轉(zhuǎn)換成了關(guān)聯(lián)數(shù)據(jù)。
2007年1月啟動(dòng)Open Linked Data項(xiàng)目是關(guān)聯(lián)數(shù)據(jù)最典型的應(yīng)用,其目標(biāo)是通過(guò)定義已存在并可公開使用的數(shù)據(jù)集,根據(jù)關(guān)聯(lián)數(shù)據(jù)原則將其轉(zhuǎn)換為RDF,并通過(guò)HTTP來(lái)傳遞,進(jìn)而改善數(shù)據(jù)網(wǎng)絡(luò)Webof Data。隨著項(xiàng)目的逐步壯大,一些大型機(jī)構(gòu)如 BBC、GOOGLE、美國(guó)國(guó)會(huì)圖書館等都積極參與其中。[4]
作為信息收集、組織與處理的專門機(jī)構(gòu),圖書館界對(duì)關(guān)聯(lián)數(shù)據(jù)的研究與應(yīng)用非常重視,并進(jìn)行大力推廣與參與。在國(guó)外,2010年5月萬(wàn)維網(wǎng)聯(lián)盟(W3C)宣布成立圖書館關(guān)聯(lián)數(shù)據(jù)孵化小組(Library Linked Data Incubator Group)以幫助圖書館建立關(guān)聯(lián)數(shù)據(jù),主要集中將圖書館的MARC數(shù)據(jù)、主題標(biāo)目等數(shù)據(jù)開放成為關(guān)聯(lián)數(shù)據(jù)。瑞典國(guó)家圖書館是全球首個(gè)將國(guó)家圖書館級(jí)書目數(shù)據(jù)LIBRIS全部發(fā)布為關(guān)聯(lián)數(shù)據(jù),美國(guó)國(guó)會(huì)圖書館以SKOS(簡(jiǎn)單知識(shí)組織系統(tǒng))格式將傳統(tǒng)的主題標(biāo)目LCSH(國(guó)會(huì)標(biāo)題表)全部轉(zhuǎn)換為可應(yīng)用的關(guān)聯(lián)數(shù)據(jù),德國(guó)國(guó)家圖書館將權(quán)威文檔發(fā)布為關(guān)聯(lián)數(shù)據(jù)的項(xiàng)目,OCLC將杜威分類法及國(guó)際虛擬權(quán)威檔發(fā)布為關(guān)聯(lián)數(shù)據(jù)。而國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究尚不普及,大多集中在對(duì)關(guān)聯(lián)數(shù)據(jù)國(guó)外研究的綜述,白海燕[5-6]和范煒、鄒慶[7]的研究涉及了關(guān)聯(lián)數(shù)據(jù)項(xiàng)目開發(fā)和技術(shù)實(shí)現(xiàn),馬費(fèi)成等[8]針對(duì)網(wǎng)絡(luò)信息資源集成所面臨的困難,結(jié)合關(guān)聯(lián)數(shù)據(jù)的基本思想,提出一個(gè)基于關(guān)聯(lián)數(shù)據(jù)的網(wǎng)絡(luò)信息資源集成框架,并依據(jù)此框架,設(shè)計(jì)和實(shí)現(xiàn)了以武漢大學(xué)為基本單位的免費(fèi)網(wǎng)絡(luò)學(xué)術(shù)資源集成實(shí)驗(yàn)系統(tǒng),李琳探討關(guān)聯(lián)數(shù)據(jù)在圖書館界的應(yīng)用,指出關(guān)聯(lián)數(shù)據(jù)在圖書館的進(jìn)一步應(yīng)用也還面臨著用戶交互、數(shù)據(jù)整合、鏈接維護(hù)、隱私保護(hù)等方面的挑戰(zhàn)。[9]
關(guān)聯(lián)數(shù)據(jù)具有相對(duì)于數(shù)據(jù)庫(kù)更加開放的環(huán)境,允許用戶通過(guò)某一點(diǎn)關(guān)聯(lián)到更廣泛的信息資源。對(duì)圖書館而言,如果在其館藏目錄中增加關(guān)聯(lián)信息,這些關(guān)聯(lián)信息將會(huì)關(guān)聯(lián)圖書館以外的各種資源,這似乎在讓用戶遠(yuǎn)離圖書館。作為知識(shí)服務(wù)的提供者,圖書館應(yīng)該從用戶的角度出發(fā),確保為用戶提供更多的相關(guān)資源和知識(shí),而不僅僅是已經(jīng)訂購(gòu)的資源。因此,對(duì)于關(guān)聯(lián)數(shù)據(jù),圖書館不單只是利用,還應(yīng)將一些館藏?cái)?shù)據(jù)發(fā)布成關(guān)聯(lián)數(shù)據(jù)。這樣,圖書館不僅可以為用戶提供外部的資源,同時(shí)還可以把用戶帶回到圖書館服務(wù)中來(lái)。
知識(shí)發(fā)現(xiàn)是一個(gè)系統(tǒng)化過(guò)程,這個(gè)過(guò)程的實(shí)施是對(duì)大量的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或知識(shí)庫(kù)進(jìn)行分析處理,進(jìn)而深層挖掘,尋找數(shù)據(jù)間潛在的關(guān)聯(lián)模式、規(guī)則、趨勢(shì)等知識(shí)。關(guān)聯(lián)數(shù)據(jù)為知識(shí)發(fā)現(xiàn)提供了良好的途徑,可以將圖書館的資源與外部的資源有效地相互連接起來(lái),幫助用戶獲取圖書館以外的資源。無(wú)論是對(duì)用戶還是圖書館館員,關(guān)聯(lián)數(shù)據(jù)將超越圖書館的資源,為用戶提供新的資源發(fā)現(xiàn)和訪問服務(wù),使發(fā)現(xiàn)資源變得更為容易。
關(guān)聯(lián)數(shù)據(jù)可使來(lái)自圖書館不同的信息系統(tǒng)之間的數(shù)據(jù)關(guān)聯(lián),也能使不同領(lǐng)域的數(shù)據(jù)相互關(guān)聯(lián),使共享網(wǎng)絡(luò)中不同類型的數(shù)據(jù)、信息、知識(shí)成為可能。通過(guò)資源的擴(kuò)展和關(guān)聯(lián),提供知識(shí)服務(wù)的館員和用戶可獲取豐富的檢索結(jié)果。同時(shí),關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)中的數(shù)據(jù)并不是一成不變的,新的數(shù)據(jù)會(huì)不斷加入,舊的數(shù)據(jù)需要修改或刪除,數(shù)據(jù)之間的關(guān)系也會(huì)隨之變化。因此,關(guān)聯(lián)數(shù)據(jù)在為圖書館減輕整合分布式異構(gòu)數(shù)據(jù)源的復(fù)雜性的同時(shí),使資源管理變得更加復(fù)雜化。3.4關(guān)聯(lián)數(shù)據(jù)對(duì)知識(shí)服務(wù)的方式提出了新的要求
關(guān)聯(lián)數(shù)據(jù)的最大好處是將來(lái)自不同數(shù)據(jù)源的同一個(gè)對(duì)象進(jìn)行整合,可以將多個(gè)分布式異構(gòu)數(shù)據(jù)源整合的關(guān)聯(lián)的訪問,返回給用戶關(guān)于該對(duì)象的所有相關(guān)信息的統(tǒng)一視圖,同時(shí)允許用戶在不同數(shù)據(jù)源之間進(jìn)行瀏覽,這使得用戶所面對(duì)的數(shù)據(jù)和信息呈指數(shù)級(jí)增長(zhǎng)。
網(wǎng)絡(luò)環(huán)境下用戶的知識(shí)需求也不再限于單純的文獻(xiàn)檢索傳遞服務(wù),他們更希望通過(guò)圖書館的知識(shí)服務(wù)直接獲取全面的知識(shí)內(nèi)容和知識(shí)關(guān)聯(lián),要求提供知識(shí)密集度較高的知識(shí)服務(wù)產(chǎn)品,同時(shí)還會(huì)要求圖書館針對(duì)他們的具體專業(yè)提供全方位的知識(shí)信息保障,這些都對(duì)圖書館的知識(shí)服務(wù)提出了新的要求。
對(duì)圖書館而言,館藏資源往往是有限的,而關(guān)聯(lián)數(shù)據(jù)的出現(xiàn),使知識(shí)服務(wù)的資源保障從傳統(tǒng)的館藏資源進(jìn)一步關(guān)聯(lián)到整個(gè)互聯(lián)網(wǎng)。建立以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ)的知識(shí)服務(wù)資源保障體系,不僅可以幫助用戶實(shí)現(xiàn)資源發(fā)現(xiàn)的相關(guān)性和便捷性,更重要的是可以滿足用戶對(duì)熱點(diǎn)追蹤、新興或潛在主題發(fā)現(xiàn)等高層次科研咨詢的需求。
關(guān)聯(lián)數(shù)據(jù)一般來(lái)源于分布異構(gòu)的多個(gè)數(shù)據(jù)源,而對(duì)用戶而言,他們更傾向于一站式地利用所有資源與服務(wù)。這就要求圖書館必須充分利用關(guān)聯(lián)數(shù)據(jù),對(duì)這些分散、異構(gòu)的信息資源進(jìn)行有效組織和集成。
首先,將圖書館“內(nèi)部的數(shù)據(jù)”關(guān)聯(lián)起來(lái),消除內(nèi)部數(shù)據(jù)的相互隔閡。圖書館“內(nèi)部的數(shù)據(jù)”包括圖書館集成管理系統(tǒng)、圖書館檢索平臺(tái)、參考咨詢系統(tǒng)等,將這些內(nèi)部數(shù)據(jù)進(jìn)行關(guān)聯(lián)不僅使圖書館能及時(shí)了解讀者需求,而且讀者也可了解圖書館的館藏狀況并充分利用。
其次,整合圖書館內(nèi)部和外部的資源。通過(guò)關(guān)聯(lián)數(shù)據(jù),用戶所需的信息資源中的知識(shí)內(nèi)容、知識(shí)對(duì)象以單一語(yǔ)義映像和多層語(yǔ)義互聯(lián),可將目前基于文獻(xiàn)層面的“整合集成”深化到對(duì)其邏輯關(guān)系進(jìn)行深入、系統(tǒng)的語(yǔ)義描述。
需要指出的是,關(guān)聯(lián)數(shù)據(jù)無(wú)法對(duì)封閉系統(tǒng)中的資源進(jìn)行整合。因此,圖書館在數(shù)據(jù)整合的過(guò)程中,必須考慮關(guān)聯(lián)數(shù)據(jù)與館內(nèi)一些相對(duì)封閉資源的整合,對(duì)于無(wú)法融合在一個(gè)系統(tǒng)里的數(shù)據(jù),則應(yīng)提供一定的資源導(dǎo)航或術(shù)語(yǔ)規(guī)范的支持。
對(duì)于開展知識(shí)服務(wù)的圖書館來(lái)說(shuō),應(yīng)基于海量信息資源和數(shù)據(jù),利用多種知識(shí)挖掘和內(nèi)容計(jì)量手段,擴(kuò)展檢索結(jié)果,整合異類資源,進(jìn)行知識(shí)組織系統(tǒng)的構(gòu)建,為用戶提供深度知識(shí)服務(wù)。這就要求圖書館的知識(shí)服務(wù)必須融入用戶需求,明確針對(duì)具體用戶的服務(wù)責(zé)任,充分利用關(guān)聯(lián)數(shù)據(jù)去調(diào)動(dòng)和集成各種資源、系統(tǒng)和服務(wù),通過(guò)系統(tǒng)集成、服務(wù)集成、團(tuán)隊(duì)工作等多種方式聯(lián)合利用多種知識(shí)、資源來(lái)組織和提供知識(shí)服務(wù),并根據(jù)用戶的實(shí)際情況動(dòng)態(tài)地選擇、分析各種知識(shí),動(dòng)態(tài)地設(shè)計(jì)、組織、安排和協(xié)調(diào)有關(guān)服務(wù)工作和產(chǎn)品形態(tài)。
圖書館開展的以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ)的知識(shí)服務(wù),需要對(duì)海量的知識(shí)進(jìn)行分析、整合和重組;需要運(yùn)用數(shù)據(jù)挖掘、智能檢索等技術(shù)對(duì)知識(shí)資源進(jìn)行深度分析,需要通過(guò)推送技術(shù)、導(dǎo)航技術(shù)為用戶提供個(gè)性化知識(shí)服務(wù)。由此,如何將本館的館藏發(fā)布為關(guān)聯(lián)數(shù)據(jù),如何建立館內(nèi)外關(guān)聯(lián)數(shù)據(jù)的導(dǎo)航,如何將關(guān)聯(lián)數(shù)據(jù)嵌入到用戶的科研系統(tǒng),并為用戶提供一站式的知識(shí)服務(wù)等問題,都要求圖書館要有能提供知識(shí)服務(wù)技術(shù)保障的團(tuán)隊(duì)。該團(tuán)隊(duì)除了要掌握關(guān)聯(lián)數(shù)據(jù)和互聯(lián)網(wǎng)的基本技術(shù)外,還要充分了解本館館藏的實(shí)情,清楚讀者的需求。
圖書館開展的知識(shí)服務(wù)需要將多種媒體的信息資源進(jìn)行深層次分析、整合和處理,找出符合用戶需求的知識(shí),同時(shí)還要求綜合利用多種信息技術(shù)、網(wǎng)絡(luò)技術(shù),科學(xué)地將知識(shí)內(nèi)容顯示出來(lái),并根據(jù)用戶研究過(guò)程中不斷出現(xiàn)的新情況,自始至終參與解決問題的過(guò)程,通過(guò)與用戶的交流互動(dòng)最終形成解決問題的方案。這些過(guò)程需要圖書館員具備熟練的計(jì)算機(jī)操作能力,具備相當(dāng)?shù)膱D書情報(bào)專業(yè)知識(shí)、相關(guān)學(xué)科專業(yè)知識(shí)、一定的外語(yǔ)水平、良好的溝通能力等素質(zhì)和技能才能實(shí)現(xiàn)。單靠某個(gè)或者幾個(gè)館員,是無(wú)法取得令人滿意的服務(wù)效果的。因此,在圖書館知識(shí)服務(wù)中必須依靠團(tuán)隊(duì)的力量,而且往往團(tuán)隊(duì)所做出的決策要比單一個(gè)體所做出的決策更有創(chuàng)意,更能滿足用戶需求,從而提高圖書館的服務(wù)質(zhì)量。
作為語(yǔ)義網(wǎng)的一種實(shí)現(xiàn)方式,關(guān)聯(lián)數(shù)據(jù)通過(guò)發(fā)布和鏈接網(wǎng)上的結(jié)構(gòu)化數(shù)據(jù)使得來(lái)自不同領(lǐng)域的異類、異構(gòu)數(shù)據(jù)相互關(guān)聯(lián),并根據(jù)信息內(nèi)容中的知識(shí)對(duì)象、知識(shí)關(guān)系連接和集成相互關(guān)聯(lián)的內(nèi)容,從而支持基于網(wǎng)絡(luò)的知識(shí)組織和知識(shí)發(fā)現(xiàn)。隨著關(guān)聯(lián)數(shù)據(jù)規(guī)模的不斷擴(kuò)展,其在企業(yè)、圖書館和政府部門當(dāng)中的應(yīng)用也將日益廣泛。關(guān)聯(lián)數(shù)據(jù)在給知識(shí)服務(wù)帶來(lái)挑戰(zhàn)的同時(shí),也帶來(lái)了新的機(jī)遇。
[1] Structured DynamicsLLC.Linked DataFAQ[EB/OL].[2010互03互06].http://structured-dynamics.com/linked_data.html.
[2]潘有能,張悅.關(guān)聯(lián)數(shù)據(jù)研究與應(yīng)用進(jìn)展[J].情報(bào)科學(xué),2011,29(1):124互130.
[3] Berners-Lee T.Linked Data[EB/OL].[2010互01互20].http://www.w3.org/DesignIssues/LinkedData.htm.
[4]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報(bào),2011(2):5互12.
[5]白海燕,朱禮軍.關(guān)聯(lián)數(shù)據(jù)的自動(dòng)關(guān)聯(lián)構(gòu)建研究[J].現(xiàn)代圖書情報(bào)技術(shù),2010,26(2):44互49.
[6]白海燕,喬曉東.基于本體和關(guān)聯(lián)數(shù)據(jù)的書目組織語(yǔ)義化研究[J].現(xiàn)代圖書情報(bào)技術(shù),2010(9):18互27.
[7]范煒,鄒慶.詞表資源關(guān)聯(lián)化[J].情報(bào)理論與實(shí)踐,2010(5):21互25.
[8]馬費(fèi)成,等.基于關(guān)聯(lián)數(shù)據(jù)的網(wǎng)絡(luò)信息資源集成[J].情報(bào)雜志,2011(2):167互175.
[9]李琳.關(guān)聯(lián)數(shù)據(jù)在圖書館界的應(yīng)用與挑戰(zhàn)[J].圖書與情報(bào),2011(4):58互61.