王露露,徐軍華(湘潭大學(xué)公共管理學(xué)院)
?
語義網(wǎng)環(huán)境下的數(shù)字圖書館服務(wù)創(chuàng)新
王露露,徐軍華(湘潭大學(xué)公共管理學(xué)院)
摘要:通過分析數(shù)字圖書館建設(shè)中存在的一些問題,探討在語義網(wǎng)環(huán)境下數(shù)字圖書館與語義網(wǎng)相結(jié)合,在信息檢索技術(shù)、打破“信息孤島”、改進(jìn)用戶體驗等方面可以進(jìn)行的技術(shù)改進(jìn)與服務(wù)創(chuàng)新。
關(guān)鍵詞:語義網(wǎng);數(shù)字圖書館;服務(wù)創(chuàng)新
2014年10月26日,在京舉辦的“2014開放學(xué)習(xí)國際論壇”首次發(fā)布了由新媒體聯(lián)盟會同瑞士庫爾技術(shù)與經(jīng)濟(jì)學(xué)院﹑蘇黎世聯(lián)邦理工學(xué)院圖書館和德國國家科學(xué)技術(shù)圖書館共同完成的《新媒體聯(lián)盟地平線報告(2014圖書館版)》的國內(nèi)譯版。報告顯示,未來5年,圖書館館藏圖書資料將只是信息資源的一部分,信息資源借助網(wǎng)絡(luò)將具有共享性﹑互動性﹑開放性,呈現(xiàn)方式也更加多樣化。與此同時,信息技術(shù)發(fā)展將從根本上改變?nèi)祟惈@取知識和利用資源的方式,必然會給圖書館的職能及服務(wù)帶來全面而深刻的變革。[1]新媒體聯(lián)盟遴選出了極有可能在未來5年成為驅(qū)動圖書館技術(shù)采納和決策制定的六大趨勢,其中的一大焦點(diǎn)技術(shù)就是語義網(wǎng)。
自2000年Tim Berners-Lee提出語義網(wǎng)的七層模型以來,對于語義網(wǎng)的建設(shè)一直在進(jìn)行中,W3C已出臺七層模型的底部四層標(biāo)準(zhǔn),但邏輯層﹑證明層﹑信任層的研究仍在進(jìn)行中。事實(shí)上,對于語義網(wǎng)研究的參考文獻(xiàn)大部分都是外文,國內(nèi)在圖書館領(lǐng)域的深入研究少之又少。但是,隨著七層模型的不斷細(xì)化和各界關(guān)于語義網(wǎng)應(yīng)用的不斷研究,它作為網(wǎng)絡(luò)發(fā)展新的愿景而言,將會無可限量,尤其IBM﹑Google等互聯(lián)網(wǎng)產(chǎn)業(yè)巨頭以及美國國會圖書館對于語義網(wǎng)的熱衷可見一斑。因此,筆者認(rèn)為,作為互聯(lián)網(wǎng)發(fā)展催生的數(shù)字圖書館,更應(yīng)該站在技術(shù)革新的浪頭,更加精心地將處于生長期的“初生兒”——語義網(wǎng)哺育長大。
2.1檢索系統(tǒng)效率較低
數(shù)字圖書館的搜索引擎多以傳統(tǒng)的關(guān)鍵字檢索為主要方式,這種檢索方式雖然一定程度上滿足了用戶需求,但是由于關(guān)鍵字與其真正語義的含義不在同一層面,導(dǎo)致查詢結(jié)果往往只是字面意義上的相加匹配,而非我們真正需要的信息,最終導(dǎo)致檢準(zhǔn)率較低。比如,我們在搜索欄輸入“比爾·克林頓的夫人”,搜索引擎只會給出同時包含“比爾·克林頓”和“夫人”兩個關(guān)鍵詞的一系列網(wǎng)頁,只有點(diǎn)鏈接,逐條閱讀,我們才可以找到答案。另外,目前數(shù)字圖書館的檢索對象僅僅是已經(jīng)數(shù)字化﹑標(biāo)準(zhǔn)化的資源,對于那些數(shù)量龐大或是資源還未與元數(shù)據(jù)匹配的信息卻無能為力,最終導(dǎo)致檢全率較低。
2.2資源利用效率較低
(1)傳統(tǒng)用戶利用數(shù)字圖書館資源的方式一般是在搜索欄搜索到相關(guān)結(jié)果,分篇下載或是瀏覽后,從眾多資源中選擇自己想要的相關(guān)主題信息,信息獲取過程繁雜。(2)不同領(lǐng)域之間甚至同一領(lǐng)域之間的知識關(guān)聯(lián)度較差,因為元數(shù)據(jù)標(biāo)準(zhǔn)﹑信息系統(tǒng)的鴻溝,甚至社會組織之間的交流隔閡,我們很難將其完整收集并整合起來。(3)面向用戶的信息載體單一,數(shù)字圖書館基本沿襲的都是傳統(tǒng)圖書館古老的知識呈現(xiàn)方式,即文字與符號。但事實(shí)上,就同一主題,我們可以在google搜索到相關(guān)網(wǎng)頁新聞,在Youtube搜索到相關(guān)視頻,在DIALOG聯(lián)機(jī)數(shù)據(jù)庫中搜索到相關(guān)論文,在Twitter搜索到相關(guān)評論,卻沒有一個是可以同時搜索到全部格式的信息系統(tǒng)。
2.3用戶體驗指數(shù)較差
Web2.0環(huán)境下,數(shù)字圖書館用戶是以信息集中地“客人”的身份到訪的——用戶提出需求,再由圖書管理員根據(jù)用戶需求向用戶推送信息。用戶與圖書館管理員之間溝通不暢,極大削弱了數(shù)字圖書館用戶的體驗指數(shù)。因此,克服這一問題的方法就是要想方設(shè)法讓用戶成為“主人”,獲取信息就像取家里的物品一樣隨心隨意,而這一切的實(shí)現(xiàn)都需要語義網(wǎng)的加入。
3.1推動圖書館信息檢索平臺智能化
語義網(wǎng)不是對Web的重塑,而是在現(xiàn)有Web2.0基礎(chǔ)上的延伸,是對現(xiàn)有Web利用價值的挖掘。語義網(wǎng)首先強(qiáng)調(diào)的不是語義,而是Web,是讓計算機(jī)智能化,這對于數(shù)字圖書館而言,將會為信息檢索平臺和檢索用戶之間創(chuàng)建一種可交流的語言,讓信息檢索平臺可以聽懂用戶的聲音。要實(shí)現(xiàn)這一服務(wù),需要應(yīng)用語義技術(shù),構(gòu)建智能化信息檢索平臺。一般有以下兩種方法:一是在基于本體的傳統(tǒng)信息檢索平臺的基礎(chǔ)上,增加以RDFS﹑OWL等為基礎(chǔ)語言的語義層;二是通過引入語義技術(shù),如智能代理﹑Web爬蟲等,實(shí)現(xiàn)智能聚合﹑組織和處理用戶提出的檢索項功能,即在原有的系統(tǒng)模型的基礎(chǔ)上實(shí)現(xiàn)傳統(tǒng)檢索平臺的智能升級。
在語義信息檢索過程中,信息推理分析引擎通過本體工程支撐,抽取出用戶提問背后的某專業(yè)領(lǐng)域所隱含的信息。同時,經(jīng)過語義描述標(biāo)準(zhǔn)和智能推理技術(shù)將檢索信息轉(zhuǎn)化為與語義信息檢索平臺的元數(shù)據(jù)結(jié)構(gòu)和規(guī)則精確契合的檢索詞,即生成為計算機(jī)可以理解的結(jié)構(gòu)化語言,進(jìn)而在互聯(lián)網(wǎng)中央大數(shù)據(jù)庫搜索數(shù)據(jù),最后通過智能聚合﹑語義排序等操作向用戶返回查詢結(jié)果(見圖1)。
圖1 語義信息檢索模型
3.2打破數(shù)字圖書館“信息孤島”和“社交藩籬”
語義網(wǎng)最大的特點(diǎn)就是提供了打破應(yīng)用﹑企業(yè)和社區(qū)之間藩籬的工具,就數(shù)字圖書館而言,“界限”這個概念被顛覆。原來所定義的界限是各個信息系統(tǒng)之間的“信息孤島”,我們對于打破“孤島”之間的界限問題一直在探索中。當(dāng)互聯(lián)網(wǎng)發(fā)展至Web3.0階段,信息資源最大的特點(diǎn)就是開放。一方面,有了語義網(wǎng)的RDF和內(nèi)容元數(shù)據(jù)結(jié)成的數(shù)據(jù)標(biāo)準(zhǔn)套件,“信息孤島”問題將迎刃而解;另一方面,語義網(wǎng)作為“云計算”的孿生子,就像云計算對于數(shù)字資源的優(yōu)化整合作用,語義網(wǎng)不僅可以打破數(shù)字資源領(lǐng)域的“信息孤島”,還可以跨越新浪微博﹑維基百科﹑Youtube等UGC和社交網(wǎng)絡(luò)領(lǐng)域,實(shí)現(xiàn)數(shù)字圖書館與應(yīng)用﹑企業(yè)和社區(qū)的創(chuàng)新性攜手,這樣將不會有任何“孤島”的問題。
3.2.1增強(qiáng)數(shù)字圖書館的開放化
提到數(shù)字資源的整合和開放化,不得不提到關(guān)聯(lián)數(shù)據(jù)(Linked Data)。筆者這樣理解:它以大量的RDF三元組(主詞,謂詞,賓詞)在數(shù)據(jù)層與語義層之間形成一種統(tǒng)一資源定位符(URL),但并不賦予語義含義,以此取代各式各樣且不斷變化的網(wǎng)站地址,從而使得整個互聯(lián)網(wǎng)變成一個放置在“云”中的大數(shù)據(jù)庫。數(shù)字圖書館將其用戶模型發(fā)布為關(guān)聯(lián)數(shù)據(jù)實(shí)例,建立起不同系統(tǒng)所擁有的同一用戶模型片段的關(guān)聯(lián),呈現(xiàn)具有更多信息的用戶全景圖,支持用戶情景敏感服務(wù)優(yōu)化;[2]不僅開放數(shù)據(jù),也開放功能,將圖書館數(shù)據(jù)真正嵌入到社會信息基礎(chǔ)結(jié)構(gòu)中去,使圖書館數(shù)據(jù)不僅存在于網(wǎng)絡(luò),而且成為開放網(wǎng)絡(luò)的一部分,便于搜索引擎發(fā)現(xiàn)和索引。[3]也就是說,在語義網(wǎng)的環(huán)境下,數(shù)百萬種書籍將被掃描傳播到世界網(wǎng)絡(luò)中,有史以來第一次,全世界圖書館用戶可以真正通過數(shù)字圖書館訪問這些書籍內(nèi)容的章節(jié)﹑概念﹑引用﹑公式﹑定理和數(shù)字等內(nèi)容。用戶可以真正在幾本專業(yè)領(lǐng)域的書籍內(nèi)容之外,用這數(shù)百萬種書籍中的內(nèi)容另外搭建一個龐大又精細(xì)的知識模型,實(shí)現(xiàn)數(shù)字圖書館從用戶需求到收獲結(jié)果的“一站式”服務(wù)。
3.2.2增強(qiáng)數(shù)字圖書館的社交功能
Web2.0帶來的全民合作——在維基百科﹑QQ﹑微博微信之類的社交平臺上廣大用戶集體共享智慧與服務(wù)的時代,也將數(shù)字圖書館初步帶入全民社交圈。國內(nèi)許多高校﹑企業(yè)合作的數(shù)字圖書館也紛紛開通了微博﹑微信交流平臺,說明數(shù)字圖書館已經(jīng)有意識地通過建立社交平臺,將本身的信息資源與圖書館用戶的評論﹑喜好﹑需求相結(jié)合匹配,從而走向數(shù)字圖書館社交服務(wù)的道路。在語義網(wǎng)環(huán)境下,數(shù)字圖書館的社交功能將會比現(xiàn)在熱門的微信公眾平臺契合很多,文本﹑標(biāo)簽﹑數(shù)據(jù)庫﹑社交應(yīng)用等各種格式將實(shí)現(xiàn)無縫式鏈接,用戶在閱讀時,可以通過一種語義標(biāo)記獲得其他用戶的評論,又或是專業(yè)研究員關(guān)于這一段的科學(xué)性探討。這一功能的實(shí)現(xiàn)需要圖書館在移動服務(wù)組合領(lǐng)域繼續(xù)推動創(chuàng)新,以滿足用戶對核心信息的需求和適應(yīng)用戶自服務(wù)的時代特征。比如,通過開發(fā)移動網(wǎng)站和移動應(yīng)用的個性定制功能,增強(qiáng)基于定位和實(shí)時活動的服務(wù)功能,改進(jìn)QR掃描技術(shù)和電子書閱讀體驗,實(shí)現(xiàn)移動圖書館設(shè)備的普及以及擴(kuò)大與Facebook﹑Twitter﹑YouTube等其他具備成熟移動服務(wù)的社交媒體之間的交互性等,[4]從而讓用戶基于完善的移動端服務(wù),自覺培養(yǎng)起主人的信息共享和參與意識,也讓數(shù)字圖書館真正打破“社交藩籬”。
3.3帶動圖書館用戶體驗角色的轉(zhuǎn)換
用戶體驗與個性化需求是現(xiàn)今促進(jìn)技術(shù)創(chuàng)新進(jìn)步的一大動力,也是Web2.0階段“以用戶為中心”這一顯著特征的重要體現(xiàn)。同時,它也是數(shù)字圖書館技術(shù)進(jìn)步和服務(wù)完善的一大衡量標(biāo)準(zhǔn),必須引起我們的重視。筆者主要從感官體驗動態(tài)化﹑知識體驗個性化﹑情感體驗主人化來介紹語義網(wǎng)將給數(shù)字圖書館用戶帶來的體驗及角色轉(zhuǎn)換。
3.3.1視覺體驗動態(tài)化
語義網(wǎng)在圖書館用戶視覺體驗上的創(chuàng)新主要表現(xiàn)在以下兩方面:一方面,基于FRBR模型,可以識別和定義書目實(shí)體﹑屬性和它們之間的關(guān)系,進(jìn)而根據(jù)書籍內(nèi)容的相關(guān)度和個人記錄的搜索信息將多個版本﹑不同載體資源之間的關(guān)系進(jìn)行智能排序和聚合,以一種更豐富﹑準(zhǔn)確和有意義的方式呈現(xiàn)給用戶。[5]因此,用戶在搜索相關(guān)內(nèi)容時,可以通過主題樹或標(biāo)簽云更加直接方便地發(fā)現(xiàn)與之相關(guān)的隱性信息以及主題之間的關(guān)系。另一方面,語義網(wǎng)支持在用戶界面采用超文本﹑圖形接口技術(shù)以及Z39.50協(xié)議實(shí)現(xiàn)不同系統(tǒng)平臺的開放互聯(lián),支持?jǐn)?shù)字圖書館用戶在閱讀相關(guān)內(nèi)容時,可以進(jìn)入圖像界面﹑語音界面﹑多媒體界面交流,獲得更加生動﹑立體﹑多維的知識體驗。
3.3.2知識體驗個性化
在語義環(huán)境下,數(shù)字圖書館主要通過個人偏好庫服務(wù)實(shí)現(xiàn)為用戶提供個性化的知識體驗。這種服務(wù)是基于用戶的基本設(shè)定以及搜索系統(tǒng)中的歷史記錄等專為用戶建設(shè)的偏好庫。它面向個體用戶,以合并起來的多個大型知識庫為信息基礎(chǔ),通過明晰的知識網(wǎng)絡(luò)模型建立起一個覆蓋全網(wǎng)﹑解答角度立體的自適應(yīng)動態(tài)系統(tǒng)。個人偏好庫與傳統(tǒng)信息定制服務(wù)的不同之處在于它解放了用戶之間的信息壁壘,展現(xiàn)知識更加廣闊﹑立體和動態(tài)。在用戶搜索時,搜索引擎將提取用戶檢索信息并記憶此次搜索行動,在語義檢索平臺上通過RDF的形式語義和推理功能,將非結(jié)構(gòu)化的語言結(jié)構(gòu)化并為計算機(jī)所理解,進(jìn)而通過已搭建的立體知識模型拉取全網(wǎng)偏好庫中的有用信息呈現(xiàn)給用戶,同時自動更新并發(fā)布自身偏好庫的最新動態(tài)(見圖2)。
圖2 個人偏好庫服務(wù)流程
3.3.3情感體驗主人化
語義網(wǎng)將推動數(shù)字圖書館從以主動“推送”為主的服務(wù)進(jìn)入以用戶為中心的“推拉”服務(wù)時代,以此實(shí)現(xiàn)數(shù)字圖書館用戶從信息集散地的客人到隨心所欲的主人的角色轉(zhuǎn)換。這一角色轉(zhuǎn)換的實(shí)現(xiàn)則要依靠基于推拉技術(shù)而形成的“智能信息推送”(IIPP)。IIPP技術(shù)應(yīng)用了人工智能(AI)﹑機(jī)器學(xué)習(xí)(ML)方法﹑知識工程(KE)的知識推理搜索方法﹑知識發(fā)現(xiàn)(KDD)方法等技術(shù),將“智能信息
推送”(IIpush)和“智能信息拉取”(IIpull)相結(jié)合,一方面,提高“信源”對“用戶”興趣的推測水平,實(shí)現(xiàn)主動﹑個性化的信息推送服務(wù),另一方面,幫助用戶快速﹑準(zhǔn)確地從信源拉取信息,提高用戶的滿意度。[6]這樣既使得用戶獲取信息的主動權(quán)得到更大的解放,最大程度地減少了用戶需求與獲得結(jié)果的不一致概率,又避免了圖書館單方面推送信息服務(wù)準(zhǔn)確率低的現(xiàn)象,減少了用戶篩選和過濾無用信息的勞動量和時間,也使得一些沒有主動獲取信息能力及知識水平較低的受眾同樣可以獲得優(yōu)質(zhì)的用戶體驗。
[參考文獻(xiàn)]
[1]張鐵道,等.新媒體聯(lián)盟地平線報告:未來圖書館就在你的指尖[N].中國教育報,2014-12-10(007).
[2]賀德方.基于語義的數(shù)字圖書館服務(wù)創(chuàng)新[J].情報學(xué)報,2012,31(10):1012-1017.
[3]林海青,等.圖書館關(guān)聯(lián)數(shù)據(jù):機(jī)會與挑戰(zhàn)[J].中國圖書館學(xué)報,2012(1):58-68.
[4]Lisa Carlucci Thomas.The State of Mobile in Libraries 2012[EB/OL].[2015-03-24].http://www.thedigitalshift.com/2012/02/mobile/the-state-of-mobile-in-libraries-2012/.
[5]KiorgaardD.ResourceDescriptionandAccess[DB/OL]. [2015-03-24].http://www.nla.gov.au/openpublish/index.php/nlasp/article/download/1420/1725/1420-6735-2-PB.pdf.
[6]百度百科.智能信息推拉技術(shù)[EB/OL].[2015-03-24].http://baike.baidu.com/view/2638844.htm.
Service Innovation of Digital Library in the Environment of Semantic Web
Wang Lu-lu, Xu Jun-hua
Abstract:The paper analyses some problems existing in the construction of digital library, and further explores the technology improvement and service innovation on information retrieval, information island breakdown as well as user experience improvement with the combinationof digital library andsemantic web in the semantic web environment.
Keywords:Semantic Web; Digital Library; Service Innovation
[收稿日期]2015-04-27[責(zé)任編輯]張雅妮
[作者簡介]王露露(1993-),女,山西晉城人,湘潭大學(xué)公共管理學(xué)院電子政務(wù)系在讀學(xué)生,研究方向:圖書情報領(lǐng)域;徐軍華(1979-),男,博士,湘潭大學(xué)公共管理學(xué)院碩士生導(dǎo)師,發(fā)文30余篇,研究方向:圖書館管理、數(shù)字圖書館服務(wù)。
[基金項目]本文系2013年度湖南省社科基金立項資助一般項目“數(shù)字環(huán)境下湖南省高校圖書館業(yè)務(wù)流程重組的模式研究”(項目編號:13YBA312)研究成果之一。
中圖分類號:G250.76
文獻(xiàn)標(biāo)志碼:A
文章編號:1005-8214(2016)01-0088-03