摘?? 要:數(shù)字圖書館需要在海量的網(wǎng)絡(luò)資源中以用戶滿意度為目的,檢索符合用戶需求的信息,為用戶提供更多更優(yōu)質(zhì)的資源,滿足用戶的信息需求。文章介紹了數(shù)字圖書館層次查詢模型的功能和模塊,針對數(shù)字圖書館層次結(jié)構(gòu)服務(wù)存在的數(shù)據(jù)處理能力低、資源內(nèi)容匱乏、互動性不足等問題,提出了增加數(shù)據(jù)清洗環(huán)節(jié)、分模塊細(xì)化檢索過程、引入社交關(guān)系網(wǎng)等優(yōu)化數(shù)字圖書館層次檢索平臺服務(wù)的策略。
關(guān)鍵詞:數(shù)字圖書館;信息資源融合;層次查詢;用戶服務(wù)
中圖分類號:G251?? 文獻(xiàn)標(biāo)識碼:A?? DOI:10.11968/tsyqb.1003-6938.2020070
Research on the Construction of Digital Library Platform in the Age of Digital Economy
Abstract The digital library has to retrieve in the mass information what the users need to provide users with more and higher quality resources. In this paper the author analyzes the information resources and hierarchical query model of the digital library platform, introduces grid technology, explains the specific advantages and service connotation of the digital library, and analyzes the degree of realizing the hierarchical service of the digital library to meet the actual needs of users. In view of the problems of low data processing ability, lack of resources and content, and lack of interaction in the digital library, this paper puts forward a series of strategies to optimize the service ability of the digital library's hierarchical retrieval platform, so as to provide users with accurate and all-round personalized information that can meet their query semantics and provide users with satisfactory services.
Key words digital library; information resources integration; hierarchical query; user service
1?? 引言
在數(shù)字經(jīng)濟(jì)時代,數(shù)字圖書館將分散分布、孤島式存儲的數(shù)字資源整合為一個完整的“大數(shù)據(jù)”,但在這個過程中,存在數(shù)據(jù)來源多元化、數(shù)據(jù)存儲方式多樣化、數(shù)據(jù)形式非結(jié)構(gòu)性等問題[1-4],在服務(wù)能力和競爭能力方面走出一條新路至關(guān)重要,因此該領(lǐng)域?qū)W者紛紛投入到數(shù)字圖書館平臺檢索研究中。
童忠勇[5]基于公共圖書館數(shù)字信息資源構(gòu)建、互聯(lián)網(wǎng)技術(shù)與國家有關(guān)政策,描述了數(shù)字圖書館資源平臺構(gòu)建整體思路,同時根據(jù)圖書館工程與推廣工程的構(gòu)建成果,通過云計算和大數(shù)據(jù)等一系列技術(shù)描繪出了平臺總結(jié)構(gòu)與核心功能模塊,設(shè)計并構(gòu)建了基于各個省市圖書館所具優(yōu)勢、面向大眾和共享開放的圖書館資源服務(wù)平臺;常飛[6]指出云計算和云資源的共享模式能夠?yàn)閿?shù)字圖書館平臺構(gòu)建奠定技術(shù)基礎(chǔ)?;旌显品?wù)是適合應(yīng)用至云共享平臺間的一種云共享模式,在混合云平臺結(jié)構(gòu)下,數(shù)字圖書館平臺組成部分需要妥善解決服務(wù)平臺中資源利用過程中的版權(quán)問題,優(yōu)化平臺中資源共享體制,通過平臺自身具備的優(yōu)勢提高服務(wù)質(zhì)量,并統(tǒng)一與規(guī)范組成部分?jǐn)?shù)據(jù)庫標(biāo)準(zhǔn);李彩寧[7]基于文獻(xiàn)綜述,利用追蹤相對前沿的信息技術(shù),分析當(dāng)前用戶需求存在的特征,說明智慧圖書館定義與內(nèi)涵。依據(jù)用戶資源的二元視角,給出隱性和顯性相互結(jié)合下的圖書館服務(wù)模式。根據(jù)信息系統(tǒng)設(shè)計法,設(shè)計并構(gòu)建圖書館平臺結(jié)構(gòu)。
但是以往的研究中忽略了用戶體驗(yàn)感即用戶滿意程度,僅以平臺資源和用戶單方面需求為出發(fā)點(diǎn)和落腳點(diǎn),沒有很好地展現(xiàn)數(shù)字圖書館檢索平臺的服務(wù)性主旨,因此,本文針對圖書館設(shè)計構(gòu)建中此類用戶滿意度低、搜索過程冗長的問題,提出數(shù)字圖書館信息資源融合下層次查詢優(yōu)化策略研究,為未來數(shù)字圖書館創(chuàng)新發(fā)展提供參考。本次研究創(chuàng)新性在于以結(jié)合平臺信息資源與層次查詢模型的結(jié)合,引入網(wǎng)格技術(shù),闡述數(shù)字圖書館具體優(yōu)勢與服務(wù)內(nèi)涵,并從查詢檢索、用戶個人偏好和語義實(shí)體庫三個方面分析數(shù)字圖書館層次結(jié)構(gòu),優(yōu)化數(shù)字圖書館層次檢索平臺,以圖緩解數(shù)字圖書館平臺存在用戶滿意度低的問題,改善和優(yōu)化圖書館服務(wù)流程與服務(wù)方式。
2?? 數(shù)字圖書館查詢平臺優(yōu)化
2.1??? 平臺信息資源融合
網(wǎng)格技術(shù)具備很強(qiáng)的優(yōu)勢,其降低了構(gòu)建網(wǎng)站與提供服務(wù)的投資成本[8],將分布于各個地方的計算機(jī)和數(shù)據(jù)信息等融合為一個邏輯體。現(xiàn)代軟件工程公共操作在最大程度上將各種各樣的新知識與新服務(wù)集成,且在任何操作平臺中都可完成資源交換與程序連接,以此為基礎(chǔ),為數(shù)字圖書館層次化信息服務(wù)平臺的構(gòu)建提供可靠支撐,實(shí)現(xiàn)圖書館資源共享操作(具體數(shù)字圖書館平臺信息資源融合結(jié)構(gòu)見圖1)。
用戶之間的分享、交流不夠多是造成數(shù)字圖書館用戶與用戶間的互動性不足的主要原因。閱讀是重建自身知識結(jié)構(gòu)及體系的行為,思考是對閱讀知識的消化和吸收,分享和交流是思維后的結(jié)果。數(shù)字圖書館是在網(wǎng)絡(luò)環(huán)境下開展的服務(wù),應(yīng)充分發(fā)揮網(wǎng)絡(luò)的交互性特點(diǎn)。但目前很少有建立用戶個性化服務(wù)交流平臺體系的數(shù)字圖書館。圖書館資源被用戶與用戶間孤立地使用,用戶間無法聯(lián)系,不能順利進(jìn)行彼此間的交流和分享。
4?? 數(shù)字圖書館優(yōu)化策略
為了提高檢索服務(wù)過程中的準(zhǔn)確率和用戶滿意度,依據(jù)圖書館平臺和數(shù)據(jù)集成融合結(jié)果,對數(shù)字圖書館平臺層次檢索優(yōu)化策略進(jìn)行分析與設(shè)計。
4.1??? 增加清洗數(shù)據(jù)環(huán)節(jié)
圖書館數(shù)據(jù)處理實(shí)際為閱讀者的需求處理和閱讀者閱讀記錄的信息數(shù)據(jù)處理,因此在數(shù)據(jù)處理過程中,針對數(shù)據(jù)處理過程繁瑣的問題,應(yīng)進(jìn)行多維、實(shí)時、關(guān)聯(lián)性方面的分析,實(shí)現(xiàn)數(shù)據(jù)挖掘;應(yīng)對信息資源進(jìn)行深層次挖掘、分析、整理與組織利用,構(gòu)建一條依靠數(shù)字信息服務(wù)的新型數(shù)字圖書館發(fā)展模式。如智能出行,高德地圖利用 GPS技術(shù)為人們導(dǎo)航各城市各景區(qū)的路線,智慧圖書館也可根據(jù)用戶需求,設(shè)計為用戶智能導(dǎo)覽服務(wù)功能,依托圖書館 APP,向用戶提供當(dāng)?shù)芈糜沃改?、“館友”旅游心得等;或根據(jù)用戶參觀圖書館的時間記錄,提醒用戶到圖書館充實(shí)休閑生活。智慧型圖書館情境感知服務(wù)內(nèi)容設(shè)計需要設(shè)計者挖掘人的需求,不斷為人提供服務(wù),以達(dá)到增加圖書館的工作量的目的。
在采集的數(shù)據(jù)中,涵蓋了各種類型的信息資源,并不是所有數(shù)據(jù)均具備利用價值,由此要針對圖書館數(shù)據(jù)進(jìn)行相應(yīng)處理,進(jìn)而提升數(shù)據(jù)的代表性、可處理性以及準(zhǔn)確性。圖書館數(shù)據(jù)處理可從數(shù)據(jù)源到數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)加載環(huán)節(jié)。在數(shù)據(jù)抽取環(huán)節(jié),主要任務(wù)為連接與訪問源數(shù)據(jù)和其模型,得到變化數(shù)據(jù)。在數(shù)據(jù)清洗環(huán)節(jié),主要任務(wù)為清洗與增補(bǔ)數(shù)據(jù)整體結(jié)構(gòu)和規(guī)則等,構(gòu)建源數(shù)據(jù)庫用來表征數(shù)據(jù)的質(zhì)量。在數(shù)據(jù)轉(zhuǎn)換環(huán)節(jié),主要任務(wù)為處理數(shù)據(jù),并將源數(shù)據(jù)轉(zhuǎn)換成目標(biāo)數(shù)據(jù)。在數(shù)據(jù)加載環(huán)節(jié),主要任務(wù)為將數(shù)據(jù)加載為維度不同的維度表以及事實(shí)表,并將處理之后的數(shù)據(jù)傳輸至存儲模塊(數(shù)據(jù)清洗過程見圖4)。
由圖可知,在圖書館數(shù)據(jù)采集中,通過ETL工具針對圖書館數(shù)據(jù)進(jìn)行相應(yīng)處理,將平臺檢索響應(yīng)延遲控制在30ms內(nèi),具有很快的響應(yīng)速度,有效提升了數(shù)據(jù)的代表性、可處理性以及準(zhǔn)確性,在一定程度上提高了數(shù)據(jù)質(zhì)量,進(jìn)而提高用戶滿意度。
4.2?? 分模塊細(xì)化檢索過程
語義處理模塊:在實(shí)際應(yīng)用中,將語義處理模塊針對用戶申請進(jìn)行分析和處理,利用對表達(dá)式執(zhí)行抽詞、詞性標(biāo)注等一系列操作將檢索式中詞語抽取出來,在這個過程中可通過當(dāng)前的抽詞工具,同時充分利用本體庫中包含的專業(yè)詞典挖掘檢索式中涵蓋的專有詞匯,將出現(xiàn)在檢索式中虛詞以及沒有利用價值的助詞刪除,在抽詞后,將結(jié)果根據(jù)詞性標(biāo)注進(jìn)行處理,以此進(jìn)一步實(shí)現(xiàn)語法分析,并通過概念識別用戶檢索的類型,將用戶需求描述為具體概念模式,在語義實(shí)體庫中執(zhí)行配準(zhǔn)操作,以此完成語義級別查詢優(yōu)化。
資源查詢檢索模塊:在圖書館數(shù)據(jù)存儲中,多種存儲方式結(jié)合可實(shí)現(xiàn)數(shù)據(jù)的高度匯總,降低數(shù)據(jù)冗余,進(jìn)而降低服務(wù)延遲,因此要在用戶登錄用戶模型之后平臺依據(jù)用戶提出的查詢檢索申請,平臺進(jìn)入用戶個人偏好庫進(jìn)行配準(zhǔn);如果偏好庫中含有則增加權(quán)重,反之更新用戶行為庫;查詢檢索模塊針對用戶申請對領(lǐng)域知識本體中的信息進(jìn)行語義擴(kuò)展;對語義擴(kuò)展之后的信息申請生成相應(yīng)概念圖;將概念圖在語義實(shí)體庫中根據(jù)概念圖配準(zhǔn)法進(jìn)行配準(zhǔn)和相似程度計算;如果概念圖示匹配到檢索項(xiàng)則將排序之后的最終檢索結(jié)果返回給用戶,如果沒有匹配成功則返回后臺,形成檢索需求項(xiàng),待后臺工作人員添加檢索資源(具體流程見圖5)。
4.3??? 引入社交關(guān)系網(wǎng)
用戶密切關(guān)注社交網(wǎng)絡(luò),通過該平臺用戶可以結(jié)識到新朋友,與朋友們的交流變得簡便,可以快速地收集、分享并傳遞各種信息資源。當(dāng)今社會,每天都有很多用戶通過各種社交平臺發(fā)布自己的動態(tài)或查詢好友信息。在數(shù)字圖書館的信息推送服務(wù)里,引入這種社交網(wǎng)絡(luò)的思想,將數(shù)字圖書館的受眾面擴(kuò)大,同時也使數(shù)字圖書館與用戶間的真實(shí)溝通和用戶與用戶間的真實(shí)溝通得到加強(qiáng),把用戶在現(xiàn)實(shí)中的生活圈、興趣喜好、工作研習(xí)等方面與數(shù)字圖書館的信息推送服務(wù)有機(jī)的結(jié)合在一起,了解用戶及與用戶相關(guān)人的實(shí)時信息需求,參與到用戶的文化世界中去,使數(shù)字圖書館在用戶個人文化生活中的作用提升,影響力擴(kuò)大。
將經(jīng)過上述處理之后的圖書館數(shù)據(jù)應(yīng)用至平臺服務(wù)中,實(shí)現(xiàn)圖書館資源平臺信息資源的融合,并在用戶檢索信息處理中完成層次查詢,實(shí)現(xiàn)數(shù)據(jù)的高度匯總,利于降低數(shù)據(jù)冗余,提高數(shù)據(jù)整體質(zhì)量,降低服務(wù)延遲,實(shí)現(xiàn)數(shù)字圖書館層次檢索平臺優(yōu)化。
5?? 結(jié)語
數(shù)字圖書館的高效應(yīng)用是時代發(fā)展的必然需求,但數(shù)字圖書館建設(shè)相關(guān)研究成果在用戶滿意度等方面的問題有待解決。本文分析數(shù)字圖書館數(shù)據(jù)采集過程、處理與存儲實(shí)現(xiàn)數(shù)字圖書館資源融合程度,總結(jié)數(shù)字圖書館在平臺層次檢索性能方面的不足之處,并提出數(shù)字圖書館在檢索準(zhǔn)確性、滿足用戶檢索需求等方面的發(fā)展策略,將其應(yīng)用數(shù)字圖書館平臺服務(wù)中,可完善語義處理模塊實(shí)現(xiàn)語義級別檢索,降低檢索信息平臺數(shù)據(jù)冗余,提高數(shù)據(jù)整體質(zhì)量,使得用戶滿意度高,層次檢索延遲低,具有較強(qiáng)可靠性,實(shí)現(xiàn)資源查詢的高效檢索,為構(gòu)建數(shù)字圖書館檢索能力的發(fā)展提供重要的理論依據(jù)。
參考文獻(xiàn):
[1]? 吳宗大,謝堅,鄭城仁,等.數(shù)字圖書館用戶的行為偏好隱私保護(hù)框架[J].中國圖書館學(xué)報,2018,44(2):72-85.
[2]? 張寧,李雪.國家圖書館數(shù)據(jù)管理與分析平臺建設(shè)[J].國家圖書館學(xué)刊,2016,25(6):80-89.
[3]? 龔曉林.嵌入高校教學(xué)過程的數(shù)字圖書館教學(xué)支撐平臺構(gòu)想[J].圖書館,2018(8):74-78.
[4]? 李青維,婁策群.數(shù)字圖書館信息生態(tài)鏈價值平衡的標(biāo)志及影響因素[J].情報科學(xué),2019,37(3):19-23.
[5]? 童忠勇.國家數(shù)字圖書館特色資源云平臺的建設(shè)與實(shí)踐[J].國家圖書館學(xué)刊,2018,27(5):101-107.
[6]? 常飛.基于混合云服務(wù)平臺的數(shù)字圖書館聯(lián)盟建構(gòu)[J].山西檔案,2018(4):111-113.
[7]? 李彩寧,畢新華,陳立軍.智慧圖書館服務(wù)模式及平臺構(gòu)建研究[J].圖書館,2018(12):1-7.
[8]? 孫倩.數(shù)字圖書館網(wǎng)站建設(shè)視角下資源可視化揭示的實(shí)踐探索[J].圖書館理論與實(shí)踐,2017(5):84-87.
[9]? 任精舉.“互聯(lián)網(wǎng)+”時代高校圖書館學(xué)習(xí)平臺構(gòu)建研究[J].圖書館工作與研究,2017(3):43-46.
[10]? 史美靜,解金蘭.數(shù)字圖書館移動視覺搜索平臺的框架與功能研究[J].圖書館工作與研究,2018(2):42-47.
[11]? 張秉軍.移動圖書館平臺構(gòu)建——以天津職業(yè)技術(shù)師范大學(xué)移動圖書館建設(shè)為例[J].圖書館工作與研究,2016(3):47-49.
[12]? Schneider B I,Miller B R,Saunders B V.NIST's Digital Library of Mathematical Functions[J].Physics Today,2018,71(2):48-53.
[13]? 周莉.基于OAI-PMH協(xié)議數(shù)字圖書館中數(shù)據(jù)提供者的研究[J].現(xiàn)代電子技術(shù),2016,39(9):27-30.
[14]? 畢強(qiáng),閆晶,李潔,等.基于扎根理論的數(shù)字圖書館資源聚合質(zhì)量影響因素研究[J].情報理論與實(shí)踐,2018,41(5):42,65-70.
[15]? 吳宗大,謝堅,鄭城仁,等.數(shù)字圖書館用戶的行為偏好隱私保護(hù)框架[J].中國圖書館學(xué)報,2018,44(2):72-85.
[16]? Cox J.Communicating New Library Roles to Enable Digital Scholarship:A Review Article[J].New Review of Academic Librarianship,2016,22(2):1-16.
[17]? 謝人強(qiáng),葉福蘭.數(shù)字圖書館網(wǎng)站信息服務(wù)生態(tài)性評價及實(shí)證研究[J].圖書館工作與研究,2018(7):76-82.
[18]? 楊國棟.用戶需求視野下的數(shù)字圖書館微信平臺信息自助服務(wù)研究[J].山西檔案,2018(3):113-115.
[19]? Hu X,Ho E M Y,Qiao C.Digitizing Dunhuang Cultural Heritage:A User Evaluation of Mogao Cave Panorama Digital Library[J].Journal of Data and Information Science,2017,2(3):49-67.
[20]? 徐彤陽,張國標(biāo),任浩然.基于鏡頭的數(shù)字圖書館視頻資源檢索框架構(gòu)建與實(shí)現(xiàn)[J].情報科學(xué),2017,35(5):92-96.
作者簡介:施少芳(1979-),女,閩南理工學(xué)院圖書館副研究館員,研究方向:數(shù)字化信息管理。
本文系教育部2018年第二批產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目(項(xiàng)目編號:201802343010)與2019年福建省本科高校重大教育教學(xué)改革研究項(xiàng)目(項(xiàng)目編號:FBJG20190316)研究成果之一。
收稿日期:2020-01-04;責(zé)任編輯:胡剛;通訊作者:施少芳(ssf@mnust.cn)