盛先鋒
摘要:隨著近年來(lái)計(jì)算機(jī)技術(shù)快速發(fā)展,數(shù)字圖書館有必要基于聚類優(yōu)化對(duì)多種文獻(xiàn)數(shù)據(jù)資源協(xié)同過(guò)濾,面向用戶提供個(gè)性化推薦服務(wù),以提高服務(wù)效率。文章在介紹聚類優(yōu)化概念及含義的基礎(chǔ)上,分析了數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)的優(yōu)勢(shì),包括優(yōu)化圖書館數(shù)字信息服務(wù)機(jī)制、為用戶提供優(yōu)質(zhì)文獻(xiàn)資源、提高數(shù)字資源利用率等。探究了協(xié)同過(guò)濾個(gè)性化推薦服務(wù)模式,包括個(gè)性化定制服務(wù)、個(gè)性化推送服務(wù)、數(shù)據(jù)挖掘與決策服務(wù)。最后歸納出數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)構(gòu)建策略,即利用智能搜索技術(shù)、精確搜索資源,應(yīng)用數(shù)據(jù)挖掘技術(shù)、挖掘數(shù)字信息價(jià)值,優(yōu)化聚類算法、制定精準(zhǔn)服務(wù)方案,完善系統(tǒng)平臺(tái)、構(gòu)建資源過(guò)濾服務(wù)機(jī)制。
關(guān)鍵詞:聚類優(yōu)化;數(shù)字圖書館;個(gè)性化推薦服務(wù);數(shù)據(jù)挖掘
DOI: 10.3969/j.issn.2095-5707.2019.03.009
中圖分類號(hào):G250.7;G258.6 ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):2095-5707(2019)03-0037-04
Abstract: With the rapid development of computer technology in recent years, it is necessary for digital libraries to collaboratively filter a variety of literature and data resources based on clustering optimization and provide personalized recommendation services for users in order to improve service efficiency. On the basis of introducing the concept and meaning of clustering optimization, this article analyzed the advantages of collaborative filtering personalized recommendation services in digital libraries, including optimizing the mechanism of digital information services in libraries, providing high-quality literature resources for users, and improving the utilization rate of resources, explored the personalized recommendation service mode, including personalized customization services, personalized push services, and data mining and decision making services, and finally concluded the construction strategies of collaborative filtering personalized recommendation services in digital libraries, that is to use intelligent search technology to accurately search resources, apply data mining technology to mining digital information value, optimize clustering algorithms to develop precise service plans, and improve system platform to construct resource filtering service mechanism.
Key words: clustering optimization; digital libraries; personalized recommendation services; data mining
隨著數(shù)字工具、計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,以數(shù)字網(wǎng)絡(luò)為核心,智能搜索技術(shù)、數(shù)據(jù)挖掘技術(shù)為輔助的數(shù)字圖書館個(gè)性化推薦服務(wù)成為我國(guó)圖書情報(bào)界研究的重點(diǎn)課題。我國(guó)許多高等院校、科研院所、信息服務(wù)機(jī)構(gòu)都構(gòu)建了符合自身發(fā)展及用戶個(gè)性化需求的數(shù)據(jù)資源推薦服務(wù),并在增強(qiáng)數(shù)字圖書館數(shù)據(jù)處理能力的同時(shí),不斷促進(jìn)其功能拓展,實(shí)現(xiàn)基于聚類優(yōu)化數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)。但從目前的實(shí)踐情況來(lái)看,很多數(shù)字圖書館的個(gè)性化推薦服務(wù)還處在初步驗(yàn)證階段,面向用戶提供的服務(wù)存在服務(wù)質(zhì)量不高,服務(wù)效能低等問題[1]。因此,在數(shù)字信息情景中,數(shù)字圖書館個(gè)性化推薦服務(wù)還有許多需要改進(jìn)的地方?;诰垲悆?yōu)化的數(shù)字圖書館個(gè)性化推薦服務(wù)能解決數(shù)字圖書館在數(shù)字信息管理、用戶信息認(rèn)證、數(shù)據(jù)資源協(xié)同過(guò)濾、知識(shí)共享方面存在的問題,完善與發(fā)展面向用戶的個(gè)性化推薦服務(wù),為構(gòu)建集成化、模塊化、高效率的個(gè)性化推薦服務(wù)模式提供方法指導(dǎo)。
1 ?聚類優(yōu)化概述
1.1 ?概念
在科學(xué)情景中,對(duì)物理或是抽象對(duì)象的集合根據(jù)其特征與相似的性質(zhì)分成類的過(guò)程稱為聚類,由多個(gè)聚類生成的簇是一組或多組數(shù)據(jù)的集合,針對(duì)其存在的性質(zhì)有目的選擇、清洗、定向使用稱為聚類優(yōu)化。在信息科學(xué)領(lǐng)域,針對(duì)海量的數(shù)據(jù)資源存在著大量分類問題,聚類優(yōu)化又稱為群優(yōu)化,主要研究各種相似數(shù)據(jù)資源或關(guān)聯(lián)數(shù)據(jù)的優(yōu)化問題,是一種基于統(tǒng)計(jì)學(xué)概念的數(shù)據(jù)優(yōu)化方法。聚類優(yōu)化起源于分類學(xué),針對(duì)目標(biāo)群體的有效聚類不等于分類,聚類與分類的不同之處在于進(jìn)行聚類的目標(biāo)群體劃分的類是未知的。聚類優(yōu)化有多種方法,有系統(tǒng)聚類優(yōu)化、樣品聚類優(yōu)化、動(dòng)態(tài)聚類優(yōu)化及模糊聚類優(yōu)化等,在數(shù)字圖書館數(shù)據(jù)挖掘與資源存儲(chǔ)中得到了廣泛應(yīng)用[2]。
1.2 ?含義
目前,基于聚類優(yōu)化概念產(chǎn)生了聚類優(yōu)化算法與聚類優(yōu)化工具,在數(shù)字信息處理、數(shù)據(jù)挖掘、資源存儲(chǔ)與利用方面得到最廣泛的應(yīng)用。在面對(duì)海量信息資源及大量結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù)時(shí),傳統(tǒng)的數(shù)據(jù)分類方法及數(shù)據(jù)歸類工具很難在短時(shí)間內(nèi)做出針對(duì)性的處理,對(duì)數(shù)據(jù)資源深度挖掘,提取有價(jià)值的信息片段,而聚類優(yōu)化能有效地彌補(bǔ)這一點(diǎn)。面對(duì)大量結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù)信息,基于特定的分類主題或根據(jù)數(shù)據(jù)資源共有的某些特性組成的集合分成類,并根據(jù)這些類進(jìn)行數(shù)據(jù)挖掘,提取有價(jià)值的信息數(shù)據(jù)并進(jìn)行有效存儲(chǔ),供使用者定向提取[3]。這種基于聚類的數(shù)據(jù)優(yōu)化方法適用于多種信息情景,數(shù)據(jù)挖掘過(guò)程中提取的各種高價(jià)值信息能被有效利用,適用于數(shù)字圖書館開展用戶個(gè)性化服務(wù)。
2 ?基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)的優(yōu)勢(shì)
2.1 ?優(yōu)化圖書館數(shù)字信息服務(wù)機(jī)制
在知識(shí)經(jīng)濟(jì)時(shí)代,阻礙數(shù)字圖書館文獻(xiàn)資源高效率利用、傳輸及獲取的主要障礙在于信息服務(wù)渠道及管理問題。數(shù)字圖書館面向用戶的個(gè)性化服務(wù)并不完善,只適用于少部分用戶的個(gè)性化需求,面向群體用戶及特定需求用戶缺乏有效的個(gè)性化推薦服務(wù)。當(dāng)前數(shù)字圖書館海量的數(shù)據(jù)資源及與之對(duì)應(yīng)的數(shù)據(jù)資源管理、個(gè)性化推薦及個(gè)性化獲取缺乏必要的技術(shù)支持,所提供的個(gè)性化服務(wù)不盡如人意?;诰垲悆?yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)成為解決數(shù)字圖書館用戶服務(wù)問題的有效方法[4]。依靠聚類優(yōu)化及對(duì)海量數(shù)據(jù)資源的深度挖掘和協(xié)同過(guò)濾,能在滿足數(shù)字資源集中處理需求的基礎(chǔ)上實(shí)現(xiàn)與不同需求用戶的對(duì)接及個(gè)性化推薦,根據(jù)用戶需求自動(dòng)匹配數(shù)據(jù)資源,使用戶獲取數(shù)據(jù)資源的渠道更加暢通,數(shù)字圖書館信息服務(wù)機(jī)制得到優(yōu)化。
2.2 ?為用戶提供優(yōu)質(zhì)文獻(xiàn)資源
在知識(shí)服務(wù)情景中,用戶的信息需求更加多元,從傳統(tǒng)的書籍借閱、文獻(xiàn)檢索、資源獲取轉(zhuǎn)向個(gè)性化的知識(shí)需求。數(shù)字圖書館傳統(tǒng)的用戶服務(wù)模式已難以適應(yīng)用戶的個(gè)性化知識(shí)需求。這就迫切需要一種新的個(gè)性化知識(shí)服務(wù)以滿足用戶的需求?;诰垲悆?yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)能適應(yīng)用戶的個(gè)性化獲取知識(shí)資源的意愿。對(duì)海量知識(shí)資源進(jìn)行深度挖掘、聚類優(yōu)化并有效過(guò)濾,根據(jù)用戶需求進(jìn)行資源共享,為用戶直接提供知識(shí)服務(wù),使用戶獲取知識(shí)更為便捷[5]。同時(shí),基于聚類優(yōu)化的數(shù)字圖書館個(gè)性化推薦服務(wù)改變了數(shù)字圖書館傳統(tǒng)以知識(shí)共享、資源輸出為主的信息服務(wù)模式,不僅提高了數(shù)字圖書館的服務(wù)效率,更深入滿足了用戶的信息需求,垂直為用戶提供優(yōu)質(zhì)的文獻(xiàn)資源。
2.3 ?提高數(shù)字圖書館數(shù)字資源利用率
基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)應(yīng)是數(shù)字圖書館信息服務(wù)功能的延伸,是以聚類優(yōu)化為核心、協(xié)同過(guò)濾為輔助,面向用戶提供個(gè)性化知識(shí)服務(wù)的服務(wù)模式。但目前很多數(shù)字圖書館基于用戶個(gè)性化需求的知識(shí)服務(wù)尚不能滿足用戶高效率資源獲取的需要,無(wú)法根據(jù)用戶需求匹配數(shù)據(jù)資源?;诰垲悆?yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)針對(duì)數(shù)字圖書館各種信息數(shù)據(jù)深度挖掘、聚類優(yōu)化,針對(duì)數(shù)據(jù)資源類型進(jìn)行整理和存儲(chǔ),根據(jù)用戶需要垂直提供個(gè)性化服務(wù),避免了數(shù)字圖書館數(shù)據(jù)資源浪費(fèi),實(shí)現(xiàn)數(shù)據(jù)資源高效利用。
3 ?基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)模式
根據(jù)服務(wù)需求和服務(wù)類別,可以分成3種服務(wù)模式:個(gè)性化定制服務(wù)、個(gè)性化推送服務(wù)、數(shù)據(jù)挖掘及決策服務(wù)。可以真正發(fā)揮出以用戶為核心的服務(wù)理念,結(jié)合用戶需求與個(gè)人偏好,實(shí)現(xiàn)個(gè)性化推薦服務(wù),依靠數(shù)據(jù)挖掘?yàn)橛脩籼峁Q策服務(wù),最大化滿足用戶文獻(xiàn)資源獲取的需要。
3.1 ?個(gè)性化定制服務(wù)
個(gè)性化定制服務(wù)是一種針對(duì)用戶需求分析,或是分析以往用戶服務(wù)記錄,針對(duì)用戶需求提前做好知識(shí)產(chǎn)品,提供給用戶的服務(wù)模式,也就是根據(jù)用戶的個(gè)性化需求量身定制產(chǎn)品。該項(xiàng)服務(wù)需要以用戶的自動(dòng)性選擇為基礎(chǔ)。數(shù)字圖書館作為產(chǎn)品供應(yīng)方,首先要針對(duì)用戶的興趣與行為偏好進(jìn)行大量的數(shù)據(jù)搜集,以搜集過(guò)來(lái)的數(shù)據(jù)信息作為初始數(shù)據(jù),并有針對(duì)性地進(jìn)行分析,依據(jù)用戶需求定制個(gè)性化網(wǎng)頁(yè),推送相關(guān)的數(shù)據(jù)信息,將個(gè)性化的知識(shí)導(dǎo)航推薦給目標(biāo)用戶。用戶可自主選擇這種個(gè)性化信息推送方式,服務(wù)具有較強(qiáng)的針對(duì)性[6]。但由于用戶對(duì)數(shù)字圖書館資源內(nèi)容不了解,圖書館很難將用戶抽象化的需求轉(zhuǎn)化為能提供具體服務(wù)的方式,服務(wù)形式相對(duì)較單一,是一種淺層的服務(wù)模式。
3.2 ?個(gè)性化推送服務(wù)
與上述依據(jù)用戶需求進(jìn)行產(chǎn)品定制開發(fā)服務(wù)模式不同的是,個(gè)性化推送服務(wù)屬于圍繞用戶需求的主動(dòng)化的服務(wù)模式,主要以智能技術(shù)為核心,通過(guò)智能系統(tǒng)大量收集用戶信息,包括用戶的行為習(xí)慣、個(gè)人興趣、行為偏好等,通過(guò)對(duì)這些初始數(shù)據(jù)深度挖掘,在數(shù)據(jù)結(jié)果的支撐下為用戶主動(dòng)推送信息。數(shù)字圖書館這種面向用戶的個(gè)性化推送服務(wù)模式是相對(duì)全面的信息推送,操作簡(jiǎn)單,服務(wù)效果較強(qiáng),以用戶的初始數(shù)據(jù)為基礎(chǔ)為用戶提供服務(wù),屬于深層次的個(gè)性化推薦服務(wù)模式[7]。
3.3 ?數(shù)據(jù)挖掘及決策服務(wù)
這種服務(wù)模式與上述的個(gè)性化推送服務(wù)模式有著相似之處,都是在全面搜集與分析用戶基礎(chǔ)數(shù)據(jù)前提下進(jìn)行的信息推送。但這種服務(wù)模式使用的技術(shù)及工具更加先進(jìn),大量采用了大數(shù)據(jù)挖掘技術(shù)、語(yǔ)義網(wǎng)技術(shù)等智能化技術(shù)與手段。通過(guò)對(duì)用戶初始數(shù)據(jù)深度挖掘與分析后,進(jìn)一步延伸用戶的基礎(chǔ)信息數(shù)據(jù)價(jià)值,為用戶自行進(jìn)行文獻(xiàn)檢索和資源獲取提供決策支持。這種全智能化的個(gè)性化推薦服務(wù)模式要應(yīng)用到較多的先進(jìn)技術(shù),不僅其服務(wù)的精準(zhǔn)性和有效性更高,服務(wù)的時(shí)效性也更強(qiáng),屬于最高層次的個(gè)性化推薦服務(wù)。
4 ?基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)構(gòu)建策略
4.1 ?利用智能搜索技術(shù),精確搜索資源
基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)的實(shí)現(xiàn)要以智能搜索技術(shù)為核心,對(duì)信息資源實(shí)現(xiàn)精確查詢。數(shù)字時(shí)代每天產(chǎn)生海量的信息數(shù)據(jù),為了方便人們快速查詢和獲取信息,發(fā)明了搜索引擎供人們快速查詢數(shù)據(jù)。搜索引擎技術(shù)多種多樣,有的用于定向搜索,有的用于數(shù)據(jù)搜索,以可供識(shí)別的方式將人們搜索的信息呈現(xiàn)出來(lái)。智能搜索引擎技術(shù)是兼容多種技術(shù)與數(shù)據(jù)格式的搜索技術(shù),以人工智能技術(shù)為基礎(chǔ),對(duì)不同種類的信息精準(zhǔn)定位、快速識(shí)別,在應(yīng)用過(guò)程中要實(shí)現(xiàn)6種功能,包括語(yǔ)音識(shí)別、搜索提示、服務(wù)導(dǎo)航、文獻(xiàn)檢索、智能推送、數(shù)據(jù)查詢,根據(jù)用戶的行為偏好自動(dòng)呈現(xiàn)信息數(shù)據(jù),使用戶獲取數(shù)據(jù)資源更為便捷。
將智能搜索技術(shù)運(yùn)用到數(shù)字圖書館的個(gè)性化推薦服務(wù)中,能為用戶提供更加精準(zhǔn)高效的信息服務(wù),能夠提高數(shù)字圖書館個(gè)性化推薦服務(wù)的整體效率,使數(shù)字圖書館資源利用能全面滿足用戶的個(gè)性化需求。智能搜索技術(shù)是基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)的核心,全面利用該項(xiàng)技術(shù)并使其發(fā)揮出效能,能實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)資源的優(yōu)化提取,提高數(shù)據(jù)資源搜索的精準(zhǔn)性。
4.2 ?應(yīng)用數(shù)據(jù)挖掘技術(shù),挖掘數(shù)字信息價(jià)值
基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性推薦服務(wù)的實(shí)現(xiàn)要全面利用數(shù)據(jù)挖掘技術(shù),對(duì)有價(jià)值的信息資源進(jìn)行深度挖掘,發(fā)揮其特有的作用。數(shù)字圖書館個(gè)性化推薦服務(wù)作為新的服務(wù)模式,離不開數(shù)據(jù)挖掘技術(shù)的支持。數(shù)據(jù)挖掘是從大量信息中找到有價(jià)值的數(shù)據(jù),利用多學(xué)科技術(shù),并借助算法工具、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)。基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)可針對(duì)數(shù)據(jù)庫(kù)滯留的數(shù)據(jù)進(jìn)行深度挖掘、聚合、提取,篩選出有價(jià)值的數(shù)據(jù)資源進(jìn)行二次開發(fā),并通過(guò)個(gè)性化推薦服務(wù)直接與用戶匹配,滿足不同用戶的資源檢索、查詢的需要。
4.3 ?優(yōu)化聚類算法,制定精準(zhǔn)服務(wù)方案
基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)的實(shí)現(xiàn),要利用聚類優(yōu)化算法工具為用戶提供精準(zhǔn)的個(gè)性化推薦服務(wù)。在數(shù)字信息情景中,為了確保個(gè)性化推薦服務(wù)的高效率和精準(zhǔn)性,數(shù)字圖書館要從數(shù)據(jù)資源搜集、管理、綜合利用等方面全面利用聚類優(yōu)化算法工具,對(duì)數(shù)據(jù)庫(kù)中的資源數(shù)據(jù)深度挖掘、聚類優(yōu)化。相較于傳統(tǒng)的個(gè)性化推薦服務(wù),采用聚類優(yōu)化算法工具的個(gè)性化推薦服務(wù)的精準(zhǔn)性更高,給予用戶的個(gè)性化選擇空間更大,能有效避免數(shù)據(jù)資源流失、浪費(fèi)等問題,滿足用戶個(gè)性化資源獲取需求。
4.4 ?完善系統(tǒng)平臺(tái),構(gòu)建資源過(guò)濾服務(wù)機(jī)制
要實(shí)現(xiàn)基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù),需完善系統(tǒng)架構(gòu),創(chuàng)設(shè)資源過(guò)濾服務(wù)機(jī)制。數(shù)字圖書館在長(zhǎng)期的信息服務(wù)過(guò)程中會(huì)產(chǎn)生各種各樣的數(shù)據(jù)信息,對(duì)這些數(shù)據(jù)資源聚類優(yōu)化是數(shù)字圖書館首先要完成的任務(wù)。這也就決定了數(shù)字圖書館要利用一系列算法工具針對(duì)用戶的個(gè)性化需求,有目的、有選擇地對(duì)不同數(shù)據(jù)資源聚類優(yōu)化,篩選出有價(jià)值的數(shù)據(jù)資源供用戶使用。一方面,數(shù)字圖書館要在綜合不同數(shù)據(jù)資源種類的前提下,著重于價(jià)值性數(shù)據(jù)資源的選取和利用;另一方面,數(shù)字圖書館要針對(duì)用戶個(gè)性化需求及時(shí)匹配資源,方便用戶連續(xù)獲取資源。
5 ?小結(jié)
基于聚類優(yōu)化的數(shù)字圖書館協(xié)同過(guò)濾個(gè)性化推薦服務(wù)的實(shí)現(xiàn),符合圖書館數(shù)字化轉(zhuǎn)型的需要,利用一系列先進(jìn)的技術(shù)工具對(duì)數(shù)字圖書館的數(shù)字資源聚合優(yōu)化、挖掘,能解決數(shù)字圖書館面對(duì)用戶個(gè)性化需求服務(wù)效能不足的問題,可有效提高數(shù)字圖書館信息服務(wù)效率,為用戶提供高質(zhì)量、高效率、人性化的個(gè)性化推薦服務(wù)。
參考文獻(xiàn)
[1] 陳臣.大數(shù)據(jù)時(shí)代一種基于用戶行為分析的圖書館個(gè)性化智慧服務(wù)模式[J].圖書館理論與實(shí)踐,2015(2):96-99.
[2] 姚錢,溫嶸生.人工智能技術(shù)在圖書館中的應(yīng)用[J].科技資訊, 2017(24):222,224.
[3] 陸婷婷.從智慧圖書館到智能圖書館:人工智能時(shí)代圖書館發(fā)展的轉(zhuǎn)向[J].圖書與情報(bào),2017(3):98-101,140.
[4] 張興旺.以信息推薦為例探討圖書館人工智能體系的基本運(yùn)作模式[J].情報(bào)理論與實(shí)踐,2017,40(12):69-74.
[5] 韋美峰,王亞民.基于后綴樹聚類的主題搜索引擎研究[J].情報(bào)理論與實(shí)踐,2017,40(12):123-127,62.
[6] 趙蓉英,陳必坤.基于Nutch的圖情博客搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J].情報(bào)科學(xué),2012,30(4):486-491.
[7] 胡秀云.云計(jì)算環(huán)境下數(shù)字圖書館個(gè)性化信息服務(wù)研究[D].武漢:湖北工業(yè)大學(xué),2014.
(收稿日期:2018-11-05)
(修回日期:2018-11-23;編輯:魏民)