牛翠屏
關(guān)鍵詞:數(shù)字圖書館;個(gè)性化服務(wù);資源推薦模式
摘要:文章簡(jiǎn)述了數(shù)字圖書館個(gè)性化資源推薦服務(wù),探討了數(shù)字圖書館的讀者興趣模型及推薦資源對(duì)象模型的建立,并分析了資源推薦模式,同時(shí)指出了數(shù)字圖書館的資源推薦服務(wù)應(yīng)用存在的問(wèn)題。
中圖分類號(hào):G250.76文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2017)08-0119-03
數(shù)字圖書館是當(dāng)前社會(huì)信息基礎(chǔ)設(shè)施建設(shè)的重要組成部分,它以知識(shí)資源和信息資源為支撐,為讀者建立集知識(shí)服務(wù)與信息服務(wù)為一體的圖書館環(huán)境,為讀者提供優(yōu)質(zhì)的知識(shí)與信息服務(wù)。數(shù)字圖書館服務(wù)質(zhì)量和資源利用效率的有效提高以個(gè)性化服務(wù)為主要途徑,將讀者作為服務(wù)的中心,一切工作的展開(kāi)都是為了滿足讀者的個(gè)性化需求,有很強(qiáng)的主動(dòng)性和針對(duì)性,是當(dāng)前我國(guó)數(shù)字圖書館主要應(yīng)用的服務(wù)模式。但隨著數(shù)字資源的不斷豐富,讀者個(gè)性化的需求受到了擠壓,圖書館越來(lái)越難以滿足讀者對(duì)圖書資源的個(gè)性化需求,如何為讀者提供更好的個(gè)性化服務(wù)成為各圖書館迫切需要解決的問(wèn)題[1]。為了解決這一問(wèn)題,圖書館對(duì)推薦技術(shù)進(jìn)行了研究和應(yīng)用,認(rèn)為以推薦技術(shù)為依據(jù)建立的個(gè)性化服務(wù)資源推薦模式能夠更好地適應(yīng)當(dāng)前數(shù)字圖書館的業(yè)務(wù)發(fā)展需求,具有較高的利用價(jià)值。
1 個(gè)性化服務(wù)資源推薦簡(jiǎn)述
數(shù)字圖書館個(gè)性化服務(wù)資源推薦是指圖書館對(duì)讀者的閱讀特點(diǎn)、愛(ài)好及明顯的個(gè)人資源訪問(wèn)行為進(jìn)行分析和挖掘,掌握讀者的閱讀興趣與愛(ài)好,以及和圖書資源、讀者群之間的關(guān)聯(lián),以便為他們提供更好的信息服務(wù)。圖書館在提供服務(wù)的過(guò)程中會(huì)過(guò)濾掉與該讀者無(wú)關(guān)的信息與資源,只提供和推薦那些與其興趣相關(guān)的信息與資源[2]。讀者興趣模型、資源推薦對(duì)象、推薦算法及讀者四大板塊共同構(gòu)成了數(shù)字圖書館個(gè)性化資源推薦服務(wù)系統(tǒng)(見(jiàn)圖1)。
從圖1可以看出,個(gè)性化資源推薦服務(wù)系統(tǒng)能夠基于資源推薦對(duì)象的特征信息及讀者興趣模型,判定讀者的需求信息并進(jìn)行相關(guān)性匹配;應(yīng)用推薦算法能計(jì)算和篩選與讀者興趣相關(guān)的知識(shí)資源,并向其推薦;而讀者興趣的獲取則是通過(guò)掌握讀者的資源訪問(wèn)行為得到的。
2 讀者興趣模型的建立
為了保證推薦信息的準(zhǔn)確率、有效性和個(gè)性化,個(gè)性化資源推薦服務(wù)系統(tǒng)從讀者那里獲取的信息應(yīng)該是動(dòng)態(tài)和多方面的,并根據(jù)掌握的信息建立興趣模型,以便及時(shí)更新模型中讀者的興趣愛(ài)好(見(jiàn)圖2)。興趣模型以從讀者那里獲取的信息為數(shù)據(jù)基礎(chǔ),即個(gè)性化資源推薦服務(wù)系統(tǒng)對(duì)讀者的信息進(jìn)行獲取與記錄,同時(shí)根據(jù)讀者的興趣愛(ài)好做出分類,及時(shí)掌握讀者的需求,進(jìn)而生成具有描述功能的文件。
數(shù)字圖書館有三種數(shù)據(jù)類型對(duì)讀者的興趣愛(ài)好做出反映:①讀者屬性。該數(shù)據(jù)類型反映的是讀者的一些基本信息,主要是讀者的姓名、年齡、性別、專業(yè)、年級(jí)、院系、興趣等[3]。讀者興趣模型的初始構(gòu)建就是以這些基本信息為依據(jù)的。②業(yè)務(wù)管理系統(tǒng)。數(shù)字圖書館的業(yè)務(wù)管理系統(tǒng)對(duì)讀者的相關(guān)信息進(jìn)行記錄,有讀者的借閱信息、咨詢信息、學(xué)術(shù)成果信息等,這些信息在讀者的閱讀過(guò)程中被記錄下來(lái),具有較高的準(zhǔn)確性。③歷史訪問(wèn)信息。讀者在數(shù)字圖書館的搜索與訪問(wèn)記錄反映了其閱讀興趣與愛(ài)好,數(shù)字圖書館對(duì)讀者的閱讀、下載、瀏覽、檢索等行為進(jìn)行記錄,可以實(shí)時(shí)掌握讀者的行為信息。
顯式、隱式、啟發(fā)式是讀者興趣模型中的三種輸入信息獲取模式,分別是:讀者主動(dòng)提供信息行為、系統(tǒng)跟蹤信息獲取行為、咨詢啟發(fā)讀者興趣并提供相關(guān)資源行為。讀者對(duì)資源的興趣會(huì)隨著時(shí)間的推移而發(fā)生變化,因此興趣模型分短期興趣、長(zhǎng)期興趣及儲(chǔ)存記憶[4]。模型建立的對(duì)象既可以是個(gè)體讀者,也可以是群體讀者,即讀者群,是具有相同興趣愛(ài)好的讀者所組建的群體性組織。
3 推薦資源對(duì)象模型的建立
在資源推薦服務(wù)系統(tǒng)中會(huì)存在一些基于內(nèi)容和分類的方式對(duì)資源對(duì)象做出描述。非結(jié)構(gòu)化是網(wǎng)絡(luò)資源的一個(gè)特性,這一特性無(wú)法對(duì)標(biāo)準(zhǔn)做出統(tǒng)一的描述,因而描述的方式會(huì)采取以內(nèi)容為依據(jù)的從對(duì)象本身抽取信息的方式。資源對(duì)象文本信息的描述和提取是比較完善的,但是描述的對(duì)象常常會(huì)存在文本描述不足或者不具有文本特征現(xiàn)象。數(shù)字圖書館的文獻(xiàn)資源主要有期刊、學(xué)術(shù)論文、學(xué)位論文、專利、報(bào)刊、會(huì)議論文等。這些資源的分類與描述相對(duì)于網(wǎng)絡(luò)資源是比較成型的,著錄和描述的方式一般以MARC或者DC標(biāo)準(zhǔn)為基礎(chǔ),《科圖法》和《中圖法》是其主要使用的分類方法[5]。因此,推薦資源模型的建立可以對(duì)學(xué)科分類的方式進(jìn)行應(yīng)用,使每一個(gè)資源都能夠找到與其對(duì)應(yīng)的學(xué)科分類,并對(duì)應(yīng)讀者興趣模型中的興趣描述。
4 資源推薦模式分析
4.1 內(nèi)容資源推薦模式分析
資源對(duì)象內(nèi)容與讀者興趣相似性的推薦及讀者檢索結(jié)果相似性的推薦是內(nèi)容資源推薦模式的兩個(gè)組成部分。具體來(lái)說(shuō),是系統(tǒng)自動(dòng)提取并分析與資源對(duì)象相關(guān)的數(shù)據(jù)信息或文檔,并對(duì)讀者興趣模型中的讀者興趣愛(ài)好進(jìn)行計(jì)算匹配,然后根據(jù)匹配度的高低將資源向讀者推薦。讀者在數(shù)字圖書館進(jìn)行文獻(xiàn)搜索時(shí)輸入關(guān)鍵詞,會(huì)出現(xiàn)相關(guān)的文獻(xiàn)資源列表,資源推薦系統(tǒng)根據(jù)檢索詞相關(guān)程度從高到低依次排列,為讀者呈現(xiàn)直觀的文獻(xiàn)信息。
4.2 協(xié)同過(guò)濾推薦模式分析
個(gè)性化資源推薦服務(wù)系統(tǒng)中使用最廣泛的推薦方法是協(xié)同過(guò)濾推薦,這種方法以假設(shè)為前提,即假設(shè)具有相同興趣愛(ài)好的讀者會(huì)更容易相遇。協(xié)同過(guò)濾推薦模式由讀者的協(xié)同推薦、項(xiàng)目的協(xié)同推薦、模型的協(xié)同推薦三部分構(gòu)成:①讀者的協(xié)同推薦,即一個(gè)讀者選擇的內(nèi)容是基于其他讀者的推薦,而這種推薦需要找到與其有相同興趣愛(ài)好的其他讀者,然后對(duì)具有共同興趣的資源進(jìn)行推薦。②項(xiàng)目的協(xié)同推薦,即通過(guò)內(nèi)容相似性計(jì)算來(lái)取代讀者之間的相似性[6]。個(gè)性化資源推薦服務(wù)系統(tǒng)以所有讀者的資源訪問(wèn)信息為依據(jù),發(fā)現(xiàn)讀者之間存在的相似點(diǎn),并對(duì)讀者的歷史搜索與偏好數(shù)據(jù)信息進(jìn)行分析,向讀者推薦相似的信息。③模型的協(xié)同推薦,即以讀者在數(shù)字圖書館的資源訪問(wèn)信息為數(shù)據(jù)基礎(chǔ),為讀者建立一個(gè)有針對(duì)性的讀者興趣愛(ài)好模型,對(duì)讀者資源需求的預(yù)測(cè)建立模型,根據(jù)讀者的興趣相似性及資源內(nèi)容向讀者推薦資源信息。這種推薦模式的核心是讀者的訪問(wèn)行為,統(tǒng)計(jì)模型、線性回歸模型、機(jī)器學(xué)習(xí)等是其常用的方法。