提平
摘要:描述了數(shù)字圖書館所提供的個性化信息服務(wù)的相關(guān)誕生原因和外界因素,還有整體的相關(guān)意義,并且涉及到整個結(jié)構(gòu)體系,從而進(jìn)一步解釋了數(shù)字圖書館所提供的個性化服務(wù)的體系里用戶興趣模型的理論,最后實(shí)現(xiàn)了系統(tǒng)相關(guān)功能。
關(guān)鍵詞:數(shù)字圖書館;個性化信息服務(wù);興趣模型
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)11-0016-02
進(jìn)入21世紀(jì),伴隨著信息產(chǎn)業(yè)時代的來臨,互聯(lián)網(wǎng)上的信息呈多元化海量化趨勢,這也是數(shù)字圖書館得以發(fā)展起來的基礎(chǔ)。數(shù)字圖書館雖然擁有著龐大的資源信息,但是因?yàn)闆]有完善的系統(tǒng)支持,所以在提供信息的時候無法抓住用戶的興趣點(diǎn)。個性化的服務(wù)是要打破傳統(tǒng)圖書館用戶主動獲取信息的模式,通過網(wǎng)絡(luò)為用戶提供更加高效便捷的服務(wù)。
1 數(shù)字圖書館個性化服務(wù)
數(shù)字圖書館的個性化信息服務(wù)是在“信息爆炸”時代下瞬間產(chǎn)生的。數(shù)字圖書館能夠提供個性化的信息服務(wù)的前提是對用戶個人信息的掌握和深入研究,將有著相同特征的用戶群體進(jìn)行分類,從而為有著共同特征的群體提供他們感興趣的信息服務(wù),這種有針對性的個性化服務(wù)可以大大縮短用戶在海量信息中找尋所需信息的時間。數(shù)字圖書館與傳統(tǒng)圖書館的差別就在于前者是主動向用戶提供信息,而后者只有資源沒有服務(wù),在網(wǎng)絡(luò)高度普及的今天,有特色的個性化服務(wù)才是數(shù)字圖書館未來的發(fā)展方向。個性化服務(wù)[1]強(qiáng)調(diào)的是明晰用戶的需求,從而為用戶提供相關(guān)的專業(yè)信息,從而讓用戶可以更便捷的獲取所需信息。
2 個性化服務(wù)系統(tǒng)結(jié)構(gòu)
數(shù)字圖書館的信息資源是基于數(shù)字資源生命周期設(shè)計(jì)的總體框架,通過網(wǎng)絡(luò)向讀者提供服務(wù),建立數(shù)字圖書館的邏輯結(jié)構(gòu),該邏輯結(jié)構(gòu)框架中涉及多個內(nèi)容,首先圖書館要對信息資源的搜集匯總,再對資源信息進(jìn)行分類描述,然后建立索引,用戶可根據(jù)自己的需求在索引中找尋相關(guān)信息的時候,系統(tǒng)可以通過信息搜索與匹配,將用戶需要的信息快速呈現(xiàn)出來。
在上述邏輯框架的構(gòu)建中,數(shù)字圖書館所需要做的是對資料信息的整理匯總,對資源的大概描述以及對資源的長期保存和管理。信息在經(jīng)過整理后通過一定的技術(shù)手段呈現(xiàn)在用戶面前。
數(shù)字圖書館具備了比普通圖書館更加豐富的資源系統(tǒng),一般來說,我們說的數(shù)圖的有關(guān)資源有這樣的兩種部分,一個是數(shù)字圖書館自己原本特定的資源,另一個主要來源是購置的商業(yè)資源。
個性化服務(wù)系統(tǒng)功能分成5個功能模塊:用戶認(rèn)證、我的收藏、信息推送、數(shù)據(jù)分析和信息交流,系統(tǒng)功能結(jié)構(gòu)如圖1所示。
圖1 個性化系統(tǒng)功能結(jié)構(gòu)圖
3 用戶興趣模型的理論
3.1 用戶模型的定義
用戶興趣模型的建立是基于一批有相關(guān)聯(lián)系的用戶群體,他們之間或存在相同的興趣愛好,或存在相同的信息獲取習(xí)慣,用戶興趣模型描述了用戶與其興趣特征之間的關(guān)系。用戶興趣模型的表示決定了其反映用戶真實(shí)興趣的能力和可計(jì)算能力。
3.2模型結(jié)構(gòu)有關(guān)表示形式
1) 關(guān)鍵詞形式
用戶在搜索信息的時候一般是輸入與信息相關(guān)的關(guān)鍵詞,從用戶輸入的關(guān)鍵詞中能分析得出很多的結(jié)論,比如用戶經(jīng)常搜索的關(guān)鍵詞有哪些,如果出現(xiàn)的頻率很高,說明用戶的興趣點(diǎn)就在這一方面。個性化的信息資源服務(wù)[2]需要對具有相同搜索習(xí)慣的用戶的關(guān)鍵詞進(jìn)行分類研究,從而用戶提供更加精準(zhǔn)的信息結(jié)果,另外還可以在結(jié)果頁面推送其他用戶可能感興趣的信息。這種基于關(guān)鍵詞的用戶興趣模型因?yàn)樯婕暗降膬?nèi)容相對較少,建立的過程不會太復(fù)雜。
2) 向量空間模型形式
基于關(guān)鍵詞研究建立的模型是為用戶推薦相關(guān)信息,而向量空間模型則通過代數(shù)計(jì)算,在用戶進(jìn)行搜索信息時將不相關(guān)的信息屏蔽掉,將具體的文本信息用向量來表示,構(gòu)建相關(guān)模型。向量以0,1表示,0,1分別代表文本中是否出現(xiàn)相關(guān)信息。向量空間模型中用向量表示文檔,用n維特征向量來表示用戶模型:
Ui={( t1,w1),(t2,w2),…,(tn,wn)}
公式中的ti指代次序上為i的詞,wi 則指代ti 本身占有通篇文本權(quán)重,權(quán)重通常取布爾值或者為實(shí)數(shù),一旦選取了布爾值,就意味著用戶具有興趣的項(xiàng)目;取值實(shí)數(shù),一般意味著用戶的興趣程度,兩者有所區(qū)分。
3) 神經(jīng)網(wǎng)絡(luò)表示形式
構(gòu)建在神經(jīng)網(wǎng)絡(luò)上的一種用戶模型結(jié)構(gòu)里面,包含了若干輸入的節(jié)點(diǎn),一般用m指代只有一個節(jié)點(diǎn)用于將信號傳出,還有若干介于兩者間的隱層神經(jīng)元,一般用n指代。m表示了整個數(shù)據(jù)系統(tǒng)中,設(shè)想的用戶具有興趣的關(guān)鍵詞,n則表示在實(shí)際意義上真實(shí)的興趣關(guān)鍵詞所在。這里的權(quán)重一般由神經(jīng)網(wǎng)絡(luò)分析得出,往往是隱層節(jié)點(diǎn)權(quán)重。
4) 評分矩陣形式
建立在矩陣上的一種表現(xiàn)形式為使用二維平面矩陣Rm*n,以顯示用戶內(nèi)在的興趣,構(gòu)成相關(guān)模型[3]。模型中以字母m表示用戶量,以字母n表示個體具有興趣的資源量。矩陣R里的任意rij都顯示了用戶i關(guān)于資源j有效評定,普遍情況下是實(shí)數(shù)。數(shù)值的高低同整個體系內(nèi)客戶表現(xiàn)的興趣程度為正比例函數(shù),而用戶沒有進(jìn)行有效的評價,就表示為空值。這類方式通常會被應(yīng)用到協(xié)同過濾推薦體系中。
4 個性化服務(wù)系統(tǒng)實(shí)現(xiàn)
4.1 系統(tǒng)開發(fā)方式
本系統(tǒng)在設(shè)計(jì)上選用.NET作為開發(fā)工具,C#作為開發(fā)語言,SQL Server2008 作為數(shù)據(jù)庫。采用B/S的方式來實(shí)現(xiàn)整體系統(tǒng)架構(gòu),構(gòu)建了從用戶層、業(yè)務(wù)層和資源層的三層框架平臺。
4.2 系統(tǒng)的主要界面
圖2 個人屬性、用戶興趣定義界面
圖3 個性化系統(tǒng)的推薦界面
5 小結(jié)
個性化信息服務(wù)系統(tǒng)的完善是建立在用戶興趣模型基礎(chǔ)之上的,只有對用戶有了充分的了解,才能構(gòu)建出合理化的數(shù)字圖書館個性化信息服務(wù)平臺。
參考文獻(xiàn):
[1]陶力.數(shù)字圖書館個性化信息服務(wù)研究述評.圖書館學(xué)研究,2006(3).
[2]何莉.基于 Web 信息抽取的個性化信息服務(wù)研究與實(shí)現(xiàn)[J].華東師范大學(xué),2007(6):16-25.
[3]吳麗花,劉魯.個性化推薦系統(tǒng)用戶建模技術(shù)綜述[J].情報(bào)學(xué)報(bào),2006,25(1):55-62.