張 昕,宋頂利
(河北聯(lián)合大學(xué),河北 唐山 063009)
圖書館檢索系統(tǒng)中圖書推薦技術(shù)研究
張 昕,宋頂利
(河北聯(lián)合大學(xué),河北 唐山 063009)
社會的快速發(fā)展也為圖書出版事業(yè)帶來了繁榮,圖書館藏書的數(shù)量在顯著增加同時,更需要給讀者提供更加人性化的服務(wù)。但當(dāng)前,圖書館的檢索系統(tǒng)比較落后,推薦技術(shù)也過于機(jī)械化,無法為讀者提供有效的資料?;趫D書館當(dāng)前存在的這一問題,借鑒當(dāng)前網(wǎng)絡(luò)上流行的圖書推薦方案,對圖書館內(nèi)的圖書推薦技術(shù)進(jìn)行深入研究。
人性化服務(wù);檢索系統(tǒng);推薦技術(shù)
近幾年,隨著信息技術(shù)的不斷進(jìn)步與網(wǎng)絡(luò)的普及,圖書的數(shù)量也不斷增多,圖書館的藏書量也不斷增多,規(guī)模逐漸擴(kuò)大,圖書館的信息服務(wù)面臨著嚴(yán)峻的挑戰(zhàn)。為了提高圖書館人性化服務(wù)的質(zhì)量,幫助讀者快速找到想要的資料,圖書推薦系統(tǒng)便成為了當(dāng)前圖書館信息服務(wù)方式的主流。但隨著信息技術(shù)的不斷進(jìn)步,圖書館的推薦技術(shù)也應(yīng)該緊跟時代發(fā)展潮流,做出相應(yīng)的技術(shù)改進(jìn)。
一般情況下,用戶會根據(jù)自身需要,通過搜索引擎來查找,但有些時候,用戶給出的關(guān)鍵詞語并不能詮釋自己需要的圖書類別的資料的內(nèi)容,這就很容易造成檢索結(jié)果給出的資料與用戶的實(shí)際要求不相符的情況,這就需要在檢索系統(tǒng)當(dāng)中增添推薦系統(tǒng),以便更好的為用戶提供服務(wù)。其次,當(dāng)讀者通過該系統(tǒng)輸入關(guān)鍵詞時,系統(tǒng)會與關(guān)鍵詞有關(guān)的圖書迅速羅列并分類,并且,會將圖書的權(quán)值顯現(xiàn)給讀者。
當(dāng)前,圖書館的檢索推薦方式分為兩類,一類是圖書館內(nèi)的管理人員協(xié)助讀者檢索推薦;另一類是讀者通過自己總結(jié)出的關(guān)鍵詞,借助圖書檢索系統(tǒng)的推薦技術(shù)進(jìn)行關(guān)鍵詞的檢索。從當(dāng)前圖書出版業(yè)與圖書館的發(fā)展形勢來看,這兩類檢索方式都不符合圖書館建設(shè)人性化、個性化信息服務(wù)的要求。因此,要對圖書推薦系統(tǒng)進(jìn)行重新設(shè)計(jì)。
2.1系統(tǒng)總體設(shè)計(jì)
隨著電子商務(wù)的不斷發(fā)展,網(wǎng)上書店也隨之興旺起來,其中,其當(dāng)當(dāng)網(wǎng)、China-Pub、卓越網(wǎng)等知名網(wǎng)絡(luò)書店都使用了推薦技術(shù),幫助用戶快速購書。雖然現(xiàn)在的圖書館也在使用推薦技術(shù),但是在圖書內(nèi)容的相關(guān)性上要弱于網(wǎng)上書店,因此,本文結(jié)合網(wǎng)上書店的推薦技術(shù),將圖書推薦系統(tǒng)分四個板塊進(jìn)行設(shè)計(jì)。首先,對網(wǎng)絡(luò)書店中圖書的數(shù)據(jù)進(jìn)行采集,在分析出該店半結(jié)構(gòu)化的網(wǎng)頁源碼后,得出相關(guān)的有效數(shù)據(jù),并根據(jù)其中的有效數(shù)據(jù)設(shè)計(jì)出專用的爬蟲,將數(shù)據(jù)導(dǎo)入到圖書館的數(shù)據(jù)庫中。然后,利用Book Rank計(jì)算技術(shù)算出每一本圖書Book Rank數(shù)值,為后續(xù)推薦系統(tǒng)模塊的圖書排序提供有效的數(shù)據(jù),防止在排序上出現(xiàn)數(shù)值誤差。最后,設(shè)計(jì)出符合該系統(tǒng)的兩個推薦策略。
2.2數(shù)據(jù)庫設(shè)計(jì)
推薦系統(tǒng)的設(shè)計(jì)需要大量的數(shù)據(jù)做輔助,為了使圖書館的圖書推薦系統(tǒng)能夠更好的與網(wǎng)上的半結(jié)構(gòu)化的網(wǎng)頁源碼數(shù)據(jù)相結(jié)合,使其能夠更好的貼合圖書館數(shù)據(jù)庫系統(tǒng),就需要對圖書館的數(shù)據(jù)庫系統(tǒng)進(jìn)行合理設(shè)計(jì)。首先,對當(dāng)當(dāng)網(wǎng)、China-Pub和卓越網(wǎng)這三大網(wǎng)站提供的數(shù)據(jù)詳細(xì)分析,找出圖書數(shù)據(jù)來源等問題,在確定了這一系列數(shù)據(jù)來源的基礎(chǔ)上,設(shè)計(jì)圖書數(shù)據(jù)庫。圖書數(shù)據(jù)庫各類圖書關(guān)系的設(shè)計(jì)主要分為三大類:一是圖書的隸屬關(guān)系,其關(guān)系從大到小排列為圖書主分類-分類名稱-上一級分類;二是表示圖書現(xiàn)有數(shù)量的分類,分類主要包括,圖書主分類以及各類圖書數(shù)量兩大方面。
3.1依照關(guān)鍵詞
該方法主要為了解決當(dāng)前圖書館檢索系統(tǒng)在檢索關(guān)鍵詞時,只會將與關(guān)鍵詞相關(guān)的圖書檢索出來,沒有進(jìn)行分類,用戶查找不便,關(guān)鍵詞推薦策略是針對當(dāng)用戶在檢索系統(tǒng)中輸入關(guān)鍵詞得到信息時,推薦系統(tǒng)會根據(jù)圖書的類別進(jìn)行分類統(tǒng)計(jì),并依據(jù)個類別的現(xiàn)有數(shù)量,合理的分配不同類別推薦的圖書數(shù)目。同時,依據(jù)Book Rank值來從推薦的數(shù)目當(dāng)中進(jìn)行圖書的選擇、匯總和排序。
3.2依照特定圖書
當(dāng)讀者選擇某一本書時,圖書推薦系統(tǒng)會根據(jù)該圖書的相關(guān)分類信息向讀者推薦同類圖書。這一設(shè)計(jì)思路主要是:當(dāng)讀者選擇此本書籍時,他可能會對同類圖書也感興趣,由此推理出其需要的書籍可能在同類的圖書當(dāng)中,于是便將該類別的圖書作為推薦目錄。
圖書數(shù)據(jù)庫是將圖書按照樹狀結(jié)構(gòu)進(jìn)行分類的,總目錄是該樹狀結(jié)構(gòu)的基礎(chǔ)部分,其目錄名即為分類號,子目錄是該樹狀結(jié)構(gòu)的中間點(diǎn),而圖書則是該樹狀結(jié)構(gòu)的葉子部分。該方法的特點(diǎn)是,當(dāng)讀者選取的目錄中圖書數(shù)量較少或者沒有該類圖書時,讀者可以擴(kuò)大目錄選級,從而有效的彌補(bǔ)當(dāng)前圖書推薦系統(tǒng),推薦數(shù)量不足的現(xiàn)狀,擴(kuò)大目錄范圍,為讀者提供更多的選擇。具體流程如圖1所示。
圖1 特定圖書推薦策略流程圖
本文從以圖書推薦技術(shù)為主要研究點(diǎn),將推薦系統(tǒng)的概念作為研究的開端,著重講述推薦技術(shù)的優(yōu)勢,并且就其在圖書館的具體應(yīng)用進(jìn)行詳解。同時結(jié)合當(dāng)前圖書館信息服務(wù)發(fā)展的需要,分析了目前圖書推薦技術(shù)存在的不足之處,吸收并借鑒網(wǎng)絡(luò)上的先進(jìn)方法,從而對圖書推薦技術(shù)進(jìn)行整體技術(shù)設(shè)計(jì)。
10.3969/j.issn.1673-0194.2015.02.140
G250.7
A
1673-0194(2015)02-0196-01
2014-12-28