張紅偉
(濟(jì)寧醫(yī)學(xué)院圖書館,山東 濟(jì)寧 272067)
基于P2P技術(shù)的個人數(shù)字圖書館復(fù)本策略*
張紅偉
(濟(jì)寧醫(yī)學(xué)院圖書館,山東 濟(jì)寧 272067)
在分析P2P技術(shù)和個人數(shù)字圖書館的基礎(chǔ)上,結(jié)合復(fù)本問題對個人數(shù)字圖書館造成的影響,提出一種基于P2P技術(shù)的個人數(shù)字圖書館復(fù)本策略,該策略根據(jù)資源被請求次數(shù)創(chuàng)建索引文件或復(fù)本,為個人數(shù)字圖書館系統(tǒng)的可靠性提供保障。
個人數(shù)字圖書館;P2P;復(fù)本;策略
隨著信息技術(shù)的不斷發(fā)展,個人計算機(jī)上的數(shù)字資源數(shù)量不斷攀升,單純依靠人力去管理這些繁雜的資源難度不斷增加。個人數(shù)字圖書館(簡稱PDL)在這種情況下開始嶄露頭角,大大提高了數(shù)字資源的管理和使用效率,成為個人管理和使用數(shù)字資源的得力助手[1]。
由于分散性特點,傳統(tǒng)數(shù)字圖書館的C/S模式已無法適應(yīng)個人數(shù)字圖書館的發(fā)展,P2P技術(shù)與個人數(shù)字圖書館相結(jié)合成為大勢所趨[2]。復(fù)本問題成為個人數(shù)字圖書館亟待解決的問題之一。復(fù)本策略可以增加共享系統(tǒng)的健壯性,提高獲取文件的概率[3],一些學(xué)者針對復(fù)本代價、文件改寫等問題提出不同的復(fù)本策略[4-5]。作為一個新生事物,個人數(shù)字圖書館的研究主要集中在系統(tǒng)開發(fā)和使用的初級階段[6],關(guān)于個人數(shù)字圖書館復(fù)本問題的研究較少,本文提出一種基于P2P技術(shù)的復(fù)本策略。
紙質(zhì)圖書復(fù)本問題沒有帶入傳統(tǒng)數(shù)字圖書館,在傳統(tǒng)數(shù)字圖書館中,每種數(shù)字資源在服務(wù)器中只存一份,用戶可以不限次數(shù)的下載,不用考慮復(fù)本問題[7]。但是,在個人數(shù)字圖書館中,復(fù)本問題不僅顯現(xiàn)出來,而且問題更為復(fù)雜,良好的復(fù)本策略可以為個人數(shù)字圖書館共享系統(tǒng)的可靠性和可用性提供保障。
復(fù)本有利于提高PDL系統(tǒng)的可靠性,在P2P共享網(wǎng)絡(luò)中,每個PDL作為網(wǎng)絡(luò)中的一個節(jié)點都可以自由進(jìn)入或退出網(wǎng)絡(luò),如果一個PDL永久的退出網(wǎng)絡(luò),它所存儲的數(shù)字資源也將無法訪問,因此,在另一個PDL存放該數(shù)字資源的復(fù)本可以避免數(shù)字資源的丟失;復(fù)本有利于避免PDL負(fù)載過重,如果一個PDL存儲熱點資源,該P(yáng)DL被大量訪問從而造成負(fù)載過重,在其他PDL上存放該熱點資源的復(fù)本可以有效減輕該P(yáng)DL的負(fù)載[8];復(fù)本有利于提高訪問效率,在其他PDL上存放適量的復(fù)本后,同類數(shù)字資源在網(wǎng)絡(luò)中的數(shù)量增加,需要該數(shù)字資源的PDL可以快速定位并獲取到資源。
2.1 個人數(shù)字圖書館P2P網(wǎng)絡(luò)
P2P網(wǎng)絡(luò)分為集中式、分布式和混合式3種結(jié)構(gòu)[9]。本文研究的個人數(shù)字圖書館網(wǎng)絡(luò)采用混合式結(jié)構(gòu),這種結(jié)構(gòu)整合了其他2種結(jié)構(gòu)的優(yōu)勢,具有較好的分散化特性以及較快的資源搜索速度。
網(wǎng)絡(luò)中存在2種PDL:超級PDL和普通PDL[10]。每個超級PDL與一組普通PDL相連形成一個簇,超級PDL在簇內(nèi)具有重要職責(zé),每個超級PDL都記錄了自己以及簇內(nèi)普通PDL上的資源信息。簇外查詢消息首先到達(dá)超級PDL,由超級PDL根據(jù)持有的資源信息進(jìn)行查找,如果找到資源,超級PDL返回包含資源地址的回復(fù)信息。當(dāng)簇內(nèi)普通PDL發(fā)起查詢時,普通PDL首先將查詢消息發(fā)給超級PDL,超級PDL先在簇內(nèi)搜索,如果沒有找到相應(yīng)資源,超級PDL將查詢消息發(fā)往其他簇的超級PDL進(jìn)行查詢。超級PDL一般由在線時間較長、帶寬和存儲容量較大、計算能力較強(qiáng)的PDL擔(dān)任,為了提高系統(tǒng)的健壯性,每個簇都選兩個預(yù)備超級PDL,當(dāng)超級PDL離開網(wǎng)絡(luò)時,一個預(yù)備超級PDL立刻被激活。
2.2 個人數(shù)字圖書館復(fù)本策略
超級PDL記錄簇內(nèi)每個共享資源R的被請求次數(shù)Q,當(dāng)Q達(dá)到閾值Q1時,資源R還不屬于熱點文件但被請求次數(shù)達(dá)到一定數(shù)量,為了節(jié)約存儲空間,減少網(wǎng)絡(luò)流量,無需直接創(chuàng)建復(fù)本,而是在請求資源的簇內(nèi)創(chuàng)建該資源的索引文件,索引文件中包含位置信息;當(dāng)Q達(dá)到閾值Q2時(Q2>Q1),資源R屬于熱點文件,在請求資源的簇內(nèi)創(chuàng)建R的復(fù)本。無論簇內(nèi)還是簇外的搜索消息首先都要經(jīng)過超級PDL,由于超級PDL網(wǎng)絡(luò)帶寬、計算能力等綜合性能較好,超級PDL中的資源搜索與傳輸效率較高,因此,在創(chuàng)建資源索引文件或復(fù)本時,優(yōu)先選擇在超級PDL中創(chuàng)建,如果超級PDL存儲空間不足,由超級PDL選擇簇內(nèi)一個綜合性能較好的普通PDL進(jìn)行創(chuàng)建。
何時創(chuàng)建資源索引文件或復(fù)本主要分為以下2種情況:一種情況是當(dāng)收到來自簇外請求資源R的消息時,超級PDL在簇內(nèi)查找資源R,如果存在共享資源R,超級PDL將R的被請求次數(shù)加1,如果Q 圖1 簇外搜索復(fù)本創(chuàng)建策略 另一種情況是當(dāng)收到來自簇內(nèi)請求資源R的消息時,超級PDL在簇內(nèi)查找資源R,如果存在資源R,由于簇內(nèi)共享文件時,搜索效率較高,無需創(chuàng)建復(fù)本或索引文件,因此,直接返回資源信息;如果存在資源R的索引文件,將索引文件被請求次數(shù)加1,如果Q≥Q2,返回資源信息,根據(jù)資源索引文件在簇內(nèi)創(chuàng)建資源復(fù)本,然后刪除索引文件。簇內(nèi)搜索復(fù)本創(chuàng)建策略流程圖如圖2所示。 圖2 簇內(nèi)搜索副本創(chuàng)建策略流程圖 傳統(tǒng)的C/S模式無法適應(yīng)個人數(shù)字圖書館發(fā)展的需求,具有分散性的P2P技術(shù)與數(shù)字圖書館結(jié)合已成為大勢所趨。復(fù)本問題在個人數(shù)字圖書館網(wǎng)絡(luò)中顯現(xiàn),文章探討了混合式P2P網(wǎng)絡(luò)結(jié)構(gòu)中個人數(shù)字圖書館的復(fù)本策略,此策略可以為個人數(shù)字圖書館網(wǎng)絡(luò)系統(tǒng)的可靠性和可用性提供保障。 [1] 陳好敏.個人數(shù)字圖書館研究[D].武漢:華中師范大學(xué),2012. [2] 徐麗,呂囡.P2P環(huán)境下個人數(shù)字圖書館資源共享研究[J].農(nóng)業(yè)圖書館情報學(xué)報,2012,24(3):23-24,42. [3] Xhafa F.Data replication and synchronization in P2P collaborative systems[C]//Advanced Information Networking and Applications(AINA),2012 IEEE 26th International Conference on.IEEE,2012:7-7. [4] Shen H,Liu G.A lightweight and cooperative multifactor considered file replication method in structured P2P systems[J].Computers,IEEE Transactions on,2013,62(11):2115-2130. [5] Potlog A D,Xhafa F,Pop F,et al.Evaluation of optimistic replication techniques for dynamic files in P2P systems[C]//P2P,Parallel,Grid,Cloud and Internet Computing(3PGCIC),2011 International Conference on.IEEE,2011:259-265. [6] 吳洋.國內(nèi)個人數(shù)字圖書館研究現(xiàn)狀及國外實踐掃描[J].長春金融高等??茖W(xué)校學(xué)報,2013,28(1):93-96. [7] 汪繼南.覆蓋率與復(fù)本量[J].大學(xué)圖書館學(xué)報,1990,8(3):45-47. [8] 王巍,司加全,玄世昌,等.基于查詢請求分析的P2P訪問熱點負(fù)載均衡[J].計算機(jī)工程,2012,38(11):111-113. [9] 廖季萍.基于P2P的數(shù)據(jù)資源共享研究[D].長春:長春理工大學(xué),2014. [10] 王小娟,周竹榮.基于leader-follower算法的超級節(jié)點研究[J].計算機(jī)應(yīng)用,2012,32(1):143-146,162. Duplicate strategy of personal digital library based on P2P technology ZHANGHongwei (Library of Jining Medical university,Jining 272067,China) On the basis of analysis of P2P technology and the personal digital libraries,combining the impact of personal digital libraries caused by duplicates,a duplicate strategy of Personal Digital Library based on peer-to-peer is proposed which creates an index file or duplicate according to the number of resource requested and guarantees the reliability of the personal digital library system. Personal digital library;Peer-to-peer;Duplicates;Strategy * [基金項目]2011年濟(jì)寧醫(yī)學(xué)院青年基金項目(編號:JYQ2011 KM 035) 10.3969/j.issn.1000-9760.2015.01.015 G250.76 A 1000-9760(2015)02-054-03 2015-01-09)3 結(jié)束語