魯 昉
(中共貴州省委黨校 信息管理處,貴陽 550025)
大數(shù)據(jù)環(huán)境下的數(shù)字圖書館關(guān)鍵技術(shù)研究
魯 昉
(中共貴州省委黨校 信息管理處,貴陽 550025)
在大數(shù)據(jù)環(huán)境下,大型的數(shù)據(jù)技術(shù)在信息提取等方面得到廣泛的應(yīng)用,并對信息資源進(jìn)行有效的管理,但在大數(shù)據(jù)環(huán)境中蘊(yùn)藏著海量的數(shù)據(jù)信息,這些信息多樣,而且較為零散、復(fù)雜,因此,為信息的存儲和管理等工作增加了不少的難度。在大數(shù)據(jù)環(huán)境下,數(shù)字圖書館的發(fā)展面臨眾多挑戰(zhàn)。本文圍繞大數(shù)據(jù)環(huán)境下的數(shù)字圖書館關(guān)鍵技術(shù)進(jìn)行分析。
大數(shù)據(jù)環(huán)境;數(shù)字圖書館;關(guān)鍵技術(shù)
隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)等的發(fā)展,圖書館也已經(jīng)進(jìn)入到了數(shù)字化發(fā)展階段,在圖書館信息資源整理和管理等工作中,也加大了對數(shù)字化技術(shù)的應(yīng)用,促進(jìn)了信息化服務(wù)和數(shù)字化服務(wù)的實(shí)現(xiàn)。數(shù)字圖書館使用數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)等構(gòu)建信息應(yīng)用系統(tǒng),對信息數(shù)據(jù)進(jìn)行存儲、檢索、保存等,從數(shù)字圖書館自身進(jìn)行分析,其各項(xiàng)功能的實(shí)現(xiàn)都是在以下這些關(guān)鍵技術(shù)的支持下完成的,數(shù)字圖書館利用這些關(guān)鍵技術(shù)實(shí)現(xiàn)新時代的信息化服務(wù)。
在數(shù)字圖書館中儲存技術(shù),主要是將信息數(shù)字化之后的文件保存,在實(shí)際工作中,純文本的信息資源,如果只是對數(shù)字化技術(shù)和信息組織技術(shù)應(yīng)用,根本無法對目前的數(shù)字圖書館需求滿足。當(dāng)前與數(shù)字圖書館相關(guān)的數(shù)據(jù)技術(shù),包括有多媒體數(shù)據(jù)技術(shù)、面向?qū)ο髷?shù)據(jù)庫技術(shù)等,這些數(shù)字化技術(shù)的特點(diǎn)如表1。
表1 數(shù)字圖書館的關(guān)鍵數(shù)據(jù)庫技術(shù)比較
數(shù)字圖書館的文本智能檢索技術(shù),可以實(shí)現(xiàn)跨地域、跨文庫的實(shí)現(xiàn)信息資源的檢索,并按照用戶的要求,實(shí)施精密文本信息。文本檢索技術(shù)可以根據(jù)用戶的實(shí)際信息需求,對信息進(jìn)一步進(jìn)行分析,制定信息檢索方案,根據(jù)信息的檢索方案對用戶需求的文本信息先進(jìn)行分布式的檢索,其次實(shí)施精確檢索,提高文本檢索的質(zhì)量以及文本信息檢索的準(zhǔn)確性。常見的文本格式為DOC、TXT、RTF、PDF,圖像格式為BMP、TIF、GIF、WMF、PICT、PCD、 TGA、JPG等,動畫格式為ANI、FLI、FLC,視頻格式為AVI、MOV、MPG等,音頻格式為WAV、MID、AUD等,程序格式為COM、EXT。數(shù)字圖書館技術(shù)運(yùn)用這些技術(shù),進(jìn)行文本信息、圖像信息、音頻信息等的檢索、獲取等,先進(jìn)行相似性檢索,然后直接從內(nèi)容中選取相應(yīng)的文本信息特征,進(jìn)行信息檢索。
在大數(shù)據(jù)環(huán)境下,數(shù)字圖書館成為先進(jìn)技術(shù)應(yīng)用的一個代表,在數(shù)字圖書館中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用,可以從大量的數(shù)據(jù)信息中,挖掘出抽象的、潛在的信息,發(fā)現(xiàn)數(shù)字圖書館中數(shù)字?jǐn)?shù)據(jù)庫中的核心,為大量數(shù)據(jù)的有效利用提供幫助。
人與人的興趣、愛好存在差異性,在數(shù)字圖書館發(fā)展的過程中,每一個用戶都有自己感興趣的信息和內(nèi)容,但是用戶自己想檢索的文本信息等內(nèi)容存在局限性,此時,利用識別技術(shù),對用戶感興趣的內(nèi)容進(jìn)行識別,獲取用戶可讀的信息,同時,提高上數(shù)字圖書館的信息獲取效率,更好的為用戶提供服務(wù)。
數(shù)字圖書館是在網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)技術(shù)等的支持下實(shí)現(xiàn)的,所以,其自身的遞送網(wǎng)絡(luò)技術(shù)是一種網(wǎng)絡(luò)體系結(jié)構(gòu),通過該技術(shù),實(shí)現(xiàn)各種信息資源的緩存、復(fù)制、發(fā)送等。遞送網(wǎng)絡(luò)技術(shù)的控制可以采用動態(tài)流量分配實(shí)現(xiàn),在用戶訪問請求下,引導(dǎo)用戶實(shí)施就近訪問,對網(wǎng)絡(luò)運(yùn)行中存在的網(wǎng)絡(luò)堵塞問題處理,提高用戶的訪問響應(yīng)速度。
數(shù)字圖書館的一大特征就是知識信息量大而且豐富,這些特征也進(jìn)一步的說明,信息的知識產(chǎn)權(quán)保護(hù)是一大難題。當(dāng)前,產(chǎn)權(quán)保護(hù)是全社會都在關(guān)注的問題,并受到社會結(jié)構(gòu)、倫理等的影響,為了保證數(shù)字圖書館中信息資源的安全性,其知識權(quán)保護(hù)技術(shù),按照網(wǎng)絡(luò)瀏覽版權(quán)法,對用戶的訪問范圍進(jìn)行合理的設(shè)置,在一定程度下,還可以為用戶提供瀏覽服務(wù),但是不提供復(fù)制服務(wù)。
主要參考文獻(xiàn)
[1]陳臣.大數(shù)據(jù)環(huán)境下數(shù)字圖書館安全威脅與對策研究[J].圖書館工作與研究,2014(11):34-38.
[2]鄭沁.數(shù)字圖書館的發(fā)展及關(guān)鍵技術(shù)[J].海峽科學(xué),2012(12):73-74,83.
10.3969/j.issn.1673 - 0194.2015.06.134
G250.76;G252
A
1673-0194(2015)06-0212-01
2015-02-05