關(guān)鍵詞:圖書(shū)館;特藏;EBM;按需數(shù)字化
摘要:文章介紹了數(shù)字化的設(shè)備以及數(shù)字化過(guò)程中需要考慮的因素。圖書(shū)館可以引進(jìn)EBM,借鑒國(guó)外的管理模式,大膽嘗試對(duì)特色資源按需數(shù)字化,加速特藏的流通,更好地為讀者服務(wù)。
中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2015)03-0096-02
1高校圖書(shū)館特藏?cái)?shù)字化
普通高校評(píng)估要求高校圖書(shū)館有長(zhǎng)期積累、獨(dú)具特色的資源,每個(gè)高校都有自己的重點(diǎn)學(xué)科,所具有的電子資源也都各有側(cè)重。在網(wǎng)絡(luò)環(huán)境下,人類獲取信息的手段和方式越來(lái)越多,圖書(shū)館館藏如果僅停留在普通水平上,就與互聯(lián)網(wǎng)無(wú)異。在檢索方便快捷方面,圖書(shū)館與baidu、Google相比并不占優(yōu)勢(shì)。OCLC在2006年進(jìn)行的一項(xiàng)全球調(diào)查顯示,89%的高校學(xué)生首選Google等網(wǎng)絡(luò)搜索引擎搜集信息資源,而選擇圖書(shū)館的比例僅占2%。由此,高校圖書(shū)館如果想保持永久的生命力,致力于特色資源建設(shè)是其必然選擇。特色資源的收藏并不是目的,其目的在于最大限度地實(shí)現(xiàn)資源共享,提供特色服務(wù)。如果所有紙質(zhì)特藏資源內(nèi)容都能提供電子目錄摘要,那么在讀者有需要時(shí)就可以按需數(shù)字化或打印,在共享的同時(shí)又保護(hù)了珍貴的原始資料。
2數(shù)字化的設(shè)備
書(shū)刊掃描儀是專為書(shū)刊、期刊、報(bào)紙、古籍、易損壞文檔而設(shè)計(jì)的A2大幅面掃描設(shè)備,掃描出來(lái)的圖像,可直接用于印刷。目前國(guó)內(nèi)沒(méi)有任何企業(yè)生產(chǎn)制造此類型的掃描設(shè)備,國(guó)內(nèi)市場(chǎng)上也只有幾個(gè)國(guó)外品牌的書(shū)刊掃描儀,國(guó)外有圖書(shū)館用這種書(shū)刊掃描儀把所有圖書(shū)掃描成電子檔,存儲(chǔ)在數(shù)據(jù)庫(kù)里,建立虛擬圖書(shū)館,供人們網(wǎng)上閱讀。以下介紹3種圖書(shū)掃描儀(機(jī))。
2.1美國(guó)Kirtas全自動(dòng)書(shū)刊掃描儀(Espresso Book Machine)
美國(guó)Kirtas全自動(dòng)書(shū)刊掃描儀簡(jiǎn)稱EBM,是技術(shù)先進(jìn)、功能卓越和最受歡迎的書(shū)刊數(shù)字化的全自動(dòng)電子設(shè)備,可實(shí)現(xiàn)自動(dòng)翻頁(yè)、自動(dòng)掃描、批量數(shù)字化處理功能,可以把傳統(tǒng)的印刷書(shū)刊、雜志以及很多珍貴的古代書(shū)籍知識(shí)以數(shù)字化的方式儲(chǔ)存下來(lái)。 EBM是一種集成式按需印刷系統(tǒng),主要由美國(guó)On Demand Books,LLC(ODB)公司的EspressNet軟件系統(tǒng)、打印系統(tǒng)、書(shū)帖整理對(duì)齊系統(tǒng)、裝訂系統(tǒng)、裁切系統(tǒng)構(gòu)成,其中EspressNet的軟件系統(tǒng)相當(dāng)于一個(gè)指揮調(diào)度中樞和核算中心,而打印系統(tǒng)、書(shū)帖整理對(duì)齊系統(tǒng),膠訂系統(tǒng)、裁切系統(tǒng)的功能則相當(dāng)于一個(gè)印刷裝訂廠。該掃描儀2003年11月獲得美國(guó)科學(xué)技術(shù)創(chuàng)新最優(yōu)獎(jiǎng)。據(jù)ODB公開(kāi)的資料, 已經(jīng)有近61臺(tái)EBM安裝在世界各地的書(shū)店、圖書(shū)館和大學(xué)。其中大學(xué)書(shū)店21家,獨(dú)立書(shū)店19家,圖書(shū)館14家,其他連鎖書(shū)店7家。劍橋大學(xué)出版社擁有一臺(tái),用來(lái)把劍橋圖書(shū)館收藏的重要的學(xué)生用書(shū)數(shù)字化。中國(guó)僅有一臺(tái),在中國(guó)出版集團(tuán)。EBM主要用于絕版圖書(shū)、專業(yè)性強(qiáng)的學(xué)術(shù)著作、個(gè)人出版和根據(jù)顧客需求專門(mén)定制的圖書(shū)。
2.2谷歌圖書(shū)掃描機(jī)
2004年12月,谷歌啟動(dòng)了一項(xiàng)名為“數(shù)字圖書(shū)館”的工程,即把全球知名大學(xué)和研究機(jī)構(gòu)所屬圖書(shū)館的藏書(shū)轉(zhuǎn)化為電子書(shū)。這些圖書(shū)館包括斯坦福大學(xué)、哈佛大學(xué)、密歇根大學(xué)、牛津大學(xué)所屬圖書(shū)館及紐約公共圖書(shū)館等。在谷歌啟動(dòng)“數(shù)字圖書(shū)館”之前,業(yè)界通常使用光學(xué)字符識(shí)別軟件(OCR)來(lái)實(shí)現(xiàn)紙質(zhì)書(shū)的數(shù)字化。但OCR軟件要求被掃描的圖書(shū)每頁(yè)必須平整放置。而對(duì)于整本書(shū)籍來(lái)說(shuō),不損壞書(shū)籍裝訂的通行掃描方法是:將圖書(shū)一頁(yè)頁(yè)打開(kāi)放在玻璃面板上壓平。另一種方式是把已裝訂的圖書(shū)一頁(yè)頁(yè)拆開(kāi)。由此可見(jiàn),上述兩種圖書(shū)掃描方式效率都不高,且容易毀壞書(shū)籍。而谷歌所開(kāi)發(fā)的批量化圖書(shū)掃描技術(shù)解決了這一難題。谷歌向USPTO提交的圖書(shū)掃描專利申請(qǐng)說(shuō)明書(shū)顯示,工作人員把被掃描書(shū)籍放入谷歌專門(mén)開(kāi)發(fā)的圖書(shū)硬件設(shè)備后,該設(shè)備所配備的紅外技術(shù)攝像頭將檢測(cè)被掃描書(shū)籍的三維形態(tài)和角度,然后把該信息傳輸至OCR軟件,并進(jìn)行失真校準(zhǔn),使OCR軟件能夠更準(zhǔn)確地識(shí)別被掃描文本。利用谷歌最新的圖書(shū)掃描技術(shù),被掃描圖書(shū)既不用放在玻璃面板上壓平,也不用將其一頁(yè)頁(yè)拆開(kāi),因此其掃描速度和準(zhǔn)確率都大幅提高。2013年11月15日,谷歌與美國(guó)作家協(xié)會(huì)(Authors Guild)之間長(zhǎng)達(dá)八年之久的版權(quán)爭(zhēng)議告一段落,曼哈頓聯(lián)邦地區(qū)華裔法官陳卓光(Denny Chin)做出判決,表示谷歌掃描圖書(shū)是擁有益處的公平行為。谷歌電子掃描的內(nèi)容是經(jīng)過(guò)“高度改編的”,并不會(huì)侵犯原創(chuàng)市場(chǎng)。按照新的判決,谷歌將能夠繼續(xù)電子掃描存在版權(quán)爭(zhēng)議的約2,000萬(wàn)冊(cè)圖書(shū)。
2.3DIY圖書(shū)掃描儀
研究生Daniel Reetz 自制了DIY圖書(shū)掃描儀,整個(gè)掃描儀由兩個(gè)相機(jī)、兩個(gè)小燈以及回收來(lái)的木板等組成,OCR軟件則用的是開(kāi)源。掃描一本400頁(yè)的圖書(shū)僅用時(shí)20分鐘。耗時(shí)三天,總花費(fèi)300美元(包括2臺(tái)佳能Power shot A590相機(jī))。使用這個(gè)掃描儀也極其簡(jiǎn)單:將書(shū)本攤開(kāi)放到V型托盤(pán)上,按按鈕開(kāi)始,翻頁(yè)時(shí)當(dāng)然也是“全自動(dòng)”(全部自己動(dòng)手),300美元的東西你不能寄希望它有多么智能。當(dāng)然還存在其他問(wèn)題,最為重要的是:自制圖書(shū)掃描儀的版權(quán)問(wèn)題,即你購(gòu)買(mǎi)一本書(shū)后是否擁有了它所有形式的所有權(quán)。
田甜:高校圖書(shū)館特藏按需數(shù)字化探索田甜:高校圖書(shū)館特藏按需數(shù)字化探索3特藏按需數(shù)字化需要考慮的因素
3.1特藏?cái)?shù)字化的后期制作
數(shù)字化后的圖像有時(shí)會(huì)扭曲,所有圖像頁(yè)面需要裁切和修正。一般有自動(dòng)和人工兩部分,全自動(dòng)掃描儀一般都具有裁切、移除不想要的部分等功能,根據(jù)書(shū)的大小,花費(fèi)的時(shí)間也不等。有時(shí)也還需要人工用圖像編輯軟件來(lái)處理,這項(xiàng)工作大都外包。
3.2特藏?cái)?shù)字化的質(zhì)量、成本和數(shù)字化所需時(shí)間三者之間的關(guān)系
特藏?cái)?shù)字化的質(zhì)量、成本和數(shù)字化所需時(shí)間三者之間的關(guān)系為:質(zhì)量越高,后期制作需要越多,花費(fèi)越大;質(zhì)量越高,后期制作需要越多,數(shù)字化持續(xù)時(shí)間越長(zhǎng);數(shù)字化持續(xù)時(shí)間越長(zhǎng),顧客的數(shù)字化請(qǐng)求越少。鑒于“客戶”將支付前期數(shù)字化的成本,必須找到質(zhì)量、成本、所需時(shí)間的最佳平衡點(diǎn)。筆者建議:①質(zhì)量方面,如果圖書(shū)館是幫助讀者盡快有效地得到信息,那么內(nèi)容能滿足用戶需要就可以,不需要達(dá)到商業(yè)出版的作品質(zhì)量。②時(shí)間方面,滿足用戶需要的數(shù)字化內(nèi)容應(yīng)該盡快交付,應(yīng)該告知用戶交付使用的時(shí)間表。③成本方面,如果前期的成本仍然很高,可以依據(jù)數(shù)字化的產(chǎn)品綜合價(jià)值,降低首次數(shù)字化的成本,因?yàn)橐院罂赡苓€會(huì)有大量用戶,并非所有的數(shù)字化成本都必須由首位客戶支付。數(shù)字化副本和打印品必須讓一般的大學(xué)生用戶能夠負(fù)擔(dān)得起,考慮到按需的屬性,價(jià)位應(yīng)該在學(xué)術(shù)文本書(shū)和大眾平裝書(shū)之間。
3.3數(shù)字化管理和存儲(chǔ)設(shè)備
目前劍橋大學(xué)根據(jù)現(xiàn)存的打印和數(shù)字化流程,僅存貯PDF格式的文檔。有些圖書(shū)館可能也想存貯高質(zhì)量的JPG或者是TIFF格式的文件。圖書(shū)館在考慮按需數(shù)字化時(shí),需要考慮以下問(wèn)題:①假定外部有數(shù)字化圖書(shū)館,是否還有必要在本館保存數(shù)字化的產(chǎn)品。②產(chǎn)權(quán)問(wèn)題或者說(shuō)原始資料的所有者是否授權(quán)。
4結(jié)語(yǔ)
綜上所述,雖然最初的投資比較大,但EBM全自動(dòng)書(shū)刊掃描儀提供了一種快速高效的全文數(shù)字化方式。當(dāng)然,圖書(shū)館也可以租用設(shè)備或者使用第三方(代理)加工數(shù)字化。盡管在按需數(shù)字化服務(wù)中可能有高利潤(rùn),但這種需求可能僅限于特定的讀者。特藏重在用而不是藏,圖書(shū)館工作人員應(yīng)該考慮怎樣最大化地滿足讀者的需要,讓特藏快速、高效地流通,更好地為讀者服務(wù)。
參考文獻(xiàn):
[1]Ian Rowlands,David Nicholas, Peter Williams,etal. The Google generation: the information behavior of the researcher of the future [R]. Aslib Proceedings,2008(60):290-310.
[2]EBM Locations: List View [EB/OL].[2014-06-06].http://ondemandbooks.com/ebm_locations_list.php.
[3]谷歌勝訴 掃描圖書(shū)是合法使用[EB/OL].[2014-06-06].http://it.sohu.com/201311
15/n390185443.shtml.
[4]圖書(shū)掃描儀DIY僅300美元[EB/OL].[2014-06-06].http://www.molei.net/article/7976.html.
[5]Henry P.Zulu. Digitalization of Scholarly Works at the Special Collections of the University of Zambia Library[D].長(zhǎng)春:東北師范大學(xué),2010.
(編校:周雪芹)