季瑩,趙寧,韓露
(1.哈爾濱工業(yè)大學(xué)圖書館,黑龍江哈爾濱 150001;2.黑龍江電視臺,黑龍江哈爾濱 150001)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和數(shù)字圖書館的使用,數(shù)字圖書館的用戶和資源量訪問量的增加,對數(shù)字圖書館的數(shù)據(jù)存儲與系統(tǒng)輸入輸出的穩(wěn)定性和數(shù)據(jù)安全有更高的要求。
高校數(shù)字圖書館存儲了大量電子文獻,學(xué)位論文庫、特色庫、媒體庫、自建庫和購買的電子期刊備份、全文庫等都在隨著年份的增長而不斷增加,數(shù)據(jù)是多樣性的[1]。
高校圖書館的存儲面臨以下問題:需要保證數(shù)據(jù)安全和服務(wù)器7×24 h 可用;數(shù)據(jù)的傳輸性、實時性和兼容性較差;需要解決服務(wù)器系統(tǒng)之間交換數(shù)據(jù)文件,滿足大塊數(shù)據(jù)的輸入輸出、數(shù)據(jù)的共享性、跨平臺的計算環(huán)境、足容災(zāi)容錯集群管理、多級備份、在線備份與近線備份等問題;存儲多數(shù)使用磁盤列,不能共享;主流硬件設(shè)備和存儲類型不同,擴充不便。
高校數(shù)字圖書館存儲技術(shù)包括DAS、NAS、SAN。DAS是直接附加存儲技術(shù),通過SCSI 接口或者光纖等將磁盤陣列接到服務(wù)器上,但是加大了管理難度[2],不適合大規(guī)模存儲。按照存儲網(wǎng)絡(luò)工業(yè)協(xié)會SNIA 的定義,SAN 是存儲區(qū)域網(wǎng),利用互聯(lián)網(wǎng)協(xié)議,在服務(wù)器與存儲之間傳送數(shù)據(jù);NAS是存儲設(shè)備,直接連接LAN,提供文件級服務(wù)[3]。
SAN 是服務(wù)器連接存儲的結(jié)構(gòu)。存儲設(shè)備不在服務(wù)器系統(tǒng)中。SAN 將LAN 上的存儲轉(zhuǎn)換到由存儲設(shè)備組成的SAN 上[4-7]。
優(yōu)點是高寬帶,低延時,數(shù)據(jù)傳輸速度高、距離長,子網(wǎng)不影響主網(wǎng)的帶寬和性能,操作的可靠安全性和可擴展能力高[8-9]。缺點是互操作性差,成本較高,無法實現(xiàn)異構(gòu)環(huán)境的文件共享,維護較難。
NAS 是跨平臺數(shù)據(jù)存儲設(shè)備。通過網(wǎng)絡(luò)協(xié)議和I/O 方式數(shù)據(jù)傳輸,即插即用LAN,支持共享數(shù)據(jù)。將數(shù)據(jù)存儲任務(wù)從主服務(wù)器分離出來,主服務(wù)器只用于數(shù)據(jù)處理[3]。
優(yōu)點是設(shè)備故障不影響其他服務(wù)器,在網(wǎng)絡(luò)上存取數(shù)據(jù)減小CPU 開銷,支持共享數(shù)據(jù)和多種傳輸協(xié)議[10],文件級操作,價格低廉。缺點是難與現(xiàn)有備份系統(tǒng)集成,備份恢復(fù)困難,操作占用大帶寬,其他I/O 受影響,擴展受限多,增加存儲介質(zhì)影響網(wǎng)絡(luò)性能,讀寫占用流量,不能集中管理,不支持數(shù)據(jù)庫服務(wù),傳輸速度慢。
NAS 和SAN 存儲優(yōu)勢互補。SAN 用作數(shù)據(jù)庫的快速運行,NAS 負責(zé)客戶端,通過專線網(wǎng)絡(luò)存儲與備份數(shù)據(jù),不占用原來帶寬,傳輸性能改善,無限擴展[11-12]。
SAN 和NAS 互聯(lián)只是設(shè)備互聯(lián),兩種存儲方式并用,各自的網(wǎng)絡(luò)還是各自響應(yīng)數(shù)據(jù)的I/O 方式。SAN 和NAS 的互聯(lián)如圖1 所示。
圖1 SAN 和NAS 的互聯(lián)
NAS 是功能服務(wù)器和存儲器件。去掉存儲,即RAID 卡,加上一個FC 卡,通過光纖交換機或集線器連接共享和訪問網(wǎng)絡(luò)存儲資源。NAS 服務(wù)器提供子系統(tǒng)的文件級服務(wù)或用NAS 引擎連接存儲區(qū)域網(wǎng),提供數(shù)據(jù)塊I/O 操作和數(shù)據(jù)庫應(yīng)用。NAS 負責(zé)文件和數(shù)據(jù)塊之間的轉(zhuǎn)換,實現(xiàn)數(shù)據(jù)共享。但文件級的NAS 承受不了大負載。NAS 和SAN 的集成如圖2 所示。
圖2 NAS 和SAN 的集成
增加FCP 協(xié)議。安裝NIC 網(wǎng)卡訪問局域網(wǎng)和HBA 卡連接光纖交換機,將NAS 存儲子系統(tǒng)融入SAN。NIC 在主機和存儲設(shè)備之間傳送數(shù)據(jù)包,塊狀數(shù)據(jù)通過HBA 或者并行SCSI 接口傳送;HBA 負責(zé)主機和存儲之間傳送塊狀數(shù)據(jù)。NAS 對存儲資源進行數(shù)據(jù)塊訪問,獲得迅速的數(shù)據(jù)響應(yīng)。SAN 和NAS 的統(tǒng)一連接如圖3 所示。
圖3 SAN 和NAS 的統(tǒng)一連接
高校數(shù)字圖書館采用靈活的網(wǎng)絡(luò)拓撲結(jié)構(gòu),通過光纖交換機及設(shè)備連接,高速傳輸,實現(xiàn)任意節(jié)點間的多路可選擇的數(shù)據(jù)交換,并將專用數(shù)據(jù)存儲局域網(wǎng)與應(yīng)用網(wǎng)絡(luò)分離,設(shè)計滿足數(shù)字圖書館不同數(shù)據(jù)處理要求的存儲系統(tǒng)。
采用EMC 公司存儲設(shè)備產(chǎn)品,如Clariion CX400/500,磁盤陣列采用光纖通道技術(shù),采用通用的硬件體系結(jié)構(gòu)和軟件應(yīng)用程序套件。NAS 設(shè)備NS501 前端口連接以太網(wǎng)接口或iSCSI 口,后端連接DPE 獲得存儲資源,NAS 管理臺管理存儲容量。NAS 設(shè)置NFS/CIFS/HTTP 和FCP 文件服務(wù)器,前端口用NIC 連接以太網(wǎng)交換機,后端口配置HBA 卡,或者通過FC Switch 連接DPE。光纖交換機FC switch 是擴展CX400/500 磁盤陣列連接的服務(wù)器數(shù)目。組建的FC-SAN(8 端口)可以使得128 臺主機通過存儲網(wǎng)絡(luò)訪問磁盤陣列的存儲資源。關(guān)鍵性業(yè)務(wù)采用SAN 的Lan-free,不占用LAN帶寬,不降低性能,一般業(yè)務(wù)通過Server-free 方式,提高了網(wǎng)絡(luò)傳輸速度。
SAN 和NAS 融合是一種新的存儲方式,既有SAN 的高性能和可直接訪問存儲設(shè)備的特點,又有NAS 的統(tǒng)一管理、共享數(shù)據(jù)的特點。結(jié)合高校數(shù)字圖書館要求對于所保存信息的數(shù)字化、服務(wù)方式的網(wǎng)絡(luò)化,實現(xiàn)集中存儲、訪問和共享。保持系統(tǒng)持續(xù)運行,高速有效的訪問;不僅擴充硬件設(shè)備,還兼容異構(gòu)系統(tǒng),確保數(shù)據(jù)完整一致。