楊曦++楊俊偉++印國成
摘要: 作者通過細(xì)致分析,對比了當(dāng)前比較常見的數(shù)據(jù)庫雙機(jī)容錯備份系統(tǒng)的設(shè)計原理、思路、實現(xiàn)方法、性能優(yōu)缺點(diǎn)以及數(shù)據(jù)庫雙機(jī)熱備份技術(shù)在圖書館數(shù)據(jù)庫中的具體應(yīng)用,設(shè)計了一種方案,該方案基本滿足了計算機(jī)數(shù)據(jù)庫應(yīng)用對于系統(tǒng)安全、存儲備份、可靠性方面的基本要求,為計算機(jī)容錯技術(shù)在國內(nèi)發(fā)展進(jìn)行了新探討。
關(guān)鍵詞:雙機(jī)熱備份; 數(shù)據(jù)庫; 容錯; RAID
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)11-0021-02
Dual-computer Fault-tolerant Database Backup System to Explore and Research
YANG Xi1, YANG Jung-wei2, YIN Guo-cheng1
(1.Straight Yangzhou University College Library,Yangzhou 225009, China; 2.College of Hydraulic and Energy and Power Engineering, Yangzhou University, Yangzhou 225009, China)
Abstract : The author analyzed deeply and compared the current duplicated fault tolerance system design principle, design idea, implementation method and its performance advantages and disadvantages as well as the application of double-machine hot backup technology database in the library. The scheme can meet the basic computer application using for system security, backup, the basic requirement of reliability,bring new ideas for the computer fault-tolerant technology in domestic development.
Key words: duplicated fault tolerance system; database; fault tolerance; RAID
計算機(jī)的大眾化使得人類的生產(chǎn)生活越來越離不開計算機(jī)、網(wǎng)絡(luò)以及數(shù)據(jù)庫。人們對計算機(jī)的依賴性越大,計算機(jī)的可靠性就越發(fā)顯得重要,對容錯熱備計算機(jī)的需求也就越大,同時也能夠推動容錯熱備技術(shù)的新發(fā)展。因此,人們越來越重視對計算機(jī)的容錯、熱備份技術(shù)的研發(fā),使得容錯熱備技術(shù)被應(yīng)用到各個領(lǐng)域的計算機(jī)系統(tǒng)之中。
1 雙機(jī)熱備系統(tǒng)構(gòu)成
目前,企業(yè)對計算機(jī)的依賴程度越來越高,使得數(shù)據(jù)庫的重要性也隨之增加,因此,為了保證數(shù)據(jù)不丟失,雙機(jī)熱備是一個很優(yōu)的選擇。在傳統(tǒng)的雙機(jī)熱備份系統(tǒng)中,磁盤陣列是兩臺主機(jī)之間的共用數(shù)據(jù)存儲設(shè)備,并通過相應(yīng)的軟件對磁盤陣列進(jìn)行管理,同時管理和監(jiān)控受保護(hù)的服務(wù)。若服務(wù)器軟硬件發(fā)生問題,導(dǎo)致服務(wù)器失效,則另一臺將取代其功能,啟動發(fā)生故障的服務(wù)器的網(wǎng)絡(luò)資源服務(wù)。
在服務(wù)器容錯應(yīng)用方案中,雙機(jī)熱備份技術(shù)尤其突出,其是將軟硬件結(jié)合,運(yùn)用工作機(jī)和備份機(jī)同時執(zhí)行同一服務(wù)。工作機(jī)在一般情況下為服務(wù)器應(yīng)用系統(tǒng)提供服務(wù)并負(fù)責(zé)檢測備份機(jī)是否正常;備份機(jī)的主要職責(zé)是監(jiān)視工作機(jī)的運(yùn)行是否正常。備份機(jī)在工作機(jī)出現(xiàn)故障時主動接替其工作,保證服務(wù)器應(yīng)用系統(tǒng)能夠不間斷的運(yùn)行。
在高性能的服務(wù)器容錯解決方案中是通過磁盤陣列集中管理網(wǎng)絡(luò)系統(tǒng)的所有數(shù)據(jù),并進(jìn)行數(shù)據(jù)備份。集中管理網(wǎng)絡(luò)系統(tǒng)數(shù)據(jù),是運(yùn)用服務(wù)器雙機(jī)熱備讀取服務(wù)器中央存儲設(shè)備中所有站點(diǎn)的數(shù)據(jù),然后進(jìn)行儲存并對數(shù)據(jù)實行專業(yè)的管理,這樣數(shù)據(jù)的保密性、可靠性和安全性大大提高。用戶的數(shù)據(jù)存放在外接共享磁盤陣列中,備份機(jī)在工作機(jī)發(fā)生故障時,能及時接管主機(jī)的工作,為服務(wù)器應(yīng)用系統(tǒng)提供服務(wù)。
2 數(shù)據(jù)庫雙機(jī)熱備方式
數(shù)據(jù)庫雙機(jī)熱備份技術(shù)包括共享方式和鏡像方式,其中鏡像方式又可稱為純軟件方式。
簡單的說,服務(wù)器雙機(jī)熱備共享方式就是將數(shù)據(jù)庫存儲在共享的設(shè)備上。正常情況下,服務(wù)器能夠讀取存儲設(shè)備上的數(shù)據(jù),當(dāng)然,在轉(zhuǎn)換系統(tǒng)后備份機(jī)也可直接在存儲設(shè)備上讀寫。
雙機(jī)熱備鏡像方式,是指在另一臺服務(wù)器上運(yùn)用系統(tǒng)鏡像軟件實時復(fù)制數(shù)據(jù),確保兩臺服務(wù)器上數(shù)據(jù)存儲同步,若一臺失效則另一臺可以及時運(yùn)作。雙機(jī)熱備鏡像方式具有以下優(yōu)點(diǎn):避免了服務(wù)器磁盤陣列的單點(diǎn)故障、不受距離的限制、節(jié)省了投資。鏡像方式不僅可以增強(qiáng)服務(wù)器部署的靈活性,同時其安全性也得到了提高。
在投資充裕、數(shù)據(jù)量大于1T的情況下,建議在選擇數(shù)據(jù)庫雙機(jī)熱備時采用共享存儲設(shè)備的方式(比如磁盤陣列),需注意的是要盡量選擇富有可靠性的設(shè)備以及考慮雙控制器的方案。否則就應(yīng)該選擇數(shù)據(jù)庫雙機(jī)熱備鏡像方式,此時選擇的產(chǎn)品必須是成熟可靠的。
3 雙機(jī)熱備工作原理
服務(wù)器雙機(jī)熱備份技術(shù)連接主系統(tǒng)與備用系統(tǒng),是通過“心跳”方法?!靶奶笔侵竷蓚€系統(tǒng)之間發(fā)送的通訊信號,是按一定的時間為間隔,以監(jiān)測各自系統(tǒng)運(yùn)行狀態(tài)的正常與否。,雙機(jī)熱備份主系統(tǒng)出現(xiàn)故障或者其“心跳”信號未能被備用的系統(tǒng)接收時,“心跳”停止,系統(tǒng)管理軟件做出反應(yīng),停止主機(jī)運(yùn)作,備用系統(tǒng)開始接收系統(tǒng)資源,取代主機(jī)地位,接替主系統(tǒng)的工作,確保網(wǎng)絡(luò)服務(wù)能夠不受其影響。
硬盤的問題通過RAID技術(shù)解決,系統(tǒng)出現(xiàn)問題后的恢復(fù)則由數(shù)據(jù)備份解決,它們的重要性顯而易見。但是它們不能避免服務(wù)中斷問題的出現(xiàn),若服務(wù)器存在故障,則將導(dǎo)致服務(wù)器的中斷。此時服務(wù)器雙機(jī)熱備份技術(shù)的重要性突顯,尤其是對于需要持續(xù)可靠地提供應(yīng)用服務(wù)的系統(tǒng)。
4 雙機(jī)容錯備份系統(tǒng)具體應(yīng)用
4.1 服務(wù)器硬件建議需要4G以上的內(nèi)存
內(nèi)存將優(yōu)先被Oracle數(shù)據(jù)庫中的運(yùn)算使用,在內(nèi)存不足時Oracle臨時表空間將發(fā)揮作用,兩者的速度具有4個數(shù)量級的差距。RAID磁盤陣列可以外掛或機(jī)內(nèi)陣列,其中RAID1鏡像需要兩塊硬盤,而RAID5奇偶校驗的硬盤數(shù)要求比RAID1多,至少需要三塊,但不一定是服務(wù)器廠商的標(biāo)準(zhǔn)配置。 在購置PC服務(wù)器時建議購買兩臺相同的服務(wù)器。只要保證硬盤正常,即使數(shù)據(jù)庫服務(wù)器硬件存在故障,只需在OPAC服務(wù)器上安裝該硬盤,這樣館內(nèi)的業(yè)務(wù)就可以在幾分鐘內(nèi)得到正常運(yùn)行,并且與服務(wù)器雙機(jī)熱備份系統(tǒng)相比,減少了硬件成本。
4.2 雙機(jī)熱備系統(tǒng)要求
1)以客戶發(fā)展需求為出發(fā)點(diǎn),將群集服務(wù)器及其應(yīng)用程序的數(shù)量擴(kuò)大;個別故障可以單獨(dú)進(jìn)行修復(fù),節(jié)約了系統(tǒng)復(fù)原的時間;功能多樣,可以監(jiān)察修復(fù)故障,然后排除故障;在出現(xiàn)故障時,服務(wù)器動態(tài)負(fù)載調(diào)節(jié)將應(yīng)用程序均勻分配至不同的服務(wù)器上;現(xiàn)在服務(wù)器系統(tǒng)的各個環(huán)節(jié)能夠與開放式APIS和模塊構(gòu)造相結(jié)合,保證服務(wù)器端對端的可靠性;靈活可調(diào)的群集構(gòu)造,能夠為日后擴(kuò)展作足準(zhǔn)備。
2)將環(huán)境中的資源作為一個整體看待。使用單一的配置數(shù)據(jù)庫(為避免單點(diǎn)失效,復(fù)制多份);管理規(guī)則的統(tǒng)一和應(yīng)用腳本的集中整合系統(tǒng)中的資源,形成一個資源集。不限制集群內(nèi)的主機(jī)數(shù)量,并提供多TCP/IP連接、獨(dú)立網(wǎng)絡(luò)檢測、利用磁盤作為通道和通過通信等方式進(jìn)行心跳偵測以及通信。
3)提供自適配通信環(huán)境,使用智能式?jīng)Q策過程來檢測服務(wù)器以及應(yīng)用程序的故障并使之正常運(yùn)行。智能式檢測及恢復(fù)的同時,提供了故障負(fù)載平衡。
4)多臺服務(wù)器的群集受到支持,并監(jiān)視著群集內(nèi)每個應(yīng)用程序的正常運(yùn)作。并且提供單故障服務(wù)器和應(yīng)用程序切換。當(dāng)服務(wù)器或應(yīng)用程序存在故障時,及時將故障的服務(wù)組切換到其它服務(wù)器上,使原服務(wù)器和應(yīng)用程序能夠不受影響,繼續(xù)運(yùn)行。
5 雙機(jī)容錯備份系統(tǒng)測試
設(shè)置雙機(jī)互援、雙機(jī)熱切換,一開始先將磁盤陣列上的硬盤做成RAID5并映射出兩個通道,然后用SCSI外置線纜分別連接到兩臺服務(wù)器上,安裝上Windows 2003系統(tǒng)。若連接正確,則每臺服務(wù)器的磁盤管理中都將多出一個磁盤1,此時磁盤陣列可以被兩臺服務(wù)器共享,在應(yīng)用網(wǎng)頁服務(wù)器及大型數(shù)據(jù)庫時,文件目錄指向該服務(wù)器磁盤陣列使得其脫離服務(wù)器而存在,當(dāng)系統(tǒng)發(fā)生故障時,數(shù)據(jù)不再丟失,大大提高了資料的安全性。隨后在兩臺服務(wù)器中安裝集群軟件,連接心跳線,同時啟動該軟件,此時兩臺服務(wù)器都呈開啟狀態(tài)且中間心跳線為綠色,此時為方便開啟對外服務(wù)需要設(shè)置公共的IP地址。兩臺服務(wù)器分別設(shè)為開啟狀態(tài)和休眠狀態(tài)。在可用的局域網(wǎng)里,運(yùn)用電腦C進(jìn)行測試,執(zhí)行“PING+公共IP地址+-t”的命令,隨后數(shù)據(jù)包將不斷地被發(fā)送至該地址。電腦C屏幕在拔掉開啟狀態(tài)的服務(wù)器網(wǎng)線后會顯示連接斷開,雖然開啟狀態(tài)的服務(wù)器圖標(biāo)變黑,但是服務(wù)器的屏幕顯示休眠狀態(tài)的服務(wù)器開啟,這時電腦C恢復(fù)連接,說明成功進(jìn)行了熱切換。
6 總結(jié)
由于不同部門有著各自的特點(diǎn),所以容錯備份方案不是一成不變的,每個部門應(yīng)該根據(jù)自己的特點(diǎn),結(jié)合自身實際,建立起一套適合自身的容錯熱備份機(jī)制,以防未然,確保了數(shù)據(jù)庫的安全、完整以及正確。數(shù)據(jù)備份可以提高數(shù)據(jù)的安全性,RAID和雙機(jī)都是一種實時的備份。任何問題都將在多份數(shù)據(jù)中同時發(fā)生影響,這些問題包括軟件錯誤、病毒影響、誤操作等。所以在采用服務(wù)器雙機(jī)熱備份方案的同時還要備份關(guān)鍵業(yè)務(wù)的數(shù)據(jù),以防數(shù)據(jù)損壞、丟失。
參考文獻(xiàn):
[1] 莫里斯-墨菲. Oracle9i數(shù)據(jù)庫管理員.II.備份/恢復(fù)與網(wǎng)絡(luò)管理[M]. 清華大學(xué)出版社,2004.
[2] 袁由光.容錯計算原理[M]. 哈爾濱工程大學(xué)出版社,2006.
[3] 張暉.基于ISIS協(xié)議的雙備份處理解決方案[J]. 南京工程學(xué)院學(xué)報:自然科學(xué)版,2013(4).
[4] 管東華.博物館數(shù)字資源的保證——容災(zāi)備份[J]. 博物館研究,2013(4).