劉建
[摘 要]當(dāng)前流行的服務(wù)器容錯技術(shù)可以分成以下三種:服務(wù)器群集技術(shù)、雙機(jī)熱備份技術(shù)和單機(jī)容錯技術(shù)。它們各自所對應(yīng)的容錯級別是從低到高的,也就是說服務(wù)器群集技術(shù)容錯級別最低,而單機(jī)容錯技術(shù)級別最高。由此可知它們各自應(yīng)用的行業(yè)容錯級別需求也是從低到高的。本文主要介紹后兩種容錯技術(shù)。
[關(guān)鍵詞]單機(jī)容錯 雙機(jī)熱備份 冗余
中圖分類號:TP309 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2016)21-0157-01
1、雙機(jī)熱備份技術(shù)
雙機(jī)熱備份就是使用互為備份的兩臺服務(wù)器共同執(zhí)行同一服務(wù),其中一臺主機(jī)為工作機(jī)(Primary Server),另一臺主機(jī)為備份機(jī)(Standby Server)。在系統(tǒng)正常情況下,工作機(jī)為應(yīng)用系統(tǒng)提供服務(wù),備份機(jī)監(jiān)視工作機(jī)的運(yùn)行情況(工作機(jī)同時也在檢測備份機(jī)是否正常),當(dāng)工作機(jī)出現(xiàn)異常,不能支持應(yīng)用系統(tǒng)運(yùn)營時,備份機(jī)主動接管工作機(jī)的工作,繼續(xù)支持關(guān)鍵應(yīng)用服務(wù),保證系統(tǒng)不間斷的運(yùn)行。
2、單機(jī)容錯技術(shù)
從上面的分析我們知道,雙機(jī)熱備份技術(shù)所采用的是兩臺配置完全一樣的服務(wù)器系統(tǒng),其實服務(wù)器群集方案中的容錯技術(shù)也是一種多服務(wù)器容錯技術(shù)。而本節(jié)所要介紹的單機(jī)容錯技術(shù)則是在一臺服務(wù)器實現(xiàn)高性能容錯的,它的容錯能力要遠(yuǎn)比服務(wù)器群集和雙機(jī)熱備份中容錯能力要高,所以更加適合那些如證券、電信、金融、醫(yī)療等對容錯能力特別苛刻的行業(yè)。以往的集群系統(tǒng)在出現(xiàn)故障的情況下,需要中斷服務(wù)器的運(yùn)行,然后用一定的時間切換至備用的服務(wù)器上面進(jìn)行運(yùn)行,才能進(jìn)行維修和恢復(fù),這其中所付出的成本和帶來的損失是用戶最不愿意看到的。具有容錯技術(shù)的容錯服務(wù)器,最大的優(yōu)勢就在于它能夠自動分離故障模塊,在不中斷運(yùn)行的情況下,進(jìn)行模塊調(diào)換,對損壞的部件進(jìn)行維護(hù),并且在一切物理故障消除后,系統(tǒng)會自動重新同步運(yùn)行,從而有效的解決了客戶的后顧之憂。正因如此,具有容錯技術(shù)的容錯服務(wù)器,正在沖擊前幾年興起的雙機(jī)熱備份和集群技術(shù),越來越被人們所關(guān)注。同時,更為難得的是它可以在采用符合工業(yè)標(biāo)準(zhǔn)部件的服務(wù)器中實現(xiàn)(IA架構(gòu)服務(wù)器),極具競爭力的成本優(yōu)勢,更使得容錯服務(wù)器令人刮目相看。
3、雙機(jī)熱備的選擇條件和步驟
雙機(jī)熱備針對的是服務(wù)器的故障。而服務(wù)器一般都存儲著公司的重要信息,如果突然出現(xiàn)問題,損失是不可估量的,所以雙機(jī)熱備對各大企業(yè)來說都是一個好的選擇。
在考慮雙機(jī)熱備時,需要注意,一般意義上的雙機(jī)熱備都會有一個切換過程,這個切換過程可能是一分鐘左右。在切換過程中,服務(wù)是有可能短時間中斷的。但是,當(dāng)切換完成后,服務(wù)將正?;謴?fù)。因此,雙機(jī)熱備不是無縫、不中斷的,但它能夠保證在出現(xiàn)系統(tǒng)故障時,能夠很快恢復(fù)正常的服務(wù),業(yè)務(wù)不致受到影響。而如果沒有雙機(jī)熱備,則一旦出現(xiàn)服務(wù)器故障,可能會出現(xiàn)幾個小時的服務(wù)中斷,對業(yè)務(wù)的影響就可能會很嚴(yán)重。另有一點需要強(qiáng)調(diào),即服務(wù)器的故障與交換機(jī)、存儲設(shè)備的故障不同,其概念要高得多。原因在于服務(wù)器是比交換機(jī)、存儲設(shè)備復(fù)雜得多的設(shè)備,同時也是既包括硬件、也包括操作系統(tǒng)、應(yīng)用軟件系統(tǒng)的復(fù)雜系統(tǒng)。不僅設(shè)備故障可能引起服務(wù)中斷,而且軟件方面的問題也可能導(dǎo)致服務(wù)器不能正常工作。
3.1何時應(yīng)該采用雙機(jī)熱備呢?
用戶可以根據(jù)系統(tǒng)的重要性以及終端用戶對服務(wù)中斷的容忍程度決定是否使用雙機(jī)熱備。比如網(wǎng)絡(luò)中的用戶最多能容忍多長時間恢復(fù)服務(wù)?如果服務(wù)不能很快恢復(fù)會造成什么樣的后果等。對于承擔(dān)企業(yè)關(guān)鍵業(yè)務(wù)應(yīng)用的服務(wù)器需要極高的穩(wěn)定性和可用性,需要7×24不間斷服務(wù),推薦使用雙機(jī)熱備。
3.2選擇與實施雙機(jī)熱備的三個步驟
我們可以把雙機(jī)熱備簡單理解成使用互為備份的兩臺服務(wù)器共同執(zhí)行同一服務(wù),其中一臺主機(jī)為工作機(jī)(Primary Server),另一臺主機(jī)為備份機(jī)(Standby Server)。
(1) 雙機(jī)熱備以應(yīng)用為主導(dǎo),以高可用性為宗旨,分析需求的必要性。
(2)雙機(jī)熱備選擇確定具體的設(shè)備、軟件的型號等。需要注意的是: 不同的軟件或是硬盤等存儲設(shè)備,他們之間存在兼容性的問題,因此在購買之前應(yīng)咨詢專業(yè)人員,避免出現(xiàn)采購了雙機(jī)軟件后對相關(guān)的存儲設(shè)備存在不兼容等現(xiàn)象。
(3)雙機(jī)熱備在實施完成后,一定要進(jìn)行測試,以確保工作正常,而且應(yīng)注意在運(yùn)行過程中定期的對系統(tǒng)是否能夠正常切換進(jìn)行測試。
4、結(jié)束語
雖然服務(wù)器還有很多防護(hù)措施,比如:磁盤陣列(RAID)、數(shù)據(jù)備份。這些方法固然是非常重要,但它們還是無法代替雙機(jī)熱備的作用。另外,雙機(jī)熱備份方式由于需要至少2臺服務(wù)器,導(dǎo)致在軟件采購(操作系統(tǒng)、中間件、雙機(jī)備份軟件等)、軟件維護(hù)升級、系統(tǒng)硬件升級都需要比單機(jī)容錯方式多1倍的額外投入,而且在雙機(jī)備份軟件出現(xiàn)故障后,其維修的難度較高,對客戶會帶來較大困難。因此雖然單機(jī)容錯服務(wù)器的硬件成本高于雙機(jī)備份方式的硬件投入,而其總成本(TCO)卻遠(yuǎn)遠(yuǎn)低于雙機(jī)備份方式的成本。但是就其靈活配置方面,雙機(jī)熱備份方案更具優(yōu)勢,許多熱備份方案都是由一些系統(tǒng)集成商組合不同廠家服務(wù)器產(chǎn)品進(jìn)行的,可以滿足不同客戶需求。