李 峰 曹 中 劉正偉
摘 要:隨著現(xiàn)代化信息技術(shù)的發(fā)展和企業(yè)信息化進(jìn)程的推進(jìn),信息應(yīng)用系統(tǒng)已經(jīng)推廣到企業(yè)日常辦公的各個(gè)領(lǐng)域。應(yīng)用系統(tǒng)的高度自動(dòng)化為以往的工作帶來(lái)很大的方便,同時(shí)也提高了工作效率,企業(yè)的運(yùn)轉(zhuǎn)已經(jīng)離不開(kāi)應(yīng)用系統(tǒng)的支持。所以對(duì)于企業(yè)重要的應(yīng)用系統(tǒng)而言,保證系統(tǒng)持續(xù)、可靠地提供服務(wù)是非常重要的。財(cái)務(wù)系統(tǒng)作為企業(yè)中最核心業(yè)務(wù)應(yīng)用之一,對(duì)于穩(wěn)定性、安全性和高可用性有著極高的要求,尤其是在財(cái)務(wù)部門(mén)月底做報(bào)表的時(shí)候,財(cái)務(wù)服務(wù)器是絕對(duì)不允許出故障的。
關(guān)鍵詞:雙機(jī)備份;安全性;節(jié)點(diǎn);財(cái)務(wù)系統(tǒng)
中圖分類號(hào):TP309文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1004-373X(2009)03-097-03
Application of Information Technology to Build Digital Enterprise
LI Feng CAO Zhong2,LIU Zhengwei1
(1.Science & Technology Agency,Dagang Petrochemistry Company,Tianjin,300280,China;
2.Information Conter,Dagang Petrochemistry Company,Tianjin,300280,China)
Abstract:With the development of modern information technology,information technology and business process forward,Application of information systems has been extended to enterprises in all areas of day-to-day office.Application of a high degree of automation in the past for the work of a great convenience,but also improved the efficiency of business operation has involved the application of the system.For important business applications,to ensure continuous,reliable delivery of services is very important.The financial system as a business in one of the most core business applications,for stability,security,high availability and has very high requirements,especially in the financial sector to do at the end of statements,the financial server is not allowed out of trouble.
Keywords:two machine back-up;security;node;financial system
1 服務(wù)器容錯(cuò)技術(shù)簡(jiǎn)介
目前主流應(yīng)用的服務(wù)器容錯(cuò)技術(shù)有三類,它們分別是:服務(wù)器群集技術(shù)、雙機(jī)熱備份技術(shù)和單機(jī)容錯(cuò)技術(shù)。它們各自所對(duì)應(yīng)的容錯(cuò)級(jí)別是從低到高的,也就是說(shuō)服務(wù)器群集技術(shù)容錯(cuò)級(jí)別最低,而單機(jī)容錯(cuò)技術(shù)級(jí)別最高。決定使用哪種服務(wù)器容錯(cuò)技術(shù),正確的方法是要分析一下系統(tǒng)的重要性以及用戶對(duì)服務(wù)中斷的容忍程度,即系統(tǒng)用戶能容忍多長(zhǎng)時(shí)間的服務(wù)中斷,如果服務(wù)器不能盡快恢復(fù)會(huì)造成多大的影響。
1.1 集群技術(shù)
所謂集群就是共同為客戶機(jī)提供網(wǎng)絡(luò)資源的一組計(jì)算機(jī)系統(tǒng)。而其中的每一臺(tái)提供服務(wù)的計(jì)算機(jī),稱之為節(jié)點(diǎn)。當(dāng)一個(gè)節(jié)點(diǎn)不可用或者不能處理客戶的請(qǐng)求時(shí),該請(qǐng)求將會(huì)轉(zhuǎn)到另外的可用節(jié)點(diǎn)來(lái)處理,而這些對(duì)于客戶端來(lái)說(shuō),它根本不必關(guān)心這些要使用資源的具體位置,集群系統(tǒng)會(huì)自動(dòng)完成。集群中節(jié)點(diǎn)可以以不同的方式來(lái)運(yùn)行,這要看它們是如何設(shè)置的。在一個(gè)理想的兩個(gè)節(jié)點(diǎn)的集群中,兩個(gè)服務(wù)器都同時(shí)處于活動(dòng)狀態(tài),也就是在兩個(gè)節(jié)點(diǎn)上同時(shí)運(yùn)行相同的應(yīng)用程序,當(dāng)一個(gè)節(jié)點(diǎn)出現(xiàn)故障時(shí),運(yùn)行在出故障的節(jié)點(diǎn)上的應(yīng)用程序就會(huì)轉(zhuǎn)移到另外的沒(méi)有出現(xiàn)故障的節(jié)點(diǎn)上,這樣一來(lái),由于兩個(gè)節(jié)點(diǎn)的工作現(xiàn)在由一臺(tái)服務(wù)器來(lái)承擔(dān),自然會(huì)影響服務(wù)器的性能。針對(duì)這種情況的解決方案是,在正常操作時(shí),另一個(gè)節(jié)點(diǎn)處于備用狀態(tài),只有當(dāng)前活動(dòng)的節(jié)點(diǎn)出現(xiàn)故障時(shí)該備用節(jié)點(diǎn)才會(huì)接管工作,但這并不是一個(gè)經(jīng)濟(jì)的方案,因?yàn)槟悴坏貌毁I(mǎi)兩臺(tái)服務(wù)器來(lái)做一臺(tái)服務(wù)器的工作。雖然當(dāng)出現(xiàn)故障時(shí)不會(huì)對(duì)性能產(chǎn)生任何影響,但是在正常運(yùn)行時(shí)的性能價(jià)格比并不太高。
1.2 雙機(jī)備份技術(shù)
雙機(jī)熱備份技術(shù):是一種軟硬件結(jié)合的較高容錯(cuò)應(yīng)用方案。該方案是由兩臺(tái)服務(wù)器系統(tǒng)和一個(gè)外接共享磁盤(pán)陣列柜(也可沒(méi)有,而是在各自的服務(wù)器中采取RAID卡)及相應(yīng)的雙機(jī)熱備份軟件組成。原理如圖1所示。在這個(gè)容錯(cuò)方案中,操作系統(tǒng)和應(yīng)用程序安裝在兩臺(tái)服務(wù)器的本地硬盤(pán)上,整個(gè)應(yīng)用系統(tǒng)的數(shù)據(jù)是通過(guò)磁盤(pán)陣列集中管理的。數(shù)據(jù)集中管理是通過(guò)雙機(jī)熱備份軟件,將所有站點(diǎn)的數(shù)據(jù)直接從中央存儲(chǔ)設(shè)備讀取和存儲(chǔ),并由專業(yè)人員進(jìn)行管理,極大地保護(hù)了數(shù)據(jù)的安全性和保密性。用戶的數(shù)據(jù)存放在外接共享磁盤(pán)陣列中,在一臺(tái)服務(wù)器出現(xiàn)故障時(shí),備機(jī)主動(dòng)替代主機(jī)工作,保證網(wǎng)絡(luò)服務(wù)不間斷。
雙機(jī)熱備份的工作模式即目前通常所說(shuō)的active/standby方式,active服務(wù)器處于工作狀態(tài);standby服務(wù)器處于監(jiān)控準(zhǔn)備狀態(tài),服務(wù)器工作時(shí)將數(shù)據(jù)寫(xiě)入共享磁盤(pán)陣列(或同時(shí)向兩臺(tái)或多臺(tái)服務(wù)器寫(xiě)入,通常各服務(wù)器采用RAID磁盤(pán)陣列卡),保證數(shù)據(jù)的即時(shí)同步。當(dāng)active服務(wù)器出現(xiàn)故障的時(shí)候,通過(guò)軟件診測(cè)或手工方式將standby機(jī)器激活,保證應(yīng)用服務(wù)在短時(shí)間內(nèi)完全恢復(fù)正常使用。雙機(jī)熱備典技術(shù)型應(yīng)用在證券資金服務(wù)器或行情服務(wù)器,這是目前采用較多的一種模式。
雙機(jī)互備模式:是兩個(gè)相對(duì)獨(dú)立的應(yīng)用在兩臺(tái)機(jī)器同時(shí)運(yùn)行,但彼此均設(shè)為備機(jī),當(dāng)某一臺(tái)服務(wù)器出現(xiàn)故障時(shí),另一臺(tái)服務(wù)器可以在短時(shí)間內(nèi)將故障服務(wù)器的應(yīng)用接管過(guò)來(lái),從而保證了應(yīng)用的持續(xù)性,但對(duì)服務(wù)器的性能要求比較高。
雙機(jī)雙工模式:是目前cluster(群集)的一種形式,兩臺(tái)服務(wù)器均為活動(dòng),同時(shí)運(yùn)行相同的應(yīng)用,保證整體的性能,也實(shí)現(xiàn)了負(fù)載均衡和互為備份,需要利用磁盤(pán)柜存儲(chǔ)技術(shù)(最好采用San方式)。WEB服務(wù)器或FTP服務(wù)器等用此種方式比較多。
1.3 單機(jī)容錯(cuò)技術(shù)
單機(jī)容錯(cuò)技術(shù)則是在一臺(tái)服務(wù)器上實(shí)現(xiàn)高性能容錯(cuò)的,它的容錯(cuò)能力要遠(yuǎn)比服務(wù)器群集和雙機(jī)熱備份中容錯(cuò)能力要高。容錯(cuò)服務(wù)器是通過(guò)CPU時(shí)鐘鎖頻,通過(guò)對(duì)系統(tǒng)中所有硬件的備份,包括CPU、內(nèi)存和I/O總線等的冗余備份,通過(guò)系統(tǒng)內(nèi)所有冗余部件的同步運(yùn)行,實(shí)現(xiàn)真正意義上的容錯(cuò)。系統(tǒng)任何部件的故障都不會(huì)造成系統(tǒng)停頓和數(shù)據(jù)丟失。
以往的集群系統(tǒng)在出現(xiàn)故障的情況下,需要中斷服務(wù)器的運(yùn)行,然后用一定的時(shí)間切換至備用的服務(wù)器才能進(jìn)行維修和恢復(fù),這在實(shí)時(shí)響應(yīng)要求非常高的應(yīng)用領(lǐng)域是不可容忍的。具有容錯(cuò)技術(shù)的容錯(cuò)服務(wù)器,最大的優(yōu)勢(shì)就在于它能夠自動(dòng)分離故障模塊,在不中斷運(yùn)行的情況下,進(jìn)行模塊調(diào)換,對(duì)損壞的部件進(jìn)行維護(hù),并且在一切物理故障消除后,系統(tǒng)會(huì)自動(dòng)重新同步運(yùn)行,從而有效的解決了客戶的后顧之憂。
雙機(jī)熱備份和容錯(cuò)服務(wù)器的定位稍微有些不同,這是由兩者實(shí)現(xiàn)的可用性差別決定的。雙機(jī)熱備份一般可以實(shí)現(xiàn)99.9%的可用性,容錯(cuò)服務(wù)器卻可以實(shí)現(xiàn)99.999%的可用性。雙機(jī)熱備份大多應(yīng)用在業(yè)務(wù)連續(xù)性不是很?chē)?yán)格的行業(yè),比如說(shuō)公安系統(tǒng)、部隊(duì)系統(tǒng)或者個(gè)別的制造企業(yè),這些行業(yè)的應(yīng)用允許數(shù)據(jù)有一小段時(shí)間的中斷。而如電信、金融、證券和醫(yī)療等要求高的行業(yè)則是容錯(cuò)服務(wù)器的天下。
2 雙機(jī)熱備技術(shù)在大港石化公司財(cái)務(wù)系統(tǒng)中的應(yīng)用
結(jié)合石化公司財(cái)務(wù)處的需求及高可用性方面的考慮,按照財(cái)務(wù)系統(tǒng)的架構(gòu),對(duì)原有進(jìn)行系統(tǒng)的全面升級(jí)改造,使用共享存儲(chǔ)的雙機(jī)熱備形式來(lái)提高整個(gè)系統(tǒng)的可用性。應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器分別采用雙機(jī)技術(shù),使用共享的光存儲(chǔ)設(shè)備。兩組服務(wù)器采用光纖通道同磁盤(pán)陣列相連接,SYBASE數(shù)據(jù)庫(kù)文件及應(yīng)用服務(wù)器數(shù)據(jù)文件保存在共享磁盤(pán)陣列中。兩臺(tái)服務(wù)器采用active/standby方式,在工作過(guò)程中,兩臺(tái)服務(wù)器以一個(gè)虛擬的IP地址對(duì)外提供服務(wù),雙機(jī)熱備軟件控制服務(wù)器的響應(yīng),將服務(wù)請(qǐng)求發(fā)送給active服務(wù)器處理。同時(shí)standby服務(wù)器通過(guò)心跳線(目前往往采用建立私有網(wǎng)絡(luò)的方式)偵測(cè)另一臺(tái)服務(wù)器的工作狀況。當(dāng)active服務(wù)器出現(xiàn)故障時(shí),standby服務(wù)器根據(jù)心跳偵測(cè)的情況做出判斷,并進(jìn)行切換,接管服務(wù)。對(duì)于用戶而言,這一過(guò)程是全自動(dòng)的,在很短時(shí)間內(nèi)完成,從而對(duì)業(yè)務(wù)不會(huì)造成影響。
2.1 硬件配置
本系統(tǒng)由4臺(tái)IBMx3560服務(wù)器作為系統(tǒng)的硬件業(yè)務(wù)平臺(tái),其中2臺(tái)為應(yīng)用服務(wù)器業(yè)務(wù)平臺(tái),組成雙機(jī)熱備組,另外2臺(tái)作為數(shù)據(jù)庫(kù)服務(wù)器硬件平臺(tái),組成雙機(jī)熱備組;1臺(tái)EMC AX4-5存儲(chǔ)盤(pán)陣作為共享存儲(chǔ)平臺(tái),數(shù)據(jù)庫(kù)服務(wù)器及應(yīng)用服務(wù)器的相關(guān)數(shù)據(jù)以共享的形式保存在盤(pán)陣上;2臺(tái)Cisco 9124光纖通道交換機(jī),同磁盤(pán)陣列、服務(wù)器一起組成SAN存儲(chǔ)網(wǎng)絡(luò)。
2.2 軟件配置
在本項(xiàng)目中由于存在多條冗余路徑,所以對(duì)多路徑如何進(jìn)行管理就成為了提高系統(tǒng)運(yùn)行效率和系統(tǒng)穩(wěn)定性的重要因素,基于穩(wěn)定性和效率方面的考慮,采用了EMC的PwoerPath軟件來(lái)管理多條I/O通路間的負(fù)載均衡。
EMC PowerPathTM軟件用于增強(qiáng)存儲(chǔ)環(huán)境中開(kāi)放系統(tǒng)的運(yùn)行性能,使服務(wù)器可以在較少的時(shí)間內(nèi)完成更多的工作,并消除I/O通路中的單點(diǎn)故障。PowerPath工作原理如圖2所示。
在PowerPath體系結(jié)構(gòu)中使用的設(shè)備:PowerPath在邏輯設(shè)備和物理設(shè)備的可用通路之間提供一對(duì)多映射。如果不使用PowerPath,映射關(guān)系是一對(duì)一映射的,一個(gè)設(shè)備只存在一個(gè)有效通路。原理如圖3所示。
PowerPath軟件體系結(jié)構(gòu):PowerPath軟件具有一個(gè)“強(qiáng)大的驅(qū)動(dòng)器”,它放置在主機(jī)上,位于主機(jī)總線適配器(HBA)設(shè)備層之上。這個(gè)透明的部件使得PowerPath可以創(chuàng)建虛擬的“強(qiáng)力設(shè)備”,為EMC存儲(chǔ)系統(tǒng)提供防止故障和負(fù)載均衡的通路。
雙機(jī)熱備的核心軟件選擇的是EMC AutoStart雙機(jī)熱備軟件。在服務(wù)器上安裝Autostart集群管理軟件,通過(guò)策略腳本對(duì)熱備組服務(wù)器之間的切換進(jìn)行控制。
EMC AutoStart支持無(wú)限制主機(jī)數(shù)量的群集組合,EMC AutoStart能按客戶發(fā)展需求增加EMC AutoStart群集服務(wù)器及所載應(yīng)用程序數(shù)量;提供故障監(jiān)察、修復(fù)、重新啟動(dòng)及排除故障功能;能單獨(dú)修復(fù)個(gè)別故障應(yīng)用,縮短系統(tǒng)復(fù)原時(shí)間;動(dòng)態(tài)負(fù)載調(diào)節(jié),確保故障出現(xiàn)時(shí),應(yīng)用程序能平均地分布在不同服務(wù)器上;靈活、可靠、可調(diào)的群集構(gòu)造,為日后擴(kuò)展作好充分的準(zhǔn)備;模塊構(gòu)造和開(kāi)放式APIs與現(xiàn)在系統(tǒng)的各個(gè)環(huán)節(jié)配合,確保端對(duì)端可靠性;協(xié)同數(shù)據(jù)庫(kù)及RDBMS數(shù)據(jù)備份服務(wù)器;提供中央管理,監(jiān)察群集組內(nèi)不同的UNIX平臺(tái)。EMC AutoStart的這些關(guān)鍵技術(shù)可以為系統(tǒng)提供高可用性,可管理性和擴(kuò)展性。
2.3 系統(tǒng)實(shí)施
在這套雙機(jī)系統(tǒng)中,為每臺(tái)服務(wù)器配置2塊千兆以太網(wǎng)卡,其中1塊Ethernet作為HeartBeat(心跳)線接口,HeartBeat線通過(guò)交叉線相連。Heartbeat接口配置雙機(jī)熱備組的私用IP地址,用于相互監(jiān)視對(duì)方的健康狀況。另外1個(gè)Ethernet網(wǎng)口用于配置服務(wù)器實(shí)際IP地址,把服務(wù)器接入到財(cái)務(wù)專用網(wǎng)絡(luò)上,原有的防火墻等安全設(shè)備配置不變。
在存儲(chǔ)共享的實(shí)現(xiàn)上,為每臺(tái)服務(wù)器安裝2塊FC HBA卡,2塊HBA卡互為備份,通過(guò)兩臺(tái)光纖交換機(jī)同磁盤(pán)陣列進(jìn)行連接,這樣就可以組合出多條訪問(wèn)存儲(chǔ)設(shè)備的通路。
在解決雙機(jī)監(jiān)控方面,在每臺(tái)服務(wù)器上安裝EMC AutoStar雙機(jī)管理軟件。通檢測(cè)服務(wù)器的網(wǎng)絡(luò)連接狀態(tài)、服務(wù)器關(guān)鍵服務(wù)進(jìn)程狀態(tài)及雙機(jī)與共享盤(pán)陣的連接狀態(tài)控制雙機(jī)的切換。EMC AutoStar雙機(jī)軟件支持虛擬IP技術(shù),將active主機(jī)和standby的IP虛擬為對(duì)外工作IP。一旦active服務(wù)器的檢測(cè)狀態(tài)發(fā)現(xiàn)異常,AutoStar會(huì)立刻激活standby服務(wù)器,接管故障服務(wù)器上所有的服務(wù),整個(gè)切換過(guò)程對(duì)用戶不會(huì)造成大的影響,而且是對(duì)用戶透明的。
3 結(jié) 語(yǔ)
整個(gè)系統(tǒng)在實(shí)施完成之后實(shí)現(xiàn)了以下功能:實(shí)現(xiàn)數(shù)據(jù)及應(yīng)用的分離存儲(chǔ),整個(gè)系統(tǒng)的數(shù)據(jù)都保存在外部存儲(chǔ)盤(pán)陣上,避免了由于服務(wù)器硬件損壞而導(dǎo)致的數(shù)據(jù)丟失;關(guān)鍵性部件和SAN存儲(chǔ)通道均實(shí)現(xiàn)了冗余配置,基本消除了單點(diǎn)故障的可能性;服務(wù)器之間進(jìn)行雙機(jī)熱備份,即應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器都是有兩臺(tái)一樣的機(jī)器組成的熱備組,熱備組中的一臺(tái)機(jī)器發(fā)生問(wèn)題(軟件或硬件方面)服務(wù)后,另外一臺(tái)機(jī)器會(huì)迅速接管故障機(jī)器的應(yīng)用,整個(gè)切換過(guò)程是由AutoStart雙機(jī)軟件根據(jù)策略自動(dòng)進(jìn)行的,無(wú)需管理員手動(dòng)干預(yù),系統(tǒng)切換的速度快,簡(jiǎn)化了系統(tǒng)維護(hù)工作量。
參考文獻(xiàn)
[1]馬紀(jì)穎,朱力軍,張顏.Web信息檢索中信息分類計(jì)數(shù)研究[J].現(xiàn)代電子技術(shù),2008,31(10):76-78.
[2]格巴斯.Sybase ASE12.5性能優(yōu)化.張崇文,譯.北京:電子工業(yè)出版社,2005.
[3]袁科萍,岑崗,攀慶紅.Unix Shell編程.3版.北京:中國(guó)鐵道出版社,2004.
[4]馮海軍.雙機(jī)熱備技術(shù)的應(yīng)用[J].科技信息,2008(14):27-28.
[5]楊銳,冷祥.三層交換技術(shù)在局域網(wǎng)中的應(yīng)用[J].電腦知識(shí)與技術(shù),2008,1(3):441-442.
[6]杜永春,張喜柱,陸長(zhǎng)福.財(cái)務(wù)管理.北京:新華出版社,1996.
[7]郭永基.可靠性工程原理[M].北京:清華大學(xué)出版社,2002.
[8]黎邵平,李錫文.雙機(jī)熱冗余控制系統(tǒng)的可靠性分析[J].自動(dòng)化技術(shù)與應(yīng)用,2006(12):18-20.
[9]鄭建立,路林吉.雙機(jī)熱冗余可修復(fù)容錯(cuò)控制系統(tǒng)的可靠性分析[J].中國(guó)紡織大學(xué)學(xué)報(bào),1999,25(1):67-69.
作者簡(jiǎn)介 李 峰 男,1973年出生,天津大港人,信息工程師。主要從事網(wǎng)絡(luò)信息通訊管理研究工作。
曹 中 女,天津大港人,主要從事油田網(wǎng)絡(luò)信息化系統(tǒng)研究工作。
劉正偉 男,天津大港人,主要從事油田網(wǎng)絡(luò)信息化系統(tǒng)研究工作。