張興彤 黃 勝
(四川啟明星鋁業(yè)有限責(zé)任公司,四川 眉山 620041)
四川啟明星鋁業(yè)有限責(zé)任公司在2002年新建廠時(shí),為了提高整個(gè)生產(chǎn)控制系統(tǒng)的穩(wěn)定性和存儲(chǔ)數(shù)據(jù)的安全性,在焙燒車間的焙燒火焰控制系統(tǒng)、煅燒車間的煅燒及余熱發(fā)電DCS系統(tǒng)、供電車間的供電綜合自動(dòng)化系統(tǒng)中均采用雙機(jī)熱備技術(shù)。系統(tǒng)還配備了以態(tài)網(wǎng)模塊和工業(yè)交換機(jī),用戶可以通過(guò)光纜與其他崗位進(jìn)行通信。由于完善的設(shè)計(jì),使得整個(gè)系統(tǒng)的穩(wěn)定性、安全性得到保障。自投產(chǎn)以來(lái),系統(tǒng)工作狀態(tài)非常穩(wěn)定,有力地保障了生產(chǎn)。雙機(jī)熱備技術(shù)從廣義上講就是使用兩臺(tái)服務(wù)器對(duì)重要的服務(wù)互相備份,共同執(zhí)行同一服務(wù),當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),可以由另一臺(tái)服務(wù)器承擔(dān)服務(wù)任務(wù),從而在不需要人工干預(yù)的情況下確保系統(tǒng)能持續(xù)提供服務(wù)。
雙機(jī)熱備份技術(shù)是一種軟硬件相結(jié)合的具有較高容錯(cuò)能力的解決方案。根據(jù)兩臺(tái)服務(wù)器的工作方式,在雙機(jī)備份方案中可以有三種不同的工作模式,即雙機(jī)熱備模式、雙機(jī)互備模式和雙機(jī)雙工模式。
①雙機(jī)熱備模式即目前通常所說(shuō)的active/standby方式,active服務(wù)器處于工作狀態(tài),而standby服務(wù)器處于監(jiān)控準(zhǔn)備狀態(tài)。當(dāng)active服務(wù)器出現(xiàn)故障時(shí),standby服務(wù)器通過(guò)軟件偵測(cè)或手工方式將standby機(jī)器激活,從而保證應(yīng)用在短時(shí)間內(nèi)完全恢復(fù)正常使用。
②雙機(jī)互備模式是指兩臺(tái)設(shè)備之間互相備份,彼此獨(dú)立工作,完成不同的數(shù)據(jù)類型傳輸(如設(shè)備甲傳輸A類業(yè)務(wù)數(shù)據(jù),設(shè)備乙傳輸B類業(yè)務(wù)數(shù)據(jù)),當(dāng)其中某一臺(tái)設(shè)備發(fā)生故障時(shí),另一臺(tái)設(shè)備在完成自己傳輸工作的同時(shí),接替另一臺(tái)設(shè)備的傳輸工作,達(dá)到備份的目的。但此模式對(duì)服務(wù)器的性能要求比較高,服務(wù)器配置相對(duì)較好。
③雙機(jī)雙工模式是目前Cluster(集群)的一種形式,兩臺(tái)服務(wù)器均為活動(dòng)狀態(tài),同時(shí)運(yùn)行相同的應(yīng)用,保證整體的性能,也實(shí)現(xiàn)了負(fù)載均衡和互為備份[1-2]。
雙機(jī)熱備有兩種實(shí)現(xiàn)模式,一種是基于共享的存儲(chǔ)設(shè)備的方式;另一種是沒(méi)有共享的存儲(chǔ)設(shè)備的方式,一般稱為純軟件方式。基于存儲(chǔ)共享的雙機(jī)熱備是雙機(jī)熱備的最佳方案。這種方式采用兩臺(tái)(或多臺(tái))服務(wù)器,使用共享的存儲(chǔ)設(shè)備(磁盤陣列柜或存儲(chǔ)區(qū)域網(wǎng)SAN)。兩臺(tái)服務(wù)器可以采用熱備(主從)、互備和雙工(并行)等不同的方式。在工作過(guò)程中,兩臺(tái)服務(wù)器將以一個(gè)虛擬的IP地址對(duì)外提供服務(wù),并按照工作方式的不同將服務(wù)請(qǐng)求發(fā)送給其中一臺(tái)服務(wù)器承擔(dān)。同時(shí),服務(wù)器通過(guò)心跳線(目前往往采用建立私有網(wǎng)絡(luò)的方式)偵測(cè)另一臺(tái)服務(wù)器的工作狀況。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),另一臺(tái)服務(wù)器根據(jù)心跳偵測(cè)的情況作出判斷并進(jìn)行切換,接管服務(wù)。對(duì)于用戶而言,這一過(guò)程是全自動(dòng)的,它能在很短的時(shí)間內(nèi)完成,因而不會(huì)對(duì)業(yè)務(wù)造成影響。由于使用共享的存儲(chǔ)設(shè)備,因此兩臺(tái)服務(wù)器使用的是相同的數(shù)據(jù),由雙機(jī)或集群軟件對(duì)其進(jìn)行管理[3-4]。
2.1.1 控制系統(tǒng)介紹
2002年,經(jīng)多方論證,四川啟明星鋁業(yè)公司在建設(shè)25萬(wàn)t電解鋁工程項(xiàng)目時(shí)決定在煅燒工藝控制中采用分散集中式控制系統(tǒng)DCS控制技術(shù)。DCS控制系統(tǒng)是隨著現(xiàn)代大型工業(yè)生產(chǎn)自動(dòng)化的不斷興起和過(guò)程控制要求的日益復(fù)雜應(yīng)運(yùn)而生的綜合控制系統(tǒng)。它集計(jì)算機(jī)技術(shù)、系統(tǒng)控制技術(shù)、網(wǎng)絡(luò)通信技術(shù)和多媒體技術(shù)于一體,可提供窗口友好的人機(jī)界面和強(qiáng)大的通信功能,是完成過(guò)程控制、過(guò)程管理的現(xiàn)代化設(shè)備。它的應(yīng)用對(duì)鋁用碳素煅燒工藝來(lái)說(shuō),無(wú)疑是一個(gè)重大的突破。目前,除廣元啟明星鋁業(yè)煅燒車間余熱發(fā)電部分采用了DCS之外,其他鋁廠的煅燒工藝基本上采用局部PLC控制或原始的電氣控制。其系統(tǒng)硬件結(jié)構(gòu)如圖1所示,PLX即為Process Logix。
圖1 Process Logix系統(tǒng)硬件結(jié)構(gòu)Fig.1 Hardware structure of Process Logix system
2.1.2 控制系統(tǒng)工作原理
四川啟明星鋁業(yè)有限責(zé)任公司控制煅燒工藝的DCS采用的是美國(guó)Rockwell的Process Logix R510系統(tǒng)。為保證控制系統(tǒng)的穩(wěn)定可靠運(yùn)行,四川啟明星鋁業(yè)有限責(zé)任公司在方案中采用雙機(jī)熱備技術(shù),兩臺(tái)服務(wù)器的工作模式為active/standby模式:兩臺(tái)Dell服務(wù)器(即圖1中的PLX服務(wù)器A和PLX服務(wù)器B)互為主備狀態(tài),先啟動(dòng)的服務(wù)器默認(rèn)為主服務(wù)器,后啟動(dòng)的服務(wù)器為備用服務(wù)器,當(dāng)兩臺(tái)服務(wù)器啟動(dòng)后,需要在Process Logix R510系統(tǒng)軟件中進(jìn)行數(shù)據(jù)同步,通過(guò)數(shù)據(jù)同步過(guò)程,保證主備服務(wù)器數(shù)據(jù)的一致性。假如PLX服務(wù)器A為主服務(wù)器,PLX服務(wù)器B為備用服務(wù)器,當(dāng)PLX服務(wù)器A出現(xiàn)故障時(shí),PLX服務(wù)器B自動(dòng)切換為主服務(wù)器,接替PLX服務(wù)器A的所有工作,工作站也相應(yīng)自動(dòng)切換,并與PLX服務(wù)器B進(jìn)行數(shù)據(jù)交換;當(dāng)PLX服務(wù)器A恢復(fù)正常啟動(dòng)后,PLX服務(wù)器B通過(guò)數(shù)據(jù)同步過(guò)程成為備用服務(wù)器。整個(gè)系統(tǒng)基于數(shù)據(jù)復(fù)制的方式同步完成,保證主備服務(wù)器的數(shù)據(jù)一致性。
2.2.1 控制系統(tǒng)的組成
焙燒車間的陽(yáng)極焙燒過(guò)程就是粘結(jié)劑-瀝青炭化變成焦炭的熱處理過(guò)程,焙燒陽(yáng)極的質(zhì)量受諸多因素的影響,如焙燒工藝、原料組成、混捏均勻度和振動(dòng)成型過(guò)程等一系列工藝過(guò)程。而在焙燒的生產(chǎn)過(guò)程中,由于其他因素的不可控性,計(jì)算最優(yōu)焙燒溫度、調(diào)節(jié)焙燒過(guò)程中溫度場(chǎng)和焙燒陽(yáng)極揮發(fā)份的濃度含量等參數(shù)就成為提高陽(yáng)極炭塊質(zhì)量的關(guān)鍵。為保證陽(yáng)極焙燒質(zhì)量,四川啟明星鋁業(yè)有限責(zé)任公司引進(jìn)瑞士RD公司的焙燒爐過(guò)程控制系統(tǒng)(bake furnace process control system,BPS)燃燒控制系統(tǒng),在填充料的保護(hù)下采用天然氣作為燃料,按照既定的焙燒曲線進(jìn)行高溫?zé)崽幚?,使瀝青轉(zhuǎn)化成瀝青焦,從而形成具有較高導(dǎo)電性和強(qiáng)度的陽(yáng)極熟塊,再按一定速度冷卻后出爐,從而有效地提高了陽(yáng)極焙燒質(zhì)量。
焙燒火焰控制系統(tǒng)硬件結(jié)構(gòu)如圖2所示。
圖2 焙燒火焰控制系統(tǒng)硬件結(jié)構(gòu)Fig.2 Hardware structure of the roasting fire control system
2.2.2 控制系統(tǒng)工作原理
焙燒爐過(guò)程控制系統(tǒng)(BPS)采用雙機(jī)雙工模式,實(shí)現(xiàn)模式是基于共享的存儲(chǔ)設(shè)備的方式。整個(gè)系統(tǒng)由兩臺(tái)HP高端服務(wù)器、一臺(tái)磁盤陣列柜和磁盤陣列卡構(gòu)成雙機(jī)備份模式,兩臺(tái)服務(wù)器互為備份,當(dāng)一臺(tái)服務(wù)器出現(xiàn)問(wèn)題停機(jī)時(shí),另一臺(tái)服務(wù)器能實(shí)時(shí)接管中斷的工作,保證業(yè)務(wù)系統(tǒng)的正常運(yùn)行。操作系統(tǒng)和應(yīng)用程序安裝在兩臺(tái)服務(wù)器的本地系統(tǒng)盤上,整個(gè)網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)通過(guò)磁盤陣列進(jìn)行集中管理和數(shù)據(jù)備份。數(shù)據(jù)集中管理是通過(guò)雙機(jī)熱備份系統(tǒng),將所有站點(diǎn)的數(shù)據(jù)直接從中央存儲(chǔ)設(shè)備讀取和存儲(chǔ),并由專業(yè)人員進(jìn)行管理,極大地保護(hù)了數(shù)據(jù)的安全性和保密性。用戶的數(shù)據(jù)存放在外接共享磁盤陣列中,當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),備機(jī)主動(dòng)代替主機(jī)工作,保證網(wǎng)絡(luò)服務(wù)不間斷。
磁盤柜磁盤具有熱插拔功能,故可以靈活組成RAID 5模式,當(dāng)一塊硬盤發(fā)生損壞時(shí),數(shù)據(jù)可以恢復(fù),保證數(shù)據(jù)不丟失。由于采用了雙機(jī)容錯(cuò)的集群結(jié)構(gòu),系統(tǒng)具有極高的可靠性。兩臺(tái)服務(wù)器可以作為一個(gè)整體為網(wǎng)絡(luò)提供服務(wù),且相互間互為監(jiān)控。集群具有一定的負(fù)載平衡功能,可將一個(gè)任務(wù)的多個(gè)進(jìn)程分?jǐn)偟絻膳_(tái)服務(wù)上運(yùn)行,提高系統(tǒng)的整體性能。當(dāng)一臺(tái)服務(wù)器發(fā)生故障時(shí),其所運(yùn)行的進(jìn)程及服務(wù)可以自動(dòng)地由另一臺(tái)服務(wù)器接管,保證客戶端的工作不受影響。同時(shí),如果系統(tǒng)采用RAID技術(shù)對(duì)數(shù)據(jù)進(jìn)行保護(hù),可確保重要數(shù)據(jù)不因系統(tǒng)故障而造成損失。
BPS燃燒控制系統(tǒng)采用基于共享的存儲(chǔ)設(shè)備的實(shí)現(xiàn)方式,數(shù)據(jù)庫(kù)放在共享的磁盤柜磁盤上。當(dāng)一臺(tái)服務(wù)器提供服務(wù)時(shí),服務(wù)器直接在磁盤柜磁盤上進(jìn)行讀寫;而當(dāng)系統(tǒng)切換后,另一臺(tái)服務(wù)器也同樣讀取該磁盤柜磁盤上的數(shù)據(jù)。它可以在無(wú)人值守的情況下提供快速的切換,保證不會(huì)發(fā)生數(shù)據(jù)丟失現(xiàn)象。
2.3.1 供電系統(tǒng)的作用
電解鋁廠對(duì)供電系統(tǒng)的可靠性要求非常高,且電能占生產(chǎn)成本的30%以上。高可靠性的綜合自動(dòng)化系統(tǒng)項(xiàng)目的實(shí)施,加強(qiáng)了整個(gè)變電整流系列的保護(hù)和監(jiān)控,提高了電解槽的電解效率,降低了企業(yè)的生產(chǎn)成本,增強(qiáng)了企業(yè)的競(jìng)爭(zhēng)力。四川啟明星鋁業(yè)有限責(zé)任公司供電車間采用PecStar 2電力綜合自動(dòng)化監(jiān)控組態(tài)軟件,同時(shí),為了保證系統(tǒng)穩(wěn)定可靠,供電綜合自動(dòng)化系統(tǒng)采用Active/standby架構(gòu)。
2.3.2 供電系統(tǒng)工作原理
PecStar 2對(duì)服務(wù)器提供完善的雙機(jī)熱備方案,在硬件層、通道層、網(wǎng)絡(luò)層提供PecStar 2多重冗余保護(hù)。每一個(gè)監(jiān)控站配置兩臺(tái)監(jiān)控機(jī),雙機(jī)一主一備,互為熱備,網(wǎng)絡(luò)均采用雙纜冗余方式。在主機(jī)正常退出的情況下,備機(jī)立即轉(zhuǎn)為主用;而在主機(jī)異常關(guān)機(jī)或死機(jī)的情況下,備機(jī)3 s后轉(zhuǎn)為主機(jī);主機(jī)重新啟動(dòng)后,備機(jī)可于10 s后將主用權(quán)再交回原來(lái)的主機(jī),從而保證系統(tǒng)在監(jiān)控機(jī)由于硬件或軟件發(fā)生異常時(shí)可在線切換,提高系統(tǒng)的可靠性。
兩臺(tái)主備監(jiān)控機(jī)各自有不同的通道,用于與硬件進(jìn)行通信,當(dāng)主用機(jī)上的通道發(fā)生故障不能正常通信時(shí),可切換到備機(jī)上進(jìn)行通信;當(dāng)主用通道恢復(fù)正常后,再切換到主用通道。通道的冗余技術(shù)解決了現(xiàn)場(chǎng)因環(huán)境或老化等原因造成通道故障,影響正常運(yùn)行的問(wèn)題。
在硬件層,除采用具有雙通道口的監(jiān)控和保護(hù)設(shè)備可靠性以外,PecStar 2還支持雙網(wǎng)卡的網(wǎng)絡(luò)硬件冗余方案。PecStar 2的上位機(jī)監(jiān)控網(wǎng)絡(luò)采用TCP/IP進(jìn)行通信,監(jiān)控廠站和后臺(tái)機(jī)上都可以安裝雙網(wǎng)卡,組成雙重計(jì)算機(jī)網(wǎng)絡(luò)。當(dāng)計(jì)算機(jī)上的某一個(gè)網(wǎng)卡出現(xiàn)故障或網(wǎng)線某處發(fā)生故障時(shí),監(jiān)控系統(tǒng)可自動(dòng)無(wú)縫切換到另一個(gè)網(wǎng)絡(luò)進(jìn)行通信。這對(duì)于供電需要高可靠或者在網(wǎng)絡(luò)環(huán)境比較惡劣時(shí)的系統(tǒng)運(yùn)行非常有利。
在雙機(jī)熱備情況下,從機(jī)處于熱備狀態(tài)且自動(dòng)與主機(jī)中的數(shù)據(jù)庫(kù)通信,而在本機(jī)成為主機(jī)時(shí)自動(dòng)切換到與本機(jī)數(shù)據(jù)庫(kù)通信,從機(jī)客戶端與其他客戶端一樣能夠?qū)?shù)據(jù)進(jìn)行操作。
供電綜合自動(dòng)化雙機(jī)熱備系統(tǒng)可聯(lián)機(jī)多個(gè)客戶端。當(dāng)顯示的是客戶端時(shí),連接監(jiān)控設(shè)備的電腦就成為與控制設(shè)備通信的主機(jī);當(dāng)客戶端請(qǐng)求顯示數(shù)據(jù)時(shí),系統(tǒng)就會(huì)從主機(jī)中請(qǐng)求數(shù)據(jù)并在本機(jī)上處理;當(dāng)面臨系統(tǒng)故障問(wèn)題時(shí),用冗余備用機(jī)替代有故障的主機(jī),客戶端要求的數(shù)據(jù)就可以通過(guò)備用機(jī)進(jìn)行處理,而備用服務(wù)器只有在通信中斷時(shí),才會(huì)對(duì)主服務(wù)器進(jìn)行取代。當(dāng)主服務(wù)器恢復(fù)功能后,就會(huì)從備服務(wù)器中讀取數(shù)據(jù)以自動(dòng)回填,而備用服務(wù)器再次恢復(fù)到其以前的角色[5-7]。
2.3.3 生產(chǎn)中雙機(jī)熱備的優(yōu)點(diǎn)
生產(chǎn)中雙機(jī)熱備具有以下優(yōu)點(diǎn)。
①高可用性:兩臺(tái)服務(wù)器的互相切換不會(huì)干擾系統(tǒng)應(yīng)用運(yùn)行,無(wú)需修改應(yīng)用,當(dāng)系統(tǒng)出現(xiàn)故障時(shí),系統(tǒng)能夠自動(dòng)檢測(cè)應(yīng)用或服務(wù)器故障,可將應(yīng)用在備用服務(wù)器上快速重新啟動(dòng),并在短時(shí)間內(nèi)(如1~30 s內(nèi))恢復(fù)運(yùn)行,從而有效確保生產(chǎn)過(guò)程的穩(wěn)定性和連續(xù)性。
②數(shù)據(jù)安全性:應(yīng)用數(shù)據(jù)存儲(chǔ)在兩個(gè)服務(wù)器硬盤中,相當(dāng)于對(duì)數(shù)據(jù)進(jìn)行雙層保護(hù),確保生產(chǎn)數(shù)據(jù)的準(zhǔn)確性。
③開放的應(yīng)用系統(tǒng)保護(hù)機(jī)制:這種機(jī)制便于用戶針對(duì)自己的應(yīng)用提供保護(hù),將較為重要的數(shù)據(jù)存儲(chǔ)于雙機(jī)熱備系統(tǒng)中。
④高性能:服務(wù)器現(xiàn)均采用高可靠性部件,同時(shí)提供了多種冗余組件,這就大大提高了單臺(tái)服務(wù)器的穩(wěn)定性和安全性。
⑤高穩(wěn)定性和安全性:控制系統(tǒng)為冗余的雙通信通道,控制系統(tǒng)間通信網(wǎng)絡(luò)采用TCP/IP協(xié)議,網(wǎng)絡(luò)均采用雙纜冗余方式,冗余的雙CPU設(shè)計(jì),運(yùn)行時(shí)一主一備。
⑥便捷安全的熱備切換方式:用戶可以手動(dòng)熱備切換,也可以通過(guò)人機(jī)界面或編程器切換;在電源失效、CPU失效、I/O失效(電纜或模板)、NOM失效(只在啟動(dòng)時(shí))時(shí)將完成CPU的自動(dòng)切換,確保生產(chǎn)設(shè)備連續(xù)工作[5-7]。
從四川啟明星鋁業(yè)公司運(yùn)行雙機(jī)熱備系統(tǒng)的實(shí)踐證明,當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),該服務(wù)器上的工作能以最快的速度切換至備用服務(wù)器上運(yùn)行,保證了數(shù)據(jù)和控制的連續(xù)性。本公司在工業(yè)控制系統(tǒng)中使用雙機(jī)熱備技術(shù)取得了很好的效果,雙機(jī)熱備系統(tǒng)的應(yīng)用和存儲(chǔ)運(yùn)行穩(wěn)定正常,完全達(dá)到了企業(yè)預(yù)期的效果,解決了企業(yè)所擔(dān)心的數(shù)據(jù)丟失問(wèn)題。該系統(tǒng)安全可靠、性能優(yōu)異、實(shí)用性強(qiáng),易于在各行業(yè)廣泛地推廣應(yīng)用。
[1]姜堅(jiān)華.雙機(jī)熱備系統(tǒng)的技術(shù)研究和具體實(shí)現(xiàn)[J].微型電腦應(yīng)用,2004,20(3):7-10.
[2]李彥青.雙機(jī)熱備典型應(yīng)用[EB/OL].[2006-11-01].http://www.realinfo.com.cn/tec/tech19.htm.
[3]呂輝,李進(jìn),劉曙.防空指揮自動(dòng)化系統(tǒng)軟件工程[M].西安:西北大學(xué)出版社,2007.
[4]斯桃枝,李戰(zhàn)國(guó).計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)集成[M].北京:北京大學(xué)出版社,2006.
[5]王曜.視頻點(diǎn)播[M].北京:北京郵電大學(xué)出版社,2002.
[6]孫建華.網(wǎng)絡(luò)安全應(yīng)用技術(shù)[M].北京:北京郵電大學(xué)出版社,2007.
[7]代海英.雙機(jī)熱備系統(tǒng)的應(yīng)用[EB/OL].[2010-03-30].http://book.51cto.com/art/201003/191756.htm.