王慧姮
摘 要:隨著虛擬化、云計算等信息技術(shù)的高速發(fā)展,醫(yī)療信息系統(tǒng)也日趨完善。作為貫穿整個醫(yī)療就診流程的信息系統(tǒng),對于醫(yī)療服務(wù)和醫(yī)院管理起著至關(guān)重要的作用。系統(tǒng)意外停機或數(shù)據(jù)丟失將直接影響患者就診和治療,造成的損失不可估量,因此加大對醫(yī)療信息系統(tǒng)的研究,對保障醫(yī)院正常運行意義重大。
關(guān)鍵詞:云計算;醫(yī)療信息系統(tǒng);雙活數(shù)據(jù)中心
中圖分類號:TP368.5 文獻標識碼:A 文章編號:2096-4706(2019)02-0074-03
Abstract:With the rapid development of information technology such as virtualization and cloud computing,medical information system is becoming more and more perfect. As the information system running through the whole medical treatment process,it plays a vital role in medical service and hospital management. Accidental shutdown of the system or data loss will directly affect the patient’s visit and treatment,resulting in immeasurable losses. Therefore,increasing the research on medical information system is of great significance for ensuring the normal operation of hospitals.
Keywords:cloud computing;medical information system;Active-Active data center
1 系統(tǒng)發(fā)展回顧
從醫(yī)療信息系統(tǒng)的可用性角度來看,我院系統(tǒng)建設(shè)經(jīng)歷了以下兩個階段:
1.1 雙機熱備(HA)+數(shù)據(jù)備份
雙機熱備是我院最初采用也是行業(yè)最常見的高可用架構(gòu),其將關(guān)鍵的業(yè)務(wù)系統(tǒng)部署在兩臺服務(wù)器上,通過HA軟件訪問外接共享磁盤存儲。服務(wù)器采用主-備工作方式,當(dāng)服務(wù)器發(fā)生故障時,HA軟件自動將應(yīng)用切換到備份服務(wù)器,從而保障業(yè)務(wù)連續(xù)性。同時其也部署了周期性的數(shù)據(jù)備份,以防止數(shù)據(jù)丟失。但是隨著應(yīng)用逐漸增加,每部署一套應(yīng)用,都要部署兩臺服務(wù)器,總體運行成本高,資源浪費明顯。且存儲的壓力日漸增大、單點故障風(fēng)險提高,一旦存儲發(fā)生故障,整個系統(tǒng)都會受到影響。
1.2 主機虛擬化+容災(zāi)
為了提升服務(wù)器的資源利用率和管理性能,我院嘗試采用服務(wù)器虛擬化技術(shù),將HIS、EMR以外的系統(tǒng)均部署在虛擬化平臺上,分別在兩個機房(四樓/五樓)部署了刀片服務(wù)器集群和VNX5500存儲,并通過SAN網(wǎng)絡(luò)連通,實現(xiàn)了虛擬化應(yīng)用可以在樓層機房間在線負載和遷移。同時利用存儲的遠程復(fù)制功能,對部分數(shù)據(jù)卷進行同步復(fù)制,初步建成了以跨機房的虛擬化集群和數(shù)據(jù)容災(zāi)為核心的系統(tǒng)架構(gòu)。如圖1所示。
2 系統(tǒng)存在的問題
虛擬化平臺和容災(zāi)系統(tǒng)自建設(shè)以來,在IT管理、資源利用及可用性方面取得了顯著成效,為我院信息系統(tǒng)的運行提供了良好的技術(shù)支撐。隨著醫(yī)療應(yīng)用的不斷推廣,醫(yī)療信息系統(tǒng)對自身業(yè)務(wù)的連續(xù)性和數(shù)據(jù)的安全性要求進一步提高。我院醫(yī)療信息系統(tǒng)主要存在以下幾個方面的問題。
2.1 維護成本高、難度大
醫(yī)療信息系統(tǒng)的HIS、EMR關(guān)鍵系統(tǒng)目前還采用物理服務(wù)器方式,維護成本高、難度大,且該系統(tǒng)存儲設(shè)備老舊,故障風(fēng)險高。這就需要全面虛擬化來解決,以降低維護成本和難度,提升關(guān)鍵系統(tǒng)的可靠性和管理性能。
2.2 業(yè)務(wù)連續(xù)性有待提高
雙機熱備高可用架構(gòu)的兩臺存儲設(shè)備之間缺少有效的切換機制,存在單點故障。一旦存儲損壞,運行的業(yè)務(wù)就會中斷,這其間雖然數(shù)據(jù)不受影響,但是兩臺存儲設(shè)備卻需要半小時甚至數(shù)小時的時間來切換。新大樓機房對于系統(tǒng)的持續(xù)運行提出了更高的要求,因此需要建立更加可靠和高效的容災(zāi)系統(tǒng)來保障醫(yī)療信息系統(tǒng)的正常運行。
2.3 數(shù)據(jù)安全保障有待完善
醫(yī)院數(shù)據(jù)信息安全對于醫(yī)院正常運行意義重大,而這些數(shù)據(jù)安全主要依賴于醫(yī)療信息系統(tǒng),我院醫(yī)療信息系統(tǒng)的備份方案采用周期性(每天)備份,這樣一旦數(shù)據(jù)出現(xiàn)錯誤或丟失,就會面臨較長時間的數(shù)據(jù)缺失,嚴重影響醫(yī)院的醫(yī)療就診服務(wù)。
3 “雙活”數(shù)據(jù)中心+三站點容災(zāi)
基于對以上問題的分析可知,醫(yī)院信息系統(tǒng)的正常運行離不開硬件平臺和實時有效數(shù)據(jù)的支撐。本文結(jié)合我院現(xiàn)有的IT資源及環(huán)境、新大樓的機房建設(shè),對三個機房進行了資源分配和角色梳理,以劃分不同的故障域。
規(guī)劃將系統(tǒng)部署在現(xiàn)有的四樓機房和新大樓機房,實現(xiàn)“雙活”數(shù)據(jù)中心業(yè)務(wù)層面的跨機房高可用,即系統(tǒng)無單點故障。系統(tǒng)不會因為服務(wù)器、網(wǎng)絡(luò)、存儲、甚至是某一機房電源故障而無法正常提供服務(wù)。將現(xiàn)有的五樓機房作為三站點的容災(zāi)故障域,使其同時為兩個機房提供數(shù)據(jù)和容災(zāi)服務(wù)。
3.1 “雙活”數(shù)據(jù)中心特點
“雙活”數(shù)據(jù)中心既是容災(zāi)技術(shù)的提升,也是系統(tǒng)高可用架構(gòu)的延伸。兩個數(shù)據(jù)中心同時為業(yè)務(wù)提供服務(wù),當(dāng)任何一個中心出現(xiàn)問題導(dǎo)致系統(tǒng)不可用時,另一中心將繼續(xù)持續(xù)提供服務(wù),期間不需要人為干預(yù)和決策。
“雙活”數(shù)據(jù)中心相對于容災(zāi)系統(tǒng)有以下特點:
(1)資源利用充分。災(zāi)難是一個小概率事件,容災(zāi)系統(tǒng)只有災(zāi)難發(fā)生時才能起作用,“雙活”數(shù)據(jù)中心可以避免容災(zāi)中心資源因長期處于閑置狀態(tài)而產(chǎn)生的資源浪費;通過其資源整合,數(shù)據(jù)中心的服務(wù)能力可以得到成倍提升。
(2)“雙活”數(shù)據(jù)中心如果中斷一個數(shù)據(jù)中心,而另外一個數(shù)據(jù)中心還可持續(xù)運行,數(shù)據(jù)中心的運行對業(yè)務(wù)系統(tǒng)來說是透明的。而災(zāi)備模式下,如果生產(chǎn)數(shù)據(jù)中心癱瘓,則需要數(shù)小時甚至更長的時間才能啟動災(zāi)備中心,在這段時間里,業(yè)務(wù)系統(tǒng)將面臨長時間停機。
3.2 “雙活”數(shù)據(jù)中心實現(xiàn)方式
3.2.1 網(wǎng)絡(luò)雙活
從網(wǎng)絡(luò)層面來看,“雙活”數(shù)據(jù)中心需要將同一個網(wǎng)絡(luò)擴展到多個數(shù)據(jù)中心,在數(shù)據(jù)中心間需要大二層網(wǎng)絡(luò)連接并且實現(xiàn)服務(wù)器和應(yīng)用的虛擬化數(shù)據(jù)中心互聯(lián)。在數(shù)據(jù)中心之間建設(shè)一張?zhí)摂M的大二層網(wǎng)絡(luò)是實現(xiàn)網(wǎng)絡(luò)雙活的基礎(chǔ)。通過大二層網(wǎng)絡(luò),可以實現(xiàn)跨數(shù)據(jù)中心的集群、資源共享和故障切換,它是保證從故障發(fā)生到故障切換的過程中不丟包的重要手段。
VMware虛擬化平臺的NSX網(wǎng)絡(luò)虛擬化功能提供了如下服務(wù):物理三層網(wǎng)絡(luò)的連接下,在虛擬大二層網(wǎng)絡(luò)故障,數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)故障或NSX組件故障時,兩數(shù)據(jù)中心網(wǎng)絡(luò)將按現(xiàn)有的網(wǎng)絡(luò)轉(zhuǎn)發(fā)狀態(tài)轉(zhuǎn)發(fā)數(shù)據(jù),避免網(wǎng)絡(luò)中斷,保證業(yè)務(wù)客戶端連接隨故障轉(zhuǎn)移。
3.2.2 存儲雙活
存儲雙活能夠?qū)崿F(xiàn)信息在數(shù)據(jù)中心內(nèi)部以及數(shù)據(jù)中心之間共享、存取或移動,從而將各種不同的存儲系統(tǒng)聯(lián)合成為單一資源。它允許地理上分離的兩個數(shù)據(jù)中心的存儲系統(tǒng)同時進行數(shù)據(jù)存取,對業(yè)務(wù)系統(tǒng)透明,且保證了數(shù)據(jù)的可靠性和可用性。
利用存儲虛擬化網(wǎng)關(guān)的數(shù)據(jù)鏡像功能,結(jié)合上層應(yīng)用集群,使兩個數(shù)據(jù)中心都處于運行狀態(tài),并同時承擔(dān)相同業(yè)務(wù),可以提高數(shù)據(jù)中心的整體服務(wù)能力和系統(tǒng)資源利用率。存儲雙活是數(shù)據(jù)中心雙活的重要基礎(chǔ),EMC VPLEX可創(chuàng)建分布式虛擬卷,可供多臺存儲設(shè)備同時訪問,主機集群可同時訪問同一個虛擬卷。任何數(shù)據(jù)中心的存儲故障時,業(yè)務(wù)將自動通過另一數(shù)據(jù)中心的存儲訪問數(shù)據(jù),實現(xiàn)RPO=0,RTO≈0,解決了傳統(tǒng)災(zāi)備中心不能承載業(yè)務(wù)和業(yè)務(wù)無法自動切換的問題。如圖2所示。
3.2.3 應(yīng)用雙活
應(yīng)用雙活是“雙活”數(shù)據(jù)中心所追求的業(yè)務(wù)目標,只有在實現(xiàn)網(wǎng)絡(luò)雙活和存儲雙活的基礎(chǔ)上才能真正實現(xiàn)應(yīng)用雙活,從而保證所有的業(yè)務(wù)系統(tǒng)跨數(shù)據(jù)中心的連續(xù)性。
應(yīng)用雙活可以由數(shù)據(jù)庫層面實現(xiàn),如Oracle RAC,也可通過虛擬化集群實現(xiàn)。在VMware的雙活方案中對后端的雙活存儲廠商也做了認證。只有通過VMware的VMSC雙活認證的存儲方案,VMware VMotion、HA、DRS等特性才能得以保證,這些功能的實現(xiàn)基于VMware虛擬化應(yīng)用雙活。如圖3所示。
3.3 三站點容災(zāi)
數(shù)據(jù)備份只支持恢復(fù)至上一個備份點,一般關(guān)鍵業(yè)務(wù)在每晚備份,也就是說當(dāng)發(fā)生邏輯錯誤(如操作錯誤,誤刪表,病毒等)時,通過備份恢復(fù)的手段只能找到前一天晚上備份點的數(shù)據(jù),而無法恢復(fù)從備份點至故障點期間丟失的數(shù)據(jù),這對醫(yī)療信息系統(tǒng)的正常運行產(chǎn)生了重要影響。
我院通過第三站點,結(jié)合業(yè)界當(dāng)前先進的持續(xù)數(shù)據(jù)保護技術(shù),對“雙活”數(shù)據(jù)中心提供持續(xù)的數(shù)據(jù)和系統(tǒng)容災(zāi)保護。在容災(zāi)站點建設(shè)較低配置的服務(wù)器和存儲資源,利用EMC的虛機持續(xù)保護技術(shù),對重要的應(yīng)用系統(tǒng)以虛擬機為單位進行容災(zāi)。容災(zāi)資源可以用于日常開發(fā)和測試,在“雙活”數(shù)據(jù)中心發(fā)生邏輯數(shù)據(jù)錯誤時,可對數(shù)據(jù)進行任意時間點的恢復(fù),同時在事件突發(fā)的情況下,容災(zāi)系統(tǒng)也可臨時頂替生產(chǎn)。
4 結(jié) 論
(1)“雙活”數(shù)據(jù)中心架構(gòu)是此次項目建設(shè)的重點,其核心組件是EMC VPLEX存儲虛擬化引擎,也是EMC的一項獨特技術(shù)。構(gòu)建基于存儲虛擬化技術(shù)的“雙活”數(shù)據(jù)中心,當(dāng)一個數(shù)據(jù)中心內(nèi)的服務(wù)器、存儲甚至是整個數(shù)據(jù)中心發(fā)生故障時,業(yè)務(wù)可以無縫地切換到另一個數(shù)據(jù)中心,業(yè)務(wù)始終保持在線,實現(xiàn)了數(shù)據(jù)中心最高級別的高可用。
(2)真正的雙活,是在數(shù)據(jù)中心的各個層面,都實現(xiàn)雙活。存儲、服務(wù)器、網(wǎng)絡(luò)、應(yīng)用等,各層面都要有雙活的設(shè)計,這樣才能真正意義上實現(xiàn)數(shù)據(jù)中心層面的雙活。
(3)“雙活”數(shù)據(jù)中心雖然具備最高級別的高可用,但是數(shù)據(jù)在邏輯上只有一份,發(fā)生邏輯錯誤時,“雙活”是無能為力的。因此需要對數(shù)據(jù)進行邏輯保護,CDP是目前業(yè)界最先進的數(shù)據(jù)保護技術(shù),我院采用該技術(shù)且將數(shù)據(jù)保護到第三站點獨立的故障域中。真正實現(xiàn)了從物理設(shè)備、站點到邏輯等層面為數(shù)據(jù)提供全面的保護。
系統(tǒng)實現(xiàn)效果:
(1)如果出現(xiàn)服務(wù)器故障,系統(tǒng)能夠利用服務(wù)器虛擬化技術(shù)實現(xiàn)自動切換?;謴?fù)時間:5分鐘以內(nèi),數(shù)據(jù)損失:0。
(2)系統(tǒng)為冗余設(shè)計,如果出現(xiàn)某臺交換機、某塊HBA卡、某條光纖鏈路故障,不會引起系統(tǒng)停止響應(yīng)?;謴?fù)時間:0,數(shù)據(jù)損失:0。
(3)如果某臺存儲出現(xiàn)故障,另一機房的存儲可以自動接管應(yīng)用,不會造成系統(tǒng)停止響應(yīng)?;謴?fù)時間:0,數(shù)據(jù)損失:0。
(4)如果主機房出現(xiàn)災(zāi)難故障,另一機房可以在不需要人為干預(yù)的情況下自動接管應(yīng)用。恢復(fù)時間:5分鐘以內(nèi),數(shù)據(jù)損失:0。
(5)如果出現(xiàn)邏輯數(shù)據(jù)錯誤,可利用持續(xù)數(shù)據(jù)保護技術(shù)回滾?;謴?fù)時間:數(shù)十分鐘,數(shù)據(jù)損失:約為0(針對數(shù)據(jù)庫應(yīng)用)。
參考文獻:
[1] 何昕,許劍,陳馨,等.云計算的體系架構(gòu)與關(guān)鍵技術(shù) [J].現(xiàn)代信息科技,2017,1(5):112-113.
[2] 楊敬巍,張立成,李佳記.基于SDN技術(shù)構(gòu)建業(yè)務(wù)支撐互聯(lián)網(wǎng)域的雙活數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu) [J].中國信息化,2018(9):57-59.
[3] 陳寧鈺,楊樹華.病案首頁信息在醫(yī)療統(tǒng)計中的重要作用分析 [J].現(xiàn)代信息科技,2018,2(10):149-150.
作者簡介:王慧(1976-),女,漢族,安徽蕪湖人,本科,副主任,工程師,研究方向:信息管理。