徐偉明
摘要:隨著信息化建設的逐步發(fā)展,數(shù)據(jù)庫作為整個信息網(wǎng)絡化最重要基礎組成部分,其地位和作用越來越突出。經(jīng)權威技術部門統(tǒng)計,影響業(yè)務系統(tǒng)宕機的主要原因有:硬件故障占44%、人為錯誤占32%、軟件故障占14%、病毒影響占7%、自然災難占3%.。上述這些問題都會給信息化的進程造成種種障礙,進一步影響了信息系統(tǒng)連續(xù)使用的可用性。
為了進一步提高信息系統(tǒng)的可用性、可靠性和安全性,筆者在設計重要信息系統(tǒng)時,把數(shù)據(jù)容災作為首要的項目重點進行實施,以保證在任何危機的時刻,信息系統(tǒng)都能保證其業(yè)務工作的穩(wěn)定運轉。數(shù)據(jù)容災作為高可用性的一部分,在高可用性設計中是必不可少的。容災建設,就是在復雜的環(huán)境中,以保證業(yè)務的連續(xù)性為目的,根據(jù)項目的需求去定制最佳的容災方案,是一個業(yè)務和技術相結合,高度冗余的信息網(wǎng)絡化基礎組成部分。
關鍵詞:數(shù)據(jù)容災;高可用性;Oracle11g;ActiveData;Guard
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)36-8615-03
2數(shù)據(jù)庫雙機系統(tǒng)的主要接口關鍵概念
1)服務端--數(shù)據(jù)同步:基于網(wǎng)絡TCP/IP協(xié)議,利用Oracle11gActiveDataGuard技術,將主用數(shù)據(jù)庫的所有DML、DDL、DCL等數(shù)據(jù)操作信息,通過聯(lián)機日志以實時異步的方式,傳輸?shù)疆惖氐膫溆脭?shù)據(jù)庫上。備用數(shù)據(jù)庫會實時接收這些日志,并同步到本地數(shù)據(jù)庫中。
2)客戶端—雙機監(jiān)控:默認以每30分鐘巡檢一次數(shù)據(jù)庫的頻率,對數(shù)據(jù)庫雙機35個關鍵技術點進行分析。包含:備份、鎖、連接數(shù)、表空間、數(shù)據(jù)同步、作業(yè)、歸檔日志等多個數(shù)據(jù)庫對象,一旦達到預警范圍,會立即在界面告警,并提示可能故障的原因。
3數(shù)據(jù)庫雙機系統(tǒng)的配置
結合工作的實際,數(shù)據(jù)庫雙機系統(tǒng)有一個主數(shù)據(jù)庫和一個備用數(shù)據(jù)庫,備用數(shù)據(jù)庫采用物理備用數(shù)據(jù)庫方式,采用物理備用數(shù)據(jù)庫方式有優(yōu)點:
1)對主數(shù)據(jù)庫分塊復制提供了快速、高效的故障轉移。
2)對數(shù)據(jù)類型不做限制。
3)允許用在執(zhí)行預定的維護時,切換主數(shù)據(jù)庫和備用數(shù)據(jù)庫的角色。
4)能夠從主數(shù)據(jù)庫中卸載備份。
5)使得在升級時停機時間最短,并允許使用TransientLogicalStandbyDatabase功能進行修補。
4系統(tǒng)設計
4.1雙機模式
雙存儲系統(tǒng)設計,真正意義上的雙機環(huán)境,即使在主用數(shù)據(jù)庫完全丟失的情況下,業(yè)務數(shù)據(jù)也能得到最大限度的保障。
數(shù)據(jù)庫雙機系統(tǒng)能實現(xiàn)1:1的雙機模式,即一臺主用數(shù)據(jù)庫對應一臺備用數(shù)據(jù)庫。不支持一臺主用數(shù)據(jù)庫對應多臺備用數(shù)據(jù)庫的模式,也不支持多臺主用數(shù)據(jù)庫對應一臺備用數(shù)據(jù)庫的模式。
主、備庫硬件要求非常低,支持x86_64架構,需要windows2008R2(x64)系統(tǒng)。Intel公司2006年以后生產的CPU都支持64位模式。
無心跳線設計,一根網(wǎng)線既可以滿足業(yè)務需要,也可以滿足數(shù)據(jù)同步需要。在網(wǎng)絡帶寬大于數(shù)據(jù)日志增長量的環(huán)境下,主、備機可以在城域網(wǎng)內實現(xiàn)異地容災的效果。
因設計為異步數(shù)據(jù)傳輸,所以即使在主用數(shù)據(jù)庫高負載模式下,也能穩(wěn)健的完成數(shù)據(jù)同步,數(shù)據(jù)同步產生的性能損耗微乎其微。
智能容錯模式,當備機因異常脫離雙機環(huán)境,主用庫會自動緩存增量日志。在緩存最高限額時間范圍內,備機修復正常后,只要插上網(wǎng)線,雙機自動恢復同步狀態(tài)。
防病毒設計,主、備庫僅通過1521端口傳輸數(shù)據(jù),在防火墻配合下的雙機環(huán)境,即使主庫感染了病毒,病毒也無法傳播到備庫。相反地,如果備庫感染了病毒,也無法傳播到主庫。
其他的特點:對殺毒軟件均兼容,無操作系統(tǒng)分區(qū)大小限制。
4.2監(jiān)控模式
數(shù)據(jù)庫雙機系統(tǒng)監(jiān)控軟件作為雙機系統(tǒng)的第三個視角,可以同時監(jiān)控多個數(shù)據(jù)庫,主要目的是加強雙機數(shù)據(jù)同步的監(jiān)管,做好真正意義上的數(shù)據(jù)保護。
同時,系統(tǒng)監(jiān)控軟件不僅監(jiān)控數(shù)據(jù)同步的信息,還監(jiān)控數(shù)據(jù)庫容易引發(fā)故障的潛在信息,例如:鎖、作業(yè)、連接數(shù)、表空間等,這些隱含在內部的信息不容易被察覺,一旦發(fā)生故障,對業(yè)務系統(tǒng)都會產生嚴重的影響。
系統(tǒng)監(jiān)控軟件在巡檢過程中,如果發(fā)現(xiàn)了故障或隱患信息,會自動調用高級模式,將更加詳細的日志在后臺進行輸出,確保后續(xù)的分析和處理。
參考文獻:
[1]ScotJesse,BryanVongray.OracleDatabase11gR2高可用性[M].張慧穎,李波,譯.北京:清華大學出版社,2012.
[2]GopalakrishnanK.OracleDatabase11gRAC手冊[M].賈洪峰,梁濤,郭紹明,譯.北京:清華大學出版社,2012.