彭麗恩+鄧雄雷+何少萍
【摘要】 愛立信OSS系統(tǒng)當前一般采用冷備份的容災方式,主備用服務器上無數(shù)據(jù)同步功能,應急操作依賴于管理員手工切換,容災效果大打折扣。作為移動通信網(wǎng)中專用的設備操作管理系統(tǒng),OSS系統(tǒng)的可用性至關重要,直接影響了對網(wǎng)絡的操作維護。因此,本論文提出一種有效的解決方案,實現(xiàn)冷備份系統(tǒng)“準熱備份”的容災效果。該解決方案也可用于其它冷備份系統(tǒng),提升容災效果。
【關鍵詞】 冷備份 數(shù)據(jù)同步 一鍵切換 軟切換
一、背景情況
OSS系統(tǒng)是移動通信網(wǎng)中專用的愛立信設備操作管理系統(tǒng),提供集中式的無線網(wǎng)絡和核心網(wǎng)絡的操作維護功能,主要提供故障管理、配置管理、性能管理、鑒權管理四大功能,包含OSS主服務器、備用服務器、COMINF服務器、UAS接口機、OMBS服務器、ENIQ服務器、交換機等設備,這些設備各施其能、各管其職,協(xié)同工作,為用戶提供愛立信網(wǎng)元的網(wǎng)管服務。OSS系統(tǒng)采用冷備份的容災方式,當該服務器的軟件或硬件出現(xiàn)故障的時候,需要切換到備用服務器上,由系統(tǒng)管理員前往機房操作,同時需要重啟備用服務器上的進程,更新備用服務器上的數(shù)據(jù)。當前OSS的容災方式和應急操作手段的不足,直接影響了OSS的冷備份容災效果。
1、主備機間無數(shù)據(jù)同步機制,數(shù)據(jù)不同步直接影響了切換后OSS用戶的某些維護操作。OSS系統(tǒng)上精確地配置了每個用戶的權限,存儲了每一個網(wǎng)絡設備的配置信息,包括IP地址、帳號權限、網(wǎng)絡配置等,以及用戶自己的文件。如果主備機切換前用戶的權限、網(wǎng)元的配置或者網(wǎng)絡參數(shù)修發(fā)生了變化,而備機沒有及時更新,切換后用戶就會因權限問題無法進行某些操作,網(wǎng)元出現(xiàn)斷連、參數(shù)不對無法進行網(wǎng)絡優(yōu)化等問題。雖然切換到了備用服務器,但對于用戶來說,OSS的網(wǎng)管服務還是不可用的。
2、人工切換耗時長,需要OSS系統(tǒng)管理員前往機房進行操作,容災效果不明顯。若故障發(fā)生在非工作時間,OSS系統(tǒng)管理員趕到機房所耗費的時間,可能比起系統(tǒng)管理員直接修復主機故障所用的時間還長,備機的冷備份容災方式便形同虛設。
從上面的兩點可以看出,當前OSS系統(tǒng)采用的冷備份容災方式的效果受限于當前容災操作的數(shù)據(jù)維護方式和切換方式。而廠家也沒有任何解決辦法。為此,如何解決當前OSS系統(tǒng)冷容災方式的不足成為亟待解決的技術難題。
二、技術解決方案
1、備用服務器數(shù)據(jù)同步解決方案。
在備用服務器上開發(fā)數(shù)據(jù)準實時同步工具,實現(xiàn)備用服務器主動更新TSS、ARNE、HOME三大數(shù)據(jù)庫的數(shù)據(jù),保持與主用服務器一致。
(1)增設主備用服務器間數(shù)據(jù)同步的專用網(wǎng)絡。
OSS系統(tǒng)內(nèi)部原有3個獨立隔離的網(wǎng)絡:業(yè)務網(wǎng)絡、管理網(wǎng)絡和備份網(wǎng)絡,分別負責系統(tǒng)內(nèi)部的業(yè)務通信、系統(tǒng)管理和系統(tǒng)備份。為避免相互干擾,提供安全可靠的傳輸通道,增設一個專用的數(shù)據(jù)同步網(wǎng)絡,使用C類IP地址,使用主備服務器上的備用網(wǎng)卡和冗余網(wǎng)口??紤]成本問題,采用在交換機上劃分VLAN的方式而非增加一臺交換機來實現(xiàn)。
(2)主用服務器自動備份相關數(shù)據(jù)。
從效率、資源成本的角度從發(fā),選用Shell腳本與CRONTAB定時任務結合實現(xiàn)數(shù)據(jù)備份的功能。SHELL腳本實現(xiàn)的功能是檢測數(shù)據(jù)的變化和將相關數(shù)據(jù)備份到指定目錄。與現(xiàn)網(wǎng)關聯(lián)的數(shù)據(jù)主要是網(wǎng)元的連接數(shù)據(jù),存儲在ARNE數(shù)據(jù)庫里,與用戶操作權限相關的數(shù)據(jù)存儲在TSS數(shù)據(jù)庫里,其他還需要實時更新的數(shù)據(jù)也包括用戶自己的數(shù)據(jù),存儲在/ossrc/home/路徑下,還有一些定時任務CRONTAB的數(shù)據(jù)。這些數(shù)據(jù)是備機需要與主機同步的,因為他們直接影響OSS的服務。Shell腳本的功能就是定期備份這些數(shù)據(jù)到指定目錄,對于數(shù)據(jù)量大的用戶數(shù)據(jù),采用增量備份方式,即只備份在上一次備份之后有變化的新數(shù)據(jù)。由于TSS是Sybase數(shù)據(jù)庫,和ARNE的Versant數(shù)據(jù)庫類型和架構不一樣,而HOME下的數(shù)據(jù)采用增量備份方式,所以主用服務器上需要配置多個SHELL腳本,實現(xiàn)不同的功能:TSS數(shù)據(jù)庫備份腳本實現(xiàn)賬號權限全量數(shù)據(jù)備份;ARNE數(shù)據(jù)備份腳本實現(xiàn)網(wǎng)元配置數(shù)據(jù)全量備份;HOME文件變更檢測腳本通過對文件的名字、大小、變更時間的比對發(fā)現(xiàn)文件的變更信息,檢測出所有用戶的文件變更情況和用戶CRONTAB任務表變更情況;HOME數(shù)據(jù)備份腳本將檢測到的變更文件備份到指定目錄。
綜合考慮服務器性能、數(shù)據(jù)變更頻率、數(shù)據(jù)重要性和對用戶的影響程度,并錯開網(wǎng)絡工程時間,在CRONTAB設置各個腳本的執(zhí)行頻率與時間:
在主用服務器上上配置了這些Shell腳本后,主用服務器便可自動備份指定的數(shù)據(jù),并存儲到專用的特定目錄下。備份周期可根據(jù)實際情況調(diào)整。例如,用戶變更的數(shù)據(jù)量不大但對用戶的操作影響大,每天早上上班前備份一次,而網(wǎng)元連接數(shù)據(jù)、用戶權限等變化少但數(shù)據(jù)量大的,則每周備份一次。為了使備份數(shù)據(jù)的工作對OSS主服務器的負荷影響降到最低,可將備份時間設為OSS業(yè)務量少,網(wǎng)絡工程已結束但日常維護還未開始的早上。同時,若系統(tǒng)管理員進行了大量的數(shù)據(jù)修改,可在數(shù)據(jù)修改后手動啟動以上各個腳本備份好數(shù)據(jù)。
(3)備用服務器自動獲取主用服務器上的備份數(shù)據(jù)并更新自身數(shù)據(jù)。
在備用服務器上布置定時Shell腳本,在主用服務器開始備份數(shù)據(jù)的30分鐘后,采用FTP技術通過專用數(shù)據(jù)同步網(wǎng)絡獲取主用服務器上備份好的數(shù)據(jù),然后導入到本機上相應的數(shù)據(jù)庫和文件目錄下,進行數(shù)據(jù)更新。
2、主備服務器一鍵切換解決方案。
將主備用服務器同時接入OSS系統(tǒng)的業(yè)務網(wǎng)絡,劃分在同一個VLAN上面。平時,交換機上備用服務器的業(yè)務端口處于down的狀態(tài),主用服務器的業(yè)務端口處于up狀態(tài),對外提供服務。當啟動一鍵切換功能,通過交換機上的管理網(wǎng)絡,將OSS的主用服務器的業(yè)務端口狀態(tài)改為down狀態(tài),將備用服務器的業(yè)務端口狀態(tài)改為up,由備用服務器對外提供網(wǎng)管服務。
一鍵切換功能部署在管理主機上。該功能由系統(tǒng)管理員啟動,通過Shell腳本實現(xiàn)。Shell腳本登陸到交換機上利用管理網(wǎng)絡進行操作,改變業(yè)務網(wǎng)絡的端口狀態(tài)實現(xiàn)主備用服務器間的切換。切換后,腳本將檢查備用服務器上的數(shù)據(jù)是否最新,若否則啟動數(shù)據(jù)同步功能,更新備用服務器上的數(shù)據(jù),然后啟動備用服務器上的ldap-client和cron的守護進程,最后重啟所有UAS 接口機。
三、總結
實踐證明本文提出的方案有效解決了冷備容災方式數(shù)據(jù)不同步的問題,實現(xiàn)了硬切換到軟切換的轉變,達到了快速切換的目標。該解決方案適合于有數(shù)據(jù)同步需求或需要在服務器間進行切換的系統(tǒng)引入,尤其適合于想將冷備份容災方式轉化成“準熱備份”容災方式的系統(tǒng)。
【摘要】 愛立信OSS系統(tǒng)當前一般采用冷備份的容災方式,主備用服務器上無數(shù)據(jù)同步功能,應急操作依賴于管理員手工切換,容災效果大打折扣。作為移動通信網(wǎng)中專用的設備操作管理系統(tǒng),OSS系統(tǒng)的可用性至關重要,直接影響了對網(wǎng)絡的操作維護。因此,本論文提出一種有效的解決方案,實現(xiàn)冷備份系統(tǒng)“準熱備份”的容災效果。該解決方案也可用于其它冷備份系統(tǒng),提升容災效果。
【關鍵詞】 冷備份 數(shù)據(jù)同步 一鍵切換 軟切換
一、背景情況
OSS系統(tǒng)是移動通信網(wǎng)中專用的愛立信設備操作管理系統(tǒng),提供集中式的無線網(wǎng)絡和核心網(wǎng)絡的操作維護功能,主要提供故障管理、配置管理、性能管理、鑒權管理四大功能,包含OSS主服務器、備用服務器、COMINF服務器、UAS接口機、OMBS服務器、ENIQ服務器、交換機等設備,這些設備各施其能、各管其職,協(xié)同工作,為用戶提供愛立信網(wǎng)元的網(wǎng)管服務。OSS系統(tǒng)采用冷備份的容災方式,當該服務器的軟件或硬件出現(xiàn)故障的時候,需要切換到備用服務器上,由系統(tǒng)管理員前往機房操作,同時需要重啟備用服務器上的進程,更新備用服務器上的數(shù)據(jù)。當前OSS的容災方式和應急操作手段的不足,直接影響了OSS的冷備份容災效果。
1、主備機間無數(shù)據(jù)同步機制,數(shù)據(jù)不同步直接影響了切換后OSS用戶的某些維護操作。OSS系統(tǒng)上精確地配置了每個用戶的權限,存儲了每一個網(wǎng)絡設備的配置信息,包括IP地址、帳號權限、網(wǎng)絡配置等,以及用戶自己的文件。如果主備機切換前用戶的權限、網(wǎng)元的配置或者網(wǎng)絡參數(shù)修發(fā)生了變化,而備機沒有及時更新,切換后用戶就會因權限問題無法進行某些操作,網(wǎng)元出現(xiàn)斷連、參數(shù)不對無法進行網(wǎng)絡優(yōu)化等問題。雖然切換到了備用服務器,但對于用戶來說,OSS的網(wǎng)管服務還是不可用的。
2、人工切換耗時長,需要OSS系統(tǒng)管理員前往機房進行操作,容災效果不明顯。若故障發(fā)生在非工作時間,OSS系統(tǒng)管理員趕到機房所耗費的時間,可能比起系統(tǒng)管理員直接修復主機故障所用的時間還長,備機的冷備份容災方式便形同虛設。
從上面的兩點可以看出,當前OSS系統(tǒng)采用的冷備份容災方式的效果受限于當前容災操作的數(shù)據(jù)維護方式和切換方式。而廠家也沒有任何解決辦法。為此,如何解決當前OSS系統(tǒng)冷容災方式的不足成為亟待解決的技術難題。
二、技術解決方案
1、備用服務器數(shù)據(jù)同步解決方案。
在備用服務器上開發(fā)數(shù)據(jù)準實時同步工具,實現(xiàn)備用服務器主動更新TSS、ARNE、HOME三大數(shù)據(jù)庫的數(shù)據(jù),保持與主用服務器一致。
(1)增設主備用服務器間數(shù)據(jù)同步的專用網(wǎng)絡。
OSS系統(tǒng)內(nèi)部原有3個獨立隔離的網(wǎng)絡:業(yè)務網(wǎng)絡、管理網(wǎng)絡和備份網(wǎng)絡,分別負責系統(tǒng)內(nèi)部的業(yè)務通信、系統(tǒng)管理和系統(tǒng)備份。為避免相互干擾,提供安全可靠的傳輸通道,增設一個專用的數(shù)據(jù)同步網(wǎng)絡,使用C類IP地址,使用主備服務器上的備用網(wǎng)卡和冗余網(wǎng)口??紤]成本問題,采用在交換機上劃分VLAN的方式而非增加一臺交換機來實現(xiàn)。
(2)主用服務器自動備份相關數(shù)據(jù)。
從效率、資源成本的角度從發(fā),選用Shell腳本與CRONTAB定時任務結合實現(xiàn)數(shù)據(jù)備份的功能。SHELL腳本實現(xiàn)的功能是檢測數(shù)據(jù)的變化和將相關數(shù)據(jù)備份到指定目錄。與現(xiàn)網(wǎng)關聯(lián)的數(shù)據(jù)主要是網(wǎng)元的連接數(shù)據(jù),存儲在ARNE數(shù)據(jù)庫里,與用戶操作權限相關的數(shù)據(jù)存儲在TSS數(shù)據(jù)庫里,其他還需要實時更新的數(shù)據(jù)也包括用戶自己的數(shù)據(jù),存儲在/ossrc/home/路徑下,還有一些定時任務CRONTAB的數(shù)據(jù)。這些數(shù)據(jù)是備機需要與主機同步的,因為他們直接影響OSS的服務。Shell腳本的功能就是定期備份這些數(shù)據(jù)到指定目錄,對于數(shù)據(jù)量大的用戶數(shù)據(jù),采用增量備份方式,即只備份在上一次備份之后有變化的新數(shù)據(jù)。由于TSS是Sybase數(shù)據(jù)庫,和ARNE的Versant數(shù)據(jù)庫類型和架構不一樣,而HOME下的數(shù)據(jù)采用增量備份方式,所以主用服務器上需要配置多個SHELL腳本,實現(xiàn)不同的功能:TSS數(shù)據(jù)庫備份腳本實現(xiàn)賬號權限全量數(shù)據(jù)備份;ARNE數(shù)據(jù)備份腳本實現(xiàn)網(wǎng)元配置數(shù)據(jù)全量備份;HOME文件變更檢測腳本通過對文件的名字、大小、變更時間的比對發(fā)現(xiàn)文件的變更信息,檢測出所有用戶的文件變更情況和用戶CRONTAB任務表變更情況;HOME數(shù)據(jù)備份腳本將檢測到的變更文件備份到指定目錄。
綜合考慮服務器性能、數(shù)據(jù)變更頻率、數(shù)據(jù)重要性和對用戶的影響程度,并錯開網(wǎng)絡工程時間,在CRONTAB設置各個腳本的執(zhí)行頻率與時間:
在主用服務器上上配置了這些Shell腳本后,主用服務器便可自動備份指定的數(shù)據(jù),并存儲到專用的特定目錄下。備份周期可根據(jù)實際情況調(diào)整。例如,用戶變更的數(shù)據(jù)量不大但對用戶的操作影響大,每天早上上班前備份一次,而網(wǎng)元連接數(shù)據(jù)、用戶權限等變化少但數(shù)據(jù)量大的,則每周備份一次。為了使備份數(shù)據(jù)的工作對OSS主服務器的負荷影響降到最低,可將備份時間設為OSS業(yè)務量少,網(wǎng)絡工程已結束但日常維護還未開始的早上。同時,若系統(tǒng)管理員進行了大量的數(shù)據(jù)修改,可在數(shù)據(jù)修改后手動啟動以上各個腳本備份好數(shù)據(jù)。
(3)備用服務器自動獲取主用服務器上的備份數(shù)據(jù)并更新自身數(shù)據(jù)。
在備用服務器上布置定時Shell腳本,在主用服務器開始備份數(shù)據(jù)的30分鐘后,采用FTP技術通過專用數(shù)據(jù)同步網(wǎng)絡獲取主用服務器上備份好的數(shù)據(jù),然后導入到本機上相應的數(shù)據(jù)庫和文件目錄下,進行數(shù)據(jù)更新。
2、主備服務器一鍵切換解決方案。
將主備用服務器同時接入OSS系統(tǒng)的業(yè)務網(wǎng)絡,劃分在同一個VLAN上面。平時,交換機上備用服務器的業(yè)務端口處于down的狀態(tài),主用服務器的業(yè)務端口處于up狀態(tài),對外提供服務。當啟動一鍵切換功能,通過交換機上的管理網(wǎng)絡,將OSS的主用服務器的業(yè)務端口狀態(tài)改為down狀態(tài),將備用服務器的業(yè)務端口狀態(tài)改為up,由備用服務器對外提供網(wǎng)管服務。
一鍵切換功能部署在管理主機上。該功能由系統(tǒng)管理員啟動,通過Shell腳本實現(xiàn)。Shell腳本登陸到交換機上利用管理網(wǎng)絡進行操作,改變業(yè)務網(wǎng)絡的端口狀態(tài)實現(xiàn)主備用服務器間的切換。切換后,腳本將檢查備用服務器上的數(shù)據(jù)是否最新,若否則啟動數(shù)據(jù)同步功能,更新備用服務器上的數(shù)據(jù),然后啟動備用服務器上的ldap-client和cron的守護進程,最后重啟所有UAS 接口機。
三、總結
實踐證明本文提出的方案有效解決了冷備容災方式數(shù)據(jù)不同步的問題,實現(xiàn)了硬切換到軟切換的轉變,達到了快速切換的目標。該解決方案適合于有數(shù)據(jù)同步需求或需要在服務器間進行切換的系統(tǒng)引入,尤其適合于想將冷備份容災方式轉化成“準熱備份”容災方式的系統(tǒng)。
【摘要】 愛立信OSS系統(tǒng)當前一般采用冷備份的容災方式,主備用服務器上無數(shù)據(jù)同步功能,應急操作依賴于管理員手工切換,容災效果大打折扣。作為移動通信網(wǎng)中專用的設備操作管理系統(tǒng),OSS系統(tǒng)的可用性至關重要,直接影響了對網(wǎng)絡的操作維護。因此,本論文提出一種有效的解決方案,實現(xiàn)冷備份系統(tǒng)“準熱備份”的容災效果。該解決方案也可用于其它冷備份系統(tǒng),提升容災效果。
【關鍵詞】 冷備份 數(shù)據(jù)同步 一鍵切換 軟切換
一、背景情況
OSS系統(tǒng)是移動通信網(wǎng)中專用的愛立信設備操作管理系統(tǒng),提供集中式的無線網(wǎng)絡和核心網(wǎng)絡的操作維護功能,主要提供故障管理、配置管理、性能管理、鑒權管理四大功能,包含OSS主服務器、備用服務器、COMINF服務器、UAS接口機、OMBS服務器、ENIQ服務器、交換機等設備,這些設備各施其能、各管其職,協(xié)同工作,為用戶提供愛立信網(wǎng)元的網(wǎng)管服務。OSS系統(tǒng)采用冷備份的容災方式,當該服務器的軟件或硬件出現(xiàn)故障的時候,需要切換到備用服務器上,由系統(tǒng)管理員前往機房操作,同時需要重啟備用服務器上的進程,更新備用服務器上的數(shù)據(jù)。當前OSS的容災方式和應急操作手段的不足,直接影響了OSS的冷備份容災效果。
1、主備機間無數(shù)據(jù)同步機制,數(shù)據(jù)不同步直接影響了切換后OSS用戶的某些維護操作。OSS系統(tǒng)上精確地配置了每個用戶的權限,存儲了每一個網(wǎng)絡設備的配置信息,包括IP地址、帳號權限、網(wǎng)絡配置等,以及用戶自己的文件。如果主備機切換前用戶的權限、網(wǎng)元的配置或者網(wǎng)絡參數(shù)修發(fā)生了變化,而備機沒有及時更新,切換后用戶就會因權限問題無法進行某些操作,網(wǎng)元出現(xiàn)斷連、參數(shù)不對無法進行網(wǎng)絡優(yōu)化等問題。雖然切換到了備用服務器,但對于用戶來說,OSS的網(wǎng)管服務還是不可用的。
2、人工切換耗時長,需要OSS系統(tǒng)管理員前往機房進行操作,容災效果不明顯。若故障發(fā)生在非工作時間,OSS系統(tǒng)管理員趕到機房所耗費的時間,可能比起系統(tǒng)管理員直接修復主機故障所用的時間還長,備機的冷備份容災方式便形同虛設。
從上面的兩點可以看出,當前OSS系統(tǒng)采用的冷備份容災方式的效果受限于當前容災操作的數(shù)據(jù)維護方式和切換方式。而廠家也沒有任何解決辦法。為此,如何解決當前OSS系統(tǒng)冷容災方式的不足成為亟待解決的技術難題。
二、技術解決方案
1、備用服務器數(shù)據(jù)同步解決方案。
在備用服務器上開發(fā)數(shù)據(jù)準實時同步工具,實現(xiàn)備用服務器主動更新TSS、ARNE、HOME三大數(shù)據(jù)庫的數(shù)據(jù),保持與主用服務器一致。
(1)增設主備用服務器間數(shù)據(jù)同步的專用網(wǎng)絡。
OSS系統(tǒng)內(nèi)部原有3個獨立隔離的網(wǎng)絡:業(yè)務網(wǎng)絡、管理網(wǎng)絡和備份網(wǎng)絡,分別負責系統(tǒng)內(nèi)部的業(yè)務通信、系統(tǒng)管理和系統(tǒng)備份。為避免相互干擾,提供安全可靠的傳輸通道,增設一個專用的數(shù)據(jù)同步網(wǎng)絡,使用C類IP地址,使用主備服務器上的備用網(wǎng)卡和冗余網(wǎng)口。考慮成本問題,采用在交換機上劃分VLAN的方式而非增加一臺交換機來實現(xiàn)。
(2)主用服務器自動備份相關數(shù)據(jù)。
從效率、資源成本的角度從發(fā),選用Shell腳本與CRONTAB定時任務結合實現(xiàn)數(shù)據(jù)備份的功能。SHELL腳本實現(xiàn)的功能是檢測數(shù)據(jù)的變化和將相關數(shù)據(jù)備份到指定目錄。與現(xiàn)網(wǎng)關聯(lián)的數(shù)據(jù)主要是網(wǎng)元的連接數(shù)據(jù),存儲在ARNE數(shù)據(jù)庫里,與用戶操作權限相關的數(shù)據(jù)存儲在TSS數(shù)據(jù)庫里,其他還需要實時更新的數(shù)據(jù)也包括用戶自己的數(shù)據(jù),存儲在/ossrc/home/路徑下,還有一些定時任務CRONTAB的數(shù)據(jù)。這些數(shù)據(jù)是備機需要與主機同步的,因為他們直接影響OSS的服務。Shell腳本的功能就是定期備份這些數(shù)據(jù)到指定目錄,對于數(shù)據(jù)量大的用戶數(shù)據(jù),采用增量備份方式,即只備份在上一次備份之后有變化的新數(shù)據(jù)。由于TSS是Sybase數(shù)據(jù)庫,和ARNE的Versant數(shù)據(jù)庫類型和架構不一樣,而HOME下的數(shù)據(jù)采用增量備份方式,所以主用服務器上需要配置多個SHELL腳本,實現(xiàn)不同的功能:TSS數(shù)據(jù)庫備份腳本實現(xiàn)賬號權限全量數(shù)據(jù)備份;ARNE數(shù)據(jù)備份腳本實現(xiàn)網(wǎng)元配置數(shù)據(jù)全量備份;HOME文件變更檢測腳本通過對文件的名字、大小、變更時間的比對發(fā)現(xiàn)文件的變更信息,檢測出所有用戶的文件變更情況和用戶CRONTAB任務表變更情況;HOME數(shù)據(jù)備份腳本將檢測到的變更文件備份到指定目錄。
綜合考慮服務器性能、數(shù)據(jù)變更頻率、數(shù)據(jù)重要性和對用戶的影響程度,并錯開網(wǎng)絡工程時間,在CRONTAB設置各個腳本的執(zhí)行頻率與時間:
在主用服務器上上配置了這些Shell腳本后,主用服務器便可自動備份指定的數(shù)據(jù),并存儲到專用的特定目錄下。備份周期可根據(jù)實際情況調(diào)整。例如,用戶變更的數(shù)據(jù)量不大但對用戶的操作影響大,每天早上上班前備份一次,而網(wǎng)元連接數(shù)據(jù)、用戶權限等變化少但數(shù)據(jù)量大的,則每周備份一次。為了使備份數(shù)據(jù)的工作對OSS主服務器的負荷影響降到最低,可將備份時間設為OSS業(yè)務量少,網(wǎng)絡工程已結束但日常維護還未開始的早上。同時,若系統(tǒng)管理員進行了大量的數(shù)據(jù)修改,可在數(shù)據(jù)修改后手動啟動以上各個腳本備份好數(shù)據(jù)。
(3)備用服務器自動獲取主用服務器上的備份數(shù)據(jù)并更新自身數(shù)據(jù)。
在備用服務器上布置定時Shell腳本,在主用服務器開始備份數(shù)據(jù)的30分鐘后,采用FTP技術通過專用數(shù)據(jù)同步網(wǎng)絡獲取主用服務器上備份好的數(shù)據(jù),然后導入到本機上相應的數(shù)據(jù)庫和文件目錄下,進行數(shù)據(jù)更新。
2、主備服務器一鍵切換解決方案。
將主備用服務器同時接入OSS系統(tǒng)的業(yè)務網(wǎng)絡,劃分在同一個VLAN上面。平時,交換機上備用服務器的業(yè)務端口處于down的狀態(tài),主用服務器的業(yè)務端口處于up狀態(tài),對外提供服務。當啟動一鍵切換功能,通過交換機上的管理網(wǎng)絡,將OSS的主用服務器的業(yè)務端口狀態(tài)改為down狀態(tài),將備用服務器的業(yè)務端口狀態(tài)改為up,由備用服務器對外提供網(wǎng)管服務。
一鍵切換功能部署在管理主機上。該功能由系統(tǒng)管理員啟動,通過Shell腳本實現(xiàn)。Shell腳本登陸到交換機上利用管理網(wǎng)絡進行操作,改變業(yè)務網(wǎng)絡的端口狀態(tài)實現(xiàn)主備用服務器間的切換。切換后,腳本將檢查備用服務器上的數(shù)據(jù)是否最新,若否則啟動數(shù)據(jù)同步功能,更新備用服務器上的數(shù)據(jù),然后啟動備用服務器上的ldap-client和cron的守護進程,最后重啟所有UAS 接口機。
三、總結
實踐證明本文提出的方案有效解決了冷備容災方式數(shù)據(jù)不同步的問題,實現(xiàn)了硬切換到軟切換的轉變,達到了快速切換的目標。該解決方案適合于有數(shù)據(jù)同步需求或需要在服務器間進行切換的系統(tǒng)引入,尤其適合于想將冷備份容災方式轉化成“準熱備份”容災方式的系統(tǒng)。