郭艷萍
【摘要】隨著聯(lián)通移動(dòng)業(yè)務(wù)快速發(fā)展,保證客戶(hù)信息從前臺(tái)BSS系統(tǒng)安全、暢通送至后臺(tái)設(shè)備處理,對(duì)我們的網(wǎng)絡(luò)安全提出了更高的要求。本文對(duì)現(xiàn)網(wǎng)BSS與后臺(tái)組網(wǎng)進(jìn)行分析,結(jié)合日常故障處理,分析了網(wǎng)絡(luò)實(shí)際應(yīng)用效果以及存在的不足并對(duì)網(wǎng)絡(luò)進(jìn)行整改,降低了網(wǎng)絡(luò)風(fēng)險(xiǎn)。
【關(guān)鍵詞】HLRDCNBSS互聯(lián)網(wǎng)絡(luò)
一、引言
當(dāng)客戶(hù)通過(guò)營(yíng)業(yè)廳提出業(yè)務(wù)需求時(shí),前臺(tái)BSS營(yíng)帳系統(tǒng)會(huì)將用戶(hù)業(yè)務(wù)需求變更為各種相應(yīng)的聯(lián)機(jī)指令通過(guò)DCN網(wǎng)絡(luò)自動(dòng)送至后臺(tái)HLR設(shè)備進(jìn)行處理,從而實(shí)現(xiàn)客戶(hù)業(yè)務(wù)需求在后臺(tái)網(wǎng)元設(shè)備內(nèi)的開(kāi)通及業(yè)務(wù)變更。但在日常維護(hù)過(guò)程中發(fā)現(xiàn),會(huì)由于某些原因造成BSS系統(tǒng)與后臺(tái)HLR設(shè)備網(wǎng)絡(luò)斷聯(lián),使聯(lián)機(jī)指令在前臺(tái)堆積,無(wú)法正常傳送至后臺(tái),從而影響用戶(hù)業(yè)務(wù)辦理。
二、典型故障案例分析
2.1故障現(xiàn)象
接到BSS側(cè)投訴,受理業(yè)務(wù)無(wú)法竣工,并有工單指令堆積現(xiàn)象。從HLR側(cè)查看無(wú)告警。
2.2故障分析
現(xiàn)網(wǎng)組網(wǎng)如圖1所示:
組網(wǎng)中,HLR至DCN網(wǎng)絡(luò)為雙路由保護(hù),如圖1所示。造成聯(lián)機(jī)指令堆積可能有以下幾種原因:(1)SMU server故障,SMU雙擊倒換失敗,造成SMU server與營(yíng)帳系統(tǒng)斷連。(2)營(yíng)帳系統(tǒng)故障,造成營(yíng)帳系統(tǒng)與SMU server系統(tǒng)斷連。(3)承載網(wǎng)故障,造成營(yíng)帳系統(tǒng)與HLR SMU之間鏈路中斷。
2.3故障處理
根據(jù)以上分析進(jìn)行逐步排查:(1)檢查HLR告警臺(tái),查看告警臺(tái)是否有SMU server雙機(jī)故障及倒換的告警,經(jīng)檢查,SMU server雙機(jī)正常,無(wú)告警,且各個(gè)業(yè)務(wù)進(jìn)程正常。(2)聯(lián)系營(yíng)帳系統(tǒng)工程師排查營(yíng)帳系統(tǒng)側(cè)是否正常,經(jīng)檢查營(yíng)帳系統(tǒng)進(jìn)程及系統(tǒng)正常。(3)在smu側(cè)及營(yíng)帳側(cè)都不能互相ping通對(duì)方,判斷為中間鏈路故障。經(jīng)確認(rèn)HLR至DCN網(wǎng)絡(luò)主用傳輸鏈路故障,同時(shí)發(fā)現(xiàn)HLR內(nèi)部交換機(jī)至光貓2網(wǎng)線(xiàn)斷聯(lián),見(jiàn)圖1(紅色鏈路部分)。
恢復(fù)主備通信鏈路,觀察發(fā)現(xiàn)業(yè)務(wù)時(shí)通時(shí)斷,該現(xiàn)象可能與傳輸鏈路質(zhì)量有問(wèn)題或者網(wǎng)線(xiàn)不好有關(guān),傳輸機(jī)房查看告警無(wú)相關(guān)告警輸出,更換網(wǎng)線(xiàn)故障依舊。數(shù)據(jù)機(jī)房登陸NE40查看HLR服務(wù)器所在VLAN 214,該VLAN配置了VRRP,且主備協(xié)商正常,再登陸S9303查看VLAN 214所加入的接口,其中S9303-1下行口G2/0/22流量異常,單方向input方向流量非常大,查看S9303-2下行口G2/0/27,該接口output方向流量異常,由此推斷在VLAN 214存在環(huán)路。經(jīng)確認(rèn)HLR內(nèi)部交換機(jī)之前并沒(méi)有與光貓2直連,現(xiàn)場(chǎng)人員問(wèn)題處理時(shí)無(wú)意將網(wǎng)線(xiàn)插到光貓2導(dǎo)致形成環(huán)路。Shutdown S9303-2 G2/0/27,業(yè)務(wù)恢復(fù)。
三、制定措施進(jìn)行網(wǎng)絡(luò)整改
二層環(huán)路所引起的廣播風(fēng)暴,其結(jié)果是災(zāi)難性的,在網(wǎng)絡(luò)設(shè)計(jì)及施工時(shí)要盡量避免成環(huán),原來(lái)的網(wǎng)絡(luò)顯然存在不合理性,雖然在NE40側(cè)做了VRRP,但實(shí)際上并未達(dá)到保護(hù)的效果,經(jīng)過(guò)協(xié)商,我們對(duì)現(xiàn)網(wǎng)網(wǎng)絡(luò)進(jìn)行了改造,改造后組網(wǎng)如下:
通過(guò)本次改造,消除了環(huán)路,并減少了光貓部分的風(fēng)險(xiǎn)點(diǎn),使網(wǎng)絡(luò)安全性大大提高。
四、HLR SMU雙機(jī)倒換機(jī)制4.1SMU雙機(jī)原理
4.2SMU雙機(jī)由四個(gè)功能模塊組成
(1)主備決策模塊。通過(guò)心跳消息協(xié)商節(jié)點(diǎn)狀態(tài),最終維持一主一備的穩(wěn)定狀態(tài)。(2)文件同步模塊。將主機(jī)需要同步的文件自動(dòng)實(shí)時(shí)同步到備機(jī),主備倒換后文件數(shù)據(jù)不丟失。(3)數(shù)據(jù)庫(kù)同步模塊。將主機(jī)需要同步的數(shù)據(jù)庫(kù)表自動(dòng)實(shí)時(shí)同步到備機(jī),主備倒換后數(shù)據(jù)庫(kù)數(shù)據(jù)不丟失。(4)浮動(dòng)IP管理模塊。通過(guò)浮動(dòng)IP管理,主備倒換后對(duì)外和對(duì)內(nèi)提供服務(wù)的IP地址不變,客戶(hù)端不需要切換連接IP。
4.3SMU主備切換
(1)主用SMU某業(yè)務(wù)臺(tái)5分鐘內(nèi)異常3次時(shí),主用SMU自動(dòng)請(qǐng)求切換,同時(shí)自身置為故障標(biāo)志。(2)系統(tǒng)提供主備倒換命令(SWP SMU),允許手動(dòng)進(jìn)行主備切換。(3)如果雙機(jī)通信中斷超過(guò)2分鐘,則兩個(gè)SMU都會(huì)自動(dòng)嘗試切換為主用,但只有一個(gè)SMU能占用公共資源(目前只有浮動(dòng)IP是公共資源),因此一般不會(huì)出現(xiàn)雙主用的情況。在外網(wǎng)和心跳都中斷的情況下,可能存在雙主機(jī)的情況,如果心跳恢復(fù),則最先成為主用的SMU繼續(xù)維持主用,另一臺(tái)自動(dòng)降為備用,同時(shí)同步開(kāi)關(guān)被強(qiáng)制關(guān)閉,并上報(bào)雙主用SMU發(fā)生沖突告警(4415)。(4)如果備用SMU發(fā)現(xiàn)自身存在故障標(biāo)志,則會(huì)拒絕主用BAM的切換請(qǐng)求。(5)觸發(fā)系統(tǒng)故障標(biāo)志的條件有:某業(yè)務(wù)臺(tái)5分鐘內(nèi)異常3次。(6)任何一個(gè)SMU切換成為主用SMU失敗,都會(huì)釋放公共資源,降為備用,因此不會(huì)出現(xiàn)各占部分公共資源導(dǎo)致雙備的情況。
注意:在SMU未連接外網(wǎng)的情況下,外網(wǎng)網(wǎng)卡上配置的物理IP是不生效的,此時(shí)雙機(jī)程序也不能切換到未連接接外網(wǎng)的SMU上。
由于SMU server采用雙機(jī)原理,在正常情況下,營(yíng)帳系統(tǒng)只與SMU浮動(dòng)IP相連,當(dāng)主用SMU server自身出現(xiàn)故障或S2000至HLR鏈路故障的情況下,主用SMU自動(dòng)請(qǐng)求切換,同時(shí)自身置為故障標(biāo)志,從而保障營(yíng)帳系統(tǒng)與SMU連接不中斷,不影響業(yè)務(wù)。
五、存在問(wèn)題
當(dāng)S2000以上鏈路出現(xiàn)故障,S2000至HLR內(nèi)部交換機(jī)端口檢測(cè)仍為UP狀態(tài),因此HLR SMU不會(huì)發(fā)生自動(dòng)切換,需手工切換SMU,這樣延長(zhǎng)了業(yè)務(wù)影響時(shí)間。因此我們平時(shí)應(yīng)當(dāng)加強(qiáng)基礎(chǔ)維護(hù)管理,提升維護(hù)人員維護(hù)水平,熟悉維護(hù)操作,嚴(yán)格將網(wǎng)絡(luò)安全風(fēng)險(xiǎn)降到最低。
六、結(jié)束語(yǔ)
通過(guò)對(duì)后臺(tái)HLR設(shè)備與DCN網(wǎng)絡(luò)之間組網(wǎng)改造,減少了發(fā)生故障的風(fēng)險(xiǎn)點(diǎn),提高了網(wǎng)絡(luò)的安全性,從業(yè)務(wù)層面提高了客戶(hù)服務(wù)的支撐力度,使客戶(hù)感知進(jìn)一步提升。