謝 芳,黃 河
(海峽之聲廣播電臺(tái),廈門(mén) 361001)
隨著IP技術(shù)廣泛應(yīng)用,傳統(tǒng)的SDH傳輸技術(shù)以越來(lái)越無(wú)法滿足人們的需求,MSTP越來(lái)越被人們重視起來(lái)。本文列舉了MSTP設(shè)備常見(jiàn)的幾類故障場(chǎng)景,并針對(duì)各個(gè)故障場(chǎng)景,逐一給出故障現(xiàn)象及故障處理方法。
隨著MSTP設(shè)備應(yīng)用的廣泛,MSTP設(shè)備的維護(hù)也得到了重視。簡(jiǎn)單的設(shè)備維護(hù)可以從以下幾個(gè)步驟入手:
步驟一:日常數(shù)據(jù)備份
數(shù)據(jù)庫(kù)自動(dòng)備份策略設(shè)置的網(wǎng)管入口:系統(tǒng)>網(wǎng)元軟件管理>網(wǎng)元備份策略管理,ASON&分組網(wǎng)元每天一次,其他網(wǎng)元每周一次。
網(wǎng)管腳本定時(shí)備份:在網(wǎng)管上創(chuàng)建“全網(wǎng)配置腳本”文件的定時(shí)備份任務(wù),每周一次。
網(wǎng)管數(shù)據(jù)庫(kù)定時(shí)備份:在網(wǎng)管上創(chuàng)建數(shù)據(jù)庫(kù)定時(shí)備份任務(wù),每月一次。
網(wǎng)管側(cè)業(yè)務(wù)路徑信息導(dǎo)出:網(wǎng)管側(cè)SDH業(yè)務(wù)路徑導(dǎo)出,ASON控制鏈路/TE鏈路/智能電路信息導(dǎo)出,分組Tunnel/PWE3業(yè)務(wù)路徑導(dǎo)出,每周一次。
步驟二:采集工具部署
在Support網(wǎng)站下載“UEasyDataCollection”工具后安裝在U2000網(wǎng)管服務(wù)器上。
步驟三:日常例行檢查
數(shù)據(jù)庫(kù)檢查:在Support網(wǎng)站下載“DBCheckerUI"工具檢查。
高危告警檢查:篩查&處理全網(wǎng)高危告警(如下表),禁止屏蔽。
表1 重要告警列表
故障信息采集是較為重要的一環(huán),我們可以借助相關(guān)工具來(lái)更加快速精準(zhǔn)的完成故障信息采集。
故障業(yè)務(wù)相關(guān)信息反饋:
(1)故障發(fā)生時(shí)間、網(wǎng)管告警、網(wǎng)元異常狀態(tài)(如脫管、響應(yīng)慢等)。
(2)業(yè)務(wù)保護(hù)類型&狀態(tài)、設(shè)備類型&版本。
(3)中斷業(yè)旁類別數(shù)量,選取一條中斷業(yè)務(wù)給出路徑信息。
故障前后異常&操作信息反饋:
(1)故障前:是否有升級(jí)、掉電、割接、光纖中斷、對(duì)接設(shè)備的操作等。
(2)故障后:是否有網(wǎng)管配置上下載、業(yè)務(wù)配置、拔插纖纜/單板等。
數(shù)據(jù)備份情況:
是否有網(wǎng)元數(shù)據(jù)庫(kù)/網(wǎng)管配置腳本備份、巡檢數(shù)據(jù)等。
數(shù)據(jù)采集:
采集網(wǎng)管當(dāng)前告警、操作日志、異常事件(推薦使用UEasyDataCollection工具快速采集)。
3.1.1 環(huán)形復(fù)用段業(yè)務(wù)中斷
故障現(xiàn)象:
環(huán)形復(fù)用段倒換或倒換恢復(fù)后業(yè)務(wù)中斷,或者環(huán)形復(fù)用段狀態(tài)異常。
處理方法:
(1)復(fù)用段協(xié)議全環(huán)停啟(可能會(huì)導(dǎo)致環(huán)上業(yè)務(wù)短暫中斷)。
(2)復(fù)用段斷纖點(diǎn)區(qū)段兩側(cè)強(qiáng)制倒換。
(3)斷纖點(diǎn)兩端網(wǎng)元交叉板主備倒換。
(4)復(fù)用段環(huán)先刪后建。
(5)核實(shí)故障業(yè)務(wù)是否配置在復(fù)用段的額外通道上、是否多點(diǎn)斷纖、是否光纖錯(cuò)連。
3.1.2 線性復(fù)用段業(yè)務(wù)中斷
故障現(xiàn)象:
線性復(fù)用段創(chuàng)換或倒換恢復(fù)后業(yè)務(wù)中斷,或者線性復(fù)用段狀態(tài)異常。
處理方法:
(1)停啟復(fù)用段協(xié)議。
(2)強(qiáng)制倒換到保護(hù)通道。
(3)復(fù)用段先刪后建。
(4)排查1+1線性復(fù)用段是否缺少雙發(fā)業(yè)務(wù)。
(5)若和友商設(shè)備對(duì)接,關(guān)閉激光器觸發(fā)對(duì)端倒換。
(6)若和友商設(shè)備對(duì)接,修改兩端配置為1+1單端線性復(fù)用段保護(hù)。
3.2.1 EoS板業(yè)務(wù)中斷
故障現(xiàn)象:
EoS板端口流量為0或很小,其他TDM業(yè)務(wù)正常,即可判定為EoS板業(yè)務(wù)中斷。
處理方法:
若有配置操作,則回退。
若無(wú),則判定SDH通道是否異常:
(1)數(shù)據(jù)板是否存在SDH側(cè)告警(如AIS、UNEQ、SLM、EXC、SQM等)。
(2)測(cè)試幀結(jié)果是否正常。
(3)修改數(shù)據(jù)板通道開(kāi)銷J1/J2(VC4只能在線路板修改J1)在對(duì)端檢測(cè)實(shí)收值。
若SDH通道異常,則去激活后激活SDH業(yè)務(wù)或更換SDH路徑。
若SDH通道正常:
(1)倒換BPS/PPS/DLAG/LAG。
(2)去使能后重新使能以太端口;去使能后集新使能LCAS。
(3)刪除VCTRUNK綁定后重新綁定。
(4)刪除后重配以太業(yè)務(wù)。
(5)硬復(fù)位單板(會(huì)影響整板業(yè)務(wù))。
(6)修改專網(wǎng)為專線業(yè)務(wù)。
檢查端口參數(shù):
檢查端口TAG屬性&工作模式&封裝模式&VLAN ID是否配置正確。
3.2.2 EoS板業(yè)務(wù)成環(huán)
故障現(xiàn)象:
對(duì)于EoS專網(wǎng)業(yè)務(wù),故障端口廣播或組播流量達(dá)到1M以上,或單板響應(yīng)很慢、查詢端口實(shí)際工作模式等命令超時(shí),或存在ETHOAM_SELF_LOOP、ETHOAM_ VCG_SELF_LOOP告警,其他TDM業(yè)務(wù)正常。
處理方法:(1)若有配置操作(如新增交叉、配置VCTRUNK等),則回退。(2)檢查Hub/Spoke屬性。注:若單板響應(yīng)慢導(dǎo)致命令無(wú)法下發(fā),請(qǐng)先在網(wǎng)管設(shè)置,然后硬復(fù)位單板,使配置生效。
(3)刪除VB內(nèi)所有端口后逐一添加,判斷添加到哪個(gè)端口后業(yè)務(wù)異常。
3.3.1 ASON網(wǎng)絡(luò)資源不足
故障現(xiàn)象:
ASON網(wǎng)絡(luò)斷纖/斷纜后:
(1)故障業(yè)務(wù)存在CP_SRV_INT/CP_SER_INT/SER_INT告警。
(2)查看網(wǎng)管異常事件,故障業(yè)務(wù)在對(duì)應(yīng)時(shí)間點(diǎn)存在重路由失?。ㄊ录e(cuò)誤碼為40497)。
處理方法:
盡快修復(fù)中斷的光纖/纜(如無(wú)法立即修復(fù),可嘗試如下操怍):
(1)國(guó)將與故障業(yè)務(wù)源宿節(jié)點(diǎn)相同的鉆石級(jí)業(yè)務(wù)轉(zhuǎn)為銀級(jí)業(yè)務(wù)(選中需要操作的業(yè)務(wù),單擊鼠標(biāo)右鍵選擇“在線轉(zhuǎn)換”->“銀級(jí)”)。
(2)手工優(yōu)化其他相關(guān)的ASON業(yè)務(wù)路由,確保中斷的業(yè)務(wù)有資源可重路由。
(3)若存在CP TEL DEGRADE告警,排查鏈路DCC通道的 D4-D12是否配置正常(“網(wǎng)元管理器”->“通信”->“DCC 管理”)。
3.3.2 ASON業(yè)務(wù)中斷
斷纖/斷纜觸發(fā)的ASON重路由后業(yè)務(wù)中斷(已排除ASON資源不足)
故障現(xiàn)象&判定:
(1)ASON網(wǎng)內(nèi)故障:故障業(yè)務(wù)存在CP_SRV_INT/CP_SER_INT/SER_INT告警。
(2)ASON網(wǎng)外故障:業(yè)務(wù)源端有RLOS/RLOF/AU_CMM/AU_AIS/HP_UNEQ或CP_SRV_INT_OUT告警。
處理方法:
(1)若是ASON網(wǎng)內(nèi)故障:一是解除鎖定:在“智能路徑管理”界面選中故障路徑,單擊鼠標(biāo)右鍵選擇“設(shè)置路由屬性”,修改成不鎖定。二是業(yè)務(wù)優(yōu)化:在“配置”>“SDH智能”>“智能路徑管理”>“維護(hù)”界面中,單擊優(yōu)化。三是重新配置:去激活后重新激活業(yè)務(wù);刪除智能業(yè)務(wù)后重建靜態(tài)業(yè)務(wù)。
(2)若是ASON網(wǎng)外故障:一是接入點(diǎn)保護(hù)倒換:若ASON業(yè)務(wù)的源/宿接入點(diǎn)存在1+1或1:1MSP保護(hù),進(jìn)行保護(hù)倒換。二是接入點(diǎn)告警清除:若ASON業(yè)務(wù)源/宿節(jié)點(diǎn)端口有RLOS/RLOF/AU_CMM/AU_AIS/AU_LOP/HP_UNEQ/HP_TIM等告警,先清除這些告警。
除了以上列舉的故障外還有一些比較簡(jiǎn)單的其他故障,如電源故障、單板故障等。MSTP技術(shù)一定會(huì)被越來(lái)越多的人接受,其設(shè)備的日常維護(hù)與故障處理保障也將成為必要。