雷成勝
隨著鐵路信息化的發(fā)展,CTC/TDCS設備已在在鐵路行車指揮自動化方面發(fā)揮了極其重要的作用,系統(tǒng)網(wǎng)絡安全已成業(yè)內(nèi)人士關注的焦點,路局中心和鐵道部網(wǎng)絡癱瘓必然會造成運輸組織上的嚴重混亂,同時也會嚴重影響到行車安全。那么,目前網(wǎng)絡系統(tǒng)是否安全呢?下面首先介紹一下該系統(tǒng)網(wǎng)絡構成。
一、CTC/TDCS網(wǎng)絡結構
我們知道,CTC和TDCS網(wǎng)絡結構不盡相同,TDCS采用單網(wǎng)結構而CTC采用雙網(wǎng)結構,統(tǒng)計數(shù)據(jù)顯示,無論是單網(wǎng)還是雙網(wǎng)結構,它們在運行中出現(xiàn)局部網(wǎng)絡癱瘓概率是相同的。我們以設計安全等級較高的CTC網(wǎng)絡為例介紹其網(wǎng)絡配置。
CTC設備網(wǎng)絡包括調度中心局域網(wǎng)、系統(tǒng)廣域網(wǎng)及車站局域網(wǎng)三部分。其中,系統(tǒng)廣域網(wǎng)由調度中心與車站之間及車站與車站間的廣域網(wǎng)、控制中心與控制中心間的廣域網(wǎng)構成。
路由器、交換機、終端設備(協(xié)議轉換器)以太網(wǎng)適配器及網(wǎng)線等關鍵網(wǎng)絡設備或部件均采用冗余配置,系統(tǒng)廣域網(wǎng)結構采用冗余路由方式,包括傳輸通道的冗余和拓撲結構的冗余。
基本連結示意如下:
通過以上介紹,我們大致明白了其網(wǎng)絡結構,從現(xiàn)場使用情況看,故障經(jīng)常發(fā)生在協(xié)議轉換器與光接入設備間。同時我們注意到這種接入方法存在兩個致命缺陷:一是部分站通信機械室與信號機械室地電位不同,影響通道穩(wěn)定性,我段管內(nèi)共有三個站路由器與機柜間需隔離安裝;其二是違反電磁兼容性原則。我們知道,雷電易從鐵通桿塔引入,75歐同軸電纜又能將這種雷電引入信號設備。如發(fā)生在2008年8月25日金沙灘站雷害故障,那次雷害燒毀監(jiān)測機全部網(wǎng)絡設備,同時燒毀多個聯(lián)鎖機與CTC連接的光電隔離設備。那么,這種網(wǎng)絡結構還存在其它那些安全隱患呢,請看下面的故障案例:
二、設備故障案例
1、2008年8月28日,大同樞紐地區(qū)在同一網(wǎng)絡環(huán)路中相鄰的大西一場、房子村及小站三個車站,車站值班員同時反映:TDCS設備不能錄入車次和收不到調度命令。測試上述各站通道誤碼均超過50%,經(jīng)鐵通逐站排除,最后確認為小站對房子村方向的一個協(xié)議轉換器故障,協(xié)議轉換器類型為CONV-1035U,更換后修復。
2、2008年12月10日,大秦線大同縣和陽原車站同時發(fā)現(xiàn)CTC設備站間車次不能正常跟蹤、車務終端出現(xiàn)自律機頻繁倒機告警現(xiàn)象,同時太原中心調度員也反映調度命令發(fā)不下去。測試通道誤碼超過50%,經(jīng)查看路由器數(shù)據(jù),確認為湖東對大同縣方向、大同縣站臨接的56中繼站對東井集中繼站方向各有一協(xié)議轉換器可靠度下降到142左右,協(xié)議轉換器類型為RIC-E1,更換后修復。
3、2008年12月16日,寧岢線寧武到五寨間各站TDCS網(wǎng)絡中斷,大同電務段動態(tài)檢測室人員登錄其間各站路由器發(fā)現(xiàn):寧武對神池、莊兒上對神池方向各有一通道可靠度降到130以下,朔州通信車間把神池站路由器從機柜內(nèi)拔出后故障修復。
三、故障案例技術分析
以上各次故障發(fā)生后,大同電務段動態(tài)檢測室均派人到場和鐵通方面一起進行了分析,積累了大量處理此類故障經(jīng)驗,為此后發(fā)生同類故障快速判定故障點、更換故障器材提供了技術保障。我們在故障時登錄各故障點路由器,發(fā)現(xiàn)均有如下異常數(shù)據(jù)顯示(請注意有下畫線部分):
通過對以上數(shù)據(jù)分析,結合現(xiàn)場處理情況,兩起故障的原因為協(xié)議轉換器在運行中突發(fā)內(nèi)部性能下降,一起為通信與信號機械室間地電位不同,可靠度(reliability)下降(183/255,正常為255/255),造成路由器串口輸入(input)、校驗(crc)和幀(frame)等出錯,使網(wǎng)絡陷入局部癱瘓之中。
那么,雙網(wǎng)結構的CTC為啥也會發(fā)生這類堵塞性問題呢?從理論上講不是有其它三條通道可以實現(xiàn)數(shù)據(jù)交換嗎?這個問題涉及路由器的主備用配置問題,也涉及CISCO路由器按“跳數(shù)”選擇路經(jīng)等復雜問題,在此不一一贅述。
四、結論和推測
通過以上故障分析,我們得出如下結論:一個網(wǎng)絡環(huán)路內(nèi)同時有兩個及其以上協(xié)議轉換器內(nèi)部性能下降使可靠度降低時,或只有一個協(xié)議轉換器可靠度嚴重下降時,必然造成這個環(huán)路中故障點間相臨站網(wǎng)絡的局部癱瘓。如果路局或鐵道部中心正好有協(xié)議轉換器故障,與其連接的環(huán)路中也有一個協(xié)議轉換器發(fā)生故障時,必然造成局網(wǎng)或部網(wǎng)的局部癱瘓。
五、解決方案
1、變更網(wǎng)絡結構。建議取消目前使用的各類協(xié)議轉換器,采用光端機和EW卡由光纖直接連接通道,特別是要在與局網(wǎng)、部網(wǎng)連接車站上一律照此安裝。
2、加強網(wǎng)絡檢測。責成專人定期檢測網(wǎng)絡通道質量,發(fā)現(xiàn)可靠度下降時立即組織有關方面處理。
六、網(wǎng)絡癱瘓時的應急處理方法
在處理以上故障的過程中,我們發(fā)現(xiàn)用關閉路由器端口的方法可以很方便地降低通道誤碼率,使通道達到基本可用。步驟如下:
1、 Telnet xxx.xxx.xxx.xxx(路由器IP);
2、 輸入用戶名和密碼;
3、 在路由器狀態(tài)下用SH INT指令確認誤碼通道連接的串行端口號;
4、 用Config t指令配置串行端口:interface sx/x/x;
5、 在Config-if狀態(tài)下輸入shut;
6、 退出配置狀態(tài)(END);
7、 確認端口是否關閉:SH INT。