張國(guó)華
摘 要:CTC系統(tǒng)綜合了計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)通信技術(shù)和現(xiàn)代控制技術(shù),采用智能化分散自律設(shè)計(jì)原則,以列車(chē)運(yùn)行調(diào)整計(jì)劃為中心,兼顧了列車(chē)與調(diào)車(chē)作業(yè),是一個(gè)符合我國(guó)國(guó)情、路情的高度自動(dòng)化的調(diào)度指揮系統(tǒng),為我國(guó)調(diào)度集中的發(fā)展開(kāi)創(chuàng)了一條暫新的途徑。該系統(tǒng)反映了鐵路信息化建設(shè)的新內(nèi)容,它不僅僅是一套新的系統(tǒng),而且體現(xiàn)了鐵路運(yùn)輸組織的新模式,是鐵路行車(chē)指揮現(xiàn)代化的重要標(biāo)志。
關(guān)鍵詞:CTC系統(tǒng);結(jié)構(gòu);故障
1 CTC系統(tǒng)的概述
1.1 CTC系統(tǒng)的簡(jiǎn)介
CTC英文全稱(chēng)為:Centralized Traffic Control,亦稱(chēng)列車(chē)調(diào)度集中系統(tǒng),它是調(diào)度中心(調(diào)度員)對(duì)某一調(diào)度區(qū)段的信號(hào)設(shè)備進(jìn)行集中控制、對(duì)列車(chē)運(yùn)行直接指揮、管理的技術(shù)裝備,它的直接效果是行車(chē)管理的自動(dòng)化和遙控化,是現(xiàn)代通信技術(shù)與信號(hào)技術(shù)相結(jié)合的典型代表。
1.2 國(guó)內(nèi)外CTC系統(tǒng)對(duì)比
目前,國(guó)外調(diào)度集中系統(tǒng)應(yīng)用比較成熟的代表國(guó)家有法國(guó)、德國(guó)、日本及西班牙。上述國(guó)家所采用的調(diào)度集中系統(tǒng)各有優(yōu)缺點(diǎn),但與我國(guó)相比,國(guó)外鐵路的行車(chē)密度不高、路網(wǎng)結(jié)構(gòu)簡(jiǎn)單,雖設(shè)有信息化程度較高的運(yùn)輸調(diào)度系統(tǒng),但運(yùn)輸作業(yè)較我國(guó)簡(jiǎn)單,其調(diào)度指揮的綜合性和復(fù)雜性比我國(guó)低。我國(guó)CTC系統(tǒng)是在TDCS(原名DMIS)系統(tǒng)的基礎(chǔ)上發(fā)展起來(lái)的,自20世紀(jì)80年代后期以來(lái),我國(guó)投入了大量人力物力為全路運(yùn)輸調(diào)度指揮系統(tǒng)的立項(xiàng)決策提供了有力的保障,經(jīng)過(guò)多次廣泛調(diào)研、方案變更、反復(fù)上線試驗(yàn),符合我國(guó)國(guó)情的CTC系統(tǒng)成功應(yīng)用于我國(guó)各大客運(yùn)干線。
大秦線作為我國(guó)第一條重載煤炭運(yùn)輸鐵路,擔(dān)負(fù)著我國(guó)煤炭流通的重要使命,大秦線運(yùn)輸暢通與否、運(yùn)輸效率的高低將直接影響到我國(guó)經(jīng)濟(jì)的發(fā)展,因此用CTC系統(tǒng)代替過(guò)去人工辦理進(jìn)路的方式,將大大提升大秦線的運(yùn)輸能力,同時(shí)大大減輕調(diào)度員的工作負(fù)擔(dān),提高工作效率,更重要是時(shí)降低了人工排路可能導(dǎo)致的錯(cuò)排進(jìn)路的概率。
2 CTC系統(tǒng)的結(jié)構(gòu)
2.1 體系結(jié)構(gòu)
調(diào)度集中系統(tǒng)由鐵路總公司、鐵路局、車(chē)站三級(jí)組成。采用三層結(jié)構(gòu):第一層為鐵路總公司調(diào)度中心;第二層為鐵路局既有線/客運(yùn)專(zhuān)線調(diào)度所CTC中心;第三層為車(chē)站子系統(tǒng),構(gòu)成覆蓋全路的調(diào)度指揮網(wǎng)絡(luò)體系。鐵路局分別設(shè)置客運(yùn)專(zhuān)線CTC中心和既有線TDCS/CTC中心。
CTC系統(tǒng)網(wǎng)絡(luò)包括總公司TDCS/CTC中心局域網(wǎng)、鐵路局既有線TDCS/CTC中心局域網(wǎng)、鐵路局客運(yùn)專(zhuān)線CTC中心局域網(wǎng)、車(chē)站局域網(wǎng)及廣域網(wǎng)。其中,廣域網(wǎng)由鐵路總公司TDCS/CTC中心與鐵路局既有線TDCS/CTC中心以及鐵路局客運(yùn)專(zhuān)線CTC中心之間的廣域網(wǎng)、相鄰客運(yùn)專(zhuān)線CTC中心之間的廣域網(wǎng)、既有線TDCS/CTC中心與車(chē)站以及客運(yùn)專(zhuān)線CTC中心與車(chē)站之間的廣域網(wǎng)、車(chē)站與車(chē)站之間的廣域網(wǎng)構(gòu)成。
大秦線CTC網(wǎng)絡(luò)是把太原路局調(diào)度中心與42個(gè)車(chē)站連接起來(lái),整體網(wǎng)絡(luò)采用星型結(jié)構(gòu)與環(huán)型結(jié)構(gòu)相嵌套的模式,這樣既具有星型分層結(jié)構(gòu)的優(yōu)點(diǎn),又有環(huán)型結(jié)構(gòu)的特征,簡(jiǎn)單來(lái)說(shuō)就是把42個(gè)站分為四部分,每一部分組成環(huán)網(wǎng),四個(gè)環(huán)的頭站和尾站直接連接太原中心,四個(gè)環(huán)與中心類(lèi)似于星型連接,這樣增加了整個(gè)網(wǎng)絡(luò)的穩(wěn)定性,一旦某一個(gè)站發(fā)生脫網(wǎng),不會(huì)影響到其他車(chē)站與中心的連接。如圖1所示。
而且為了增加大秦線CTC系統(tǒng)網(wǎng)絡(luò)的可靠度,CTC采用雙通道運(yùn)行,這樣避免了通道發(fā)生問(wèn)題后導(dǎo)致某一車(chē)站無(wú)法與中心進(jìn)行聯(lián)系,因此構(gòu)成每個(gè)站網(wǎng)絡(luò)通道的設(shè)備都有雙套,每個(gè)站設(shè)置有兩臺(tái)路由器、兩臺(tái)交換機(jī),每一種服務(wù)器、工作站、計(jì)算機(jī)都有兩臺(tái),每臺(tái)安裝有兩塊網(wǎng)卡,提供了充分的冗余,例如路由器一和二處于熱備狀態(tài),自律機(jī)A和B也處于熱備狀態(tài)。當(dāng)某一個(gè)網(wǎng)絡(luò)設(shè)備出現(xiàn)故障的時(shí)候,備用設(shè)備自動(dòng)轉(zhuǎn)變?yōu)橹饔?;?dāng)某一個(gè)網(wǎng)段不通或誤碼大(可靠度小于252)的時(shí)候,可以通過(guò)另一個(gè)網(wǎng)段與中心保持通信,車(chē)站計(jì)算機(jī)從兩塊網(wǎng)卡發(fā)出兩份相同的數(shù)據(jù),只要有一份數(shù)據(jù)傳送到中心服務(wù)器,系統(tǒng)就能正常運(yùn)行,雙網(wǎng)結(jié)構(gòu)這樣也為通道維護(hù)人員提供處理故障的寶貴時(shí)間,在不影響主用網(wǎng)段的時(shí)候進(jìn)行故障網(wǎng)段的處理,極大提高網(wǎng)絡(luò)的安全性。車(chē)站設(shè)備網(wǎng)絡(luò)連接方式如圖2、3所示。
2.2 自律機(jī)的熱備
大秦線自律機(jī)雙機(jī)熱備基于active/standby方式的服務(wù)器熱備,在同一時(shí)間內(nèi)只有一臺(tái)自律機(jī)運(yùn)行另一臺(tái)處于熱備狀態(tài),當(dāng)其中運(yùn)行著的一臺(tái)自律機(jī)出現(xiàn)故障無(wú)法啟動(dòng)時(shí),另一臺(tái)備份自律機(jī)會(huì)通過(guò)軟件診測(cè)(通過(guò)心跳診斷)將standby自律機(jī)激活,保證應(yīng)用服務(wù)在短時(shí)間內(nèi)完全恢復(fù)正常使用,作為大秦線CTC系統(tǒng)中最核心的設(shè)備,自律機(jī)的安全、穩(wěn)定性能將直接關(guān)系到整個(gè)CTC系統(tǒng)的穩(wěn)定,因此大秦線自律機(jī)采用雙機(jī)熱備(基于純軟件)的方式來(lái)提高自律機(jī)的穩(wěn)定性。
純軟件方式可以在一定程度上降低成本,但它也有非常明顯的缺點(diǎn):
(1)可靠性相對(duì)較差,兩服務(wù)器間的數(shù)據(jù)實(shí)時(shí)復(fù)制是一個(gè)比較脆弱的環(huán)節(jié)。
(2)一旦某臺(tái)服務(wù)器出現(xiàn)中斷,恢復(fù)后還要進(jìn)行比較復(fù)雜的數(shù)據(jù)同步恢復(fù),并且這個(gè)時(shí)段系統(tǒng)處于無(wú)保護(hù)狀態(tài)。
(3)沒(méi)有事務(wù)機(jī)制,由于其復(fù)制是在文件和磁盤(pán)層進(jìn)行的,復(fù)制是否成功不會(huì)影響數(shù)據(jù)庫(kù)事務(wù)操作,因此有出現(xiàn)數(shù)據(jù)不完整變化的情況,這個(gè)存在著相當(dāng)?shù)娘L(fēng)險(xiǎn)。
基于active/standby方式的自律機(jī)熱備,會(huì)受到主/備機(jī)之間的通道質(zhì)量及主/備機(jī)自律機(jī)軟件中通信模塊的影響,一旦主/備機(jī)之間的通道質(zhì)量開(kāi)始下降(誤碼增加),主/備機(jī)之間的心跳診斷將會(huì)受到影響,從而導(dǎo)致備機(jī)偵測(cè)不到主機(jī)發(fā)來(lái)的指令,備機(jī)由備用升為主用,而此時(shí)主機(jī)仍舊處于主用狀態(tài),這時(shí)就發(fā)生了雙機(jī)搶主的問(wèn)題,發(fā)生雙機(jī)搶主的現(xiàn)象,導(dǎo)致主/備機(jī)同時(shí)向車(chē)務(wù)終端發(fā)送數(shù)據(jù),造成數(shù)據(jù)疊加,使得終端顯示與實(shí)際不符,影響到調(diào)度員的指揮判斷,嚴(yán)重時(shí)會(huì)導(dǎo)致非正常停車(chē),影響大秦線的正常運(yùn)行。
3 故障案例
(1)2014年11月14日23:25分,玉田北——遷西區(qū)間信號(hào)機(jī)顯示異常,電務(wù)人員立即通過(guò)調(diào)監(jiān)大屏進(jìn)行確認(rèn),為遵化北站管轄范圍的信號(hào)機(jī),通過(guò)Pcanywhere軟件遠(yuǎn)程登錄到遵化北站CTC自律A機(jī)和自律B機(jī),發(fā)現(xiàn)自律A機(jī)和自律B機(jī)互相搶主,重啟自律機(jī)軟件后,23:45分時(shí)CTC恢復(fù)正常。
(2)2014年9月27日15:50分及23:26分CTC大屏顯示延慶對(duì)下莊區(qū)間信號(hào)機(jī)非正常顯示。電務(wù)人員分別通過(guò)Pcanywhere軟件登陸延慶站自律A機(jī)、自律B機(jī),發(fā)現(xiàn)自律A,B機(jī)正在搶主,判斷為因自律A,B機(jī)搶主引起的區(qū)間信號(hào)機(jī)非正常顯示,重啟自律機(jī)軟件后,區(qū)間信號(hào)機(jī)恢復(fù)正常。
上述案例充分說(shuō)明自律機(jī)A、B機(jī)一旦發(fā)生雙機(jī)搶主將造成CTC顯示信息異常,影響到正常行車(chē)秩序,通過(guò)系統(tǒng)回放及故障查找發(fā)現(xiàn):a.主/備自律機(jī)之間的通道質(zhì)量下降,會(huì)導(dǎo)致兩者之間信息傳輸出現(xiàn)問(wèn)題,備機(jī)檢測(cè)不到從主機(jī)發(fā)送過(guò)來(lái)的心跳信息,從而導(dǎo)致主/備機(jī)出現(xiàn)搶主;b.主/備自律機(jī)運(yùn)行中發(fā)生軟件報(bào)錯(cuò)等軟件問(wèn)題也會(huì)導(dǎo)致主機(jī)跑死,從而發(fā)生搶主的問(wèn)題。
4 故障的預(yù)防和解決
(1)通過(guò)加強(qiáng)日常網(wǎng)絡(luò)通道巡視,每日定期對(duì)大秦線管內(nèi)車(chē)站自律機(jī)通道進(jìn)行測(cè)試,通過(guò)主/備機(jī)互相Ping及發(fā)送數(shù)據(jù)包測(cè)試丟包情況,發(fā)現(xiàn)通道質(zhì)量不良的及時(shí)進(jìn)行查找處理,制定措施優(yōu)化通道,確保通道質(zhì)量良好。
(2)通過(guò)Pcanywhere軟件遠(yuǎn)程登陸自律機(jī)進(jìn)行查看,發(fā)現(xiàn)存在軟件報(bào)錯(cuò)或自律機(jī)CPU運(yùn)行內(nèi)存過(guò)高的情況及時(shí)進(jìn)行處理,定期將磁盤(pán)進(jìn)行整理。
(3)優(yōu)化自律機(jī)軟件通信功能,多次自律機(jī)搶主故障表明,軟件本身通信質(zhì)量不強(qiáng)也是影響因素之一,通過(guò)優(yōu)化自律機(jī)軟件通信能力,減少故障的發(fā)生。
(4)采用基于存儲(chǔ)共享的自律機(jī)雙機(jī)熱備方式,對(duì)于這種方式,采用兩臺(tái)自律機(jī),使用共享的存儲(chǔ)設(shè)備(磁盤(pán)陣列柜或存儲(chǔ)區(qū)域網(wǎng)SAN)。兩臺(tái)自律機(jī)可以采用互備、主從、并行等不同的方式。在工作過(guò)程中,兩臺(tái)自律機(jī)將以一個(gè)虛擬的IP地址對(duì)外提供服務(wù),依工作方式的不同,將服務(wù)請(qǐng)求發(fā)送給其中一臺(tái)自律機(jī)承擔(dān),同時(shí)自律機(jī)通過(guò)心跳線(往往采用建立私有網(wǎng)絡(luò)的方式)偵測(cè)另一臺(tái)自律機(jī)的工作狀況。當(dāng)一臺(tái)自律機(jī)出現(xiàn)故障時(shí),另一臺(tái)自律機(jī)根據(jù)心跳偵測(cè)的情況做出判斷,并進(jìn)行切換,接管服務(wù)。這一過(guò)程是全自動(dòng)的,在很短時(shí)間內(nèi)即可完成,從而對(duì)設(shè)備運(yùn)行不會(huì)造成影響。由于使用共享的存儲(chǔ)設(shè)備,因此兩臺(tái)自律機(jī)使用的實(shí)際上是一樣的數(shù)據(jù),由雙機(jī)或集群軟件對(duì)其進(jìn)行管理。
目前導(dǎo)致大秦線自律機(jī)雙機(jī)搶主的問(wèn)題很多,但自律主/備機(jī)網(wǎng)絡(luò)通道質(zhì)量下降以及軟件本身通信模塊通信不暢是導(dǎo)致問(wèn)題發(fā)生的關(guān)鍵,文章主要從CTC系統(tǒng)發(fā)展、結(jié)構(gòu)構(gòu)成、大秦線CTC系統(tǒng)網(wǎng)絡(luò)架構(gòu)以及雙機(jī)搶主問(wèn)題預(yù)防和解決角度進(jìn)行闡述。