張宗峰
摘要:通信專業(yè)中的傳輸系統(tǒng)類似于鐵路線路,對(duì)于信息的傳遞起到運(yùn)輸、樞紐的作用。在端到端通信流程中,需要從整網(wǎng)的角度對(duì)系統(tǒng)進(jìn)行充分的保護(hù)。文章從可靠性的概念入手,分析了傳輸網(wǎng)絡(luò)穩(wěn)定運(yùn)行的原理,介紹了可用性的計(jì)算公式,并由小及大,由物及人,從設(shè)備級(jí)別保護(hù)、網(wǎng)絡(luò)級(jí)別保護(hù)、主動(dòng)預(yù)防保護(hù)等方面,對(duì)通信傳輸系統(tǒng)的網(wǎng)絡(luò)保護(hù)進(jìn)行層層遞進(jìn)的探討,給出問題對(duì)策。特別是主動(dòng)預(yù)防保護(hù),從人為的層面,本研究將主動(dòng)預(yù)防納入網(wǎng)絡(luò)保護(hù)的范疇,未雨而綢繆,防患于未然。
關(guān)鍵詞:網(wǎng)絡(luò)安全;網(wǎng)絡(luò)保護(hù);可靠性;可用性;主動(dòng)預(yù)防
中圖分類號(hào):TN914.34? 文獻(xiàn)標(biāo)志碼:A
0 引言
網(wǎng)絡(luò)安全是近年來一直被探討的話題,也是關(guān)乎行業(yè)生產(chǎn)、社會(huì)生活、國家安全等的重要舉措。如何維護(hù)好網(wǎng)絡(luò)安全,是每一位通信從業(yè)人員,特別是網(wǎng)絡(luò)維護(hù)人員的重要使命。本文關(guān)注的通信傳輸系統(tǒng)的網(wǎng)絡(luò)保護(hù),正是網(wǎng)絡(luò)安全的子課題之一。
早期的信息傳輸模式不過多涉及實(shí)體的網(wǎng)絡(luò)結(jié)構(gòu),隨著科學(xué)技術(shù)的指數(shù)級(jí)別發(fā)展,通信技術(shù)得到了飛速的發(fā)展和廣泛的應(yīng)用。在現(xiàn)代傳輸體系中,一張完整的傳輸網(wǎng)絡(luò),由紛繁復(fù)雜的傳輸設(shè)備、傳輸線路等組成,如何對(duì)傳輸系統(tǒng)進(jìn)行可靠的保護(hù)就成了一個(gè)重要的研究?jī)?nèi)容。
1 問題分析
傳輸設(shè)備一般由設(shè)備硬件、軟件等組成,不論是硬件還是軟件都會(huì)有失效的概率,一般在計(jì)算機(jī)系統(tǒng)中,失效率α指單位時(shí)間內(nèi)失效的事件數(shù)與事件總數(shù)的比例。其中,硬件類失效通常與產(chǎn)品質(zhì)量、生命周期、環(huán)境因素等有關(guān),軟件類失效通常體現(xiàn)為軟件BUG,可以通過每千行代碼的缺陷數(shù),即缺陷密度來表示。
雖然有上述失效發(fā)生的可能性,為了盡可能地達(dá)到使系統(tǒng)設(shè)備“用的時(shí)候一直能用”,人們提出了可靠性(Reliability)的概念??煽啃酝ǔV冈谝?guī)定的時(shí)間內(nèi)、在規(guī)定的條件下,系統(tǒng)無失效地執(zhí)行規(guī)定功能的概率,與可靠性相關(guān)的幾個(gè)指標(biāo)如下:
平均失效時(shí)間(Mean Time To Failure,MTTF),即兩次失效之間系統(tǒng)能夠正常工作時(shí)間的平均值,MTTF=1/α(α為失效率)。一般來講,MTTF越長,系統(tǒng)的可靠性越高。
平均修復(fù)時(shí)間(Mean Time To Repair,MTTR),即從出現(xiàn)失效到失效修復(fù)之間的這段時(shí)間。一般來講,MTTR越短,系統(tǒng)業(yè)務(wù)恢復(fù)得越快。
平均失效間隔時(shí)間(Mean Time Between Failures,MTBF),即兩次失效之間時(shí)間的平均值,MTBF=MTTF+MTTR。
在以上指標(biāo)的基礎(chǔ)上,人們又提出了可用性(Availability)的概念,可用性是在任意隨機(jī)時(shí)刻需要執(zhí)行任務(wù)時(shí),系統(tǒng)處于可工作狀態(tài)的概率,它的計(jì)算公式為:A=MTTF / (MTTF + MTTR)=MTTF / MTBF[1]。
為了組建一個(gè)高可靠性、高可用性的網(wǎng)絡(luò),需要在系統(tǒng)設(shè)計(jì)和使用的時(shí)候,對(duì)系統(tǒng)進(jìn)行充分的保護(hù)。
2 問題對(duì)策
對(duì)于傳輸系統(tǒng)的保護(hù),一般分為多個(gè)級(jí)別。在設(shè)備入網(wǎng)運(yùn)行后,需要重點(diǎn)考慮網(wǎng)絡(luò)安全的問題,例如:在網(wǎng)絡(luò)中某個(gè)網(wǎng)元或鏈路發(fā)生失效時(shí),可以不影響業(yè)務(wù)或者盡快地恢復(fù)業(yè)務(wù)。對(duì)于網(wǎng)元的保護(hù),稱為設(shè)備級(jí)別保護(hù),可以通過增加“額外”的硬件設(shè)備來實(shí)現(xiàn),例如:主備單板?,F(xiàn)代通信網(wǎng)中幾乎所有的設(shè)備都具有設(shè)備級(jí)別保護(hù)的功能;對(duì)于傳輸路徑的保護(hù),稱為網(wǎng)絡(luò)級(jí)別保護(hù),當(dāng)原有路徑中斷或者性能劣化時(shí),系統(tǒng)可以利用預(yù)先分配好的路徑容量繼續(xù)傳輸業(yè)務(wù)信號(hào);在設(shè)備正常運(yùn)行的過程中,提前對(duì)網(wǎng)絡(luò)失效進(jìn)行預(yù)防,稱為主動(dòng)預(yù)防保護(hù)。
2.1 設(shè)備級(jí)別保護(hù)
傳輸設(shè)備在硬件架構(gòu)上,長時(shí)期采用機(jī)柜、子架、單板的形式,對(duì)于單板的配置,通常采用主備冗余配置,即一塊單板(主用單板)完成正常的業(yè)務(wù)處理,另一塊單板在主用單板失效的情況下接管業(yè)務(wù),這種設(shè)計(jì)在一定程度上降低了設(shè)備的使用效率,但是極大地提升了設(shè)備工作的可靠性和可用性。
以華為公司的智能光傳輸設(shè)備OptiX OSN 2500為例,OptiX OSN 2500 安裝在歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)(European Telecommunications Standards Institute, ETSI)“機(jī)柜”中(也可以安裝在 19 英寸的標(biāo)準(zhǔn)機(jī)柜中),它的“子架”采用單層子架結(jié)構(gòu),分為處理板槽位區(qū)、接口板槽位區(qū)、輔助接口區(qū)、電源區(qū)和風(fēng)扇區(qū),設(shè)備支持不同類型“單板”,這些單板按功能可以分為 SDH 類單板、PDH 類單板、數(shù)據(jù)類單板、波分類單板和輔助類單板等類型,設(shè)備支持交叉時(shí)鐘1+1保護(hù)、主控1+1保護(hù)、電源保護(hù)等,這種保護(hù)就是設(shè)備級(jí)別保護(hù)[2]。
在主備單板(兩個(gè)單板一主一備)的基礎(chǔ)上,N+1保護(hù)(N個(gè)單板主用,一個(gè)單板備用),端口主備保護(hù)(兩個(gè)端口一主一備)、整設(shè)備主備保護(hù)(兩臺(tái)設(shè)備一主一備)也是一種冗余備份的思路。
2.2 網(wǎng)絡(luò)級(jí)別保護(hù)
根據(jù)組網(wǎng)結(jié)構(gòu)來劃分,傳輸系統(tǒng)的網(wǎng)絡(luò)保護(hù)基本分為鏈型網(wǎng)絡(luò)保護(hù)和環(huán)形網(wǎng)絡(luò)保護(hù)兩種。
2.2.1 鏈型網(wǎng)絡(luò)保護(hù)
鏈型網(wǎng)絡(luò)保護(hù)類型有1+1保護(hù)和1∶N保護(hù)兩種方式。1+1保護(hù)模式的每個(gè)工作信道都有一個(gè)冗余的保護(hù)信道,同設(shè)備級(jí)別保護(hù)相似,這兩條信道是主用和備用的關(guān)系。在信息的發(fā)送端,業(yè)務(wù)信號(hào)被同時(shí)發(fā)送到工作信道和保護(hù)信道進(jìn)行傳輸。在信息接收端,系統(tǒng)會(huì)持續(xù)監(jiān)測(cè)兩路信道的信號(hào)質(zhì)量,然后根據(jù)信號(hào)的優(yōu)劣選擇一路信道進(jìn)行接收,即“雙發(fā)選收”。當(dāng)工作信道信號(hào)中斷或者性能劣化時(shí),接收端將會(huì)切換到保護(hù)信道接收業(yè)務(wù)信號(hào),從而實(shí)現(xiàn)了保護(hù)的功能。區(qū)別于1+1保護(hù)模式系統(tǒng)容量利用率不高的問題,1∶N保護(hù)模式的N個(gè)工作信道共享一個(gè)保護(hù)信道,在N個(gè)工作信道傳送正常業(yè)務(wù)的同時(shí),保護(hù)信道還可以傳送優(yōu)先級(jí)別相對(duì)較低的附加業(yè)務(wù)信息。傳輸系統(tǒng)通過復(fù)用段保護(hù)功能MSP(Multiplex Section Protection)監(jiān)測(cè)到工作信道信號(hào)中斷或者性能劣化時(shí),會(huì)主動(dòng)丟棄保護(hù)信道上的附加業(yè)務(wù)信息,在發(fā)送端將正常業(yè)務(wù)倒換到保護(hù)信道上發(fā)送,在接收端切換到保護(hù)信道接收正常業(yè)務(wù)信號(hào)。
2.2.2 環(huán)形網(wǎng)絡(luò)保護(hù)
在傳輸系統(tǒng)多種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中,環(huán)型組網(wǎng)是一個(gè)具有“傳輸特色”的架構(gòu),具有更靈活的自愈功能,自愈環(huán)(Self-Healing Ring,SHR)的概念就應(yīng)運(yùn)而生了。
本文以二纖單向通道保護(hù)環(huán)的實(shí)踐案例為例,對(duì)自愈環(huán)的工作過程進(jìn)行展開,其他環(huán)形網(wǎng)絡(luò)保護(hù)的工作原理與此類似。
如圖1所示,傳輸環(huán)中有4個(gè)網(wǎng)元A、B、C、D,現(xiàn)需要在A、C兩個(gè)網(wǎng)元間進(jìn)行業(yè)務(wù)傳輸,網(wǎng)元A、C兩側(cè)分別為網(wǎng)元B、D。兩條光纖組成了傳輸方向相反的兩個(gè)環(huán),其中W為主用環(huán),P為備用環(huán),AC為A到C發(fā)送的業(yè)務(wù)信號(hào),CA為C到A發(fā)送的業(yè)務(wù)信號(hào)。
在網(wǎng)絡(luò)正常工作的情況下,AC業(yè)務(wù)信號(hào)在網(wǎng)元A插入時(shí),是并行發(fā)送的,信號(hào)同時(shí)向P1光纖和W1光纖傳送。在C網(wǎng)元接收時(shí),系統(tǒng)選擇性收取主用環(huán)W1光纖上的業(yè)務(wù)信號(hào);類似的,CA業(yè)務(wù)信號(hào)在網(wǎng)元C插入時(shí),也是并行發(fā)送的,信號(hào)同時(shí)向P2光纖和W2光纖傳送。在網(wǎng)元A接收時(shí),系統(tǒng)選擇性收取主用環(huán)W2光纖上的業(yè)務(wù)信號(hào)。二纖單向通道保護(hù)環(huán)采用的是雙發(fā)選收的保護(hù)策略,在備用環(huán)P上同時(shí)存在業(yè)務(wù)流,但是正常情況下不被接收使用,起到一個(gè)冗余備份的作用。
在網(wǎng)絡(luò)發(fā)生故障的情況下,例如BC網(wǎng)元之間的傳輸線路中斷,如圖1(b)所示。在網(wǎng)元C上從W1光纖上傳送的主用信號(hào)就丟失了,按照雙發(fā)選收的原則,網(wǎng)元C在接收業(yè)務(wù)信號(hào)時(shí),使用倒換開關(guān)從W1光纖倒換到P1光纖,從P1光纖接收來自網(wǎng)元A的AC信號(hào),這樣AC間業(yè)務(wù)信號(hào)就不會(huì)中斷了。另一個(gè)方向,網(wǎng)元C發(fā)往網(wǎng)元A的業(yè)務(wù)信號(hào),由于圖中左側(cè)線路沒有發(fā)生故障,所以在網(wǎng)元A不會(huì)觸發(fā)倒換開關(guān),系統(tǒng)仍然從W2光纖上接收業(yè)務(wù)信號(hào)。
在網(wǎng)絡(luò)故障恢復(fù)的情況下,系統(tǒng)可以根據(jù)網(wǎng)元的配置,選擇倒換回故障發(fā)生前的組網(wǎng)或者保持現(xiàn)有業(yè)務(wù)流向不變。如果配置為可恢復(fù)式,系統(tǒng)在檢測(cè)到W1環(huán)故障恢復(fù)后,將重新切換到主用環(huán)W1上接收信號(hào),網(wǎng)絡(luò)拓?fù)溥€原為故障發(fā)生前的狀態(tài)[3]。
2.3 主動(dòng)預(yù)防保護(hù)
傳輸設(shè)備建網(wǎng)后,為了保證設(shè)備的正常運(yùn)行,常常需要進(jìn)行被動(dòng)性保護(hù)和主動(dòng)預(yù)防保護(hù)等,其中被動(dòng)性保護(hù)主要是指日常故障和突發(fā)故障的處理,主動(dòng)預(yù)防保護(hù)主要是指為了防止故障的發(fā)生,主動(dòng)進(jìn)行設(shè)備的例行維護(hù)和周期性維護(hù),例如重大事件保障巡檢、節(jié)假日巡檢等,將可能發(fā)生的故障扼殺在搖籃中。在主動(dòng)預(yù)防保護(hù)中,重點(diǎn)關(guān)注以下幾個(gè)方面的檢查。
2.3.1 狀態(tài)檢查
定期檢查相關(guān)傳輸設(shè)備的狀態(tài)。設(shè)備狀態(tài)應(yīng)該為正常運(yùn)行狀態(tài),在網(wǎng)元的邏輯板位圖中,各種單板的圖標(biāo)顏色應(yīng)該為正常示色。
2.3.2 告警檢查
定期檢查全網(wǎng)告警。對(duì)全網(wǎng)告警進(jìn)行統(tǒng)計(jì)分析,根據(jù)告警的級(jí)別進(jìn)行相應(yīng)的處理動(dòng)作,根據(jù)需要制定告警清零方案,避免告警級(jí)別提高影響業(yè)務(wù)。
2.3.3 性能檢查
定期檢查設(shè)備的性能指標(biāo)。一般在網(wǎng)絡(luò)建設(shè)階段已經(jīng)設(shè)置好性能監(jiān)視的周期,即網(wǎng)管上設(shè)置的15min、30min、60min、24h等性能監(jiān)控的啟停時(shí)間,在傳輸設(shè)備性能檢查中需要重點(diǎn)關(guān)注大誤碼、大指針以及光功率的變化,通過性能檢查掌握網(wǎng)絡(luò)運(yùn)行的健康程度。
2.3.4 倒換檢查
定期檢查MSP屬性和倒換狀態(tài)、主控和交叉主備保護(hù)狀態(tài)等。相關(guān)倒換屬性正常工作的情況下,在主用發(fā)生故障時(shí),設(shè)備才可以正常倒換,及時(shí)地恢復(fù)業(yè)務(wù)。
2.3.5 一致檢查
定期檢查設(shè)備數(shù)據(jù)一致性。檢查設(shè)備側(cè)數(shù)據(jù)和網(wǎng)管側(cè)數(shù)據(jù)是否一致,避免在緊急業(yè)務(wù)恢復(fù)過程中,因?yàn)閮蓚?cè)數(shù)據(jù)不一致,導(dǎo)致的業(yè)務(wù)長時(shí)間受損。
2.3.6 時(shí)間檢查
定期檢查全網(wǎng)網(wǎng)元和網(wǎng)管的時(shí)間。為了保證設(shè)備告警等數(shù)據(jù)上報(bào)的準(zhǔn)確性,需要保證網(wǎng)元與網(wǎng)管時(shí)間一致,如果不一致,需要及時(shí)與網(wǎng)管進(jìn)行時(shí)間同步。
2.3.7 備份檢查
定期檢查設(shè)備的備份狀態(tài)。網(wǎng)元的運(yùn)行基于配置數(shù)據(jù),配置數(shù)據(jù)的損壞或丟失,可能對(duì)業(yè)務(wù)造成嚴(yán)重的影響,在主動(dòng)預(yù)防保護(hù)中需要做好數(shù)據(jù)的定時(shí)備份,并進(jìn)行備份狀態(tài)檢查,必要時(shí)可以根據(jù)備份的數(shù)據(jù)進(jìn)行業(yè)務(wù)恢復(fù)。
2.3.8 安全檢查
定期檢查維護(hù)人員賬號(hào)、密碼、授權(quán)等信息。維護(hù)人員的賬號(hào)等是網(wǎng)絡(luò)安全的關(guān)鍵信息,根據(jù)需要及時(shí)更新相關(guān)安全內(nèi)容。
除以上幾個(gè)方面外,還要進(jìn)行機(jī)房現(xiàn)場(chǎng)定期檢查,例如:機(jī)房溫度、濕度等,并根據(jù)需要制定系列專項(xiàng)巡檢行動(dòng)。
3 應(yīng)用分析
在工程設(shè)計(jì)階段,根據(jù)網(wǎng)絡(luò)需求進(jìn)行網(wǎng)絡(luò)保護(hù)相關(guān)設(shè)計(jì),包括不限于單板備份設(shè)計(jì)、網(wǎng)絡(luò)保護(hù)設(shè)計(jì)等。
在工程建設(shè)階段,根據(jù)設(shè)計(jì)文件進(jìn)行網(wǎng)絡(luò)保護(hù)配置部署,現(xiàn)以二纖單向通道保護(hù)環(huán)的配置為例。
(1)啟動(dòng)傳輸設(shè)備網(wǎng)管。
(2)創(chuàng)建網(wǎng)元,安裝單板,設(shè)備聯(lián)調(diào),組建如圖1所示網(wǎng)絡(luò)拓?fù)洹?/p>
(3)配置各個(gè)網(wǎng)元的時(shí)鐘。
(4)配置業(yè)務(wù)和保護(hù)路由,例如網(wǎng)元A到網(wǎng)元C之間1個(gè)E1業(yè)務(wù)。工作路由為:網(wǎng)元A配置1個(gè)E1的上下業(yè)務(wù),網(wǎng)元B配置1個(gè)E1的業(yè)務(wù)交叉連接,網(wǎng)元C配置1個(gè)E1的上下業(yè)務(wù)。保護(hù)路由為:網(wǎng)元A配置1個(gè)E1的上下業(yè)務(wù),網(wǎng)元D配置1個(gè)E1的業(yè)務(wù)交叉連接,網(wǎng)元C配置1個(gè)E1的上下業(yè)務(wù)。
(5)驗(yàn)證工作路由和保護(hù)路由配置的正確性,在工作路由失效的情況下,系統(tǒng)會(huì)自動(dòng)切換到保護(hù)路由工作,從而起到網(wǎng)絡(luò)保護(hù)的作用。
在運(yùn)行維護(hù)階段,需要制定網(wǎng)絡(luò)主動(dòng)巡檢方案,包括不限于常規(guī)網(wǎng)絡(luò)巡檢、重大節(jié)假日巡檢、重大事件保障巡檢等,并根據(jù)具體的故障場(chǎng)景制定網(wǎng)絡(luò)故障應(yīng)急預(yù)案。
4 結(jié)語
通信傳輸網(wǎng)絡(luò)不直接參與業(yè)務(wù)的終結(jié),卻是各種設(shè)備通信的紐帶,對(duì)業(yè)務(wù)信息的傳遞起到“使命必達(dá)”的作用。本文從應(yīng)用性的角度,分析了傳輸系統(tǒng)的各種網(wǎng)絡(luò)保護(hù)機(jī)制,從設(shè)備本身包括單板、端口級(jí)別等,到傳輸路徑包括鏈型保護(hù)、環(huán)形保護(hù)等,并結(jié)合二纖單向通道保護(hù)環(huán)的實(shí)踐案例展開,對(duì)正常場(chǎng)景和網(wǎng)絡(luò)故障場(chǎng)景進(jìn)行信號(hào)流向的推演。按照未雨綢繆、防微杜漸的思想,將主動(dòng)預(yù)防保護(hù)納入整個(gè)網(wǎng)絡(luò)保護(hù)分析的范疇,對(duì)網(wǎng)絡(luò)的主動(dòng)保護(hù)進(jìn)行相關(guān)探討,形成端到端的網(wǎng)絡(luò)保護(hù)分析機(jī)制。
參考文獻(xiàn)
[1]梅清晨,陸南耀,張金梅,等.MTBF和MTTR在設(shè)備預(yù)防保全中的應(yīng)用[J].中國設(shè)備工程,2014(6):53-55.
[2]華為技術(shù)有限公司.OptiX OSN系列智能光傳輸系統(tǒng)產(chǎn)品手冊(cè)[EB/OL].(2020-08-05)[2022-12-01].https://wenku.baidu.com/view/f581304f094c2e3f5727a5e9856a561253d32146.
[3]何一心.光傳輸網(wǎng)絡(luò)技術(shù)——SDH與DWDM[M].北京:人民郵電出版社,2013.
(編輯 王永超)
Network protection analysis of transmission system
Zhang? Zongfeng
(Nanjing Institute of Railway Technology, Nanjing 210031, China)
Abstract: The transmission system in the communication discipline is similar to the railway line, which plays a role of transportation and hub for the transmission of information. In the end-to-end communication process, the system needs to be fully protected from the perspective of the whole network. This paper starts with the concept of reliability, analyzes the principle of stable operation of transmission network, and deduces the calculation formula of availability. From the aspects of equipment level protection, network level protection, and active prevention protection, the paper discusses the network protection of communication transmission system layer by layer, and gives the problem countermeasures. In particular, active prevention, from the artificial level, brings active prevention into the scope of network protection, so as to prepare for the rainy day and take precautions.
Key words: network security; network protection; reliability; availability; proactive prevention