程林鋼
摘要:針對當前網(wǎng)絡可靠性不斷受到挑戰(zhàn)的問題,該文對提高網(wǎng)絡可靠性的方法進行了研究。首先描述了網(wǎng)絡理論、網(wǎng)絡可靠性,對網(wǎng)絡可靠性的影響因素進行了分析;其次對網(wǎng)絡可靠性進行了優(yōu)化,論述了網(wǎng)絡可靠性優(yōu)化的原則和網(wǎng)絡可靠性優(yōu)化的算法;最后對網(wǎng)絡可靠性技術進行了分析,描述了網(wǎng)絡可靠性的BFD和OAM兩種方法。該文對于網(wǎng)絡維護人員和科研人員都具有一定的積極作用。
關鍵詞:網(wǎng)絡;可靠性;協(xié)議
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2014)28-6611-03
隨著網(wǎng)絡通信技術的不斷提高,依賴互聯(lián)網(wǎng)的業(yè)務越來越多,其功能日益增強,使得網(wǎng)絡的可靠性成為一切業(yè)務正常開展的基礎。隨著互聯(lián)網(wǎng)覆蓋的區(qū)域范圍越來越大,工作、學習、生活等各方面都有著網(wǎng)絡的影子,一旦網(wǎng)絡出現(xiàn)故障或大面積的癱煥,那么將會對該地區(qū)的經(jīng)濟、文化、環(huán)境、政治等造成巨大的影響。因此,提高計算機網(wǎng)絡的可絡可靠性是十分必要的。
1 計算機網(wǎng)絡可靠性
1.1 網(wǎng)絡理論
現(xiàn)在網(wǎng)絡已經(jīng)成為人們?nèi)粘I钪械囊徊糠?,但對于網(wǎng)絡的定義,到目前為止卻沒有一個統(tǒng)一說法。結合相關文獻,對網(wǎng)絡定義總結為:分布在不同區(qū)域的獨立計算機通過各種通信線路、交互設備及網(wǎng)絡協(xié)議能夠進行通信的系統(tǒng)。
計算機網(wǎng)絡主要有三部分組成,一是網(wǎng)絡軟件,主要由計算機操作系統(tǒng)、網(wǎng)絡管理軟件、網(wǎng)絡協(xié)議及應用軟件等組成;二是傳輸或交換設備,主要由通信線路、路由器、交換機及集線器等組成;三是用戶設備,主要由服務器和客戶端組成。
1.2 網(wǎng)絡可靠性
網(wǎng)絡不斷發(fā)展的過程中,網(wǎng)絡的可靠性方面研究一直伴隨著技術的革新不斷成長,已經(jīng)由單一的技術變成了一門系統(tǒng)性的科學課程。根據(jù)國內(nèi)外學者的研究分析,將網(wǎng)絡的可靠性的度量從四個方面進行分析,分別是計算機網(wǎng)絡的生存性、連通性、有效性和抗破壞性。
網(wǎng)絡可靠性的定義是指在規(guī)定的時間(N個小時、一個月、一季度等)內(nèi),在特定的工作環(huán)境(溫度、濕度、操作方式、輻射、負載等)下,網(wǎng)絡能夠滿足業(yè)務正常工作的通信要求。
1.3 網(wǎng)絡可靠性的影響因素
網(wǎng)絡的可靠性影響的因素比較多,概括起來主要有以下幾種:
1) 網(wǎng)絡設備的影響
網(wǎng)絡設備主要有用戶設備和傳輸交換設備。其中用戶設備是網(wǎng)絡的終端,要保障網(wǎng)絡的可靠性,最重要的就是保障用戶設備的可靠性,如果用戶設備出現(xiàn)故障,那么網(wǎng)絡的應用就無從談起。用戶設備的性能越強,網(wǎng)絡可靠性就會越高。例如,服務器端有兩臺服務器,一臺作為主服務器,另一臺作為備用服務器,當主服務器出現(xiàn)故障時,備用服務器立刻投入使用,雖然所花費的成本會高一點,但是網(wǎng)絡的可靠性卻得到了充分的保障;傳輸交換設備關系到網(wǎng)絡之間的連通性,在傳輸系統(tǒng)里,布線工作是一個巨大而艱難的工程,當線路出現(xiàn)問題,在復雜的網(wǎng)絡環(huán)境里,很難發(fā)現(xiàn)哪一條線路出現(xiàn)的問題,需要花費較大的代價。另外網(wǎng)絡交換設備將不同區(qū)域的計算機有機地聯(lián)系在一起,當交換設備出現(xiàn)故障時,網(wǎng)絡之間的通信將中斷。其中集線器主要用于連接用戶設備,交換機用于連接區(qū)域網(wǎng)絡,路由器用于廣域網(wǎng)與局域網(wǎng)之間的連接。每個交換設備都有其自身的作用,當選擇的設備性價比越高,其網(wǎng)絡的可靠性也越高。
2) 網(wǎng)絡拓撲結構的影響
在對網(wǎng)絡進行規(guī)劃時,網(wǎng)絡拓撲結構是不得不考慮的重要問題,網(wǎng)絡拓撲結構也是影響網(wǎng)絡可靠性的重要因素之一。在不同的工作環(huán)境、應用領域、網(wǎng)絡規(guī)模下其網(wǎng)絡拓撲結構也是不同的。網(wǎng)絡拓撲結構是網(wǎng)絡各個設備之間的連接方式,當前網(wǎng)絡的拓撲結構主要有:總線型、環(huán)型、星型和網(wǎng)狀型。其中網(wǎng)狀拓撲結構比較復雜,但可靠性相對較強,當某一設備發(fā)生故障時,并不會影響其他設備的正常工作。在大規(guī)模的網(wǎng)絡結構設計中,一般采用網(wǎng)狀拓撲結構。網(wǎng)絡拓撲結構如圖1所示。
3) 網(wǎng)絡管理的影響
當前,一個區(qū)域很難由一家網(wǎng)絡設備企業(yè)提供所有的產(chǎn)品,網(wǎng)絡規(guī)模越大,所使用的品牌和設備種類就越多,為了保障網(wǎng)絡的可靠性,減少誤碼率和故障發(fā)生率,在設備無法進行統(tǒng)一的情況下,就需要運用科學的網(wǎng)絡管理手段來進行網(wǎng)絡維護。在進行網(wǎng)絡管理中,需要從兩方面入手,一是選擇合適的、科學的網(wǎng)絡管理軟件,看是否滿足該區(qū)域網(wǎng)絡的基本功能需求;二是針對當前網(wǎng)絡用戶及其相關人員制定相應的管理條例和制度,加強對技術人員的培訓,使之養(yǎng)成良好的網(wǎng)絡操作習慣。
2 網(wǎng)絡可靠性的優(yōu)化
2.1 網(wǎng)絡可靠性優(yōu)化的原則
為了提高網(wǎng)絡的可靠性,需要對網(wǎng)絡可靠性進行優(yōu)化處理。在長期的網(wǎng)絡可靠性管理中,科研人員和網(wǎng)絡管理人員積累了大量的經(jīng)驗,為我們進行網(wǎng)絡可靠性優(yōu)化提供了很好的借鑒。其優(yōu)化的原則是:
1) 遵循國際標準
網(wǎng)絡是開放的系統(tǒng),但系統(tǒng)并不是隨心所欲,由某個企業(yè)自己隨意定制規(guī)則,而是在開放的網(wǎng)絡體系結構的大框架下,進行功能的擴展及升級。
2) 保持先進性
對網(wǎng)絡可靠性進行優(yōu)化,要著眼于未來,采用落伍的技術不僅不能使網(wǎng)絡的可靠性得到提高,相反還增加了更多的漏洞,給不法分子提供可趁之機。
3) 有較強的冗余能力
網(wǎng)絡的冗余一方面代表著需要投入更多的資金和人力,另一方面也是對網(wǎng)絡可靠性的有力保障,以便于系統(tǒng)在發(fā)生故障時,后備的資源能夠第一時間進行補充,保障整個網(wǎng)絡的平穩(wěn)運行。
4) 較強的互通能力
網(wǎng)絡終端之間進行通信,要盡可能地提高主干網(wǎng)絡的帶寬,提高設備之間的響應速度,另外還需要盡可能地支持更多地網(wǎng)絡協(xié)議。
5) 可管理性強
在設備的管理方面,應選擇具有管理性能強的網(wǎng)絡管理軟件和設備。
6) 資源利用合理
網(wǎng)絡的建設投入的資金總是有限的,充分利用當前的網(wǎng)絡資源,選擇合理的網(wǎng)絡拓撲結構、網(wǎng)絡布線、網(wǎng)絡操作系統(tǒng)和應用軟件等。
2.2 網(wǎng)絡可靠性的設計
要提高網(wǎng)絡的可靠性,其中非常重要的一點就是提高網(wǎng)絡的容錯性。當網(wǎng)絡中的某一點出現(xiàn)故障時,有其他的設備迅速補充,保障該故障點無縫工作。在網(wǎng)絡可靠性的設計過程中,一方面利用新的技術和設備,另一方面還要考慮現(xiàn)有設備的利用,使設計的網(wǎng)絡可靠性提高的同時,具有較強的兼容性。
網(wǎng)絡可靠性的設計,采用多層網(wǎng)絡結構的思想,應用最廣泛的是三層結構,分別是接入層、分布層和核心層。其設計如圖2所示。
接入層是網(wǎng)絡的起點,通過過濾的方式對網(wǎng)絡流量和用戶的準入進行控制,在該層的主要功能是為網(wǎng)絡終端提供通信服務。
分布層位于網(wǎng)絡三層的中間,將接入層和核心層有效的分隔開來,其主要功能是VLAN的聚合、確定聯(lián)網(wǎng)方式、接入工作組、網(wǎng)絡鏈路介質(zhì)的轉換和識別。
核心層是網(wǎng)絡的主干,其主要功能是連接交換區(qū)、最大能力地進行數(shù)據(jù)包或數(shù)據(jù)幀的交換及訪問其他服務等。
隨著技術的進步,社會上越來越多的網(wǎng)絡產(chǎn)品出現(xiàn),在進行網(wǎng)絡可靠性設計時,要根據(jù)需求目標選擇合適的網(wǎng)絡設備。
2.3 網(wǎng)絡可靠性的算法優(yōu)化
自上個世紀遺傳算法被提出以來,經(jīng)過幾十年的發(fā)展,已經(jīng)成為當前解決復雜問題優(yōu)化的最有效方法。其求解過程采用“適者生存”的方式,對空間中的“染色體”不斷地進行交叉、復制及變異等操作,使得不斷進化,最終求得最優(yōu)解。
利用遺傳算法的流程對網(wǎng)絡可靠性進行優(yōu)化分析,得出網(wǎng)絡鏈路成本與網(wǎng)絡可靠性曲線之間的關系。其過程如下所示:
1) 基因表達
利用二進制編碼的方法,對整個網(wǎng)絡中的N個結點進行表達。
2) 選擇適值函數(shù)
對網(wǎng)絡中的結點進行成本值估算,最小值為1,最大值值為max,其適值函數(shù)為:
[f(x)=(x-1)/(max-1)] (1)
其中x為個體在群體排序后的位置,0≤x≤max。
3) 選擇、交叉運算
對每個基因的選擇其概率采用公式2,選中的概率與適值成正比。
[Pk=fk/j=1maxfj] (2)
在[1,N]之間隨機選擇進行交叉運算,需要注意的是,每次只能對某一結點進行操作。
4) 調(diào)整
當經(jīng)過運算后的結點無法準確地表達出原來的網(wǎng)絡拓撲結構時,對其進行調(diào)整,保證其網(wǎng)絡的連通。
5) 結束運算
遺傳算法不可能永遠不斷地運算下去,其結束條件采用比較多的是設定最大的遺傳操作迭代數(shù),其進化的程度則由最大適應值和平均適應值來管理。
3 IP網(wǎng)絡可靠性技術
當前,IP網(wǎng)絡成為互聯(lián)網(wǎng)的主流,IP網(wǎng)絡可靠性技術主要包含IP網(wǎng)絡保護倒換技術和IP網(wǎng)絡故障檢測技術兩個方面。IP網(wǎng)絡保護倒換技術的基礎是鏈路冗余,其標準時間為50ms,其代表為BFD技術;IP網(wǎng)絡故障檢測技術是以OSI網(wǎng)絡參考模型為基礎,在OSI模型的每一層面上都有故障檢測機制,其主要模式有異步模式、回聲模式和查詢模式三種。
3.1 BFD技術
BFD類似于簡單的“hello”協(xié)議,每對終端在他們通道上周期性地發(fā)送BFD包,在規(guī)定的時間內(nèi)假如沒有收到相應的BFD包,那么就認為該網(wǎng)絡線路上出現(xiàn)了故障,此時,就需要對線路進行檢查。有時在網(wǎng)絡比較暢通的情況下,為了減少不必要的負載,終端之間進行協(xié)商,可以停止BFD包的發(fā)送。BFD包的格式如圖3所示。
需要注意的是,BFD采用的異步模式發(fā)送BFD包,系統(tǒng)周期性地發(fā)送BFD包,當?shù)谝粋€包丟失時,系統(tǒng)并不會第一時間察覺,只有連續(xù)的丟失BFD包時,系統(tǒng)才會發(fā)現(xiàn)線路出現(xiàn)了故障。
3.2 OAM
OAM(Operation、Administration、Maintenance)是根據(jù)運營商的實際需要而對網(wǎng)絡管理工作的劃分。OAM機制是每個運營商都必須要做到的網(wǎng)絡技術。
以太網(wǎng)的故障管理的功能主要有:環(huán)回檢測功能、連續(xù)檢測功能、告警指示功能和鏈路跟蹤功能等。
環(huán)回檢測功能主要是檢測遠程設備與本設備之間的連接狀態(tài),通過發(fā)送一個請求消息和應答消息的模式來進行實現(xiàn)。
連續(xù)檢測功能主要是檢測網(wǎng)絡終端之間數(shù)據(jù)流是否正常,這是OAM的基本功能。以定時發(fā)送Hello進行驗證,假如在規(guī)定時間內(nèi)沒有收到遠程設備的消息,則認為設備之間的網(wǎng)絡狀態(tài)出現(xiàn)了問題。
告警功能主要是發(fā)現(xiàn)服務層的故障后,將故障通告給客戶層。其故障的傳播是由下向上,中間向兩邊擴散。
鏈路跟蹤功能主要是進行故障定位和檢測鄰接關系。
4 小結
本文對計算機網(wǎng)絡的可靠性進行了分析,由于本文的篇幅所限和網(wǎng)絡可靠性工程的浩大,對于網(wǎng)絡協(xié)議和網(wǎng)絡故障具體原因并沒有給出明確的解釋,希望對此感興趣的讀者,在此基礎上,進一步的研究。
參考文獻:
[1] 徐仁佐,謝曼,鄭人杰.軟件可靠性模型及應用[M].北京:清華大學出版社,1994.
[2] 張文,楊紅霞.網(wǎng)絡互連設備[M].北京:電子工業(yè)出版社,2003.
[3] 趙莉萍.基于模糊神經(jīng)網(wǎng)絡的綜合評判方法研究[J].預測,1998(13):54-56.
[4] 陳利兵. BFD 技術在 IP 承載網(wǎng)中的應用[J].現(xiàn)代電信科技,2008(1):61-64.