于繼江,陳 為,董中平
(中國(guó)食品藥品檢定研究院,北京,100050)
計(jì)算機(jī)網(wǎng)絡(luò)的可靠性被定義為特定條件下,規(guī)定時(shí)間內(nèi),網(wǎng)絡(luò)所能夠保持的連通和數(shù)據(jù)通信的能力,該性能是計(jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)、運(yùn)行的核心參數(shù)之一。其中,特定條件是指如規(guī)定操作方式、負(fù)載條件、網(wǎng)絡(luò)環(huán)境的溫濕度等;規(guī)定時(shí)間是指計(jì)算機(jī)網(wǎng)絡(luò)的運(yùn)行時(shí)間。利用上述定義可以獲得計(jì)算機(jī)網(wǎng)絡(luò)在上述頂一下可完成相應(yīng)功能的概率,該概率可用于直接反應(yīng)計(jì)算機(jī)網(wǎng)絡(luò)是否可靠。
為便于分析和計(jì)算,實(shí)際研究中需要將計(jì)算機(jī)網(wǎng)絡(luò)這一復(fù)雜的系統(tǒng)化簡(jiǎn)處理為可進(jìn)行理論分析的具體的網(wǎng)絡(luò)模型,然后分別對(duì)每一模型進(jìn)行可靠性問(wèn)題求解。通常,計(jì)算機(jī)網(wǎng)絡(luò)的模型可用概率圖 來(lái)描述,該概率圖中的V 是指計(jì)算機(jī)網(wǎng)絡(luò)中的終端、服務(wù)器等設(shè)備的集合,E 是指計(jì)算機(jī)網(wǎng)絡(luò)中的具體的鏈路。為應(yīng)用該概率圖進(jìn)行可靠性分析,需要對(duì)網(wǎng)絡(luò)模型進(jìn)行如下幾點(diǎn)假設(shè):(1)網(wǎng)絡(luò)是連通的,反映在概率圖上為圖中的任意兩個(gè)結(jié)點(diǎn)之間都存在一條可連通的鏈路;(2)鏈路介質(zhì)的可靠度與結(jié)點(diǎn)距離無(wú)關(guān);(3)網(wǎng)絡(luò)內(nèi)的結(jié)點(diǎn)是理想的,即結(jié)點(diǎn)設(shè)備本身不存在故障;(4)計(jì)算機(jī)網(wǎng)絡(luò)只有正常和故障兩種狀態(tài),且設(shè)備、鏈路相互獨(dú)立,這樣可以保證所發(fā)生故障的獨(dú)立性;(5)網(wǎng)絡(luò)正常運(yùn)行概率可知,分為結(jié)點(diǎn)和鏈路兩部分,且兩部分正常運(yùn)行的概率統(tǒng)計(jì)獨(dú)立;(6)網(wǎng)絡(luò)模型還可以用多狀態(tài)模型進(jìn)行刻畫(huà)。
在該假設(shè)下即可得到計(jì)算機(jī)網(wǎng)絡(luò)的概率圖,圖中的可靠性問(wèn)題由可靠性分析和可靠性設(shè)計(jì)兩部分內(nèi)容構(gòu)成。
由于計(jì)算機(jī)網(wǎng)絡(luò)的部署與設(shè)計(jì)存在持續(xù)性和不確定性,故大型計(jì)算機(jī)網(wǎng)絡(luò)中常常會(huì)采用多種網(wǎng)絡(luò)設(shè)備進(jìn)行部署,只要這些設(shè)備之間能夠很好的兼容其他設(shè)備,且能夠提供高質(zhì)量的信息傳輸服務(wù)即可。為保障計(jì)算機(jī)網(wǎng)絡(luò)的完整性、提升網(wǎng)絡(luò)可靠度、降低故障發(fā)生概率和傳輸誤碼率,就必須協(xié)調(diào)好各設(shè)備之間的關(guān)系,使用現(xiàn)金的網(wǎng)絡(luò)管理技術(shù)對(duì)網(wǎng)絡(luò)進(jìn)行管理??梢?jiàn),網(wǎng)絡(luò)管理是否有效,是否能夠及時(shí)發(fā)現(xiàn)和幫助排除計(jì)算機(jī)網(wǎng)絡(luò)中出現(xiàn)的故障對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的可靠性運(yùn)行具有十分重要的影響。
計(jì)算機(jī)網(wǎng)絡(luò)是由結(jié)點(diǎn)和介質(zhì)鏈路組成的,通常情況下網(wǎng)絡(luò)鏈路的可靠性較高,而網(wǎng)絡(luò)故障的原因大多集中在網(wǎng)絡(luò)結(jié)點(diǎn)位置。
(1)結(jié)點(diǎn)的影響。終端交互能力越強(qiáng),其所在計(jì)算機(jī)網(wǎng)絡(luò)的可靠性越高,若用戶(hù)終端中可以采用冗余設(shè)計(jì),如使用兩塊網(wǎng)卡同時(shí)與不同局域網(wǎng)建立連接時(shí),其所具有的可靠性必然會(huì)高于單網(wǎng)卡用戶(hù)終端設(shè)備的可靠性。服務(wù)器是計(jì)算機(jī)網(wǎng)絡(luò)的信息中心,其主要負(fù)責(zé)向用戶(hù)提供相關(guān)的網(wǎng)絡(luò)應(yīng)用和網(wǎng)絡(luò)服務(wù),服務(wù)器可靠性的高低直接關(guān)系到其所在計(jì)算機(jī)網(wǎng)絡(luò)的運(yùn)行效率與可靠性。為確保計(jì)算機(jī)網(wǎng)絡(luò)的可靠性,提升計(jì)算機(jī)網(wǎng)絡(luò)的應(yīng)用效果,網(wǎng)絡(luò)中所架設(shè)的服務(wù)器必須采用雙機(jī)熱備份的冗余設(shè)計(jì)。
(2)傳輸交換設(shè)備的影響。雖然傳輸介質(zhì)對(duì)計(jì)算機(jī)網(wǎng)絡(luò)可靠性的影響不如結(jié)點(diǎn)高,但是其一旦出現(xiàn)故障則需要相當(dāng)大的代價(jià)進(jìn)行故障查找與排除。為確保計(jì)算機(jī)網(wǎng)絡(luò)的持續(xù)應(yīng)用性,在采用標(biāo)準(zhǔn)線(xiàn)路按照布線(xiàn)要求進(jìn)行布線(xiàn)的同時(shí),還應(yīng)該適當(dāng)?shù)牟扇∫恍┤哂嘣O(shè)計(jì)方案進(jìn)行雙線(xiàn)架設(shè),確保一旦其中的一條線(xiàn)路出現(xiàn)問(wèn)題可以快速切換到另一條正常線(xiàn)路中,降低故障持續(xù)時(shí)間。
計(jì)算機(jī)網(wǎng)絡(luò)的部署與建設(shè)是依照嚴(yán)格的規(guī)劃和設(shè)計(jì)方案執(zhí)行的,若設(shè)計(jì)方案不合理,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)存在問(wèn)題則必然會(huì)在應(yīng)用過(guò)程中使得計(jì)算機(jī)網(wǎng)絡(luò)的可靠性大幅度下降。經(jīng)驗(yàn)表明,若想獲得較高的網(wǎng)絡(luò)可靠性,就必須依照計(jì)算機(jī)網(wǎng)絡(luò)的規(guī)模和層次進(jìn)行具體的分析與設(shè)計(jì),確保所設(shè)計(jì)的拓?fù)浣Y(jié)構(gòu)與實(shí)際應(yīng)用相匹配。
在規(guī)劃設(shè)計(jì)計(jì)算機(jī)網(wǎng)絡(luò)時(shí),為保證所設(shè)計(jì)的網(wǎng)絡(luò)具有良好的應(yīng)用特性和較高的可靠性,應(yīng)該遵循如下幾條設(shè)計(jì)原則:(1)依照國(guó)際標(biāo)準(zhǔn)進(jìn)行網(wǎng)絡(luò)設(shè)計(jì),確保所設(shè)計(jì)的網(wǎng)絡(luò)對(duì)異構(gòu)系統(tǒng)和異種設(shè)備具有良好的支持與兼容,保證所設(shè)計(jì)的網(wǎng)絡(luò)擴(kuò)展性強(qiáng);(2)盡量選用成熟的、先進(jìn)的網(wǎng)絡(luò)技術(shù),在保證所設(shè)計(jì)的網(wǎng)絡(luò)具有良好的兼容性和優(yōu)良的運(yùn)行穩(wěn)定性,必要時(shí)可同時(shí)采用多種拓?fù)浣Y(jié)構(gòu)進(jìn)行組合設(shè)計(jì);(3)設(shè)計(jì)計(jì)算機(jī)網(wǎng)絡(luò)時(shí)應(yīng)該盡量讓其支持較多的通信協(xié)議和通信標(biāo)準(zhǔn),以增強(qiáng)其與其他網(wǎng)絡(luò)或特殊環(huán)境下的互聯(lián)能力
計(jì)算機(jī)網(wǎng)絡(luò)的可靠性主要是通過(guò)系統(tǒng)的容錯(cuò)性進(jìn)行反映的,對(duì)計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行可靠性?xún)?yōu)化時(shí)可以以提升系統(tǒng)的容錯(cuò)性為出發(fā)點(diǎn)進(jìn)行冗余設(shè)計(jì),降低網(wǎng)絡(luò)故障發(fā)生的概率和持續(xù)時(shí)間。具體的設(shè)計(jì)方案如下:
(1)計(jì)算機(jī)網(wǎng)絡(luò)以并行主干,為網(wǎng)絡(luò)配置雙網(wǎng)絡(luò)中心為主。
為確保用戶(hù)終端和網(wǎng)絡(luò)服務(wù)器的運(yùn)行可靠性,可分別將用戶(hù)終端與網(wǎng)絡(luò)服務(wù)器同時(shí)連接到多個(gè)網(wǎng)絡(luò)中心中,并為其設(shè)置自動(dòng)轉(zhuǎn)接功能;邊界網(wǎng)絡(luò)與網(wǎng)絡(luò)中心的連接使用多數(shù)據(jù)、多路由的方式實(shí)現(xiàn),即便某一鏈路出現(xiàn)故障也不會(huì)產(chǎn)生大范圍的網(wǎng)絡(luò)故障;網(wǎng)絡(luò)應(yīng)支持熱插拔,可進(jìn)行功能模塊替換,這樣不僅可以增強(qiáng)組網(wǎng)的靈活性,還能夠確保網(wǎng)絡(luò)故障時(shí)能在不斷電的情況下完成故障設(shè)備的替換工作,避免全局性的斷網(wǎng)情況發(fā)生,有效提升網(wǎng)絡(luò)的容錯(cuò)能力;在計(jì)算機(jī)網(wǎng)絡(luò)的系統(tǒng)層面采用雙機(jī)熱備份機(jī)制進(jìn)行構(gòu)建,正常運(yùn)行中備用設(shè)備定期與主運(yùn)行設(shè)備進(jìn)行同步,一旦出現(xiàn)故障則直接接管故障設(shè)備的功能為用戶(hù)提供服務(wù),必要時(shí)還可以設(shè)置異地存儲(chǔ)備份機(jī)制,以確保重點(diǎn)數(shù)據(jù)內(nèi)容不被破壞;網(wǎng)絡(luò)操作系統(tǒng)應(yīng)盡量依照多處理器進(jìn)行定制化設(shè)計(jì),以便于提供應(yīng)急恢復(fù)與保障機(jī)制。
(2)網(wǎng)絡(luò)層面采用雙網(wǎng)絡(luò)冗余設(shè)計(jì)
雙冗余設(shè)計(jì)是指在現(xiàn)有網(wǎng)絡(luò)的基礎(chǔ)上添加一套新的,功能完整的備用網(wǎng)絡(luò),網(wǎng)絡(luò)內(nèi)的終端和服務(wù)器同時(shí)與主網(wǎng)絡(luò)與備用網(wǎng)絡(luò)進(jìn)行連接。正常情況下,終端可以使用兩套網(wǎng)絡(luò)同時(shí)進(jìn)行數(shù)據(jù)傳輸,也可以只使用其中一套網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸。該設(shè)計(jì)方案的優(yōu)勢(shì)在于在計(jì)算機(jī)網(wǎng)絡(luò)的物理層面實(shí)現(xiàn)了可靠性的提升,即便其中某一網(wǎng)絡(luò)的某一部分出現(xiàn)故障也不會(huì)出現(xiàn)網(wǎng)絡(luò)通信中斷的現(xiàn)象。
具體來(lái)說(shuō),評(píng)價(jià)計(jì)算機(jī)網(wǎng)絡(luò)可靠性的指標(biāo)至少包含以下幾項(xiàng)內(nèi)容:用戶(hù)在計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用過(guò)程中的網(wǎng)絡(luò)體驗(yàn)反饋;網(wǎng)絡(luò)服務(wù)質(zhì)量投訴率;網(wǎng)絡(luò)故障統(tǒng)計(jì)概率;網(wǎng)絡(luò)系統(tǒng)軟件崩潰或無(wú)響應(yīng)概率;網(wǎng)絡(luò)傳輸設(shè)備、交換設(shè)備、存儲(chǔ)設(shè)備的可靠度;鏈路通信過(guò)程中的失敗次數(shù)統(tǒng)計(jì)概率;網(wǎng)絡(luò)服務(wù)器的故障率以及用戶(hù)終端的可靠度;計(jì)算機(jī)網(wǎng)絡(luò)的平均連通率或間隔時(shí)間內(nèi)的網(wǎng)絡(luò)無(wú)故障次數(shù);網(wǎng)絡(luò)故障持續(xù)時(shí)間以及從網(wǎng)絡(luò)故障到網(wǎng)絡(luò)恢復(fù)的時(shí)間間隔;網(wǎng)絡(luò)安全認(rèn)證體系以及網(wǎng)絡(luò)組織管理制度的評(píng)價(jià)等。
可見(jiàn),上述幾項(xiàng)指標(biāo)中,部分指標(biāo)可用具體的數(shù)值進(jìn)行衡量,這些指標(biāo)被稱(chēng)為數(shù)值型變量,部分指標(biāo)無(wú)法使用具體的數(shù)據(jù)進(jìn)行衡量,這些指標(biāo)被稱(chēng)為語(yǔ)言型變量,在為不同的變量制定衡量標(biāo)準(zhǔn)時(shí)應(yīng)該依照指標(biāo)的類(lèi)型制定相應(yīng)的量綱和衡量規(guī)范,以能夠讓上述指標(biāo)充分反應(yīng)計(jì)算機(jī)網(wǎng)絡(luò)的可靠性能。
計(jì)算機(jī)網(wǎng)絡(luò)的迅猛發(fā)展使得可影響計(jì)算機(jī)網(wǎng)絡(luò)可靠性的因素不斷增多,為保證其可靠性就必須從實(shí)際出發(fā),總結(jié)歸納影響計(jì)算機(jī)網(wǎng)絡(luò)可靠性的原因,為其制定切實(shí)可行的優(yōu)化策略或優(yōu)化方案,并在優(yōu)化完畢后及時(shí)對(duì)優(yōu)化結(jié)果進(jìn)行評(píng)價(jià),為后續(xù)的優(yōu)化和改進(jìn)提供參考依據(jù)。
[1] 劉君.計(jì)算機(jī)網(wǎng)絡(luò)可靠性?xún)?yōu)化設(shè)計(jì)問(wèn)題的研究[D].沈陽(yáng)工業(yè)大學(xué),2006(3)
[2] 陳聰.計(jì)算機(jī)網(wǎng)絡(luò)可靠性?xún)?yōu)化技術(shù)研究[J].信息通信,2013(1)
[3] 李宗英. 計(jì)算機(jī)網(wǎng)絡(luò)可靠性?xún)?yōu)化技術(shù)[J]. 軟件導(dǎo)刊,2008,7(6):
[4] 滕云微.網(wǎng)絡(luò)可靠性分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)信息,2008