摘 ?要:網(wǎng)絡(luò)系統(tǒng)可靠性設(shè)計(jì)的關(guān)鍵點(diǎn)是測試組網(wǎng)中參數(shù)的確定,通過振蕩測試法、極端數(shù)據(jù)流突變測試設(shè)計(jì)方案,網(wǎng)絡(luò)系統(tǒng)中斷、恢復(fù)時(shí)間長短測試,以及網(wǎng)絡(luò)系統(tǒng)正常運(yùn)行平均無故障時(shí)間等策略確定測試環(huán)境的關(guān)鍵參數(shù);同時(shí)采用雙機(jī)容錯(cuò)或多機(jī)容錯(cuò)技術(shù)、網(wǎng)絡(luò)硬件冗余設(shè)計(jì)遵循、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)抗毀性測試,流量數(shù)據(jù)異常監(jiān)測,數(shù)據(jù)容災(zāi)備份、數(shù)據(jù)分布式異地云端備份等多種策略以期實(shí)現(xiàn)網(wǎng)絡(luò)系統(tǒng)可靠性的綜合設(shè)計(jì)。
關(guān)鍵詞:網(wǎng)絡(luò);安全;可靠性;設(shè)計(jì)
中圖分類號:TP393 ? ? 文獻(xiàn)標(biāo)識碼:A
Abstract: The key point of reliability design of the network system is the determination of the parameters in the test network. The key parameters of the test environment can be determined through the Oscillation test method, the abrupt change test of the extreme data flow, the length of the break and recovery time of the network system, and test of the mean time between failures of the network. Meanwhile, the integrated design of network system reliability can be realized through using multiple technologies, such as the two-machine fault-tolerant or multi-machine fault-tolerant technology, the redundancy design of network hardware, test of invulnerability of the network topology, traffic data abnormity monitoring, data disaster recovery backup, and data distributed remote cloud backup, etc. .
Keywords: network; security; reliability; design
1 ? 引言(Introduction)
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速應(yīng)用和發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的應(yīng)用已經(jīng)滲透到各行各業(yè),無論政治、經(jīng)濟(jì)還是金融、商業(yè)、教育,各個(gè)行業(yè)越來越高度依賴計(jì)算機(jī)網(wǎng)絡(luò)互聯(lián)[1,2]。計(jì)算機(jī)網(wǎng)絡(luò)一旦出現(xiàn)故障,會(huì)對各行各業(yè)造成重大影響,以及產(chǎn)生巨大的經(jīng)濟(jì)損失,甚至影響到國家政治安全。因此,對于計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)可靠性的要求也越來越高,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)可靠性的研究會(huì)產(chǎn)生巨大的經(jīng)濟(jì)效益和社會(huì)效益[3]。
在網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)中,充分保證整網(wǎng)運(yùn)行的可靠性是基本原則之一?;诰W(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)的可靠性要求,針對網(wǎng)絡(luò)系統(tǒng)的平均無故障時(shí)間、平均恢復(fù)時(shí)間等機(jī)制進(jìn)行模擬測試。主要測試網(wǎng)絡(luò)系統(tǒng)的可維護(hù)性,系統(tǒng)發(fā)生故障后,能快速定位、解決故障,同時(shí)在系統(tǒng)運(yùn)行過程中實(shí)時(shí)監(jiān)控系統(tǒng)的運(yùn)行狀態(tài),各類網(wǎng)絡(luò)應(yīng)用系統(tǒng)的網(wǎng)絡(luò)環(huán)境通常需要配備相關(guān)的監(jiān)控服務(wù)器,通過實(shí)時(shí)監(jiān)控可提前發(fā)現(xiàn)異常狀態(tài)并發(fā)出預(yù)警信息,提前發(fā)現(xiàn)問題減少故障。如設(shè)備溫度過高、數(shù)據(jù)流量異常突起、處理器利用率突增等各類異常情況,通過更換或者增加相關(guān)網(wǎng)絡(luò)設(shè)備或調(diào)整網(wǎng)絡(luò)邏輯結(jié)構(gòu)來規(guī)避可能出現(xiàn)的風(fēng)險(xiǎn)、故障,提前進(jìn)行預(yù)防維護(hù)。
2 ?網(wǎng)絡(luò)可靠性設(shè)計(jì)原則 (Design principles for network reliability)
網(wǎng)絡(luò)結(jié)構(gòu)通常分接入層、匯聚層、核心層。網(wǎng)絡(luò)層次越高可靠性要求也越高。為保證網(wǎng)絡(luò)可靠性,可靠性技術(shù)的實(shí)施要求嚴(yán)密、完整,在設(shè)計(jì)過程中可靠性的理念和方法不能進(jìn)行簡單疊加和無限制的冗余。否則,會(huì)增大網(wǎng)絡(luò)建設(shè)成本以及后期網(wǎng)絡(luò)系統(tǒng)管理、維護(hù)的復(fù)雜度,會(huì)給網(wǎng)絡(luò)系統(tǒng)在運(yùn)行過程中帶來潛在的安全風(fēng)險(xiǎn)。因此在對網(wǎng)絡(luò)系統(tǒng)進(jìn)行早期規(guī)劃、設(shè)計(jì)時(shí),要嚴(yán)格按照國際標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn)對網(wǎng)絡(luò)類型、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和網(wǎng)絡(luò)功能層次進(jìn)行劃分、確定,以此分析為前提來構(gòu)建網(wǎng)絡(luò)業(yè)務(wù)邏輯模型、網(wǎng)絡(luò)概念模型,并在此基礎(chǔ)上確定網(wǎng)絡(luò)拓?fù)鋱D,準(zhǔn)確找出網(wǎng)絡(luò)可靠性設(shè)計(jì)中最重要的關(guān)鍵節(jié)點(diǎn)和鏈路,合理規(guī)劃、設(shè)計(jì)、部署多套策略的網(wǎng)絡(luò)可靠性設(shè)計(jì)方法和技術(shù)。在網(wǎng)絡(luò)系統(tǒng)發(fā)生故障后,能夠快速定位故障點(diǎn),并通過相關(guān)應(yīng)對策略排除故障,并根據(jù)系統(tǒng)告警提前發(fā)現(xiàn)問題,通過更換設(shè)備或調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)來規(guī)避可能再次出現(xiàn)的故障[4]。
平均無故障時(shí)間MTBF(Mean Time Between Failure)[5]是整個(gè)網(wǎng)絡(luò)系統(tǒng)可靠性的重要參數(shù)指標(biāo),通常情況網(wǎng)絡(luò)系統(tǒng)階段累計(jì)工作時(shí)間與故障次數(shù)的比值為MTBF,用戶對MTBF的期望值趨于0。整個(gè)網(wǎng)絡(luò)系統(tǒng)在運(yùn)行過程中系統(tǒng)環(huán)境中各物理設(shè)備和軟件組件無間斷無故障連續(xù)運(yùn)行的平均時(shí)長,決定了用戶在系統(tǒng)使用時(shí)候的體驗(yàn)。
在衡量整個(gè)網(wǎng)絡(luò)系統(tǒng)容錯(cuò)能力中,有一個(gè)非常重要的指標(biāo):平均恢復(fù)時(shí)間MTTR(Mean Time to Repair),在網(wǎng)絡(luò)系統(tǒng)運(yùn)行過程中各類物理設(shè)備和軟件組件出現(xiàn)故障時(shí),網(wǎng)絡(luò)系統(tǒng)從故障狀態(tài)恢復(fù)到可正常運(yùn)行狀態(tài)所消耗的平均時(shí)間。
網(wǎng)絡(luò)系統(tǒng)可靠性公式可表示為:
MTBF/(MTBF+MTTR) * 100%
其中,MTBF:平均故障間隔時(shí)間;MTTR:系統(tǒng)平均修復(fù)時(shí)間[3]。
通過系統(tǒng)可靠性公式可看出,MTBF與系統(tǒng)的可靠性成正比,提高M(jìn)TBF可提高系統(tǒng)可靠性;MTTR與系統(tǒng)成反比,降低網(wǎng)絡(luò)系統(tǒng)平均修復(fù)時(shí)間可提高系統(tǒng)在實(shí)際運(yùn)行中的可靠性。造成網(wǎng)絡(luò)系統(tǒng)運(yùn)行低可靠性的因素眾多,通常主要因素有設(shè)備間以及設(shè)備本身的鏈路故障、設(shè)備軟硬件故障、非法數(shù)據(jù)溢出、網(wǎng)絡(luò)擁塞、用戶誤操作等。針對這些因素采取對應(yīng)措施,提高網(wǎng)絡(luò)系統(tǒng)平均故障間隔時(shí)間,降低系統(tǒng)平均修復(fù)時(shí)間,從而提高整個(gè)網(wǎng)絡(luò)系統(tǒng)運(yùn)行的可靠性以及提升用戶舒適體驗(yàn)。
3 ?網(wǎng)絡(luò)硬件冗余設(shè)計(jì)(Redundancy design of network hardware)
網(wǎng)絡(luò)硬件冗余設(shè)計(jì)對于網(wǎng)絡(luò)抗災(zāi)備份起著不可忽視的作用,硬件容錯(cuò)的方法之一就是硬件堆積冗余,在物理層面可通過元器件的重復(fù)獲得一定的可靠性。或選擇硬件待命儲(chǔ)備冗余。系統(tǒng)提供N+M模塊,當(dāng)前狀態(tài)只有一塊或者某幾塊處于工作狀態(tài),其余M1、M2、M3、M4——MM塊一直處于待命狀態(tài)。一旦工作狀態(tài)的模塊出現(xiàn)問題,立即喚醒待命模塊進(jìn)入運(yùn)行狀態(tài),以此循環(huán),直至所有待命模塊資源枯竭,采用此方法可獲得較高的穩(wěn)定性和可靠性。
雙機(jī)容錯(cuò)或多機(jī)容錯(cuò)技術(shù)的使用是確保網(wǎng)絡(luò)系統(tǒng)穩(wěn)定性的普遍做法,任何單點(diǎn)系統(tǒng)故障不會(huì)引起整個(gè)系統(tǒng)的癱瘓,系統(tǒng)提供相關(guān)工具在應(yīng)用繼續(xù)的情況下可修復(fù)單點(diǎn)節(jié)點(diǎn)故障或者移除以及新增,同時(shí)通過系統(tǒng)冗余服務(wù)器監(jiān)管網(wǎng)絡(luò)系統(tǒng)下所有設(shè)備狀態(tài)和運(yùn)行狀態(tài)。冗余設(shè)備都在使用,出現(xiàn)警示狀態(tài)后,及時(shí)調(diào)整帶寬,增大帶寬并提高網(wǎng)絡(luò)系統(tǒng)處理的速度。但在實(shí)際應(yīng)用情況中可能產(chǎn)生數(shù)據(jù)庫服務(wù)器無法及時(shí)響應(yīng)用戶需求[3],用戶對于時(shí)間等待的要求就會(huì)面臨尷尬。如2020年初因疫情防控出現(xiàn)各大網(wǎng)絡(luò)學(xué)習(xí)平臺的用戶數(shù)量的極速暴增,導(dǎo)致網(wǎng)絡(luò)帶寬以及服務(wù)器的響應(yīng)延遲,甚至爆崩。為了滿足在特定時(shí)間節(jié)點(diǎn)用戶訪問數(shù)量的激增所產(chǎn)生的訪問響應(yīng)慢,以及系統(tǒng)可能爆崩的可能性,通常建議采用負(fù)載均衡服務(wù)器,通過多臺負(fù)載均衡服務(wù)器可獲得更高的速度,有效平衡數(shù)據(jù)訪問量,也可作為高可靠性的備份系統(tǒng)。
4 ? ?網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)(Network Topology)
拓?fù)淇煽啃圆⒉荒芡耆珱Q定整個(gè)通信網(wǎng)絡(luò)的可靠性,但網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì)的優(yōu)劣將直接影響著網(wǎng)絡(luò)的性能,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)對整體網(wǎng)絡(luò)可靠性起著重要的作用,也是決定網(wǎng)絡(luò)可靠性的先天因素。借助自動(dòng)網(wǎng)絡(luò)拓?fù)?、手?dòng)網(wǎng)絡(luò)拓?fù)湔宫F(xiàn)網(wǎng)絡(luò)拓?fù)潢P(guān)系,利用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析出系統(tǒng)的可靠度。隨著網(wǎng)絡(luò)擴(kuò)大或接入新設(shè)備,網(wǎng)絡(luò)結(jié)構(gòu)將變得更加復(fù)雜,在網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì)過程中拓?fù)浣Y(jié)構(gòu)的抗毀性和生存性是衡量有效度的重要指標(biāo)。破壞整個(gè)或部分通信網(wǎng)絡(luò)的困難程度由網(wǎng)絡(luò)節(jié)點(diǎn)連接所要移除或破壞的最少網(wǎng)絡(luò)節(jié)點(diǎn)或鏈路數(shù)目來決定,由此可見抗毀性完全由網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)所決定,是可靠性的一個(gè)確定性指標(biāo)。生存性最顯著的變化是引入了網(wǎng)絡(luò)部件的失效、故障概率,在隨機(jī)故障或蓄意破壞之下,保持通信網(wǎng)絡(luò)整體或部分連通的概率,其不僅受網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響,同時(shí)還依附于網(wǎng)絡(luò)部件、設(shè)備的故障概率、網(wǎng)絡(luò)維修與管理等因素,因此網(wǎng)絡(luò)拓?fù)渖嫘允菑V義的拓?fù)鋵涌煽啃浴?/p>
5 ? 數(shù)據(jù)容災(zāi)備份(Data disaster recovery backup)
數(shù)據(jù)容災(zāi)備份的重要性體現(xiàn)在數(shù)據(jù)長期有效地保存,以及對歷史數(shù)據(jù)的備份,這些數(shù)據(jù)長期存儲(chǔ)在網(wǎng)絡(luò)硬盤上,增加了網(wǎng)絡(luò)存儲(chǔ)空間的開銷,同時(shí)消減了網(wǎng)絡(luò)存儲(chǔ)空間的利用率,降低了數(shù)據(jù)存取速度,消減了用戶感受的舒適度。為了有效利用實(shí)時(shí)數(shù)據(jù)信息,通常建議把利用率不高,但偶爾需要調(diào)用的數(shù)據(jù)保存在脫機(jī)備份介質(zhì)上,以防止自然災(zāi)害、黑客攻擊、人為破壞、非法越權(quán)操作等惡意篡改、誤操作等造成聯(lián)機(jī)數(shù)據(jù)丟失。在需要數(shù)據(jù)調(diào)用時(shí)采取授權(quán)限時(shí)訪問,以化解風(fēng)險(xiǎn),把實(shí)時(shí)訪問數(shù)據(jù)存儲(chǔ)在聯(lián)機(jī)網(wǎng)絡(luò)存儲(chǔ)設(shè)備上。
同時(shí),為了確保聯(lián)機(jī)存儲(chǔ)數(shù)據(jù)的安全需做好系統(tǒng)防護(hù),確保桌面系統(tǒng)環(huán)境下產(chǎn)生的數(shù)據(jù)到達(dá)網(wǎng)絡(luò)環(huán)境再到數(shù)據(jù)服務(wù)器的系列風(fēng)險(xiǎn)的技術(shù)管控和反跟蹤、反向消除風(fēng)險(xiǎn)降到最低。
在網(wǎng)絡(luò)數(shù)據(jù)備份中按數(shù)據(jù)安全等級采取單項(xiàng)或多種備份策略混合模式進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)安全備份,安全級別較高采用完全備份,隨數(shù)據(jù)安全級別下降可采用增量或者按需備份等多種備份混合方式的數(shù)據(jù)備份策略。
6 ?網(wǎng)絡(luò)可靠性測試方法(Test method of network reliability)
6.1 ? 網(wǎng)絡(luò)測試內(nèi)容
網(wǎng)絡(luò)系統(tǒng)可靠性測試的主要內(nèi)容是:系統(tǒng)在持續(xù)運(yùn)行不間斷的情況下、高負(fù)荷、高頻率極端數(shù)據(jù)流振蕩下的持久、穩(wěn)定、安全、精準(zhǔn)的運(yùn)行性能;單點(diǎn)故障情況下系統(tǒng)自動(dòng)恢復(fù)時(shí)間。
網(wǎng)絡(luò)可靠性測試參數(shù)的設(shè)計(jì)是保證測試效果的重點(diǎn)[6],主要測試組網(wǎng)設(shè)備參數(shù),實(shí)際測試投入中難以搭建對等比例測試運(yùn)行環(huán)境。檢驗(yàn)網(wǎng)絡(luò)系統(tǒng)運(yùn)行性能高可靠性的核心是:如何抽象和取舍模擬測試網(wǎng)絡(luò)系統(tǒng)的核心模塊。模擬測試網(wǎng)絡(luò)系統(tǒng)核心模塊抽象、簡化的基本原則和重點(diǎn)是:整體分析實(shí)際運(yùn)行過程中網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)及系統(tǒng)性能壓力瓶頸,并充分暴露其運(yùn)行過程中的薄弱點(diǎn),重點(diǎn)保留網(wǎng)絡(luò)系統(tǒng)壓力瓶頸和關(guān)鍵節(jié)點(diǎn)以及易發(fā)生數(shù)據(jù)異常的模塊。
在組網(wǎng)測試環(huán)境中對網(wǎng)絡(luò)的協(xié)議模型和流量模型進(jìn)行模擬[7],保持環(huán)境在大壓力并且振蕩的條件下持續(xù)運(yùn)行,對于當(dāng)前復(fù)雜的網(wǎng)絡(luò)環(huán)境可在測試過程中增加異常數(shù)據(jù)和流量峰值,同步監(jiān)控網(wǎng)絡(luò)系統(tǒng)整體運(yùn)行狀況和異常情況作為測試結(jié)果數(shù)據(jù)進(jìn)行反饋。
6.2 ? ?網(wǎng)絡(luò)測試參數(shù)
網(wǎng)絡(luò)系統(tǒng)協(xié)議模型可通過用戶組網(wǎng)的行業(yè)規(guī)劃設(shè)計(jì)和行業(yè)原型開發(fā)模式進(jìn)行抽象,得出相對精準(zhǔn)的網(wǎng)絡(luò)系統(tǒng)協(xié)議模型數(shù)據(jù)參數(shù)[8]。網(wǎng)絡(luò)系統(tǒng)在規(guī)劃設(shè)計(jì)階段,因無法預(yù)先監(jiān)控網(wǎng)絡(luò)系統(tǒng)持續(xù)數(shù)據(jù)流量而獲取模型參數(shù)。因而網(wǎng)絡(luò)系統(tǒng)重要數(shù)據(jù)參數(shù)不易確定,數(shù)據(jù)流量模型難以準(zhǔn)確界定,各個(gè)子模塊數(shù)據(jù)邏輯難以準(zhǔn)確劃分,成為限制組網(wǎng)方案模擬測試的主要因素。通常采取的措施是依據(jù)行業(yè)標(biāo)準(zhǔn),根據(jù)行業(yè)特性分析,網(wǎng)絡(luò)系統(tǒng)規(guī)劃需求,以及借鑒前期開發(fā)經(jīng)驗(yàn)設(shè)定具有普遍意義的參數(shù)。
而另一種非常規(guī)方法可采用預(yù)定義參數(shù)方式,類似數(shù)據(jù)結(jié)構(gòu)中的折半查找法,可根據(jù)常規(guī)設(shè)定參數(shù)范圍,預(yù)先估計(jì)參數(shù)上下(m,n)限,然后對上下限參數(shù)值進(jìn)行算術(shù)平均(m+n)/2,對于得出的算術(shù)平均參數(shù)按算術(shù)平均參數(shù)的幾何倍數(shù)增加來逐級設(shè)置網(wǎng)絡(luò)設(shè)計(jì)參數(shù)。當(dāng)網(wǎng)絡(luò)系統(tǒng)參數(shù)隨著算術(shù)平均參數(shù)幾何倍數(shù)逐級遞增時(shí),網(wǎng)絡(luò)系統(tǒng)變化異常、振蕩頻率加強(qiáng)等情況出現(xiàn)時(shí),可對算術(shù)平均參數(shù)以幾何倍數(shù)逐級遞減來設(shè)置參數(shù)。通過算術(shù)平均參數(shù)折半查找法得到比較合理的網(wǎng)絡(luò)系統(tǒng)設(shè)置參數(shù)。
協(xié)議模型和流量模型的振蕩是持續(xù)振蕩測試的基本要求之一。實(shí)際運(yùn)行過程中網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)和流量峰值是動(dòng)態(tài)變化的。來自網(wǎng)絡(luò)系統(tǒng)各類數(shù)據(jù)流的輸入輸出變化頻繁,尤其是增加各類異常數(shù)據(jù)流后,將對網(wǎng)絡(luò)系統(tǒng)穩(wěn)定運(yùn)行產(chǎn)生更大的負(fù)擔(dān),并暴露出更多的系統(tǒng)脆弱節(jié)點(diǎn)。在進(jìn)行實(shí)際網(wǎng)絡(luò)系統(tǒng)可靠性、健壯性測試過程中可不斷提高異常數(shù)據(jù)流、劇烈高頻的數(shù)據(jù)振蕩,虛擬出比實(shí)際網(wǎng)絡(luò)運(yùn)行更加糟糕的運(yùn)行環(huán)境,使網(wǎng)絡(luò)系統(tǒng)在運(yùn)行過程中能夠更全面、更快暴露較長時(shí)間才能夠發(fā)現(xiàn)的網(wǎng)絡(luò)系統(tǒng)缺陷。振蕩系數(shù)在網(wǎng)路系統(tǒng)測試過程可調(diào)整各類軟、硬件和數(shù)據(jù)在不同頻率下的振蕩結(jié)果,例如可分別以等差或等比數(shù)列的時(shí)間間隔為一個(gè)周期進(jìn)行測試。與此同時(shí)還可進(jìn)行路由條數(shù)振蕩測試,路由條數(shù)不斷高頻率變化可導(dǎo)致整個(gè)網(wǎng)絡(luò)系統(tǒng)中路由信息的不斷增加、刪除、修改,這將在網(wǎng)絡(luò)系統(tǒng)數(shù)據(jù)輸入輸出過程中引發(fā)大量數(shù)據(jù)包傳輸路徑的不斷變化、更新、響應(yīng)延遲,給網(wǎng)絡(luò)測試系統(tǒng)的穩(wěn)定性帶來更大的壓力。另一方面可采用極端數(shù)據(jù)量跳水式的流量和頻率變化來暴露網(wǎng)絡(luò)系統(tǒng)潛在的問題:在持續(xù)測試時(shí)可預(yù)先采用數(shù)據(jù)流量的極低值進(jìn)行低、中、高頻率的測試,以監(jiān)測極低值數(shù)據(jù)流量在不同頻率下的run狀態(tài)。然后在持續(xù)測試時(shí)間中采用數(shù)據(jù)流量的極大值進(jìn)行低、中、高頻率的測試,以監(jiān)測極大值數(shù)據(jù)流量在不同頻率下的run狀態(tài)和突發(fā)瓶頸問題。在持續(xù)測試過程中也可通過在同一頻率中數(shù)據(jù)流量的突然變化來檢測網(wǎng)絡(luò)系統(tǒng)run狀態(tài)和系統(tǒng)異常情況,通過振蕩測試和極端數(shù)據(jù)流突變測試,會(huì)明確了解網(wǎng)絡(luò)系統(tǒng)的可靠程度。
6.3 ? 網(wǎng)絡(luò)硬件故障
網(wǎng)絡(luò)系統(tǒng)在出現(xiàn)單點(diǎn)故障情況(如,設(shè)備命令行執(zhí)行軟件重啟、設(shè)備斷電、設(shè)備上電等)下可快速恢復(fù)是高可靠網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)的又一重點(diǎn),自動(dòng)恢復(fù)時(shí)間越短越好。為精確計(jì)算各類網(wǎng)絡(luò)系統(tǒng)故障導(dǎo)致的網(wǎng)絡(luò)中斷/恢復(fù)時(shí)間,可接入各類專用的測試設(shè)備進(jìn)行模擬測試,各類測試設(shè)備的輸入、輸出分別接入到模擬測試網(wǎng)絡(luò)系統(tǒng)的輸入、輸出口,確保被測數(shù)據(jù)流量路徑貫通整個(gè)網(wǎng)絡(luò)[9]。使上下行數(shù)據(jù)流通路徑經(jīng)過需要模擬的網(wǎng)路系統(tǒng)的流量瓶頸點(diǎn)和易出故障節(jié)點(diǎn),避免測試路徑無效。在測試的過程中可通過灰盒測試、白盒測試監(jiān)測系統(tǒng)的正確性,在測試過程加入非法數(shù)據(jù),檢測網(wǎng)絡(luò)系統(tǒng)的健壯性。測試設(shè)備停止數(shù)據(jù)發(fā)送,根據(jù)發(fā)送和接收的數(shù)據(jù)量,測算出網(wǎng)絡(luò)模擬測試系統(tǒng)流量路徑恢復(fù)時(shí)間。Time=(發(fā)送報(bào)文數(shù)量-接收報(bào)文數(shù)量)/報(bào)文發(fā)送速率(pps)。
網(wǎng)絡(luò)系統(tǒng)中斷、恢復(fù)時(shí)間長短測試也可融合在持續(xù)振蕩測試中一起完成。使用網(wǎng)絡(luò)系統(tǒng)可靠性測試硬件、軟件、各類異常報(bào)文攻擊工具,可實(shí)現(xiàn)對網(wǎng)絡(luò)系統(tǒng)的可靠性的綜合測試。
7 ? 結(jié)論(Conclusion)
網(wǎng)絡(luò)系統(tǒng)可靠性測試需要在整網(wǎng)虛擬環(huán)境下測試運(yùn)行,網(wǎng)絡(luò)系統(tǒng)可靠性測試通常情況下采用黑盒測試,不僅需進(jìn)行端到端的測試,同步監(jiān)測各個(gè)關(guān)鍵模塊的實(shí)際運(yùn)行情況,流量和協(xié)議控制層面的運(yùn)行狀態(tài),做好各類異常情況以及故障分類分析報(bào)告,總結(jié)解決問題的方式、方法,全面分析網(wǎng)路系統(tǒng)實(shí)際運(yùn)行環(huán)境的行業(yè)性、特殊性、復(fù)雜性,對網(wǎng)絡(luò)系統(tǒng)的相關(guān)特性進(jìn)行深入分析,在模擬測試網(wǎng)絡(luò)系統(tǒng)運(yùn)行環(huán)境中不斷優(yōu)化配置各類參數(shù),得到最優(yōu)最可靠的網(wǎng)絡(luò)系統(tǒng),提升計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)運(yùn)行的可靠性。
參考文獻(xiàn)(References)
[1] 詹亞平.計(jì)算機(jī)通信及網(wǎng)絡(luò)遠(yuǎn)程控制技術(shù)的應(yīng)用與可靠性提升[J].科技創(chuàng)新與應(yīng)用,2020(08):174-175.
[2] 廖駿杰.計(jì)算機(jī)通信網(wǎng)絡(luò)可靠性設(shè)計(jì)技術(shù)[J].電子技術(shù)與軟件工程,2019(6):6-7.
[3] 徐蕾.計(jì)算機(jī)網(wǎng)絡(luò)可靠性優(yōu)化設(shè)計(jì)分析[J].信息與電腦(理論版),2018(04):136-137;142.
[4] 王喜來.計(jì)算機(jī)網(wǎng)絡(luò)可靠性優(yōu)化設(shè)計(jì)[J].計(jì)算機(jī)與網(wǎng)絡(luò),2020(04):44-45.
[5] 劉文輝,曾斌.基于計(jì)算機(jī)網(wǎng)絡(luò)信息和網(wǎng)絡(luò)安全及其防護(hù)策略研究[J].電子元器件與信息技術(shù),2018(04):9-11.
[6] 劉振亮,馬小琴.計(jì)算機(jī)網(wǎng)絡(luò)可靠性優(yōu)化設(shè)計(jì)問題研究[J].信息通信,2015(04):99-105.
[7] 陳剛,李璐,陳澤.計(jì)算機(jī)網(wǎng)絡(luò)可靠性優(yōu)化設(shè)計(jì)問題的研究[J].計(jì)算機(jī)產(chǎn)品與流通,2019(09):148-149;171.
[8] 趙鶴群.計(jì)算機(jī)網(wǎng)絡(luò)可靠性提升要點(diǎn)分析[J].科技傳播,2018(1):117-118.
[9] 魯梁梁,周小健.計(jì)算機(jī)網(wǎng)絡(luò)安全的可靠性及優(yōu)化設(shè)計(jì)問題的探討解析[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(4):40;46.
作者簡介:
黃小蘭(1977-),女,碩士,講師.研究領(lǐng)域:信息系統(tǒng),計(jì)算機(jī)應(yīng)用技術(shù).