最近一段時(shí)間,因?yàn)樾略隽瞬糠謪R聚層路由器及相關(guān)子網(wǎng),導(dǎo)致之前很多64K鏈路節(jié)點(diǎn)出現(xiàn)隨機(jī)性網(wǎng)絡(luò)不可達(dá)故障,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
在該網(wǎng)絡(luò)中R4為新增的匯聚層路由器。R1和R2為本單位上聯(lián)路由器,并通過(guò)VRRP為內(nèi)網(wǎng)提供冗余網(wǎng)關(guān)。R3為早期64K鏈路匯聚路由器,為早期業(yè)務(wù)點(diǎn)提供64KWAN口鏈路接入能力。
之前網(wǎng)絡(luò)一直運(yùn)行穩(wěn)定,但最近一段時(shí)間隨機(jī)性出現(xiàn)64K連接點(diǎn)用戶(hù)申告業(yè)務(wù)系統(tǒng)無(wú)法登錄的故障,網(wǎng)絡(luò)管理員檢查R1、R2以及R3路由器發(fā)現(xiàn),針對(duì)故障點(diǎn)子網(wǎng)路由發(fā)生錯(cuò)誤。只能在R1、R2及R3上通過(guò)ip route命令來(lái)指定到故障節(jié)點(diǎn)的靜態(tài)路由來(lái)恢復(fù)業(yè)務(wù)網(wǎng)絡(luò)的可用性。但隨著時(shí)間的推移,越來(lái)越多的64K鏈路連接都需要使用靜態(tài)路由來(lái)實(shí)現(xiàn),這引起了網(wǎng)絡(luò)維護(hù)部門(mén)的高度重視。
為了徹底找到問(wèn)題發(fā)生的原因,單位網(wǎng)絡(luò)維護(hù)組進(jìn)行了認(rèn)真的分析和研究。在連接點(diǎn)用戶(hù)申告業(yè)務(wù)系統(tǒng)無(wú)法登錄期間,筆者和同事檢查發(fā)現(xiàn),連接R3及故障點(diǎn)的WAN口其實(shí)是一直連通的,筆者可以通過(guò)R3對(duì)應(yīng)的故障點(diǎn)WAN口IP地址登錄到故障點(diǎn)路由器,在故障點(diǎn)路由器使用Ping命令,可以Ping通R3路由器,但在R1或者R2上均無(wú)法Ping通故障點(diǎn)路由器的內(nèi)網(wǎng)IP地址。
使用路由追蹤命令traceroute,發(fā)現(xiàn)本該到故障點(diǎn)路由器路由被奇妙地指到了R4路由器上,后來(lái)詢(xún)問(wèn)才得知,該路由器為通級(jí)單位新增的業(yè)務(wù)點(diǎn)路由器。檢查該路由器配置發(fā)現(xiàn)該路由器在EIGRP配置中啟用了Auto-Summary(路由自動(dòng)匯總)功能。通過(guò)路由器命令show ip route命令查看路由,發(fā)現(xiàn)到故障點(diǎn)路由在R1、R2中不存在,只有一條指向WAN口邊界地址的匯總路由。將R4上的Auto-Summary (路由自動(dòng)匯總)功能關(guān)閉后,網(wǎng)絡(luò)恢復(fù)正常。
因?yàn)楸締挝痪W(wǎng)絡(luò)規(guī)模較大,同時(shí)為了節(jié)省IP地址,因此網(wǎng)絡(luò)在規(guī)劃初期在路由器WAN口間使用了168.168.0.0的變長(zhǎng)掩碼地址設(shè)置。比如,在R3中 設(shè)置的對(duì)故障點(diǎn)的WAN口地址 為168.168.101.117/30,對(duì)端WAN口地址為168.168.101.118/30。 這樣,當(dāng)R4上啟用了Auto-Summary (路由自動(dòng)匯總)功能,則會(huì)自動(dòng)將路由進(jìn)行匯總,通告路由不攜帶子網(wǎng)掩碼,或者說(shuō)子網(wǎng)掩碼會(huì)被自動(dòng)設(shè)置成標(biāo)準(zhǔn)的B類(lèi)地址掩碼。最后R1、R2只會(huì)學(xué)習(xí)到168.168.0.0的路由信息,而實(shí)際上到達(dá)168.168.101.118的路由信息因?yàn)槁酚蓞R總之后就被覆蓋了,從而導(dǎo)致網(wǎng)絡(luò)不可達(dá)故障。將AUTOSUMMARY功能關(guān)閉后,此時(shí)路由器向外宣告路由信息時(shí),攜帶了真實(shí)子網(wǎng)掩碼,此時(shí)R4只向外宣布自己的路由信息,不會(huì)將其他無(wú)類(lèi)子網(wǎng)路由信息覆蓋掉從而導(dǎo)致故障發(fā)生。
路由器作為網(wǎng)絡(luò)的核心設(shè)備,其功能無(wú)可替代。但因?yàn)樵谏a(chǎn)環(huán)境中的關(guān)系,經(jīng)常需要進(jìn)行類(lèi)似升級(jí)、故障替換等操作。很多時(shí)候如果本地路由器參數(shù)設(shè)置不當(dāng),可能會(huì)引發(fā)全局性網(wǎng)絡(luò)故障。這一方面需要網(wǎng)絡(luò)管理維護(hù)人員加強(qiáng)自我的技術(shù)學(xué)習(xí)和升級(jí),另一方面,在出現(xiàn)網(wǎng)絡(luò)問(wèn)題后,也要從整體來(lái)對(duì)網(wǎng)絡(luò)進(jìn)行分析,切不可只看局部忽略全局。因?yàn)榇说氐木W(wǎng)絡(luò)問(wèn)題其真實(shí)原因未必就一定是此地設(shè)備導(dǎo)致的。