梁慧 董峰 王鵬勛
摘 要 隨著信息化進程的深入和網(wǎng)絡(luò)系統(tǒng)的迅速發(fā)展,部隊的通信網(wǎng)絡(luò)的保障已成為信息化建設(shè)的重點問題,本文針對通信網(wǎng)絡(luò)路由出現(xiàn)的故障進行分析,以典型故障檢修為案例,為網(wǎng)絡(luò)故障維修提供參考。
關(guān)鍵詞 路由器 網(wǎng)絡(luò)
中圖分類號:TP393 文獻標(biāo)識碼:A
路由器是通過轉(zhuǎn)發(fā)數(shù)據(jù)包來實現(xiàn)各個單一網(wǎng)絡(luò)進行互連的網(wǎng)絡(luò)設(shè)備。目前在部隊的通信網(wǎng)絡(luò)系統(tǒng)中,裝備了大量的思科、港灣等品牌路由器,而路由器在使用中由于環(huán)境、供電、配置等問題會出現(xiàn)各種故障,現(xiàn)就平時工作中遇到的故障及檢修過程進行梳理以便今后積累經(jīng)驗。
1路由器寄存器配置錯誤故障
1.1故障現(xiàn)象
單位以思科3700路由器作為骨干路由器與上級網(wǎng)絡(luò)相連,采用標(biāo)準(zhǔn)配置,IOS的版本為12.2。思科2600路由器作為基層連隊路由器與團網(wǎng)絡(luò)雷達(dá)情報組網(wǎng)系統(tǒng)相連,采用標(biāo)準(zhǔn)配置,IOS的版本為3.0.0。一日發(fā)現(xiàn)組網(wǎng)系統(tǒng)的工作狀態(tài)由組網(wǎng)模式轉(zhuǎn)為獨立模式,而光端機也未出現(xiàn)告警,指示燈全部正常。
1.2檢修過程
首先登陸該路由器用“show running-config”命令檢查所有運行參數(shù),沒有發(fā)現(xiàn)錯誤;又用“show interfaces serial”命令檢查串口,發(fā)現(xiàn)某些端口狀態(tài)up,而線路協(xié)議是 down,并且出現(xiàn)這種情況的串口均在同一個串口板上,其它各模塊工作正常。經(jīng)查所有物理線路也都正常,從而排除了線路故障的可能性。然而在正常情況下同一個串口板上的所有串口同時出現(xiàn)線路故障的可能性也并不大。因此可以確定可能該串口板出了問題。當(dāng)進入全局配置模式后,再想進入該串口板上串口的端口配置模式時卻發(fā)現(xiàn)無法實現(xiàn),當(dāng)鍵入“interface serial串口號”時,總是報錯,但是同樣的命令卻可以進入其它串口的端口配置模式。這時,可以判斷是IOS本身出現(xiàn)了某種軟件故障,用reload 命令重啟路由器后系統(tǒng)自動進入ROMmonitor模式,提示符為“rommon>”,鍵入命令“boot”但是啟動路由器后故障依然存在,而且該串口板串口的配置語句全都報錯。再次將路由器關(guān)電然后加電時觀察到路由器的電源LED燈和備用電源RPS燈均工作正常,這說明系統(tǒng)的供電系統(tǒng)工作正常,風(fēng)扇旋轉(zhuǎn)正常且輸出錯誤LED燈未亮,這說明冷卻系統(tǒng)工作正常。各接口的Enable LED燈為綠色,表示路由器已完成了接口處理器的初始化。但該串口板的LED燈閃了一下就滅了,執(zhí)行“reset”命令再用“boot”引導(dǎo)系統(tǒng)后該串口板串口的配置語句全部消失了。該串口板上只有兩個串口,其中一個串口已使用,一個空閑。正常時一個正在使用的串口的LED燈應(yīng)該為黃色,而未使用的串口的LED燈應(yīng)該熄滅,但目前卻是兩個串口的LED都不亮。為了進一步壓縮可能的故障范圍,將該串口板調(diào)換到空插槽安裝,故障依然存在,將該串口板安裝在另一臺同型號無故障的路由器上時,則一切正常。通過以上的步驟,將故障壓縮到路由器配置參數(shù)上了。使用“show version”命令,在顯示信息的最后一行,發(fā)現(xiàn)路由器配置寄存器數(shù)值為0x0,將其修改為0x2102后,重新引導(dǎo)路由器,重新進行配置后路由器工作恢復(fù)正常,至此排除了這一貌似硬件接口損壞而實為啟動參數(shù)設(shè)置錯誤的故障。
1.3檢修體會
思科路由器寄存器值由四個16進制數(shù)組成,其中低4位決定系統(tǒng)的啟動方式:當(dāng)最低4位為0-0-0-0,路由器不裝載系統(tǒng)鏡像,而是進入監(jiān)控狀態(tài)(ROM monitor mode),需要手工引導(dǎo)。當(dāng)最低4位為0-0-0-1,路由器裝載從ROM里找到的系統(tǒng)鏡像。當(dāng)最低4位為0-0-1-0至于1-1-1-1之間,路由器按啟動配置中BOOT SYSTEM命令的設(shè)置裝載操作系統(tǒng)鏡像,如果沒有設(shè)置該命令則從一個默認(rèn)的網(wǎng)絡(luò)服務(wù)器上的系統(tǒng)鏡像中裝載操作系統(tǒng)鏡像。當(dāng)?shù)?位為1時,思科路由器啟動時忽略NVRAM中的配置。以上故障中路由器寄存器的值為0x0,表示不自動裝載操作系統(tǒng)鏡像而是進入ROM monitor模式等待用戶鍵入命令,而把寄存器值修改為0x2102表示正常啟動路由器。當(dāng)發(fā)現(xiàn)路由器正常啟動后進入監(jiān)控模式(ROMA monitor mode),就要懷疑是寄存器配置錯誤或者是路由器操作系統(tǒng)損壞,這樣可以少走彎路,減少故障檢修時間。
2路由器操作系統(tǒng)故障
2.1故障現(xiàn)象
某計算機的網(wǎng)絡(luò)測通記錄軟件ConnectionMonitor的監(jiān)控界面上,有個路由器和主機均顯示“No Reply”,經(jīng)詢問,光端機和與路由器相連的華環(huán)光轉(zhuǎn)換器設(shè)備工作正常,在檢查華環(huán)光轉(zhuǎn)換器、路由器、交換機的連接線后重新連線,故障依舊存在,考慮可能是路由器自身的故障。
2.2檢修過程
即可帶一臺備份路由器到該故障點去,按要求配置完參數(shù)接入網(wǎng)絡(luò)后網(wǎng)絡(luò)恢復(fù)正常。開始檢查故障的路由器,使用Windows主機的超級終端連接故障路由器console口,發(fā)現(xiàn)提示符變?yōu)閞ommon 1 >了,重新啟動路由器后現(xiàn)象和剛才一樣。 在rommon>命令提示符下使用boot命令,使路由器重新加載flash中的IOS文件,顯示boot: cannot determine first file name on device "flash:",加載IOS文件失敗。這說明IOS系統(tǒng)崩潰了,需要進行IOS系統(tǒng)的恢復(fù)操作。先在接入電腦上安裝一個tftp server軟件并運行該軟件,遠(yuǎn)程登陸到同型號路由器上,下載一個IOS文件,使用命令copy flash:c2600-ik9o3s3-mz.123-26.bin tftp:主機IP地址
然后使用超級終端通過路由器console口連接路由器進行如下操作,其步驟為:
(1)將安裝了思科 TFTP Server的電腦主機通過以太網(wǎng)與路由器的第一個以太網(wǎng)接口相連,運行思科TFTP Server 程序。
(2)指定要恢復(fù)的IOS文件名,并保證該文件在思科TFTP Server根目錄下。
(3)將PC機的IP地址改為192.168.1.2/24(我們同樣可以使用命令TFTP_SERVER = 192.168.1.x修改該設(shè)置,但要保證路由器的IP、默認(rèn)網(wǎng)關(guān)與PC機的IP在統(tǒng)一網(wǎng)段,這樣更簡單。)
(4) 在rommon >提示符下鍵入命令開始恢復(fù)IOS文件:
IP_ADDRESS=192.168.1.1(路由器的ip地址)
IP_SUBNET_MASK=255.255.255.0(路由器的掩碼)
DEFAULT_GATEWAY=192.168.1.2(網(wǎng)關(guān),是pc機的ip地址)
TFTP_SERVER=192.168.1.2(是pc機的ip地址)
TFTP_FILE=c2600-ik9o3s3-mz.123-26.bin(指定要恢復(fù)的IOS文件名)
tftpdnld
開始傳送文件,出現(xiàn)是否繼續(xù)的提示后選擇“y”,執(zhí)行該命令從TFTF Server下載IOS文件到flash。
(5)傳送完畢后,重新啟動路由器。
rommon > reset(重新加載路由器)
重啟后運行新的IOS,路由器恢復(fù)正常工作。
2.3檢修體會
FLASH是一種可擦寫、可編程的ROM,F(xiàn)LASH包含IOS及微代碼??梢园阉胂蠛蚉C機的硬盤功能一樣??梢酝ㄟ^寫入新版本的OS對路由器進行軟件升級。FLASH中的程序,在系統(tǒng)掉電時不會丟失,它常常發(fā)生在對路由器IOS版本升級操作失誤或其它軟硬件故障原因。在恢復(fù)操作系統(tǒng)時注意文件名稱區(qū)分大小寫,因此請確保正確輸入,不要忘記加上擴展文件名.bin。復(fù)制過程將需要數(shù)分鐘時間,在復(fù)制過程中,將顯示信息提示已經(jīng)復(fù)制的文件。感嘆號“!”表示正在處理復(fù)制流程,操作系統(tǒng)的校驗和鑒別將在操作系統(tǒng)寫入閃存后執(zhí)行,要耐心等候超級終端界面的提示信息。開機過程中不要斷電,不要頻繁的開關(guān)路由器而導(dǎo)致路由器系統(tǒng)崩潰無法進行工作。對于路由器維護,一是要注意它的電源的管理。包括其他網(wǎng)絡(luò)設(shè)備在內(nèi),建議使用UPS電源進行不間斷的供電,都必須使用帶有有效接地的電源,同時注意防雷擊,這主要是因為路由器等網(wǎng)絡(luò)設(shè)備內(nèi)部的零件都非常的脆弱。在打雷等惡劣天氣下,若沒有有效的接地,則很可能因為電壓的問題把路由器內(nèi)部零件燒壞。二是需要注意防塵。路由器設(shè)備由于通風(fēng)散熱的需要,通常情況下并不是密封的。此時,若灰塵比較多的情況下,往往在路由器內(nèi)部的零部件上覆蓋厚厚的一層灰塵。這會大大的影響路由器等網(wǎng)絡(luò)設(shè)備的散熱性。零部件可能會因為散熱不良而燒毀。同時,要定期的對路由器等內(nèi)部的灰塵進行清理,能夠有效的延長路由器的使用壽命。
3路由器、交換機與網(wǎng)線速度不匹配故障
3.1故障現(xiàn)象
某單位在新的值班系統(tǒng)在更新運行前,要求新舊兩套系統(tǒng)同時工作一段時間。一系列的準(zhǔn)備調(diào)試工作展開,主要實現(xiàn)目標(biāo)是以新的系統(tǒng)工作為主,同時把老的系統(tǒng)交換機連接到新系統(tǒng)的路由器上以達(dá)到新老系統(tǒng)對情報源的共享、情報上報用戶的分發(fā)一致。兩套系統(tǒng)分別位于兩個相鄰的大廳內(nèi),新系統(tǒng)已經(jīng)調(diào)試完畢,現(xiàn)在由于在新系統(tǒng)的基礎(chǔ)上增加了機器,計劃老系統(tǒng)的交換機直接用一根網(wǎng)線連接新系統(tǒng)路由器第二個網(wǎng)口。第一步,按照網(wǎng)絡(luò)規(guī)劃設(shè)置路由器第二個網(wǎng)口地址。第二步,在兩個大廳之間的線槽內(nèi)找出一根以前架設(shè)老系統(tǒng)時布好的網(wǎng)線,兩端分別連接交換機與路由器。可把全部網(wǎng)線接好后,老系統(tǒng)的服務(wù)器、工作站等設(shè)備間可以互訪,但是無法訪問路由器和新系統(tǒng)的服務(wù)器、工作站和網(wǎng)絡(luò)打印機等設(shè)備,當(dāng)然也就無法連接外網(wǎng)。
3.2檢修過程
從故障現(xiàn)象看,應(yīng)該是老系統(tǒng)的交換機與路由器的連接出現(xiàn)了問題,為了排除是與交換機相連的路由器端口的問題,我直接將路由器上的第二個端口接入一臺筆記本電腦,連接正常,網(wǎng)線長度還不到60米,用測試儀進行測試也沒有問題。
交換機、路由器、網(wǎng)線都沒問題,但交換機和路由器就是無法連通。查看老系統(tǒng)電腦的網(wǎng)絡(luò)屬性,發(fā)現(xiàn)它們的連接速度是10Mbps,網(wǎng)卡都是10Mbps網(wǎng)卡。交換機和路由器都是10M/100Mbps自適應(yīng)的,應(yīng)該不會因速度問題引起無法連接。交換機的端口都是10M/100Mbps自適應(yīng)的,而電腦的網(wǎng)卡則是10Mbps,可以接10Mbps的電腦網(wǎng)卡卻無法接100Mbps的路由器,那問題有極大的可能出在網(wǎng)線速度上。由于單位布線的時間較早,當(dāng)時流行的還是10Mbps以太網(wǎng),因此埋在線槽內(nèi)的網(wǎng)線有可能是10Mbps的網(wǎng)線。10Mbps的網(wǎng)速對于設(shè)備已經(jīng)夠用,所以不打算重新布設(shè)網(wǎng)線而是通過改變路由器和交換機的強制速率來解決問題。我立刻將 交換機與路由器相連的網(wǎng)口均設(shè)置為強制速度10Mbps。經(jīng)測試,網(wǎng)絡(luò)全部正常,故障排除。
3.3檢修體會
由于路由器的以太網(wǎng)口是10/100Mbps自適應(yīng)端口,交換機也是10/100Mbps自適應(yīng)的端口,當(dāng)路由器與交換機連接時會發(fā)現(xiàn)對端是個百兆設(shè)備,因此采用100Mbps速率通訊模式,而這時它們之間所布設(shè)的10Mbps的網(wǎng)線就無法使用了,因此交換機和路由器就表現(xiàn)為無法連通?;叵胍幌聠栴}的解決過程,之所以會茫然失措,在于當(dāng)發(fā)現(xiàn)每個設(shè)備似乎都沒問題時,就找不到問題產(chǎn)生的原因了。不匹配的設(shè)備無法協(xié)同工作是很正常的,檢修網(wǎng)絡(luò)故障不單單是確保每一個網(wǎng)絡(luò)部件的正常工作,要通盤考慮,確保不同設(shè)備合理搭配、匹配工作。