孫海虹 張建強 馮旭 李選
摘?要:當(dāng)今互聯(lián)網(wǎng)在生活中占有重要地位,而局域網(wǎng)則是保證互聯(lián)網(wǎng)信息穩(wěn)定傳輸?shù)那疤?,但在使用過程中也存在許多問題。本文利用局域網(wǎng)TCP/IP協(xié)議網(wǎng)絡(luò)各層相互獨立的特征,提出在網(wǎng)絡(luò)故障診斷過程中使用分層法可快速、準(zhǔn)確定位故障點,提高故障排查的效率,確保局域網(wǎng)網(wǎng)絡(luò)穩(wěn)定、可靠、安全地運行。
關(guān)鍵詞:分層法;局域網(wǎng);網(wǎng)絡(luò)故障;故障診斷
現(xiàn)代互聯(lián)網(wǎng)生活中,局域網(wǎng)作為大多數(shù)政府機關(guān)、企事業(yè)單位信息化辦公的重要組成部分,具有舉足輕重的地位,然而網(wǎng)絡(luò)隨時都可能發(fā)生故障,因此必須掌握相應(yīng)的技術(shù)排除故障,確保各類突發(fā)事件能夠及時、正確、果斷的處置。
1?分層法排除網(wǎng)絡(luò)故障流程
在局域網(wǎng)絡(luò)故障排查中,可利用分層法快速、準(zhǔn)確定位故障點。即接到故障申告后盡可能地向故障申告方收集故障信息,按照網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)加以分析,追本溯源,初步定位可能發(fā)生故障的范圍,在后期故障探測時重點關(guān)注。首先測試網(wǎng)絡(luò)層是否正常,若不正常接下來檢測接入層;若測試正常,那么接下來檢測應(yīng)用層和傳輸層,查看應(yīng)用軟件程序的配置信息,以及網(wǎng)絡(luò)傳輸設(shè)備是否存在故障[1]。分層法排除局域網(wǎng)網(wǎng)絡(luò)故障流程如下圖所示。
分層法排除局域網(wǎng)網(wǎng)絡(luò)故障流程圖
2?分層法排除局域網(wǎng)網(wǎng)絡(luò)故障分析
故障排除時按照分層法逐一關(guān)注網(wǎng)絡(luò)層、接入層和傳輸層有無故障現(xiàn)象。
網(wǎng)絡(luò)層提供了兩個端點之間的數(shù)據(jù)通信,包括路徑選擇、擁塞控制、傳輸確認(rèn)與中斷等。網(wǎng)絡(luò)層故障診斷的基本方法是:采用tracert命令檢驗數(shù)據(jù)包,對照查看路由表,檢查路由器接口地址,若下一跳地址或目的地址沒有在路由表中出現(xiàn),則要確定是否已輸入靜態(tài)路由、默認(rèn)路由或動態(tài)路由;否則必須重新添加丟失的路由信息,或者檢查動態(tài)路由選擇是否出現(xiàn)故障,包括RIP或者IGRP路由協(xié)議故障[2]。
接入層包括從服務(wù)器或工作站到數(shù)據(jù)接口的線纜,作為介質(zhì),包含數(shù)據(jù)接口、信息插座模塊、信息插頭模塊、集線器或交換機的各條連接的物理接口[1]。該層實現(xiàn)系統(tǒng)和通信媒體節(jié)點之間數(shù)據(jù)的打包和解包、差錯檢測、校正的透明傳輸。接入層網(wǎng)絡(luò)故障包括:物理連接故障、硬件和線路故障、設(shè)備接口配置故障。
傳輸層是對應(yīng)用層數(shù)據(jù)添加必要的控制信息,在源節(jié)點和目的節(jié)點兩個進程實體間提供端到端的數(shù)據(jù)傳輸[3]。出現(xiàn)故障大多與路由器端口配置錯誤和訪問控制列表不正確有關(guān)。在傳輸層,可利用許多實用程序來協(xié)助故障排查。如使用Netstat命令和Tcpdump命令等。
3?分層法排除局域網(wǎng)網(wǎng)絡(luò)故障實例
3.1?實例1
故障現(xiàn)象:某控制大廳網(wǎng)絡(luò)化視頻雙流中PPT出現(xiàn)馬賽克,甚至雙流掉線,導(dǎo)致網(wǎng)絡(luò)化視頻無法正常運行。
故障分析:按照分層法第一步檢查網(wǎng)絡(luò)層。一是重啟設(shè)備,查看視頻會議系統(tǒng)連接某基層方向的音視頻及雙流中的PPT是否出現(xiàn)延遲、馬賽克、甚至掉線故障;二是通過系統(tǒng)監(jiān)控軟件核查該基層終端網(wǎng)絡(luò)是否存在問題;三是用比較大的包如6000字節(jié)ping出現(xiàn)故障的基層視頻會議終端地址,查看是否存在丟包或者丟包率較高的現(xiàn)象。
ping對端ip地址l?6000t
Pinging?ip?with?6000?bytes?of?data:
Reply?from?ip:bytes=6000?time=8ms?TTL=61
Request?timed?out.
……
如上信息所示出現(xiàn)多條Request?timed?out,表示該條線路存在網(wǎng)絡(luò)丟包情況,再查看如下所示結(jié)果:
Ping?statistics?for對端ip地址
Packets:Sent=20,Received=12,Lost=8(40%loss)
第二步檢查從總部MCU到出現(xiàn)故障的基層終端的網(wǎng)絡(luò)線路是否存在問題,丟包現(xiàn)象說明從MCU到基層視頻終端每一個網(wǎng)絡(luò)節(jié)點都有丟包的可能性,需要排查從MCU到本級交換機、路由器、基層路由器、基層交換機、基層視頻終端這些環(huán)節(jié)[4]。采用tracert命令檢驗數(shù)據(jù)包通過路徑:
Tracing?route?to?ip?over?a?maximum?of?30?hops
1?<1ms?4ms?4ms?ip地址1
2?2ms?2ms?2ms?ip地址2
……
6?*?*?*?Request?timed?out.
由上顯示經(jīng)過幾個環(huán)節(jié)到達對端路由器內(nèi)部,但未到達終端,說明故障在基層內(nèi)部局域網(wǎng)。
第三步從基層終端ping路由器內(nèi)部地址,觀察ping信息,發(fā)現(xiàn)產(chǎn)生振蕩性時斷時通現(xiàn)象。基本可以判斷為網(wǎng)絡(luò)線路中其中兩個或多個交換機間出現(xiàn)環(huán)路,形成“廣播風(fēng)暴”,使網(wǎng)絡(luò)線路通信數(shù)據(jù)處理速度受限,網(wǎng)絡(luò)傳輸信道擁塞,交換機數(shù)據(jù)處理異常,導(dǎo)致網(wǎng)絡(luò)出現(xiàn)時斷時通現(xiàn)象。
故障處理:檢查各級交換機指示燈閃爍狀態(tài)是否正常,如果指示燈閃爍次數(shù)在每秒4次以上,則可判斷出現(xiàn)故障。依次檢查并去掉交換機級聯(lián)網(wǎng)線,實時監(jiān)控交換機端口指示燈狀態(tài),如果某端口網(wǎng)線拔掉后,指示燈恢復(fù)正常,繼續(xù)檢查,發(fā)現(xiàn)該網(wǎng)線的末端有網(wǎng)線形成環(huán)路,拆除該網(wǎng)線,網(wǎng)絡(luò)恢復(fù),網(wǎng)絡(luò)化視頻正常進行。
3.2?實例2
故障現(xiàn)象:指揮大廳綜合終端席位收不到基層運行數(shù)據(jù)。
故障分析:第一步檢查網(wǎng)絡(luò)層。Ping?127.0.0.1,發(fā)現(xiàn)工作正常,說明席位終端系統(tǒng)網(wǎng)絡(luò)適配器和驅(qū)動程序工作正常。Ping該本單位服務(wù)器及總部服務(wù)器,沒有丟包現(xiàn)象,說明網(wǎng)絡(luò)層正常。用Show?Interface命令檢查所經(jīng)過的交換機的配置,查看交換機與席位終端連接的接口參數(shù)及運行情況,物理層狀態(tài)運行未發(fā)現(xiàn)異常。
在本級服務(wù)器終端抓包:
Tcpdumpxs?200?src?ip?and?poor?4001
No?suitable?device?founf
顯示未截獲從總部服務(wù)器傳送的端口號為4001的數(shù)據(jù)包
Tcpdumpxs?200?dst?ip?and?poor?4001
No?suitable?device?founf
顯示未截獲發(fā)送到基層服務(wù)器傳送的端口號為4001的數(shù)據(jù)包
第二步檢查應(yīng)用層。主要排查服務(wù)器和席位終端運行狀態(tài)、測試應(yīng)用程序以及相關(guān)應(yīng)用程序的配置。網(wǎng)絡(luò)頁面可以打開,說明應(yīng)用平臺運行正常,只是沒有該基層數(shù)據(jù)。詢問外單位,系統(tǒng)其他基層單位運行正常,相關(guān)應(yīng)用程序沒有問題。
第三步檢查傳輸層。檢查基層防火墻與本席位有關(guān)的配置策略信息。發(fā)現(xiàn)協(xié)議訪問控制中信息化系統(tǒng)總部服務(wù)器與終端席位ip地址點對點臨時通道服務(wù)未開放,從而導(dǎo)致該席位無法收到基層數(shù)據(jù)包。
故障處理:登錄本級防火墻配置頁面,進入“協(xié)議訪問控制”,打開“臨時通道”,雙向添加總部服務(wù)器與基層終端席位ip地址、協(xié)議。登錄綜合終端,運行正常,基層傳輸數(shù)據(jù)正常,故障排除。
3.2?實例3
故障現(xiàn)象:本單位一終端申告該終端無法登錄單位信息網(wǎng)OA辦公系統(tǒng)。
故障分析:第一步檢查網(wǎng)絡(luò)層。首先由網(wǎng)管終端ping該故障終端IP地址,網(wǎng)絡(luò)層不通。其次在故障終端輸入ipconfig/all,顯示本機TCP/IP網(wǎng)絡(luò)配置情況,檢查IP地址、子網(wǎng)掩碼、網(wǎng)關(guān)、DNS服務(wù)器地址均正常。再次在該終端Ping本機地址:127.0.0.1,顯示正常,說明該終端系統(tǒng)網(wǎng)絡(luò)適配器和驅(qū)動程序工作正常。
第二步檢查物理層、數(shù)據(jù)鏈路層。首先檢查故障終端電源及網(wǎng)卡接口,連接正常。其次檢查該終端安全U盾,證書信息正常,在使用期內(nèi),可以保障安全上網(wǎng)。再次檢查與該終端連接的交換機端口,發(fā)現(xiàn)交換機綁定的該終端端口指示燈不亮,檢查交換機配置文件,信息正常,沒有丟失,說明交換機正常,那么只能說明故障為該網(wǎng)絡(luò)線路不通。使用測線儀檢測故障終端和交換機之間網(wǎng)線質(zhì)量,發(fā)現(xiàn)測線儀指示燈有幾個不亮。測試配線架接入端口到交換機的網(wǎng)線狀態(tài),線路正常。測試配線架接入端口到終端的網(wǎng)線狀態(tài),線路故障,大致可以判斷故障原因可能出現(xiàn)在配線架。最后在網(wǎng)絡(luò)配線架機柜排查,發(fā)現(xiàn)機柜有移動的痕跡,檢查配線架背后的打線夾,發(fā)現(xiàn)有幾處網(wǎng)線松脫。
故障處理:在配線架背面用打線刀把故障網(wǎng)線壓接入打線夾并剪切好,重新測試網(wǎng)線斷通情況,網(wǎng)絡(luò)恢復(fù)正常,故障排除。
4?結(jié)語
在故障處理的實例中,彰顯了分層法排除局域網(wǎng)網(wǎng)絡(luò)故障的巨大優(yōu)勢,該方法能夠快速縮小故障查找范圍,準(zhǔn)確定位故障點,思路清晰,大大提高了網(wǎng)絡(luò)故障診斷的效率,希望對其他網(wǎng)絡(luò)運維人員有所幫助和參考作用。
參考文獻:
[1]朱云鵬,陳卓.基于層次分析法的網(wǎng)絡(luò)故障診斷技術(shù)研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2007,(07):3032.
[2]裴祥.網(wǎng)絡(luò)常見故障診斷及排除[J].技術(shù)與市場,2010,(08):2324.
[3]金霈,李德有.如何根據(jù)數(shù)據(jù)在TCPIP模型中的傳遞方式排查網(wǎng)絡(luò)故障[J].職業(yè),2011,(14):136137.
[4]張建中,周若.省級氣象視頻會商網(wǎng)絡(luò)故障分析[J].計算技術(shù)與自動化,2014,(01):104107.
作者簡介:孫海虹(1973—?),女,漢族,碩士,工程師,研究方向:網(wǎng)絡(luò)安全。