李龍勝
摘 要:網(wǎng)絡(luò)故障極為普遍,網(wǎng)絡(luò)故障的種類也多種多樣,要在網(wǎng)絡(luò)出現(xiàn)故障時及時對出現(xiàn)故障的網(wǎng)絡(luò)進(jìn)行維護(hù),以最快的速度恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行,掌握一套行之有效的網(wǎng)絡(luò)維護(hù)理論、方法和技術(shù)是關(guān)鍵。本文就網(wǎng)絡(luò)中常見故障進(jìn)行分類,并對各種常見網(wǎng)絡(luò)故障提出相應(yīng)的解決方法
關(guān)鍵詞:網(wǎng)絡(luò)故障;網(wǎng)絡(luò)維護(hù);故障處理
隨著計(jì)算機(jī)的廣泛應(yīng)用和網(wǎng)絡(luò)的日趨流行,功能獨(dú)立的多個計(jì)算機(jī)系統(tǒng)互聯(lián)起來,互聯(lián)形成日漸龐大的網(wǎng)絡(luò)系統(tǒng)。計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定運(yùn)轉(zhuǎn)已與功能完善的網(wǎng)絡(luò)軟件密不可分。計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng),就是利用通訊設(shè)備和線路將地理位置不同的、信息交換方式及網(wǎng)絡(luò)操作系統(tǒng)等共享,包括硬件資源和軟件資源的共享:因此,如何有效地做好本單位計(jì)算機(jī)網(wǎng)絡(luò)的日常維護(hù)工作,確保其安全穩(wěn)定地運(yùn)行,這是網(wǎng)絡(luò)運(yùn)行維護(hù)人員的一項(xiàng)非常重要的工作。
1 常見網(wǎng)絡(luò)故障的分類
根據(jù)網(wǎng)絡(luò)故障的性質(zhì)把網(wǎng)絡(luò)故障分為物理故障與邏輯故障,也可以根據(jù)網(wǎng)絡(luò)故障的對象把網(wǎng)絡(luò)故障分為主機(jī)故障、線路故障和路由故障。首先介紹按照網(wǎng)絡(luò)故障不同性質(zhì)而劃分的物理故障與邏輯故障。
1.1 按網(wǎng)絡(luò)故障的性質(zhì)分類
⑴物理故障。物理故障指的是設(shè)備或線路損壞、插頭松動、線路受到嚴(yán)重電磁干擾等情況。
⑵邏輯故障。邏輯故障中最常見的情況就是配置錯誤,就是指因?yàn)榫W(wǎng)絡(luò)設(shè)備的配置原因而導(dǎo)致的網(wǎng)絡(luò)異常或故障。配置錯誤可能是路由器端口參數(shù)設(shè)定有誤,或路由器路由配置錯誤以至于路由循環(huán)或找不到遠(yuǎn)端地址,或者是路由掩碼設(shè)置錯誤等。比如,同樣是網(wǎng)絡(luò)中的線路故障,該線路沒有流量,但又可以ping通線路的兩端端口,這時就很有可能是路由配置錯誤了。
1.2 按網(wǎng)絡(luò)故障的對象分類
⑴主機(jī)端故障。主機(jī)端故障常見的現(xiàn)象就是主機(jī)的配置不當(dāng)。像主機(jī)配置的IP地址與其它主機(jī)沖突,或IP地址根本就不在子網(wǎng)范圍內(nèi),由此導(dǎo)致主機(jī)無法連通。另外在局域網(wǎng)里用軟件撥號認(rèn)證上網(wǎng)的,客戶端軟件的安裝問題導(dǎo)致無法上網(wǎng)的也屬于主機(jī)端故障。
⑵線路故障。線路故障最常見的情況就是線路不通。診斷這種情況首先檢查該線路上流量是否還存在。然后用ping檢查線路遠(yuǎn)端的路由器端口能有響應(yīng),用traceroute檢查路由器配置是否正確,找出問題逐個解決。
⑶路由故障。路由故障通常指在交換機(jī)、路由器等設(shè)備上發(fā)生的網(wǎng)絡(luò)故障。最常見的故障有配置有誤和設(shè)備硬件本身的故障。
2 常見網(wǎng)絡(luò)故障的分析模型和方法
2.1 七層的網(wǎng)絡(luò)結(jié)構(gòu)分析模型方法
從網(wǎng)絡(luò)的七層結(jié)構(gòu)的定義和功能上逐一進(jìn)行分析和排查,這是最基礎(chǔ)的分析和測試方法。這里有自下而上和自上而下兩種思路。自下而上是:從物理層的鏈路開始檢測直到應(yīng)用。自上而下是:從應(yīng)用協(xié)議中捕捉數(shù)據(jù)包,分析數(shù)據(jù)包統(tǒng)計(jì)和流量統(tǒng)計(jì)信息,以獲得有價值的資料。
2.2 網(wǎng)絡(luò)連接結(jié)構(gòu)的分析方法
從網(wǎng)絡(luò)的連接構(gòu)成來看,大致可以分成客戶端、網(wǎng)絡(luò)鏈路、服務(wù)器端三個模塊。⑴客戶端具備網(wǎng)絡(luò)的七層結(jié)構(gòu),也會出現(xiàn)從硬件到軟件、從驅(qū)動到應(yīng)用程序、從設(shè)置錯誤到病毒等的故障問題。⑵來自網(wǎng)絡(luò)鏈路的問題通常需要網(wǎng)管、現(xiàn)場測試儀,甚至需要用協(xié)議分析儀來幫助確定問題的性質(zhì)和原因。對于這方面的問題分析需要有堅(jiān)實(shí)的網(wǎng)絡(luò)知識和實(shí)踐經(jīng)驗(yàn),有時實(shí)踐經(jīng)驗(yàn)會決定排除故障的時間。⑶在分析服務(wù)器端的情況時更需要有網(wǎng)絡(luò)應(yīng)用方面的豐富知識,要了解服務(wù)器的硬件性能及配置情況、系統(tǒng)性能及配置情況、網(wǎng)絡(luò)應(yīng)用及對服務(wù)器的影響情況。
2.3 工具型分析方法
工具型分析方法有強(qiáng)大的各種測試工具和軟件,它們的自動分析能快速地給出網(wǎng)絡(luò)的各種參數(shù)甚至是故障的分析結(jié)果,這對解決常見網(wǎng)絡(luò)故障非常有效。(四)綜合及經(jīng)驗(yàn)型分析方法靠時間、錯誤和成功經(jīng)驗(yàn)的積累。
在大多數(shù)的阿絡(luò)維護(hù)工作人員的工作中是采用這個方法的,再依靠網(wǎng)管和測試工具迅速定位網(wǎng)絡(luò)的故障。
3 故障定位及排除的常用方法
3.1 告警性能分析法
通過網(wǎng)管獲取告警和性能信息進(jìn)行故障定位。我們單位使用了SolarWinds網(wǎng)絡(luò)管理軟件,可以對全單位的網(wǎng)絡(luò)設(shè)備進(jìn)行管理和監(jiān)控,平時多觀察各設(shè)備CPU負(fù)載率和各線路的流量。通過監(jiān)控軟件的告警分析和定位故障。
3.2 查看網(wǎng)絡(luò)設(shè)備日志法
經(jīng)??匆幌戮W(wǎng)絡(luò)設(shè)備的日志,分析設(shè)備狀況。這是常用的方法之一,show logging命令則是最常用的交換機(jī)命令,如果是設(shè)備本身的故障問題,查看交換機(jī)日志分析法是種非常高效快捷地定位問題的方法。
3.3 替換法
替換法就是使用一個工作正常的物體去替換一個工作不正常的物體,從而達(dá)到定位故障、排除故障的目的。這里的物件可以是一段線纜、一個設(shè)備和一塊模塊。
3.4 配置數(shù)據(jù)分析法
查詢、分析當(dāng)前設(shè)備的配置數(shù)據(jù),通過分析以上的配置數(shù)據(jù)是否正常來定位故障。若配置的數(shù)據(jù)有錯誤,需重新配置。
4 局域網(wǎng)常見故障的排除
雖然網(wǎng)絡(luò)故障原因多種多樣,但總的來講不外乎就是硬件問題和軟件問題。說得再確切一些,這些問題就是網(wǎng)絡(luò)連接性故障、網(wǎng)絡(luò)協(xié)議故障和網(wǎng)絡(luò)配置故障。
4.1 網(wǎng)絡(luò)連接性故障
4.1.1 故障原因分析
以下原因可能導(dǎo)致連通性故障:⑴網(wǎng)卡未安裝,或未安裝正確,或與其他設(shè)備有沖突;(軟件故障)。⑵網(wǎng)卡硬件故障;(硬件故障)。⑶網(wǎng)絡(luò)協(xié)議未安裝,或設(shè)置不正確;(軟件故障)。⑷網(wǎng)線、跳線或信息插座故障;(硬件故障)。⑸交換機(jī)電源未打開,交換機(jī)硬件故障,或端口硬件故障;(硬件故障)。
4.1.2 故障排除方法
⑴確認(rèn)連通性故障。當(dāng)出現(xiàn)一種網(wǎng)絡(luò)應(yīng)用故障時,如無法接入Internet,首先嘗試使用其他網(wǎng)絡(luò)應(yīng)用,如查找網(wǎng)絡(luò)中的其他電腦,或使用局域網(wǎng)中的Web瀏覽等。如果其他網(wǎng)絡(luò)應(yīng)用可正常使用,如雖然無法接入Internet,卻能夠在“網(wǎng)上鄰居”中找到其他電腦,或可ping到其他電腦.即可排除連通性故障原因。如果其他網(wǎng)絡(luò)應(yīng)用均無法實(shí)現(xiàn),繼續(xù)下面操作。endprint
⑵看LED燈判斷網(wǎng)卡的故障。首先查看網(wǎng)卡的指示燈是否正常。正常情況下,在不傳送數(shù)據(jù)時,網(wǎng)卡的指示燈閃爍較慢,傳送數(shù)據(jù)時,閃爍較快。無論是不亮,還是長亮不滅,都表明有故障存在。如果網(wǎng)卡的指示燈不正常,需關(guān)掉電腦更換網(wǎng)卡。對于交換機(jī)的指示燈,凡是插有網(wǎng)線的端口.指示燈都亮。所以交換機(jī)指示燈的作用只能指示該端口是否連接有終端設(shè)備,不能顯示通信狀態(tài)。
⑶用ping命令排除網(wǎng)卡故障。使用ping命令,Ping本機(jī)回送地址127.0.0.1檢查網(wǎng)卡和IP網(wǎng)絡(luò)協(xié)議是否安裝完好。如果能ping通,說明該電腦的網(wǎng)卡和網(wǎng)絡(luò)協(xié)議設(shè)置都沒有問題。問題出在電腦與網(wǎng)絡(luò)的連接上,因此,應(yīng)當(dāng)檢查網(wǎng)線和交換機(jī)的接口狀態(tài);如果無法ping通,只能說明TCP協(xié)議有問題,這時應(yīng)該查看網(wǎng)卡驅(qū)動是否已經(jīng)安裝或是否出錯。
⑷如果確定網(wǎng)卡和協(xié)議都正確,還是網(wǎng)絡(luò)不通,可初步斷定是交換機(jī)端口和雙絞線的問題。為了進(jìn)一步進(jìn)行確認(rèn),可再換一臺電腦用同樣的方法進(jìn)行判斷。如果其他電腦與本機(jī)連接正常,則故障一定是先前的那臺電腦和端口的接口上。
⑸如果確定交換機(jī)有故障,應(yīng)首先檢查它的指示燈是否正常.如果先前那臺電腦與連接的接口燈不亮說明該接口有故障(端口的指示燈表明插有網(wǎng)線的端口,指示燈亮,指示燈不能顯示通信狀態(tài))。
⑹如果交換機(jī)沒有問題,則檢查電腦到交換機(jī)的那一段雙絞線和所安裝的網(wǎng)卡是否有故障。判斷雙絞線是否有問題可以通過“雙絞線測試儀”或福祿克等專業(yè)工具測試。通過上面的故障壓縮,我們就可以判斷故障出在網(wǎng)卡、雙絞線或交換機(jī)上。其中福祿克是專用的測試工具,可以準(zhǔn)確判斷故障點(diǎn)的具體位置。
4.2 網(wǎng)絡(luò)協(xié)議故障
沒有網(wǎng)絡(luò)協(xié)議,網(wǎng)絡(luò)設(shè)備和電腦之間就無法通信,是不能實(shí)現(xiàn)資源共享。
4.2.1 故障原因分析
⑴協(xié)議未安裝:實(shí)現(xiàn)局域網(wǎng)通信,需安裝NetBEUI協(xié)議。
⑵協(xié)議配置不正確:TCP協(xié)議涉及到的基本參數(shù)有四個,包括IP地址、子網(wǎng)掩碼、DNS、網(wǎng)關(guān)。任何一個設(shè)置錯誤,都會導(dǎo)致故障發(fā)生。
4.2.2 故障排除步驟
當(dāng)電腦出現(xiàn)以上協(xié)議故障現(xiàn)象時,應(yīng)當(dāng)按照以下步驟進(jìn)行故障的定位:⑴檢查電腦是否安裝TCP/IP和NetBEUI協(xié)議,如果沒有,建議安裝這兩個協(xié)議,并把TCWIP參數(shù)配置好,然后重新啟動電腦。⑵使用ping命令,測試與其他電腦的連接情況。⑶在“控制面板”的“網(wǎng)絡(luò)”屬性中,單擊“文件及打印共享”按鈕.在彈出的“文件及打印共享”對話框中檢查一下,看看是否進(jìn)中了“允許其他用戶訪問我的文件”和“允許其他電腦使用我的打印機(jī)”復(fù)選框,或者其中的一個。如果沒有,全部選中或選中一個。否則將無法使用共享文件夾。⑷系統(tǒng)重新啟動后。雙擊“網(wǎng)上鄰居”,將顯示網(wǎng)絡(luò)中的其他電腦和共享資源。如果仍看不到其他電腦,可以使用“查找”命令,能找到其他電腦。⑸在“網(wǎng)絡(luò)”屬性的“標(biāo)識”中重新為該電腦命名,使其在網(wǎng)絡(luò)中具有惟一性。
4.3 網(wǎng)絡(luò)配置故障
配置錯誤也是導(dǎo)致故障發(fā)生的重要原因之一。服務(wù)器、工作站、交換機(jī)、路由器都有自己配置選項(xiàng),如果網(wǎng)絡(luò)管理員對服務(wù)器、交換機(jī)、路由器等的不當(dāng)設(shè)置自然會導(dǎo)致網(wǎng)絡(luò)故障,例如端口的shutdown,劃分到不在范圍內(nèi)的vlan或者是沒有加入端口認(rèn)證等都屬于網(wǎng)絡(luò)配置故障之一,這個時候則需要進(jìn)入交換機(jī)配置show run分析設(shè)備的詳細(xì)配置情況。
4.3.1 故障表現(xiàn)及分析
配置故障更多的時候是表現(xiàn)在不能實(shí)現(xiàn)網(wǎng)絡(luò)所提供的各種服務(wù)上.如不能訪問某一臺電腦等。因此,在修改配置前,必須做好原有配置的記錄,最好進(jìn)行備份。
配置故障通常表現(xiàn)為以下幾種:⑴電腦只能與某些電腦而不是全部電腦進(jìn)行通信。⑵電腦無法訪問任何其他設(shè)備。
4.3.2 配置故障排錯步驟
首先檢查發(fā)生故障電腦的相關(guān)配置。如果發(fā)現(xiàn)錯誤,修改后,再測試相應(yīng)的網(wǎng)絡(luò)服務(wù)能否實(shí)現(xiàn)。如果沒有發(fā)現(xiàn)錯誤,或相應(yīng)的網(wǎng)絡(luò)服務(wù)不能實(shí)現(xiàn)。執(zhí)行下述步驟。
測試系統(tǒng)內(nèi)的其他電腦是否有類似的故障,如果有同樣的故障,說明問題出在網(wǎng)絡(luò)設(shè)備上,如交換機(jī)。反之,檢查被訪問電腦對該訪問電腦所提供的服務(wù)作認(rèn)真的檢查。
5 結(jié)束語
為了在網(wǎng)絡(luò)出現(xiàn)故障時及時對網(wǎng)絡(luò)進(jìn)行維護(hù),以最快的速度恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行,在網(wǎng)絡(luò)維護(hù)中還需要注意以下幾個方面:⑴建立完整的組網(wǎng)文檔,以供維護(hù)時查詢。如系統(tǒng)需求分析報告、網(wǎng)絡(luò)設(shè)計(jì)總體思路和方案、網(wǎng)路拓?fù)浣Y(jié)構(gòu)的規(guī)劃、網(wǎng)絡(luò)設(shè)備和網(wǎng)線的選擇、網(wǎng)絡(luò)的布線、網(wǎng)絡(luò)的IP分配、vlan的劃分,網(wǎng)絡(luò)設(shè)備分布等等。⑵做好網(wǎng)絡(luò)維護(hù)日志的良好習(xí)慣,尤其是有一些發(fā)生概率低但危害大的故障和一些概率高的故障,對每臺機(jī)器都要作完備的維護(hù)文檔,以有利于以后故障的排查。這也是一種經(jīng)驗(yàn)的積累。⑶提高網(wǎng)絡(luò)安全防范意識,提高口令的可靠性,并為主機(jī)加裝最新的操作系統(tǒng)的補(bǔ)丁程序和防火墻、防黑客程序等來防止可能出現(xiàn)的漏洞。
[參考文獻(xiàn)]
[1]憎文獻(xiàn).網(wǎng)絡(luò)典型故障分析與排除[M].北京:人民郵電出版社,2003.
[2]曾明.網(wǎng)絡(luò)工程與網(wǎng)絡(luò)管理[M].北京:電子工業(yè)出版社,2003.
[3]張春明.電腦常見軟硬件故障診斷與排除典型實(shí)例[M].北京:中國電力出版社,2005.endprint