◆朱小朋 詹炳光 胡科飛 樊學舟 邵宇航
(西安衛(wèi)星測控中心 陜西 710043)
當前網(wǎng)絡(luò)信息化已經(jīng)成為時代主流,伴隨著網(wǎng)絡(luò)技術(shù)和建設(shè)的迅猛發(fā)展,使得網(wǎng)絡(luò)運維變得日益復雜,網(wǎng)絡(luò)發(fā)生故障的概率不容小覷,如果網(wǎng)絡(luò)發(fā)生故障,可能會造成用戶數(shù)據(jù)丟失、經(jīng)濟受損等不良影響,建立一個可行、快速網(wǎng)絡(luò)維護機制十分必要。
網(wǎng)絡(luò)故障是因為某種原因使得原有網(wǎng)絡(luò)功能喪失的現(xiàn)象,主要分為硬件、軟件故障和人為因素三個部分。硬件故障主要是涉及網(wǎng)絡(luò)服務(wù)器、網(wǎng)絡(luò)傳輸設(shè)備、網(wǎng)絡(luò)存儲設(shè)備以及電源設(shè)備等其他設(shè)備,可能存在板卡、芯片、接口損壞或接觸不良等工作故障。軟件故障主要表現(xiàn)為軟件安裝程序、設(shè)備參數(shù)設(shè)置不當、安裝環(huán)境不兼容、網(wǎng)絡(luò)協(xié)議沖突、系統(tǒng)軟件自身BUG 以及計算機病毒威脅、黑客非法攻擊等因素影響。人為因素主要表現(xiàn)在部分網(wǎng)絡(luò)維護者或使用者在網(wǎng)絡(luò)建設(shè)中不規(guī)范、管理使用中不嚴格、不按程序使用,出現(xiàn)操作失誤導致網(wǎng)絡(luò)故障或信息泄露隱患。同時一些網(wǎng)絡(luò)人員由于技術(shù)能力薄弱,安全意識不強、網(wǎng)絡(luò)安全危機預防應(yīng)對能力差,濫用來歷不明軟件等使得網(wǎng)絡(luò)中斷、病毒入侵等現(xiàn)象發(fā)生。
當前,還有很多在處理網(wǎng)絡(luò)故障存在經(jīng)驗主義,雖然能夠解決問題,但是還存在較大的風險,如果處置不當,會造成更大的網(wǎng)絡(luò)故障,影響域會不斷擴大,因此要采取科學化、層次化網(wǎng)絡(luò)排障思想,嚴格按照步驟進行。網(wǎng)絡(luò)排障思路要堅持結(jié)構(gòu)化網(wǎng)絡(luò)排障的思想,即報告故障、確認故障、收集信息、判斷分析、排障評估、制定方案、嚴格執(zhí)行、風險管控的思路開展網(wǎng)絡(luò)排障工作。每一個環(huán)節(jié)要環(huán)環(huán)相扣,判斷準確,要綜合利用各種手段進行分析,找準要害,切勿盲目亂試。硬件故障首先要查看電源供應(yīng)情況,電壓頻率不穩(wěn)定會影響網(wǎng)絡(luò)設(shè)備穩(wěn)定性;要通過查看主機桌面網(wǎng)絡(luò)圖標,通過網(wǎng)線測試儀等設(shè)備測試物理線路、墻壁插座連是否連通;要檢查各設(shè)備端口運行情況,接口損壞或接觸不良等工作故障;要采取替換等方法檢查是否存在板卡、芯片等工作故障;軟件故障要嚴格規(guī)范操作流程,要系統(tǒng)羅列軟件條目、軟件架構(gòu)、軟件功能、軟件沖突域等軟件故障、安裝環(huán)境等軟件運行基本面,要檢查各類參數(shù)配置是否正確;要查找是否程序有BUG,是否遭受病毒攻擊等行為。人為因素主要通過檢查賬戶信息、用戶接入方案、網(wǎng)絡(luò)安全開放策略、網(wǎng)絡(luò)管理權(quán)限等是否正常要嚴格按照既定的策略一一進行分析。上述三種故障排除可采取自底向上,自上而下、分段法、分款法、替換法、對比配置法等查找分析故障點。
計算機網(wǎng)絡(luò)維護是一項系統(tǒng)性的工作,必須整合融入,要軟硬一體,兩手都要抓,兩手都要硬,要從制度、技術(shù)、人員、管理等多種方面,構(gòu)建維護體系;要合理劃分區(qū)域,科學制定各區(qū)域維護策略,主要做到以下三個方面。
日常維護是一種預防性的工作,它是指面對網(wǎng)絡(luò)進行的定期檢查與優(yōu)化。在網(wǎng)絡(luò)的正常運行過程中,及時發(fā)現(xiàn)并消除網(wǎng)絡(luò)所存在的缺陷或隱患、維持網(wǎng)絡(luò)的健康水平,從而使網(wǎng)絡(luò)能夠長期安全、穩(wěn)定、可靠地運行。通過日常維護可以得出網(wǎng)絡(luò)基線,從而為故障排除工作打下良好的基礎(chǔ)。日常維護分為設(shè)備環(huán)境維護和設(shè)備軟件維護兩大部分。硬件運行環(huán)境是指設(shè)備運行的機房、供電、散熱等外部環(huán)境,這是設(shè)備運行的基礎(chǔ)條件,提前做好應(yīng)對預案,維護網(wǎng)絡(luò)安全;軟件維護要對計算機自帶的軟件,定期清理系統(tǒng)垃圾、安裝殺毒軟件,及時更新病毒庫,做好漏洞修復工作,要定期通過專用工具進行定期測量。要對設(shè)備軟件運行情況,通過各種命令手段進行查看,要安裝入侵檢測系統(tǒng),定期進行抓包分析、做好應(yīng)急預案,制定一系列網(wǎng)絡(luò)安全防范策略,杜絕網(wǎng)絡(luò)入侵。要對外來軟件盡可能地進行安全評估,定期進行維護升級、避免軟件漏洞、軟件兼容性等問題,形成穩(wěn)定可靠的網(wǎng)絡(luò)運維環(huán)境。
要根據(jù)實際情況,做好頂層設(shè)計工作,要把實現(xiàn)硬件和軟件的高度匹配,努力形成一套完整的網(wǎng)絡(luò)生態(tài)系統(tǒng);要嚴格制定各項管理制度,提高依法管理、科學管理水平,提高人員的網(wǎng)絡(luò)維護管理意識;要建立計算機網(wǎng)絡(luò)維護管理作業(yè)指導書,切實按綱操作;要盡力科學的獎懲制度,提高網(wǎng)絡(luò)管理人員的積極性、主動性。
要根據(jù)單位建設(shè)合理選配人員,必要時引進一批高水平、高素質(zhì)的管理維護人員,提高網(wǎng)絡(luò)管理層次;要搭建訓練平臺,采取骨干幫訓、結(jié)對子,走出去請進來的方法,提升人員的業(yè)務(wù)水平和素質(zhì),使其能夠認真履職,熟練掌握維護技能;要加強文化熏陶,端正從業(yè)態(tài)度,培養(yǎng)人員愛崗敬業(yè)精神。
計算機網(wǎng)絡(luò)故障主要分為硬件故障、軟件故障、人為因素,故障成因眾多,要采取結(jié)構(gòu)化網(wǎng)絡(luò)排障思想需要找尋到具體原因,針對性地進行故障處理,從而全方位、多角度地保障計算機網(wǎng)絡(luò)安全、有序的運行。