糜佳蓉
(江蘇省電力有限公司 宜興市供電分公司,江蘇 宜興 214200)
隨著能源互聯(lián)網(wǎng)的不斷發(fā)展,電網(wǎng)的規(guī)模也隨之擴大,對調(diào)度自動化系統(tǒng)提出了更高的要求。調(diào)度控制業(yè)務(wù)運作狀態(tài)受通信網(wǎng)絡(luò)的影響比較大,嚴重時還會導(dǎo)致電網(wǎng)的安全事件[1]。為了提高主站局的可靠性,人們在調(diào)度自動化系統(tǒng)中采用了從設(shè)備、鏈路、協(xié)議等層面發(fā)展起來的冗余技術(shù)。對于設(shè)備層面,一般將兩臺高性能的交換機連在一起,并且每臺交換機需要配置一個獨立的主板和電源,同時對應(yīng)用主機配置兩個網(wǎng)卡,將交換機的核心與主機連接在一起;對于鏈路層面,可以采取多種方式來進行連接,例如設(shè)備之間可以采用交叉的方式來進行連接或者將鏈路合在一起進行連接;對于協(xié)議層面,利用虛擬路由器冗余協(xié)議(Virtual Router Redundancy Protocol,VRRP)來實現(xiàn)對外路由器的冗余,這樣可以有效解決冗余鏈路中產(chǎn)生的問題。
在對某調(diào)度自動化主站局域網(wǎng)(Local Area Network,LAN)進行分析后,開展了冗余可行性測試,如圖1所示。
圖1 無環(huán)路雙核心局域網(wǎng)典型組網(wǎng)結(jié)構(gòu)
主機PC1與PC2都使用雙網(wǎng)卡的模式來進行綁定,兩者可以在模型中進行自由切換。此外,將主機PC1和兩臺直接接進的交換機進行連接,主機PC2和兩臺核心交換機進行連接,這樣的連接方式可以讓交換機和核心交換機之間的鏈路進行自由切換。此外,核心交換機之間的鏈路聚合可以通過光纖來實現(xiàn)。兩臺交換機分別通過兩臺防火墻進行連接,用這種方式來對其他安全區(qū)網(wǎng)絡(luò)內(nèi)的交換機進行模擬。利用網(wǎng)絡(luò)測試儀向核心交換機發(fā)射地址解析協(xié)議(Address Resolution Protocol,ARP)廣播,測試網(wǎng)絡(luò)性能是否良好[2]。為了保證測試的結(jié)果與實際結(jié)果相符合,在測試前需要對所有的交換機進行升級處理。局域網(wǎng)冗余技術(shù)可靠性測試項如表1所示。
表1 局域網(wǎng)冗余可靠性測試項
對于底層網(wǎng)卡綁定的模式,要從兩個方面分別進行測試,即網(wǎng)卡主備、負載均衡。對于頂層的核心交換機來說,從VRRP、堆疊這兩個方面來分別進行測試。在對數(shù)據(jù)分析后發(fā)現(xiàn),網(wǎng)絡(luò)冗余機制在多數(shù)的網(wǎng)絡(luò)狀態(tài)下都能夠發(fā)揮其相應(yīng)的作用,自動調(diào)整網(wǎng)卡故障、交換機故障等[3]。無環(huán)路雙核心局域網(wǎng)的拓撲配置不僅簡單,而且功能相對獨立,不存在物理的環(huán)狀。在主備模式下,通常都是采用與其他網(wǎng)卡結(jié)合在一起的方式來有效提升網(wǎng)卡冗余。一旦主用網(wǎng)卡發(fā)生損壞,系統(tǒng)會將另一塊網(wǎng)卡自動補上。與此同時,使用過程中也會出現(xiàn)相應(yīng)的問題。
(1)當ARP輪詢的時間較短時,交換機不能及時做出相應(yīng),這樣就會導(dǎo)致網(wǎng)卡切換比較頻繁。如果ARP輪詢時間較長,主機不能及時進行檢查,也會導(dǎo)致網(wǎng)絡(luò)處于長時間的中斷狀態(tài)。對于ARP輪詢時間來說,它應(yīng)該設(shè)置在合理的范圍內(nèi),這樣才能有效解決網(wǎng)絡(luò)中斷的問題。
(2)如果沒有及時發(fā)現(xiàn)備用網(wǎng)卡的故障,網(wǎng)卡中的鏈路出現(xiàn)故障,就算系統(tǒng)能夠自動切換網(wǎng)卡,那也不能解決主要的問題,通信也不能正常使用,網(wǎng)絡(luò)的冗余可靠性與網(wǎng)卡息息相關(guān)。
(3)如果核心交換機之間的鏈路中斷,那么主機與交換機之間的網(wǎng)絡(luò)系統(tǒng)也會中斷。如果接入交換機至核心交換機的鏈路只有一條時,每一臺交換機只能與一臺主機進行連接。如果想要主機同時連接兩臺核心交換機,那么就必須通過兩臺核心交換機之間的互聯(lián)鏈路來相連。采用了交換機接入核心交換機的冗余鏈路,這種方法可以盡量避免核心交換機之間的鏈路受到中斷影響。
(4)當多生成樹協(xié)議(Multiple Spanning Tree Protocol,MSTP)網(wǎng)絡(luò)未開啟時,如果網(wǎng)絡(luò)中存在環(huán)路,那么主機之間的網(wǎng)絡(luò)會存在時而斷開、時而連接或者一直保持斷開的狀態(tài)。引起廣播風(fēng)暴的主要原因之一就是網(wǎng)絡(luò)環(huán)路,這種問題不僅會讓ARP和MAC的地址錯亂,而且還會嚴重影響交換機之間的數(shù)據(jù)轉(zhuǎn)發(fā)[4]。
根據(jù)以上的測試方式對調(diào)度自動化主站局域網(wǎng)系統(tǒng)中的95臺服務(wù)器與工作站進行相應(yīng)的測試后發(fā)現(xiàn),其中4臺主機的冗余網(wǎng)卡處于缺陷狀態(tài),包括備用網(wǎng)卡故障、冗余網(wǎng)卡連線方式錯誤、單網(wǎng)卡上聯(lián)[5]。一般情況下,當GW2服務(wù)器的備用網(wǎng)卡發(fā)生故障時,主網(wǎng)卡的運行不會受到備用網(wǎng)卡的影響,其業(yè)務(wù)還是會正常運行。測試過程中要將主網(wǎng)卡對應(yīng)的鏈路進行中斷處理,ARP輪詢時,如果系統(tǒng)檢測到鏈路處于中斷狀態(tài),此時就需要立即將備用網(wǎng)卡切換上來使用。在網(wǎng)卡故障后,所有的通信都不能正常使用,從而導(dǎo)致GW2服務(wù)器的部分業(yè)務(wù)處于中斷狀態(tài)。在發(fā)現(xiàn)這些問題后,要及時恢復(fù)主網(wǎng)卡的鏈路,待業(yè)務(wù)恢復(fù)至正常狀態(tài)后再對備用網(wǎng)卡故障的原因進行逐一排解。
通過對上述問題進行分析,提出了相應(yīng)的推薦方案。在使用雙核心的交換機進行互聯(lián)時,核心交換機之間要配置相應(yīng)的局域網(wǎng)地址,主機采用ARP輪詢的方式來進行相應(yīng)檢測,將這些作為網(wǎng)卡故障的判定條件。ARP的輪詢時間應(yīng)該設(shè)為20~5 000 ms,默認為100 ms。在一些交換機性能較差的情況下,可以盡量延遲輪詢的時間。兩臺核心交換機之間可以不啟用VRRP,通過防火墻實現(xiàn)局域網(wǎng)的對外通信,同時采用雙機熱備模式,開啟后及時保存配置,避免在一些情況下不能重建防火墻。含層間冗余鏈路的雙核心局域網(wǎng)典型組網(wǎng)結(jié)構(gòu)如圖2所示,含堆疊交換機的雙核心局域網(wǎng)典型組網(wǎng)結(jié)構(gòu)如圖3所示。每臺接入的交換機都連接兩臺核心的交換機,這樣可以保證主機只有一個網(wǎng)卡工作時有冗余鏈路,同時也可以避免核心交換機聯(lián)線全部中斷時出現(xiàn)異常現(xiàn)象。
圖2 含層間冗余鏈路的雙核心局域網(wǎng)典型組網(wǎng)結(jié)構(gòu)
圖3 含堆疊交換機的雙核心局域網(wǎng)典型組網(wǎng)結(jié)構(gòu)
文章提到的一系列解決方法對后續(xù)建立局域網(wǎng)冗余可靠性提供了參考依據(jù),同時這種冗余技術(shù)還可以拓展在線網(wǎng)絡(luò)智能監(jiān)控技術(shù)。另外,還可以快速地查找到故障的原因,在計算機網(wǎng)絡(luò)和調(diào)控系統(tǒng)中的應(yīng)用比較廣泛。