彭 雋,班利軍,鄒仁明
(中國農(nóng)業(yè)大學(xué),北京 100193)
中國農(nóng)業(yè)大學(xué)校園網(wǎng)升級中堆疊問題的解決
彭 雋,班利軍,鄒仁明
(中國農(nóng)業(yè)大學(xué),北京 100193)
簡述了交換機的堆疊技術(shù)及作用,以及銳捷交換機的特點。通過介紹中國農(nóng)業(yè)大學(xué)網(wǎng)絡(luò)升級過程中遇到的堆疊問題及解決方法,指出在網(wǎng)絡(luò)升級之前應(yīng)對網(wǎng)絡(luò)設(shè)備在模擬環(huán)境中和實際環(huán)境中進(jìn)行測試。
校園網(wǎng);堆疊問題;網(wǎng)絡(luò)升級
堆疊技術(shù)是目前以太網(wǎng)接入交換機使用較多的技術(shù)。利用交換機的堆疊方式實現(xiàn)網(wǎng)絡(luò)端口和容量的擴展,可以滿足大量數(shù)據(jù)交換的需要。通過對不同品牌交換機的性能、管理和價格等方面進(jìn)行比較,中國農(nóng)業(yè)大學(xué)在本次網(wǎng)絡(luò)升級選擇了銳捷RG-S2600 E交換機。
堆疊是指使用專門的連接線,通過專用的端口將若干交換機堆疊在一起,并設(shè)置一個主設(shè)備或邏輯主設(shè)備(即交換機優(yōu)先級),設(shè)備信息寫在主設(shè)備上。從而能夠?qū)⒍询B中的幾個交換機視為—個交換機來使用和管理。交換機的堆疊模式主要有兩種:菊花鏈堆疊模式和星型堆疊模式。
堆疊中的交換機必須是同一品牌,否則無法進(jìn)行堆疊互聯(lián)。不同廠商的交換機支持堆疊的層數(shù)有所不同,一般情況下,最多可堆疊至8層。提供堆疊模塊或接口的交換機,可以通過專用的堆疊電纜進(jìn)行連接。交換機的堆疊模式主要有兩種:菊花鏈堆疊模式和星型堆疊模式。菊花鏈堆疊模式利用專用的堆疊電纜,將多臺交換機以環(huán)路方式串接起來,組建成一個交換機堆疊組,如圖1所示。
星形堆疊模式要求主交換機有足夠的背板帶寬,并且有多個堆疊模塊,然后使用高速堆疊電纜將交換機的內(nèi)部總線連接成為一條高速鏈路,如圖2所示。
購買交換機設(shè)備前需先考慮實施方案,并不是所有交換機都支持堆疊,堆疊不僅需要專門的堆疊電纜,而且需要專門的堆疊模塊。有些交換機本身帶有堆疊模塊和堆疊接口,而有些交換機雖然支持堆疊,但是還必須單獨購買堆疊模塊。
RG-S2600 E交換機是銳捷網(wǎng)絡(luò)為構(gòu)架安全穩(wěn)定的網(wǎng)絡(luò)推出的基于新一代硬件架構(gòu)的安全智能交換機。RG-S2600 E交換機通過堆疊不僅能統(tǒng)一管理和使用設(shè)備,降低管理成本,同時可靈活地組合和擴展端口,平滑擴容,保障了網(wǎng)絡(luò)的高度靈活和可擴展,網(wǎng)絡(luò)管理更加簡單。
RG-S2600 E交換機可將堆疊模塊插入后面板的擴展槽,通過堆疊線纜連接,將交換機以菊花鏈的模式進(jìn)行堆疊。菊花鏈最大的好處就是可以利用有限的信號傳輸線連接多臺設(shè)備,共享同一服務(wù),而且不存在總線競爭和阻塞等問題,因為在某設(shè)備把信號傳遞給下一個設(shè)備之前,可以修改這個信號;如果它也需要服務(wù)時,就截住這個信號。
中國農(nóng)業(yè)大學(xué)校園網(wǎng)本次升級使用的設(shè)備為RGS2652G-E交換機,交換機采用的堆疊模式是菊花鏈模式,交換機的版本號是10.4(2b2)release(88430)。升級樓宇主要是西校區(qū)家屬區(qū)和學(xué)生宿舍13號樓。學(xué)生宿舍13號樓接入層交換機在升級之前采用的是2~3個交換機堆疊,在不改變原來構(gòu)架的基礎(chǔ)上本次升級也采用了堆疊方式。
學(xué)生宿舍13號樓的部分交換機升級完成的當(dāng)天晚上,網(wǎng)絡(luò)管理員從13號樓的報修記錄發(fā)現(xiàn),不能上網(wǎng)的用戶,都是新更換的交換機堆疊從機用戶。管理員重啟交換機后,交換機恢復(fù)正常,用戶上網(wǎng)正常。但第二天又有交換機出現(xiàn)類似的現(xiàn)象。根據(jù)以上現(xiàn)象管理員初步判斷問題與新更換的交換機有關(guān),于是立即停止升級,查找故障發(fā)生的根本原因。
管理員登錄到交換機查看交換機配置信息正常,查看mac地址表發(fā)現(xiàn),只有主機下連用戶的mac地址,沒有從機下連用戶的mac地址。相關(guān)報文如下:
以上三條debug信息,表明Arp模塊查詢dhcp snooping綁定表項失敗,原因是沒有對應(yīng)的表項。通過調(diào)試命令輸出的結(jié)果我們可以推斷出從交換機下連的用戶由于沒有獲取到IP地址,所以在交換機上沒有建立dhcp snooping表項,導(dǎo)致arp查詢失敗。管理員將設(shè)備進(jìn)行重啟,重啟后設(shè)備運行正常,從機下聯(lián)用戶能正常獲取到IP地址,上網(wǎng)正常。但是一段時間后從機下聯(lián)用戶又出現(xiàn)相同問題。
管理員通過對多次故障現(xiàn)象的分析與總結(jié),得出如下結(jié)論:(1)單臺交換機連接用戶時,故障不會出現(xiàn),只有交換機堆疊后故障才會出現(xiàn)。老家屬區(qū)在升級時,交換機沒有采用堆疊技術(shù),升級完成后,沒有發(fā)生用戶不能上網(wǎng)的情況。學(xué)生宿舍13號樓的交換機實施了堆疊,在升級當(dāng)天就發(fā)生了不能上網(wǎng)的問題。(2)堆疊交換機在同時加電或同時重啟的時候,堆疊組中的交換機數(shù)量越多,出現(xiàn)故障的速度就越快。在學(xué)生宿舍13號樓的堆疊交換機中,三臺堆疊組的交換機最早出現(xiàn)故障,之后兩臺堆疊組的交換機陸續(xù)出現(xiàn)故障。(3)在交換機堆疊組中,在線用戶最多的從交換機最早出現(xiàn)故障。由于這一特點,在實驗環(huán)境中如果沒有大量的在線用戶,是很難重現(xiàn)故障現(xiàn)象的。
通過逐步的問題定位和深入分析,確定了故障發(fā)生的原因。交換機運行一段時間后從交換機與主交換機之間通訊隊列被占滿,導(dǎo)致從交換機與主交換機之間不能正常通信,從交換機的信息不能傳送到主交換機上。由于使用的是菊花鏈的堆疊方式,從交換機收到客戶端的信息后進(jìn)行處理,處理完成后要發(fā)送給主交換機并由主交換機進(jìn)行處理,如果傳輸通道堵塞,主交換機就不能收到從交換機發(fā)送的的數(shù)據(jù)包,導(dǎo)致客戶端發(fā)送的所有數(shù)據(jù)不能傳送到主交換機并被主交換機及時處理,最終結(jié)果是用戶主機不能上網(wǎng)。根據(jù)出現(xiàn)的問題,廠商及時響應(yīng)定位引起這種現(xiàn)象的原因是由于交換的軟件導(dǎo)致的,與硬件沒有關(guān)系,并開發(fā)了一個解決農(nóng)大堆疊交換機主從通訊問題的專有版本,版本號是10.4(2T77)release(105753)。對學(xué)生宿舍13號樓的交換機升級為此版本后未出現(xiàn)類似問題。
通過這次故障處理,發(fā)現(xiàn)了銳捷RG-S2600 E交換機的堆疊問題,在交換機管理中應(yīng)防止類似的問題發(fā)生。今后的網(wǎng)絡(luò)升級中,由于交換機配置不同有可能會出現(xiàn)不同的問題,在網(wǎng)絡(luò)升級之前要對交換機進(jìn)行模擬測試或在實際的環(huán)境中進(jìn)行測試,如有問題及時發(fā)現(xiàn)及時解決,如沒有問題可進(jìn)行其他設(shè)備的升級。這樣雖然會使升級所用的時間較長,但一旦發(fā)生問題對用戶的影響范圍較小。
TP393.18
B
1673-8454(2012)05-0027-02
(編輯:楊馥紅)