劉晶晶
如今,SDN作為行業(yè)熱詞經(jīng)常進入人們的視野,甚至被命名為當前產(chǎn)業(yè)的大趨勢。SDN的出現(xiàn),促使網(wǎng)絡架構重新被定義,通過控制平面和轉發(fā)平面的解耦,實現(xiàn)了網(wǎng)絡資源的池化,這徹底改變了原來垂直封閉的產(chǎn)業(yè)形態(tài),給了運營商更強的網(wǎng)絡掌控能力。
近日,騰訊系統(tǒng)架構師何權在某公開場合向業(yè)界闡釋了針對SDN控制器的探索和應用,騰訊都做了哪些方面的努力,并取得了怎樣的突破。談到SDN,何權說:“我們在天津、上海、深圳等地建立了數(shù)據(jù)中心,規(guī)模各異。同時,基于分布式的復用計算進行路由,建了一條隧道,在這樣的運作模式下缺乏一種全局的視野和統(tǒng)一的調度能力,它會導致我們在網(wǎng)絡帶寬的利用方面效率降低。”言下之意,SDN是補充全局視野和提升統(tǒng)一調度能力的有效方法。
數(shù)據(jù)中心構建
針對數(shù)據(jù)中心云化的問題,騰訊也在跟一些設備廠商合作,構建數(shù)據(jù)中心的云化,用Overlay的方案實現(xiàn)虛擬化租戶的應用?!拔覀円呀?jīng)接觸了很多用戶,有個人用戶,還有一些大小不同的企業(yè),這些企業(yè)會根據(jù)自身業(yè)務的不同提出各種各樣的需求,但這些需求在現(xiàn)有的系統(tǒng)上是沒法滿足的。
例如,普通用戶可能僅僅需要租用一臺虛擬機,但是大型租戶需要強化的計算性能,這就意味著可能會需要一大批物理機器;在這個網(wǎng)絡中,我們發(fā)現(xiàn)VM跟物理網(wǎng)絡是混在一起的,在部署方面,在現(xiàn)有的系統(tǒng)上進行部署彈性很差;另外租戶之間的安全隔離也是一個很重要的問題,我們在傳統(tǒng)的網(wǎng)絡中利用VXLAN技術運作用戶的可視化會受到很大限制,因為VXLAN的資源本身就很少,所以我們采用Overlay的方式去做?!焙螜嚓U釋說。
大規(guī)模數(shù)據(jù)中心的建設,從IDC模塊建設角度出發(fā),數(shù)量從原來的五千臺到現(xiàn)在的兩萬,甚至是五萬、幾十萬臺規(guī)模,基于原來的方式管理就會存在很大缺陷。例如通常調度的云都是基于網(wǎng)端調用,傳統(tǒng)的路由網(wǎng)絡中我們有一個比較好的業(yè)務LOL,但曾經(jīng)出現(xiàn)過網(wǎng)絡的堵塞情況。利用傳統(tǒng)的手段,很難發(fā)現(xiàn)到底哪個地方出現(xiàn)了堵塞,所以如何快速地解決這樣的問題是目前的關鍵。騰訊考慮的是想利用一些比較新的網(wǎng)絡硬件,通過特性,從Openflow的角度分析,基于流量的方式去監(jiān)控,來實現(xiàn)自動化的故障診斷。
統(tǒng)一控制器平臺
騰訊已經(jīng)在很多方面嘗試應用SDN的解決方案,在解決方案中希望所有的SDN解放都是基于一個統(tǒng)一的控制器平臺。對于現(xiàn)在的SDN控制器來說,它需要承載各種各樣的應用。如果試圖總結SDN控制器方面的特性,可以從以下幾個角度去著手:例如必須具備較高的可靠性、強大的雙備份能力以及很好的擴展性。
對于控制器來說,未來支持的網(wǎng)絡規(guī)??缍瓤赡軙?萬臺到10萬臺,與此同時在控制器上進行應用開發(fā),對于不同時期、不同場景的條件會生發(fā)不同應用。
動態(tài)的負載均衡的能力方面,在大規(guī)模的網(wǎng)絡背景下,控制器需要接入很多設備,這樣就需要控制器能夠從一個動態(tài)的角度將所有的連接負載均衡到設備上。如果從南向協(xié)議的角度思考,SDN可以從很多方面加以利用,在應用場景中,我們可能需要像openflow、VDP等這些接口的應用;除此之外就是高安全性的要求,控制器其實已經(jīng)跟網(wǎng)絡設備的境遇類似,面臨的關鍵問題都是會受到一些攻擊,所以控制器的連接其實也需要安全可靠。
基于SDN基礎特性的討論,何權表示:“我們第一次做了一個自研的控制器,做自研控制器的想法是想把普通的網(wǎng)絡設備的控制平面抽象出來,放在控制器上進行集成計算,而制作這個控制器的目標就是驗證控制器的性能。我們將開源的組建集成,使用openflow去通信。下發(fā)流表時,發(fā)現(xiàn)openflow沒有辦法滿足現(xiàn)實的需求,所以當時就在openflow1.0上進行了相關擴展?!?/p>
盡管騰訊著手制作的控制器不算復雜,但提升了多角度的功能,例如流表的管理、拓撲管理等,這些都是比較基本的網(wǎng)絡服務。但是在控制器的關鍵性能上,騰訊使用的系Apollo開源組建,實現(xiàn)了控制器的集群能力;使用MQ開源組建成功構建了一個集群之間的消息通信總線,并在南向連接實現(xiàn)動態(tài)的負載均衡。
自研性控制器平臺的反思與更新
第一代自研控制器后,騰訊也驗證了控制技術需要的一些開源組建以及對網(wǎng)絡的需求。在SDN發(fā)展方向上,何權認為十分需要廠商、開源組建一起參與。因為有大量的設備存在,如果從現(xiàn)有的網(wǎng)絡走向開源的網(wǎng)絡,就必然需要各個廠商的配合。
他說:“NOX架構基于C++進行開發(fā),我們做了比較,這個框架上的擴展性不夠理想。ODM控制器基于NOX架構開發(fā)可以加載更多的功能,相比之前的NOX實現(xiàn)的開源軟件更豐富一些。NOX關鍵的特性,集群能力、北向接口標準化、分布式存儲、南向負載均衡,對于NOX應用來說非常關鍵,但在NOX上并沒有看到這些能力,我們希望更多的廠商能夠參與進來,把控制器的基礎框架進行完善和優(yōu)化?!?/p>
從現(xiàn)實的角度看,自研的控制器已經(jīng)不太滿足實際需求。相比之下,CBN控制器可以從全局的角度達成端到端的優(yōu)化流量路徑;在獲取網(wǎng)絡信息方面,通過PCE的協(xié)議獲取網(wǎng)絡設備的鏈路信息以及帶寬信息,再通過一個比較普通的方式,用SMP把所有的流量進行采集。通過現(xiàn)在的流量狀況,還有網(wǎng)絡的帶寬去計算端到端之間的最優(yōu)化的路徑。DC控制器,位于控制器定位中比較高的層次,業(yè)界希望在未來的網(wǎng)絡中,有一個控制器能夠接入所有的網(wǎng)絡設備,對現(xiàn)有的網(wǎng)絡進行重新建模。建模之后能夠提供給不同的人看,其中包括基礎的運維人員、網(wǎng)絡操作人員以及有網(wǎng)絡設計人員等,分不同的角度詮釋網(wǎng)絡的架構狀態(tài)。
最后,何權總結說:“SDN控制器還處在發(fā)展時期,需要進行優(yōu)化與完善,我們希望能夠與業(yè)界一起推動其發(fā)展,為產(chǎn)業(yè)大趨勢的升級貢獻力量。”