肖 鑫
(成方金融信息技術(shù)服務有限公司,北京 100032)
電源分配單元(Power Distribution Unit,PDU)是數(shù)據(jù)中心配電系統(tǒng)的最末端一級設備和最基本供電單元。近年來,隨著數(shù)據(jù)中心基礎設施設備的迭代發(fā)展,PDU也從最初的普通型逐漸升級為智能型,給機柜微環(huán)境監(jiān)測和數(shù)據(jù)中心精細化管理提供了新的技術(shù)支撐。但是PDU選型和使用過程中也存在一些問題,給數(shù)據(jù)中心供電安全帶來了新的挑戰(zhàn),本文對當前數(shù)據(jù)中心PDU使用情況、存在的問題進行了剖析,并對PDU技術(shù)創(chuàng)新內(nèi)容進行了研究。
許多數(shù)據(jù)中心同時運行著普通PDU和智能PDU,但存量中普通PDU在逐漸被智能PDU替換,近幾年新建設的機房則普遍選擇配置智能PDU。雖然智能PDU較普通PDU成本要高,但是智能PDU具備端口級電量監(jiān)控的顯著優(yōu)勢,有助于規(guī)?;渴鹪O備的運行功率監(jiān)視分析及電量精細化管理,銀行、通信、互聯(lián)網(wǎng)等向全社會提供高并發(fā)實時服務的行業(yè)快速接受了智能PDU產(chǎn)品。
定制符合機房特質(zhì)的PDU并規(guī)?;渴鹪谛侣涑傻臄?shù)據(jù)中心屢見不鮮,已經(jīng)成為數(shù)據(jù)中心建設的常態(tài)化需求。客戶往往根據(jù)數(shù)據(jù)中心單機柜功率設計值、機柜型號和外形尺寸、電纜走線方式、擬上架IT設備的電源線插頭數(shù)量與規(guī)格、供電安全性級別等因素提出定制化PDU的具體技術(shù)指標要求。
近年來新建數(shù)據(jù)中心數(shù)量和規(guī)模迅猛擴展,老機房電源更新改造情況也較為普遍,PDU市場需求旺盛,眾多PDU品牌激烈競爭。在產(chǎn)品質(zhì)量方面,市場占有率高的頭部企業(yè)產(chǎn)品質(zhì)量口碑較好,品牌優(yōu)勢明顯,帶動整個行業(yè)的產(chǎn)品質(zhì)量水平持續(xù)不斷提升。
PDU本體開關(guān)的配置一般由采購方的使用習慣和使用場景決定,開關(guān)的選擇本質(zhì)上是一個管理問題:對于業(yè)主自用的機房而言,不選配PDU開關(guān)既可以節(jié)約成本又可以解決誤操作問題;但對于IDC機房而言,同一臺列頭柜后端的機柜可能承租給不同用戶,這種情況下配置PDU本體開關(guān)便于用戶自主控制機柜的電源,減少對列頭柜開關(guān)操作的頻率,避免客戶間的相互影響。
數(shù)據(jù)中心規(guī)?;?、標準化發(fā)展趨勢下,基礎設施設計過程中色彩管理的原則和方法運用具有區(qū)分空間、強化辨識度和提升管理效率的作用,而智能PDU系統(tǒng)的色彩管理往往被忽視。通過兩路智能PDU本體及其相關(guān)網(wǎng)線采用不同的明亮度和顏色,不僅使機房內(nèi)部整體感觀規(guī)范有序,還有助于運維人員快速確認電氣故障信息,在數(shù)據(jù)中心設計和設備選型過程中應優(yōu)先在智能PDU系統(tǒng)應用色彩管理。
同一個機房區(qū)域內(nèi)可能存在多個品牌的普通PDU,但很難同時存在多個品牌的智能PDU,因為智能PDU的聯(lián)網(wǎng)監(jiān)測涉及到通信數(shù)據(jù)包的一致性問題,各品牌都有自己的監(jiān)控管理系統(tǒng),不同品牌的設備很難在一個監(jiān)控系統(tǒng)下完美融合。另外,同一品牌不同型號的智能PDU混用時,也有可能存在軟、硬件版本變化導致的通信故障。未來兼容性問題可能隨著產(chǎn)品的進一步發(fā)展、通信數(shù)據(jù)格式的逐漸統(tǒng)一而減少,但使用方不應忽視這一情況。
對于直接將智能PDU接入動環(huán)監(jiān)控平臺的設計方案,如需管理2個以上品牌的智能PDU,則需在前期確定好數(shù)據(jù)接口開放事宜,避免在施工階段出現(xiàn)無法對接的情況。大型數(shù)據(jù)中心在設計階段必須考慮智能PDU監(jiān)控數(shù)據(jù)規(guī)模的問題,確保動環(huán)監(jiān)控主機性能滿足要求。
常見的PDU附屬功能模塊包括溫濕度、煙霧感應、水浸感應、門禁管理、資產(chǎn)管理等模塊,可根據(jù)機房管理的具體需求進行選配。以溫濕度模塊為例,機柜級的溫濕度探測數(shù)據(jù)對機房整體而言作用有限,因為基本上機房投產(chǎn)前都會對氣流組織進行專業(yè)的CFD模擬分析,機房內(nèi)各處的溫濕度應處在合理水平,但是在出現(xiàn)局部熱點或者個別位置濕度偏高的特殊情況下,利用PDU附屬功能模塊可實現(xiàn)近距離及時探測,所以總體沒有為全部PDU統(tǒng)一配置溫濕度模塊的必要性。其他附屬模塊同樣也應根據(jù)實際使用需求和場地具體情況綜合評估選配種類和數(shù)量。
智能PDU需通過網(wǎng)線實現(xiàn)組網(wǎng)管理,若采用每條PDU單獨引網(wǎng)線直接連接至交換機的方式,不僅對交換機的需求量非常大,對網(wǎng)線的數(shù)量需求和敷設工作量也會成倍增加,所以一般采取“手拉手”級聯(lián)的方式進行組網(wǎng):使用1臺智能PDU作為主機,3臺智能PDU作為從機,通過網(wǎng)線將4臺智能PDU串聯(lián)起來即可將2臺機柜的配電信息最終通過1條網(wǎng)線傳輸至交換機。通過級聯(lián)方式可以串聯(lián)多個機柜,但串聯(lián)的機柜數(shù)量增加會使得監(jiān)控信息更新時間變慢,且一旦串聯(lián)路徑上某個PDU出現(xiàn)故障,會導致后端PDU的信息無法上傳,因此在智能PDU組網(wǎng)過程中應根據(jù)實際情況合理選擇組網(wǎng)方式和級聯(lián)數(shù)量。
由于智能PDU每個插口都增加了電氣參數(shù)采集模塊,而且智能PDU集成的網(wǎng)口、USB口等硬件也占用了一定位置,所以智能PDU的電源插口數(shù)量比同長度的普通PDU要少,導致在當前IT設備普遍配置4路電源的情況下,機柜內(nèi)智能PDU電源插口數(shù)量越來越緊張,甚至不得不配置“一拖二”電源線和插口轉(zhuǎn)換電源線以滿足插口數(shù)量不足的需求。
當IT設備電源故障引發(fā)列頭柜分閘開關(guān)跳閘使整條PDU停電時,若不能及時判定機柜內(nèi)具體電源故障位置,只能先維持單路電源供電,存在一定的運行風險。智能PDU具備故障錄波功能,可以將開關(guān)跳閘前每個電源插口的電壓和電流波形進行記錄,有助于及時精準判定故障點位,大幅縮短故障處置時間。在智能PDU已有信號采集硬件基礎上,故障錄波功能依靠軟件改進即可實現(xiàn)。
相較于普通PDU彼此獨立沒有互聯(lián)互通的網(wǎng)絡關(guān)系,智能PDU通過網(wǎng)線連接進行組網(wǎng)集中管理后就形成了一個局域網(wǎng),可實現(xiàn)配電信息精細化管理,但這也帶來了信息安全的挑戰(zhàn)。大型數(shù)據(jù)中心數(shù)萬條智能PDU組成的局域網(wǎng)應強化防病毒、防攻擊、防控制的信息安全防護能力,通過增加防火墻、配置網(wǎng)絡訪問策略等措施提升信息安全防護水平。
考慮到當前智能PDU通過網(wǎng)線進行組網(wǎng)方式的施工難度和施工成本,可以從供電側(cè)進行技術(shù)革新:首先,保留智能PDU網(wǎng)口,僅作為設備調(diào)試使用;其次,智能PDU連接線在火線、零線和地線基礎上增加1條信號線,監(jiān)控信息通過信號線直接傳輸給列頭柜,列頭柜初步處理后上傳給動環(huán)監(jiān)控系統(tǒng);最后,對配電柜的中央處理器進行升級,確保其可以滿足十幾條智能PDU監(jiān)控數(shù)據(jù)的快速處置。按照這一思路將列頭柜和智能PDU設備進行配套改造,省去交換機和網(wǎng)線配置,避免接入動環(huán)系統(tǒng)的二次開發(fā),可大幅降低施工成本,減輕運維壓力,提升數(shù)據(jù)中心末端供電管理的可靠性和安全性。