摘? 要:大型數(shù)據(jù)中心投產(chǎn)后,運維人員需要有一個模擬環(huán)境來解決一系列冷源群控系統(tǒng)的問題,如研究節(jié)能控制策略為降低PUE貢獻價值;調測優(yōu)化后的自控程序以提高新程序執(zhí)行的可靠性;升級更友好的運維人機界面以提升運維效率;提供自控系統(tǒng)操作和學習的途徑以提升一線運維人員的操作能力等。將以國內某數(shù)據(jù)中心冷源群控仿真系統(tǒng)為例來闡述此類系統(tǒng)的功能、構成、特點及應用實踐,以期為運維管理者提供對應的解決方案。
關鍵詞:運維;數(shù)據(jù)中心;冷源集群控制;仿真系統(tǒng)
中圖分類號:TP391.9? ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)22-0020-04
Abstract: After the large data center is put into operation, the operation and maintenance personnel need a simulation environment to solve a series of problems of cold source cluster control system, such as studying the energy-saving control strategy to contribute value to reducing PUE; adjust and measure the optimized automatic control program to improve the reliability of the implementation of the new program; upgrade more friendly operation and maintenance man-machine interface to improve operation and maintenance efficiency; provide automatic control system operation and learning ways to improve the operation ability of front-line operation and maintenance personnel, etc. Taking the cold source cluster control simulation system of a domestic data center as an example, this paper expounds the function, composition, characteristics and application practice of this kind of system, in order to provide corresponding solutions for operation and maintenance managers.
Keywords: operation and maintenance; data center; cold source cluster control; simulation system
0? 引? 言
大型數(shù)據(jù)中心的制冷需求龐大,冷源系統(tǒng)會按照N+X或2N的架構進行設計,單棟樓冷凍站內設置多臺冷水機組已是標準配置,跨樓棟各冷凍站聯(lián)動供冷也已在超大型數(shù)據(jù)中心中有所應用,與此對應的冷源集群控制(以下簡稱冷源群控)系統(tǒng)的架構一般會考慮冗余或容錯[1]其控制邏輯越發(fā)復雜。系統(tǒng)投產(chǎn)后,根據(jù)實際自控運行工況和運維人員使用情況的反饋,我們會發(fā)現(xiàn)自控程序、人機互動界面等均會產(chǎn)生改進需求,同時還會發(fā)現(xiàn)一些程序BUG需要修復。此時如要對原冷源群控系統(tǒng)進行升級,首先需要申請合適的停機窗口期,其次需要在變更階段進行大量的測試驗證工作,這對需要滿足容錯的A級數(shù)據(jù)中心[2]來說壓力巨大。如何能夠縮短停機窗口期、減少變更工作從而有效降低系統(tǒng)變更的風險是我們需要重點考慮的問題。筆者將以國內某數(shù)據(jù)中心冷源群控仿真系統(tǒng)的搭建為例,來探討此類問題的解決方案。
1? 冷源群控仿真系統(tǒng)的功能
1.1? 冷源系統(tǒng)設備狀態(tài)的模擬
冷源系統(tǒng)的主要設備一般分為冷水機組、冷凍水泵、冷卻水泵、冷卻塔、各類電動閥和傳感器,需要通過仿真硬件組成模擬屏代替這些真實設備,實現(xiàn)所有控制和反饋信號的模擬,并可采用仿真軟件根據(jù)需求設置這些信號,從而仿真設備的運行狀態(tài)。
1.2? 控制系統(tǒng)界面和自控程序的模擬
控制系統(tǒng)的仿真需要無差別顯示投產(chǎn)自控系統(tǒng)的軟件控制界面,流暢運行已投用的自控程序。在仿真系統(tǒng)內完成自控界面調優(yōu)和程序優(yōu)化調測后可反向無障礙替換至已投產(chǎn)系統(tǒng)。
1.3? 訓練和教學
可將仿真系統(tǒng)用于冷源自控系統(tǒng)運維教學與操作訓練,提升運維人員的操作技能。
2? 冷源群控仿真系統(tǒng)的構成
系統(tǒng)由現(xiàn)場層、控制層和管理層三部分組成?,F(xiàn)場層實現(xiàn)冷源系統(tǒng)設備的模擬,可以接受控制系統(tǒng)發(fā)出的控制信號,并根據(jù)仿真邏輯反饋系統(tǒng)運行信息;控制層采用與投產(chǎn)冷源自控系統(tǒng)完全一致的自控設備并配置相關接口轉換部件和網(wǎng)絡通信設備;管理層設置兩臺工作站,其中一臺工作站模擬控制系統(tǒng)的服務器和工程師站,可以完成系統(tǒng)編程、上位機監(jiān)控等功能,另一臺工作站部署現(xiàn)場層仿真系統(tǒng)的上位軟件,進行仿真邏輯配置,并對仿真系統(tǒng)中的各參量進行設置,仿真系統(tǒng)架構圖如圖1所示。
2.1? 硬件構成
2.1.1? 管理層
管理層工作站分別命名為中央控制站和仿真操作站,均配置六核處理器和獨立顯卡以保證系統(tǒng)經(jīng)過多次開發(fā)和升級后仍能運行及顯示流暢。在中央控制站中使用VMware虛擬機技術,虛擬出冷源群控的主、備服務器,配合雙屏顯示可仿真已投產(chǎn)系統(tǒng)的雙機熱備功能。為滿足多虛擬機同時運行,內存需擴容至64 GB。
2.1.2? 控制層
控制層采用與本數(shù)據(jù)中心一致的PLC控制系統(tǒng),除具有傳統(tǒng)的邏輯控制功能外,還具有數(shù)字運算、數(shù)據(jù)傳送和處理的能力[3],模塊化產(chǎn)品可根據(jù)各種過程處理設備對于控制和數(shù)據(jù)管理的需要進行組合。該系統(tǒng)主要由機架、電源模塊、CPU模塊、IO模塊和現(xiàn)場接線端子等組成。通過對應板卡實現(xiàn)模擬量信號、開關量信號的數(shù)據(jù)采集和對受控設備的遠程控制。
模擬量采集信號(AI信號)采用16路高電平模擬輸入模塊,可配置16個電壓或電流點,本項目中所有AI信號均為4~20 mA的直流信號。
模擬量控制信號(AO信號)采用16路模擬輸出模塊,提供16個隔離的0~20 mA輸出,可以應對每個輸出縮放到此量程內的直流信號。
開關量采集信號(DI信號)采用直流電壓類型的32路數(shù)字輸入模塊,它們分離成2組,每組16個通道,每通道都有一對用于接口連接的螺旋端子。在公共端子和任一輸入端子之間施加10 VDC~32 VDC電壓,則輸入開啟,同時點亮模塊對應的通道上綠色指示燈。
開關量控制信號(DO信號)采用直流電壓數(shù)字輸出模塊,其提供的32個輸出同樣分離成2組,每組16個通道。輸出通道需由外部供電,每一組均有一對螺旋端子,用于+V和COM連接。輸出為高側開關(電源)類型。
2.1.3? 現(xiàn)場層
現(xiàn)場層采用模擬工藝屏方式,可以實時修改并顯示控制系統(tǒng)中的溫度、壓力、流量、壓差、電流百分比、頻率等參數(shù)。同時將數(shù)據(jù)傳給PLC控制系統(tǒng),采用4~20 mA標準信號。
模擬屏能仿真所需控制信號,包括啟停控制、開度控制和變頻控制,可實時修改并顯示設備故障、運行、手自動等反饋信號。同時將上述設備狀態(tài)實時傳輸給控制層。通訊采用RS485和TCP/IP接口,支持ModbusRTU、ModbusTCP標準通信協(xié)議。
模擬量信號使用顯示儀表和信號生成儀表定制開發(fā),顯示儀表可以接收4~20 mA模擬量輸入信號并顯示數(shù)據(jù),信號生成儀表可以生成4~20mA信號,并在數(shù)碼管上顯示實際所需數(shù)據(jù)。
2.2? 軟件構成
軟件系統(tǒng)主要由控制系統(tǒng)程序設計軟件、上位機控制應用軟件、仿真系統(tǒng)軟件和考核信息管理軟件等四部分構成。
2.2.1? 控制系統(tǒng)編程軟件
控制系統(tǒng)采用定制組態(tài)程序軟件編寫PLC控制邏輯,該軟件基于Windows系統(tǒng)易于操作,可提供模塊化設計,通過以太網(wǎng)或RS232端口連接控制器進行組態(tài)的下載、上傳和在線監(jiān)視,其規(guī)格可以滿足多種過程設備的控制和數(shù)據(jù)管理需求,從而實現(xiàn)在線組態(tài)下載、故障監(jiān)視和問題排查功能。
通過上述編程軟件,根據(jù)實際冷源控制邏輯,完成冷源自控系統(tǒng)仿真控制程序的編寫和調試,實現(xiàn)系統(tǒng)手動、半自動和全自動運行。
仿真冷源自控邏輯主要實現(xiàn)以下控制目標,須保證與已用程序完全一致:
(1)冷凍水供水溫度和壓力控制;
(2)冷水機組加減載:通過供回水的溫度和回水流量計算現(xiàn)場冷量需求并控制冷水機組投入使用的臺數(shù);
(3)冷卻水供應溫度控制:利用冷卻塔風機的開關確保冷卻水供應溫度達到設定值,保證冷機正常運行;
(4)自然冷卻的冷卻水供水溫度控制:通過冷卻塔風機的開關和投入自然冷卻的板換使用數(shù)量,保證其供水溫度達到設定值,并最大限度使用自然冷卻的冷卻水;
(5)蓄冷罐系統(tǒng)的投用和退出,保證事故情況下末端能夠連續(xù)制冷;
(6)設備發(fā)生故障后及時啟動備用設備或者系統(tǒng),保證冷源正常供冷;
(7)冷凍水旁通閥控制:通過供水壓差控制旁通閥,確保系統(tǒng)供回水壓差在正常范圍內;
(8)冷卻水旁通閥控制:保證冷卻水供回水溫度不低于冷機系統(tǒng)的最低使用要求。
2.2.2? 上位機監(jiān)控軟件
仿真系統(tǒng)的上位機軟件采用與生產(chǎn)系統(tǒng)一致的冷源群控冗余軟件,具備雙機熱備功能。上位機的人機接口組態(tài)與驅動協(xié)議均與現(xiàn)場情況一致,監(jiān)測主要應用對象涉及冷水機組、冷凍水泵、冷卻水泵、冷卻塔、蓄冷罐、水溫、壓力、壓差、流速等。
使用人員可通過上位機軟件觀察和操作冷源自控系統(tǒng)。實時數(shù)據(jù)庫提供了大量的設備數(shù)據(jù)記錄和歷史數(shù)據(jù),為測試后的總結分析提供海量數(shù)據(jù)支持。利用軟件自帶的報警管理功能,可獲得報警事件并能對其進行處理,可協(xié)同考核軟件實現(xiàn)培訓考試功能。
2.2.3? 仿真系統(tǒng)軟件平臺
仿真系統(tǒng)軟件選用較新的、面向對象的C#編程語言,使用WPF框架,具備完善錯誤的機制、 異常處理的機制[4]。它使程序員們能夠更迅速地創(chuàng)建各類基于微軟.NET平臺的應用,仿真系統(tǒng)軟件平臺如圖2所示。
該軟件主要包括圖形展示、模擬引擎和通訊管理三模組:圖形展示模組是現(xiàn)場層模擬對象的標準操作界面,主要進行對實際冷源控制系統(tǒng)的工藝流程展示、數(shù)值顯示和裝置狀態(tài)管理;模擬引擎主要實現(xiàn)工藝數(shù)據(jù)和硬件的綁定以及仿真邏輯算法的實現(xiàn),引擎可以收到由控制器發(fā)出的控制信息,并把這些信息展現(xiàn)在軟件和工藝屏上,然后通過仿真邏輯算法把相應的對象數(shù)據(jù)反饋給控制器,以此達到了模擬實際冷源系統(tǒng)的功能;而通訊管理模塊則主要實現(xiàn)與硬件的通訊,可以完成對模擬量采集模塊、模擬量信號發(fā)生模塊、開關量采集模塊和開關量輸出模塊相互之間的通訊管理工作,模塊采用多線程的方式,通過信號量互鎖,實現(xiàn)數(shù)據(jù)的高速采集,保證數(shù)據(jù)的一致性。
2.2.4? 模擬操作考核軟件平臺
模擬操作考核軟件實現(xiàn)對培訓人員的理論考核和操作考核,系統(tǒng)的模塊設計遵循高內聚低耦合的原則,分為五個模塊:數(shù)據(jù)庫模塊、賬號模塊、題庫模塊、考試模塊、用戶接口模塊,如圖3所示。數(shù)據(jù)庫模塊用于完成對數(shù)據(jù)庫中用戶賬戶密碼、考核試題內容、歷史考核數(shù)據(jù)、用戶信息等關鍵數(shù)據(jù)的增刪改查,完成數(shù)據(jù)的持久化保存;賬號模塊實現(xiàn)用戶賬戶的需求,區(qū)分賬戶類型,限定管理員賬戶和考生賬號所擁有的權限范圍,確保賬號安全;題庫模塊借助數(shù)據(jù)庫模塊從數(shù)據(jù)庫中加載并實例化試題數(shù)據(jù);考試模塊通過訪問數(shù)據(jù)庫模塊和題庫模塊,獲得試卷信息和具體的試題內容并進行顯示;用戶接口模塊即軟件的圖形界面,整理并呈現(xiàn)存儲在數(shù)據(jù)庫的相關用戶數(shù)據(jù),通過合理的交互行為實現(xiàn)參與考試、考試發(fā)布、成績?yōu)g覽等相關功能。
3? 冷源群控仿真系統(tǒng)的特點
仿真系統(tǒng)硬軟件與實際冷源系統(tǒng)的工作流程及其控制系統(tǒng)的配置高度耦合,在仿真系統(tǒng)上對實際冷源系統(tǒng)的控制算法、自控流程進行優(yōu)化設計,經(jīng)過離線驗證后可以直接應用到投產(chǎn)冷源系統(tǒng)中,具有很高的實用性。
使用工藝屏代替實際設備,將開關量、模擬量等系統(tǒng)參量進行顯示,工藝流程清晰,數(shù)據(jù)直觀。關鍵冷源設備的主要狀態(tài)均可通過工藝屏模擬,無須操作實際使用設備,對生產(chǎn)系統(tǒng)無影響。通信協(xié)議采用標準Modbus協(xié)議,方便系統(tǒng)的增容和擴展。
4? 應用實踐
仿真平臺建成后,我們導入已投產(chǎn)的控制程序,采用頭腦風暴方式構想各種極端運行工況,用以測試冷源集群控制系統(tǒng)的穩(wěn)定性,測試出幾處常規(guī)工況下不易發(fā)覺的程序缺陷。
在對數(shù)據(jù)中心冷源集群控制系統(tǒng)進行2.0版本升級的過程中,我們通過仿真系統(tǒng)進行所有新增功能、優(yōu)化邏輯以及修復缺陷的測試工作。測試通過后將程序下載至生產(chǎn)系統(tǒng),大大降低系統(tǒng)升級后的運行風險。
針對版本升級后的新功能我們利用仿真系統(tǒng)進行了多次實際操作培訓和考核,為一線運維員工快速掌握新功能提供了實踐場所。仿真模擬系統(tǒng)培訓周期短,成本低,形式一對多,更能貼近實際生產(chǎn)環(huán)境[5]。
5? 結? 論
經(jīng)過一年的運行實踐證明:該系統(tǒng)對大型數(shù)據(jù)中心冷源系統(tǒng)自控程序的優(yōu)化、節(jié)能策略的實現(xiàn)提供強有力的支撐作用。模擬測試平臺的投產(chǎn),極大地方便了員工的培訓、演練等實際應用需求。同時在園區(qū)大部分樓已經(jīng)正式投產(chǎn)的情況下,模擬測試平臺可以用于程序修改后的線下測試工作,為園區(qū)生產(chǎn)系統(tǒng)的安全穩(wěn)定運行提供了極大的保障,具有較高的推廣價值。
參考文獻:
[1] 余輝雄.面向大數(shù)據(jù)分析下配網(wǎng)主動式運維分析 [J].通信電源技術,2019,36(12):119-120.
[2] 李棟.大數(shù)據(jù)分析在網(wǎng)絡監(jiān)控中的實現(xiàn)與應用 [J].通信管理與技術,2020(4):44-46.
[3] 任帥.動環(huán)集中運維管理平臺應用探析 [J].通信電源技術,2020,37(3):64-67.
[4] 張帆.數(shù)據(jù)分析在科學統(tǒng)籌通信運營商動力運維成本中的應用研究 [J].信息與電腦(理論版),2018(17):153-154+157.
[5] 孔令誠.接入網(wǎng)機房動環(huán)監(jiān)控自動派單的分析與實現(xiàn) [J].中國新通信,2018,20(2):87-88.
作者簡介:馬一清(1981—),男,漢族,江蘇南京人,工程師,本科,研究方向:建筑智能化、自控。