國電甘肅新能源有限公司 裴 凱
某風(fēng)場機裝機容量20.1MW,選用國內(nèi)知名品牌風(fēng)機,單機容量1.5MW,共安裝134臺風(fēng)機??刂葡到y(tǒng)選用2期風(fēng)機廠家自帶的操控系統(tǒng),該系統(tǒng)自風(fēng)機投運以來性能相對穩(wěn)定,前期能夠基本滿足該風(fēng)場的風(fēng)機控制需求。但隨著時間推移及風(fēng)機數(shù)據(jù)量的增加、運行環(huán)境影響及設(shè)備老化的顯現(xiàn),造成系統(tǒng)數(shù)據(jù)、冗余數(shù)據(jù)過多而儲存空間過小,控制系統(tǒng)經(jīng)常發(fā)生崩潰使得風(fēng)機失聯(lián)無法控制,直接威脅到風(fēng)場風(fēng)機設(shè)備安全穩(wěn)定運行。
目前風(fēng)機控制系統(tǒng)除監(jiān)控風(fēng)機運行以外,還需接入風(fēng)功率預(yù)測系統(tǒng)。隨著電網(wǎng)“兩個細(xì)則”出臺,對風(fēng)功率可用功率偏差等要求的不斷提高和考核的加重,該風(fēng)場在2019年內(nèi)多次被調(diào)度“兩個細(xì)則”考核。經(jīng)排查分析具體原因是:風(fēng)功率預(yù)測系統(tǒng)可用功率偏差太大,不滿足省調(diào)可用電量的日準(zhǔn)確率應(yīng)不小于97%要求;風(fēng)機控制系統(tǒng)崩潰致使風(fēng)機運行數(shù)據(jù)無法及時轉(zhuǎn)發(fā)有直接關(guān)系。因此,經(jīng)與該風(fēng)場技術(shù)人員反復(fù)深入分析和研究,現(xiàn)場數(shù)據(jù)收集考證,提出多種解決方案,并對方案可行性進(jìn)行論證,最終確定本方案。
“兩個細(xì)則”可用功率考核情況分析可知,1月、7月、10月該風(fēng)場可用功率考核明顯高于區(qū)域平均水平。經(jīng)查閱歷史記錄一期風(fēng)機控制系統(tǒng)于2019年1月數(shù)據(jù)服務(wù)器發(fā)生第一次系統(tǒng)崩潰,二期風(fēng)機控制系統(tǒng)于2019年7月數(shù)據(jù)服務(wù)器發(fā)生第一次系統(tǒng)崩潰,一期風(fēng)機控制系統(tǒng)于2019年10月數(shù)據(jù)服務(wù)器發(fā)生第二次系統(tǒng)崩潰。究其原因,當(dāng)數(shù)據(jù)服務(wù)器發(fā)生系統(tǒng)崩潰時使得風(fēng)機后臺服務(wù)器運行的控制風(fēng)機軟件無法運行,同時給預(yù)測服務(wù)器轉(zhuǎn)發(fā)的風(fēng)機開機容量、機頭風(fēng)速等信息均無法轉(zhuǎn)發(fā),致使風(fēng)功率預(yù)測系統(tǒng)不能及時更新風(fēng)機實時數(shù)據(jù),使可用功率計算結(jié)果發(fā)生較大的偏差,使該風(fēng)場當(dāng)月在可用功率考核上蒙受巨大的經(jīng)濟損失。
當(dāng)一期風(fēng)機數(shù)據(jù)服務(wù)器發(fā)生系統(tǒng)崩潰時,風(fēng)機數(shù)據(jù)服務(wù)器所屬的本期67臺風(fēng)機數(shù)據(jù)均無法生產(chǎn)、儲存、轉(zhuǎn)發(fā),使風(fēng)機控制服務(wù)器的服務(wù)不能正常運行。當(dāng)風(fēng)機控制服務(wù)器發(fā)生系統(tǒng)崩潰時,風(fēng)機控制服務(wù)器所屬的本期67臺風(fēng)機均無法控制啟停風(fēng)機和采集風(fēng)機狀態(tài)、轉(zhuǎn)發(fā)風(fēng)機實時數(shù)據(jù)。當(dāng)風(fēng)機操作員站發(fā)生系統(tǒng)崩潰時,風(fēng)機操作員站所屬的本期67臺風(fēng)機均無法監(jiān)視、控制、轉(zhuǎn)發(fā)和歸檔風(fēng)機實時數(shù)據(jù),直接威脅風(fēng)電場安全穩(wěn)定運行。
綜上,風(fēng)機操控系統(tǒng)能否連續(xù)穩(wěn)定運行至關(guān)重要。該風(fēng)場有134臺風(fēng)機,配置2期風(fēng)機控制系統(tǒng),上述設(shè)備共計6套,由于目前已運行6年有余,而隨著控制系統(tǒng)設(shè)備老化、冗余數(shù)據(jù)量極大,加之早期設(shè)備性能及其有限,系統(tǒng)可靠性較低。該風(fēng)場風(fēng)機操作控制系統(tǒng)目前經(jīng)常發(fā)生崩潰,以致影響到風(fēng)場的安全運行和風(fēng)場經(jīng)濟效益,改造該風(fēng)場風(fēng)機控制模式勢在必行。
隨著計算機技術(shù)不斷的高速發(fā)展,該風(fēng)場運行的原風(fēng)機廠家的風(fēng)機操作控制系統(tǒng)由于驅(qū)動缺少、軟件不兼容的問題已無法安裝在目前制造的服務(wù)器上。所以需要更換第三方公司開發(fā)的操作控制平臺與原系統(tǒng)有效兼容,實現(xiàn)操作控制系統(tǒng)的虛擬兼容。
所需物料:風(fēng)電機組,中控室設(shè)備分兩期監(jiān)控,共六套硬件及兩套軟件;軟件備份:統(tǒng)計現(xiàn)場操作控制軟件備份所有原有數(shù)據(jù),其中著重備份風(fēng)機點表、第三方傳輸點表、備份數(shù)據(jù)庫和歷史數(shù)據(jù);根據(jù)業(yè)主需求,拆除舊設(shè)備,安裝新設(shè)備、系統(tǒng)及軟件、遷移歷史數(shù)據(jù)并調(diào)通設(shè)備。
所需服務(wù)器硬件配置。CPU:INTEL Xeon Silver 4114@2.20GHz;內(nèi)存:32GB DDR4;系統(tǒng)硬盤:2×512GB SSD;存儲硬盤:4×4TB 3.5寸SAS 12Gbps 7200RPM;操作員站配置尺寸:普通PC機;CPU:INTEL I5-7500@3.40GHz;主板:B250主板(LGA1151插槽類型);內(nèi)存:8GB DDR4;硬盤:1TB 7200RPM。此項目不包含兩期的能量管理平臺。軟件平臺:某公司“1.5MW風(fēng)機監(jiān)控系統(tǒng)”。方案存在問題分析如下。
以1.5MW風(fēng)機25臺為例,1.5MW風(fēng)機監(jiān)控授權(quán)費用需要30萬左右,具體計算為:1.5MW風(fēng)機監(jiān)控授權(quán)為按點表授權(quán),通過風(fēng)機需采集、控制的數(shù)據(jù)點位個數(shù)收取系統(tǒng)授權(quán)費用。單臺1.5MW風(fēng)機數(shù)據(jù)點位約1800余個為簡化計算記為1800個。1800×25=4.5萬個數(shù)據(jù)點。某公司提供3萬點、5萬點、10萬點3種規(guī)格的點表且單張點表最大風(fēng)機數(shù)不超過70臺,意味著單期風(fēng)機最多不超過70臺。
以1.5MW風(fēng)機67臺為例,單臺1.5MW風(fēng)機數(shù)據(jù)點位約1400余個,為簡化計算記為1400個,1400×67=9.3萬個數(shù)據(jù)點。該風(fēng)場兩期共計134臺風(fēng)機,按照上述要求需要某公司兩個10萬點的授權(quán)。光系統(tǒng)授權(quán)費用將近百萬。還有設(shè)備費材料費45萬,費用遠(yuǎn)超該風(fēng)場項目預(yù)算40萬。且此項目不包含兩期的能量管理平臺,技改仍需另行收費。
風(fēng)機廠家提供的設(shè)備配置一般。設(shè)備配置服務(wù)器核心為CPU:INTEL Xeon Silver 4114 2.2GHz,主頻一般;運行內(nèi)存32GB,系統(tǒng)硬盤512GB、數(shù)據(jù)硬盤4TB,空間一般;工作站主板配置B250,平臺相對落后;七代CPU:INTEL I5-7500,相對落后;8G內(nèi)存、1T硬盤,空間有限。隨著計算機行業(yè)的高速發(fā)展,以2019年計算機行業(yè)的平均配置水平來看,此供貨單所列設(shè)備屬中下水平,近幾年后仍存在設(shè)備性能不足的問題,以后該風(fēng)場的系統(tǒng)技改項目還需軟件升級,系統(tǒng)資源不足的情況更是雪上加霜。系統(tǒng)資源也不足,無法開展多級熱備等高級應(yīng)用,系統(tǒng)可靠性不能得到額外的提升。
僅對服務(wù)器進(jìn)行升級,原能量管理平臺設(shè)備性能無法保證,遠(yuǎn)期存在諸多風(fēng)險,與電網(wǎng)的設(shè)備性能要求存在較大差距,無法滿足電網(wǎng)對風(fēng)電場站精確化控制的要求,將面臨加重“兩個細(xì)則”考核的風(fēng)險。
在對設(shè)備現(xiàn)狀深入探討及市場調(diào)研的基礎(chǔ)上,經(jīng)大膽探索,依據(jù)計算機控制理論及發(fā)展,通過對本行業(yè)最新發(fā)展動態(tài)的導(dǎo)向理解,綜合各大設(shè)備廠商的技術(shù)能力,創(chuàng)新的提出基于虛化平臺+集中儲存的風(fēng)機控制系統(tǒng)解決方案。該方案在整個雙饋風(fēng)力發(fā)電機組各類容量的風(fēng)機平臺內(nèi)均未出現(xiàn)過,該風(fēng)場是中國第一家提出并實現(xiàn)雙饋風(fēng)力發(fā)電機使用此方案的風(fēng)場。
通過把現(xiàn)有的物理系統(tǒng)整合到虛擬構(gòu)架的數(shù)據(jù)中心上去,降低了的硬件投資和后期維護(hù)費用。將空閑的系統(tǒng)資源有機整合提升了系統(tǒng)的運作效率。
整合基礎(chǔ)服務(wù)器:運行基礎(chǔ)應(yīng)用的設(shè)備大多數(shù)是基于Intel構(gòu)架,基礎(chǔ)應(yīng)用有文件、打印、網(wǎng)頁、防火墻、NAT/DHCP應(yīng)用等。雖然大多數(shù)運行基礎(chǔ)應(yīng)用的設(shè)備的系統(tǒng)資源占用率通常為10~15%,但由于設(shè)備安全和兼容性方面的問題,導(dǎo)致必須指定不同的物理平臺來運行它們。設(shè)備管理、主機加固等保測評將花去大量的時間和費用。另外,為服務(wù)器服務(wù)的衍生設(shè)備將導(dǎo)致電力供應(yīng)和散熱方面的成本上升。因為較低的服務(wù)器資源利用率,基礎(chǔ)應(yīng)用服務(wù)器首選作為虛擬化和相關(guān)整合的對象。虛擬化降低了企業(yè)的投資、運作成本。
在服務(wù)器管理方面也做出了重大改進(jìn),如:添加集中儲存池、集中控制套件、萬兆光網(wǎng)。移動全部系統(tǒng)磁盤到集中儲存池,配置雙機災(zāi)備,大大提升了系統(tǒng)可靠性。變更了原系統(tǒng)的組網(wǎng)方式,通過雙路光網(wǎng)有效降低了系統(tǒng)傳輸延時,為風(fēng)電機組在故障穿越時提供了更加可靠的通訊支撐,確保集控系統(tǒng)能夠在故障穿越時及時發(fā)揮調(diào)節(jié)作用。預(yù)制了系統(tǒng)軟件及點表大大縮短了系統(tǒng)部署時間,僅半天即可完成系統(tǒng)遷移,有效降低了風(fēng)電場非停時間。完成部署后,制備了系統(tǒng)鏡像,如系統(tǒng)運行期間發(fā)生任何問題,重置過程僅需3分鐘,基于雙機災(zāi)備系統(tǒng)支撐,重置后當(dāng)天運行數(shù)據(jù)亦能得到保全。設(shè)備故障狀態(tài)下,減少了恢復(fù)時間、更少冗余設(shè)備的情況下,提升了可靠性。
有了虛擬化,系統(tǒng)管理員能在運行重要應(yīng)用的實體機和同等配置的虛擬機上創(chuàng)建集群。在待機狀態(tài)下,虛擬機并不消耗計算機資源,并且能以非常高的比例整合到一個或幾個實體平臺上去。企業(yè)無須在硬件投資、運維和加固上投入多倍的人力和物力,從而實現(xiàn)高可用性。冗余的方式將由2N變?yōu)镹+1。
圖1 虛擬化方案拓?fù)鋱D
主機與磁盤整列通過冗余萬兆光纖網(wǎng)絡(luò)連接,從而保證了傳輸速率和可靠性。而通過動態(tài)磁盤池技術(shù)會將raid的熱備空間打散到所有硬盤內(nèi),這樣就可以保證在重建的時候所有硬盤可以同時參與重建,從而大大加快重建的速度。
服務(wù)器:采用Intel C622芯片組,2×Intel Xeon Silver 4215R 8C 130W 3.2GHz的雙處理器,64GB TruDDR4 2666 MHz,2×600GB 10K 12Gbps SAS 2.5"G4HS,RAID 530-8i PCIe Adapter,1GbE RJ45 4網(wǎng)絡(luò)端口,1×Emulex 16Gb FC Dual-port HBA,2×ThinkSystem 750W(230/115V)電源,支持ASHARE A4標(biāo)準(zhǔn)。
磁盤整列:冗余雙控制器架構(gòu),控制器為雙活工作模式。實配雙控制器,控制器內(nèi)配置ASIC架構(gòu)專用RAID計算芯片,可支持FC、iSCSI、SAS協(xié)議,16G緩存,7×1.2TB 10K HDD,4×16Gb FC含模塊。
工控機:采用IPC-610L/AIMB-786/I7 9700/8G/1T×2/DVD/KM+2口網(wǎng)卡。以2019年計算機行業(yè)的平均配置水平來看,此供貨單所列設(shè)備屬上游水平,數(shù)年內(nèi)不存在設(shè)備性能不足的問題。在實際設(shè)備運行結(jié)果表明,基礎(chǔ)應(yīng)用所占算力僅為總算力的1%。以后該風(fēng)場的技改項目,如數(shù)據(jù)直采、快頻改造項目需要升級控制軟件,由于本系統(tǒng)資源充足,均不需要升級配置。
多臺設(shè)備組成的集合就稱為集群,集群的目的就是將單臺設(shè)備的負(fù)擔(dān)分配到多臺設(shè)備上從而提升算力,或是當(dāng)運行某一個服務(wù)的物理設(shè)備出現(xiàn)故障時,讓另一臺或多臺設(shè)備繼續(xù)接手這些服務(wù)。如:VMware vSphere中,將多臺物理服務(wù)器組成一個集群,在這個集群中某臺物理服務(wù)器出現(xiàn)故障時,這臺服務(wù)器上運行的虛擬機可自動遷移到其他可用的物理服務(wù)器上,保障業(yè)務(wù)的不間斷運行。集群中所有的虛擬機均可在儲存池所掛任意主機上自由遷移,并且集群可做到快速擴容和HA故障冗余;所以集群是服務(wù)器虛擬化通往數(shù)據(jù)中心的必備功能。
該風(fēng)場系統(tǒng)使用了的HA集群。因為該種集群設(shè)計專用于意外故障切換,當(dāng)監(jiān)控到集群中有主機意外故障時,會自動在其他主機上運行故障主機在故障之前所運行的全部業(yè)務(wù),切換過程可以做到無縫銜接。該風(fēng)場的服務(wù)器配置的形式為N+2,即單一臺物理機故障可用的繼承主機還有兩臺,相當(dāng)于三級熱備,大大提升了可靠性。
該項改造費用約48余萬元,由于虛化系統(tǒng)兼容性極佳,可繼續(xù)使用風(fēng)場現(xiàn)役的已購買的風(fēng)機控制系統(tǒng),不需對風(fēng)機控制系統(tǒng)點表重新授權(quán),節(jié)約了近百萬元的授權(quán)費用。且本次改造硬件性能較高,使得本方案極具性價比,開創(chuàng)了聯(lián)合動力早期投運風(fēng)機控制系統(tǒng)的平價技改先河,而且由于相同算力下與純物理系統(tǒng)相比所需的硬件及其附件設(shè)備數(shù)量更少,投資更低、更易維護(hù)。
本次技改所需的集群系統(tǒng)為主流的服務(wù)器級的應(yīng)用系統(tǒng)。系統(tǒng)基于Linux內(nèi)核,安全系數(shù)更高、主機加固效果更好、更易通過等保測評,運維成本大大降低。主機及其附屬設(shè)備更少、更加節(jié)能,有效的降低了系統(tǒng)運行成本。后續(xù)的技改工作亦可在本系統(tǒng)上進(jìn)行,大大提升系統(tǒng)的拓展性,且單一設(shè)備升級、維護(hù)、退備其他設(shè)備仍可繼續(xù)運行其業(yè)務(wù),大大提升了系統(tǒng)的可靠性。
該項目于2020年6月完成調(diào)試驗收,經(jīng)該風(fēng)場運行4個多月,整體表現(xiàn)良好,設(shè)備運轉(zhuǎn)正常,徹底解決數(shù)據(jù)服務(wù)器發(fā)生系統(tǒng)崩潰問題,各項數(shù)據(jù)傳輸正常,達(dá)到了立項目的。