馮正偉,汪銘峰,梁 慧,王 韜,黃浩林,吳建偉,計榮榮,吳米佳
(1.國網(wǎng)浙江省電力有限公司檢修分公司,浙江 金華 321000;2.國網(wǎng)浙江省電力有限公司杭州供電公司,杭州 310009)
智能變電站的二次設(shè)備可分為三層兩網(wǎng),三層為站控層、間隔層、過程層,兩網(wǎng)為站控層網(wǎng)絡(luò)、過程層網(wǎng)絡(luò)。三層設(shè)備之間通過兩層網(wǎng)絡(luò)完成信息集成與交互[1-2]。其中站控層與間隔層之間以MMS(制造報文規(guī)范)網(wǎng)絡(luò)進行實時通信,實現(xiàn)站控層設(shè)備與間隔層設(shè)備之間的數(shù)據(jù)傳輸,其運行的穩(wěn)定性、可靠性將直接影響運維人員和調(diào)度人員對全站一二次設(shè)備的實時監(jiān)視與控制[3-6]。
本文以智能變電站中的MMS網(wǎng)絡(luò)通信理論為基礎(chǔ),分析了一起典型的MMS網(wǎng)絡(luò)通信異常,并提出了相應(yīng)的處理方法,以期為類似案例提供借鑒參考。
智能變電站中站控層網(wǎng)絡(luò)的MMS通信采用客戶端/服務(wù)器模式(其模型如圖1所示)、ICP/IP傳輸機制。在智能變電站自動化系統(tǒng)中,客戶端一般是指后臺監(jiān)控主機、遠動裝置、保護信息子站等,服務(wù)器則主要指一個或幾個實際設(shè)備或子系統(tǒng),例如保護裝置、測控裝置、一體化電源系統(tǒng)等[7]。
圖1 MMS客戶端/服務(wù)器模型
在智能變電站各設(shè)備實際通信過程中,由于不同廠家的裝置可能運行著不同的系統(tǒng)和程序,硬件結(jié)構(gòu)也可能千差萬別,甚至同一個廠家不同時期、不同型號的產(chǎn)品在軟硬件上也存在差異。所以要實現(xiàn)各裝置間的互操作,首先必須考慮各裝置之間通信內(nèi)容和通信方式的規(guī)范化。而MMS服務(wù)通過構(gòu)建虛擬設(shè)備的方法來達到隱藏各裝置技術(shù)細節(jié)的目的,虛擬設(shè)備由實際設(shè)備映射得到,它和裝置的具體細節(jié)無關(guān),具體通信時信息交互在客戶端和虛擬設(shè)備之間進行。這樣就屏蔽了各裝置的技術(shù)細節(jié),客戶端就可以和不同廠家、不同型號的多種裝置進行通信,實現(xiàn)了各設(shè)備之間的良好互操作性[8-9]。
MMS服務(wù)按通信流程的不同可分為帶確認的MMS服務(wù)和不帶確認的MMS服務(wù)。其中,帶確認的MMS服務(wù)由客戶端發(fā)起,并需要服務(wù)器最終返回確認信息,其在客戶端和服務(wù)器之間的通信流程可以分為以下5個步驟[10]:
(1)客戶端發(fā)出一個服務(wù)請求(Request)。
(2)服務(wù)器收到該服務(wù)的指示(Indication)。
(3)服務(wù)器執(zhí)行必要的操作。
(4)若操作成功,服務(wù)器發(fā)送肯定響應(yīng)(Response+),不成功則發(fā)送否定響應(yīng)(Response-)。
(5)客戶端收到服務(wù)器返回的確認信息(Confirm)。
在智能變電站中,例如運行人員在后臺監(jiān)控主機上的拉合開關(guān)、投退壓板等遙控操作均屬于典型的帶確認的MMS服務(wù),如圖2所示。
不帶確認的MMS服務(wù)則不需要客戶端發(fā)出服務(wù)請求,而是由服務(wù)器每隔一定時間自動向客戶端上送。在智能變電站中,測控裝置每隔一定時間就向后臺監(jiān)控主機上送所采集的電壓、電流值,其所采用的MMS的報告服務(wù)就是典型的不帶確認的MMS服務(wù)[4],具體通信流程如圖3所示。
圖2 帶確認的MMS服務(wù)通信流程
圖3 不帶確認的MMS服務(wù)通信流程
智能變電站中MMS服務(wù)的種類較多,例如報告服務(wù)、遠方控制、定值服務(wù)和文件服務(wù)等。其中,報告服務(wù)主要用于上送變電站中保護、測控等IED(智能電子設(shè)備)的遙測值、開入量、保護動作、告警信號等,在MMS通信中映射到Information Report服務(wù)。MMS報告服務(wù)又可分為緩存報告服務(wù)和非緩存報告服務(wù)2種類型,如圖4所示。
圖4 緩存報告和無緩存報告的區(qū)別
緩存報告服務(wù)要求保護、測控等IED在內(nèi)存中緩存報告內(nèi)容,如果通信中斷期間發(fā)生了事件,在通信恢復(fù)后此類事件報文應(yīng)能上送不丟失,例如開入量、保護動作事件、告警信號、SOE(事件順序記錄)等遙信類數(shù)據(jù)一般通過緩存報告服務(wù)來上送。而非緩存報告服務(wù)不要求IED緩存,通信中斷期間的數(shù)據(jù)可能丟失,例如遙測類數(shù)據(jù)一般通過無緩存報告服務(wù)來上送。
在MMS報告服務(wù)中,EntryID(入口標識)和緩存溢出2個選項是緩存報告服務(wù)所特有的,而這2個選項在無緩存報告中則毫無意義。其中,EntryID又稱為條目標識,即為MMS緩存報告報文的順序號。在同一個IED中,每一條BRCB(緩存報告控制塊)報文均有唯一的EntryID,任意2條BRCB報文的EntryID均不重復(fù)。
當運行中的保護裝置、測控裝置等服務(wù)器與客戶端(后臺監(jiān)控或遠動裝置)通信異常而失去網(wǎng)絡(luò)連接后,客戶端將無法收到即時報文;當通信恢復(fù)正常后,客戶端通過MMS報告服務(wù)將收到的上一幀報文的EntryID告知保護裝置、測控裝置,然后保護裝置、測控裝置將按EntryID檢索緩存區(qū)內(nèi)BRCB的報文,按照“EntryID+1”確定下一條報文的順序號并將其發(fā)出。原則上客戶端在使能BRCB時,應(yīng)該為EntryID賦一個初始值。
浙江電網(wǎng)某500 kV智能變電站的后臺監(jiān)控系統(tǒng)采用國內(nèi)某主流廠家的系統(tǒng),站內(nèi)遠動裝置采用該廠家的遠動系統(tǒng),間隔層設(shè)備亦為該廠家產(chǎn)品。站控層的監(jiān)控主機、遠動裝置等客戶端均通過MMS網(wǎng)絡(luò)(A網(wǎng)、B網(wǎng))與間隔層的保護、測控等服務(wù)器進行通信和信息交互,通信網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
圖5 智能變電站通信網(wǎng)絡(luò)結(jié)構(gòu)
自變電站投運以來,測控裝置與監(jiān)控后臺主機、遠動裝置之間多次發(fā)生通信異常,導(dǎo)致變電站后臺監(jiān)控系統(tǒng)出現(xiàn)重刷歷史報文信號的問題;同時遠動裝置也多次將部分歷史報文信號重新上送遠端調(diào)度監(jiān)控中心D5000系統(tǒng),造成遠端調(diào)度監(jiān)控D5000系統(tǒng)重刷部分歷史信號,嚴重影響了調(diào)度監(jiān)控中心的正常監(jiān)視和運行。
因該自動化系統(tǒng)通信異常缺陷具有偶發(fā)性和隨機性特征,系統(tǒng)正常運行過程中不易獲取異常發(fā)生的全過程,只能通過現(xiàn)場變電站的網(wǎng)絡(luò)分析儀抓取測控裝置與監(jiān)控后臺以及遠動裝置的通信數(shù)據(jù)包進行離線分析。
2.2.1 MMS通信的正常傳輸機制
正常情況下,當監(jiān)控系統(tǒng)、遠動裝置等客戶端與保護、測控等服務(wù)器通信中斷后重新連接時,客戶端會向服務(wù)器寫入收到的最后一幀MMS報文的EntryID,服務(wù)器在收到客戶端下發(fā)的EntryID后會進行比較:若寫入值比裝置自身存儲值小,則會進行緩存歷史報告上送;若寫入值與裝置自身存儲值相同,則不會進行緩存歷史報告上送。此邏輯如圖6所示:在服務(wù)器與客戶端恢復(fù)連接時,如果向服務(wù)器寫入的EntryID小于裝置自身存儲的EntryID,服務(wù)器首先會將該客戶端對應(yīng)的WR_entryID_flag()標志置為True,并啟動歷史報告上送任務(wù),上送完畢后,客戶端與裝置自身的EntryID得到同步,裝置將該客戶端對應(yīng)的WR_entryID_flag標志清零。
圖6 正常情況下緩存報告上送邏輯示意
圖7為測控裝置具體的歷史報告上送流程。裝置根據(jù)寫入的EntryID與其自身存儲的EntryID差值進行具體的報告上送,在獲取了報告內(nèi)容后,裝置會獲取所有客戶端對應(yīng)的WR_entryID_flag標志,若發(fā)現(xiàn)WR_entryID_flag標志為True,就會向該客戶端進行報告上送,在報告上送結(jié)束后,客戶端與裝置自身的EntryID一致,裝置將該客戶端對應(yīng)的WR_entryID_flag標志置為False。
圖7 緩存歷史報告上送流程
2.2.2 實際存在的問題
在測控裝置實際運行的IEC 61850程序收到監(jiān)控主機、遠動裝置等客戶端下發(fā)的EntryID后,存在一個不正確的邏輯判斷。即當滿足“客戶端下發(fā)EntryID≤裝置自身存儲的EntryID”條件時,測控裝置的程序就會將該客戶端對應(yīng)的WR_entryID_flag標志置為True,而正確的邏輯應(yīng)當是只有“客戶端下發(fā)EntryID<裝置自身存儲的EntryID”才能將相應(yīng)的WR_entryID_flag標志置為True,如圖8所示。
圖8 錯誤的報告上送邏輯示意
因此,按照上述錯誤的邏輯條件設(shè)置后,如果監(jiān)控后臺或遠動裝置下發(fā)的EntryID與測控裝置本身的EntryID相等時,測控裝置就會錯誤地將該遠動裝置對應(yīng)的WR_entryID_flag標志置為True,雖然這個操作不會導(dǎo)致立刻就重復(fù)上送歷史報告,但是誤將測控裝置內(nèi)WR_entryID_flag標志置為True,卻給之后的運行帶來了隱患。
例如,某測控裝置誤將一臺遠動裝置客戶端的WR_entryID_flag置為True以后,當監(jiān)控后臺等其他客戶端對該測控裝置進行歷史報告上召時,將會引發(fā)測控裝置將歷史報文上送遠動裝置,從而造成該遠動裝置向遠方調(diào)度監(jiān)控中心誤送歷史報告的問題。
如果監(jiān)控后臺進行值班機切機操作時,由于來不及處理測控裝置上送的某幾幀報文,當后臺主機恢復(fù)運行并與測控裝置進行重連操作后,可能向測控裝置寫入較小的EntryID,使得測控裝置將監(jiān)控后臺客戶端對應(yīng)的WR_entryID_flag標志置為True,接著測控裝置會向監(jiān)控后臺進行歷史報告上送。而在具體的歷史報告上送執(zhí)行過程中,測控裝置實際上會向所有WR_entryID_flag標志為True的客戶端都發(fā)送歷史報告。根據(jù)之前所述,對于曾經(jīng)發(fā)生過寫入EntryID與裝置EntryID一致的遠動裝置來說,其對應(yīng)的WR_entryID_flag標志已經(jīng)為True,于是遠動裝置也會收到測控裝置誤送出來的歷史報告。不正確的歷史報告上送流程如圖9所示。
而此次歷史報告上送完畢后,監(jiān)控后臺與測控裝置之前的EntryID得到同步,WR_entryID_flag標志被清除。而對于遠動裝置來說,其自身的EntryID隨收到的歷史報告繼續(xù)累加,測控裝置本身記錄遠動裝置的EntryID卻保持不變,二者無法實現(xiàn)同步,遠動裝置對應(yīng)的WR_entryID_flag標志也無法被清除,繼續(xù)維持為True。于是在之后的運行過程中,一旦出現(xiàn)監(jiān)控后臺重新上召歷史報告,由于遠動裝置對應(yīng)的WR_entryID_flag標志未被有效清除,將會一直伴隨收到多余的歷史報告。
圖9 不正確的歷史報告上送流程
通過搭建如圖10所示的模擬實驗環(huán)境,對后臺進行切機操作,總結(jié)出現(xiàn)場誤送報告現(xiàn)象出現(xiàn)的規(guī)律:
(1)在監(jiān)控后臺將測控裝置的BRCB周期設(shè)置為90 s(實際由于負載原因,裝置上送的報告周期略大于90 s),在第一次周期報告上送完畢,下一次周期即將到達時,將后臺監(jiān)控主機切換為離線。
(2)后臺主機響應(yīng)命令進入離線狀態(tài)需要消耗大約6 s的時間,裝置新送出來的周期性報告已經(jīng)上送到后臺主機的協(xié)議棧,但由于監(jiān)控后臺響應(yīng)了主機的切換操作,此次的周期報告實際并沒有處理入庫,因此造成了測控裝置的EntryID比后臺主機的EntryID大1(1個BRCB差1,整個裝置有多個BRCB)。
圖10 模擬仿真平臺
(3)將處于離線狀態(tài)的后臺主機切換為值班機,后臺主機會與測控裝置進行MMS通信初始化,在此期間后臺監(jiān)控主機向測控裝置下發(fā)后臺入庫報告的EntryID,其值比測控裝置所存儲的EntryID小1,因此測控裝置需要向后臺上送1個歷史報告(對于多個BRCB來說,可能有多個)。
(4)最后將遠動裝置上電,在遠動裝置上電后第一次與測控裝置連接時,向測控裝置寫入EntryID為0,與裝置內(nèi)存儲的EntryID值相同,使得裝置內(nèi)部的WR_entryID_flag標志被誤置為True,于是在測控裝置向監(jiān)控后臺上送歷史報告的同時,也向遠動裝置進行了錯誤的上送。且這個標志不會清除,只要后臺進行上述步驟中的操作,遠動裝置都會伴隨收到歷史報告。
通過對某500 kV智能變電站內(nèi)測控裝置重刷歷史報告的異常缺陷進行分析,可以看出必須對該類型測控裝置的通信程序進行修改升級,具體修改內(nèi)容為:
(1)修改通信程序中WR_entryID_flag產(chǎn)生的條件,正確的條件應(yīng)為“客戶端下發(fā)EntryID<裝置自身存儲的EntryID”。
(2)優(yōu)化測控裝置的遙信歷史事件重傳機制,當某一客戶端與測控裝置進行重連操作時,使能測控裝置BRCB進行歷史報告上送,此時應(yīng)取消對其他WR_entryID_flag為True的客戶端的重傳機制。
由于該500 kV智能變電站為在網(wǎng)運行變電站,現(xiàn)場測控裝置軟件升級時,一次設(shè)備不能停運,應(yīng)在做好相關(guān)二次設(shè)備回路的安全隔離措施后,防止出現(xiàn)閉鎖運行設(shè)備的情況,并按照退出一個升級一個的原則進行。同時測控、低壓保護測控一體等單配裝置退出運行時,需向各級調(diào)度、當?shù)乇O(jiān)控申請退出“四遙”監(jiān)視及保護功能。測控裝置通信程序升級時,應(yīng)按照以下步驟進行操作:
(1)退出測控裝置的所有SV接收軟壓板,GOOSE發(fā)送、接收軟壓板。
(2)投入測控裝置的檢修硬壓板。
(3)檢查并確認因測控裝置檢修硬壓板投入而引起的其他運行設(shè)備告警信號。
(4)上裝測控裝置的過程層GOOSE及站控層CID、定值等工程級配置文件。
(5)升級測控裝置程序,并恢復(fù)備份的工程級配置,裝置運行正常后,核對軟件版本及定值。
(6)升級完畢后,投入測控裝置的所有SV和GOOSE接收軟壓板,檢查測控裝置的接收鏈路關(guān)系是否正常,若正常,則進行下一步。
(7)通過通信傳動功能與監(jiān)控后臺、遠動裝置核對信號。
(8)退出測控裝置的檢修硬壓板。
(9)投入測控裝置的所有GOOSE發(fā)送軟壓板,檢查其他運行設(shè)備相關(guān)鏈路、信號狀態(tài)正常后,恢復(fù)所有裝置運行。
隨著我國電網(wǎng)的飛速發(fā)展,智能變電站技術(shù)的不斷深入應(yīng)用,變電站內(nèi)站域信息資源的共享互通將成為智能變電站高級應(yīng)用的基礎(chǔ)。MMS網(wǎng)作為站控網(wǎng)絡(luò)的通信基礎(chǔ),其通信的可靠性、穩(wěn)定性將直接影響電網(wǎng)的運行維護、監(jiān)視控制、倒閘操作等。
本文從MMS網(wǎng)絡(luò)的通信模型和基本原理出發(fā),深入分析了一起典型的智能變電站MMS網(wǎng)絡(luò)通信異常案例,并提出了相應(yīng)的解決處理方法以及實際工作中需要注意的問題,為智能變電站MMS網(wǎng)絡(luò)日常維護和故障處理提供了參考與建議。