陳德林
(海南核電有限公司,海南昌江 572733)
昌江核電廠集散控制系統(tǒng)(DCS,Distributed Control System)采用的FOX-BORO 公司的I/A 系統(tǒng),為電廠過程控制層,其他控制系統(tǒng)通過網(wǎng)絡(luò)與DCS 進(jìn)行信息傳送,并將其他系統(tǒng)控制、監(jiān)視參數(shù)通過DCS 傳送至主控室。汽輪機(jī)數(shù)字電液調(diào)節(jié)系統(tǒng)(DEH,Digital Electronic Hydraulic Control)采用艾默生公司的Ovation 系統(tǒng),主要用于汽輪機(jī)的控制、保護(hù)及監(jiān)測。DEH 與DCS 通信正常與否對汽輪機(jī)正常運(yùn)行有直接影響,在機(jī)組安全穩(wěn)定運(yùn)行過程中具有重要意義。
DEH 與DCS 之間的通信故障頻繁發(fā)生,直接影響操作員對汽輪機(jī)相關(guān)系統(tǒng)的監(jiān)視及控制,進(jìn)而影響機(jī)組安全穩(wěn)定運(yùn)行。為滿足操作員能實(shí)時(shí)、準(zhǔn)確、可靠地對汽輪發(fā)電機(jī)的監(jiān)測、控制和操作,DEH 與DCS 之間存在大量的數(shù)據(jù)通信。因此,確保DEH 和DCS 之間網(wǎng)絡(luò)通信、數(shù)據(jù)收發(fā)暢通尤為重要?;诓穗姀SDEH 與DCS 系統(tǒng)之間存在的通信故障問題,研究如何準(zhǔn)確定位DEH 與DCS 通信故障癥結(jié)及制定相應(yīng)的處理方案。
DCS 通信部件主要包括FBM233(DCS 的通信卡件)和G427UC(DCS 通信控制器)。DCS 內(nèi)部通信采用容錯(cuò)機(jī)制實(shí)現(xiàn),I/A Series 系統(tǒng)Mesh 網(wǎng)絡(luò)采用冗余機(jī)制,通過冗余線連接實(shí)現(xiàn)數(shù)據(jù)同步。當(dāng)控制指令下達(dá)時(shí),由服務(wù)器發(fā)給主控制站,主控制站通過冗余線將指令傳送給從控制站,主從控制站進(jìn)行數(shù)據(jù)同步、同時(shí)分別輸出。接收第三方數(shù)據(jù)時(shí),只有主站數(shù)據(jù)上傳進(jìn)行運(yùn)算,從站數(shù)據(jù)不上傳、不參與邏輯運(yùn)算(僅作內(nèi)部主從站之間的數(shù)據(jù)同步、運(yùn)算)。兩個(gè)控制站一個(gè)為主站時(shí),另一個(gè)默認(rèn)為從站。
DEH 通信部分主要包括DROP(DEH 的控制器,相當(dāng)于DEH 的大腦)、ELC(以太網(wǎng)連接控制器,DEH 的通信卡,通過該卡件對通信數(shù)據(jù)進(jìn)行解析及傳輸)。DEH 與DCS 通信建立是通過以太網(wǎng)連接實(shí)現(xiàn),DEH 與DCS 通信原理如圖1 所示。
圖1 DEH 與DCS 通信原理
根據(jù)TCP/IP 網(wǎng)絡(luò)協(xié)議,通過以太數(shù)據(jù)網(wǎng)實(shí)現(xiàn)DCS 側(cè)控制站與Ovation 系統(tǒng)服務(wù)端被控側(cè)之間的通信,兩者相互進(jìn)行數(shù)據(jù)收發(fā)。由于DCS 側(cè)控制站與Ovation 系統(tǒng)服務(wù)端被控側(cè)都使用固定的端口號,因此每一個(gè)TCP 地址由一個(gè)IP 地址和一個(gè)端口號組成,確保數(shù)據(jù)傳送的正確性、可靠性、唯一性。
昌江核電廠1#、2#機(jī)組DEH 與DCS 通信故障頻繁發(fā)生,故障出現(xiàn)時(shí)主控畫面汽輪機(jī)相關(guān)的參數(shù)全部顯示為0 或是保持某一數(shù)值不變,嚴(yán)重影響操縱員對汽輪機(jī)實(shí)時(shí)狀態(tài)的監(jiān)視、控制,儀控人員經(jīng)常被主控On Call 去現(xiàn)場緊急處理通信故障問題。
收集某年5—10 月昌江核電廠1#、2#機(jī)組DEH 與DCS 通信故障總次數(shù)31 次,平均每月故障次數(shù)5.2 次。
為了找出通信故障根源所在,對收集數(shù)據(jù)采用分層法進(jìn)一步分析。分別從電源波動(dòng)、通信設(shè)備離線、控制器死機(jī)等方面進(jìn)行分析。結(jié)果表明DEH 與DCS 之間通信故障主要出現(xiàn)在通信設(shè)備離線上,占比高達(dá)87.1%,因此認(rèn)為DEH 與DCS 通信故障次數(shù)高的癥結(jié)在于通信設(shè)備離線。
針對DEH 與DCS 通信故障癥結(jié)在于通信設(shè)備離線,從人、機(jī)、料、法、環(huán)等方面進(jìn)行剖析,采用頭腦風(fēng)暴法,找到影響癥結(jié)的12 個(gè)末端因素,并繪制出因果分析圖,因果分析如圖2 所示。
圖2 因果分析
根據(jù)因果分析圖,通過現(xiàn)場測量、試驗(yàn)、論證對比及調(diào)查分析等方式,針對影響通信設(shè)備離線的12 個(gè)末端因素進(jìn)行逐條驗(yàn)證和確認(rèn)。
(1)安裝人員不按圖紙安裝。根據(jù)設(shè)計(jì)圖紙的安裝要求對現(xiàn)場DCS 機(jī)柜內(nèi)安裝情況進(jìn)行檢查,發(fā)現(xiàn)柜內(nèi)的卡件、接線端口、布線要求等與設(shè)計(jì)圖紙一致,安裝正確。因此,判斷該因素為非要因。
(2)通信點(diǎn)名設(shè)置不正確。組織儀控人員對DCS 所有通信點(diǎn)名進(jìn)行檢查,核實(shí)確認(rèn)現(xiàn)場所有的通信點(diǎn)名不存在設(shè)置不正確的情況。因此,判斷該因素為非要因。
(3)FBM233 軟件版本低?,F(xiàn)場檢查,F(xiàn)BM233 當(dāng)前軟件版本為1.32/0304 版本,而最新版本為1.36.4/0420 版本。對FBM233兩個(gè)軟件版本進(jìn)行試驗(yàn)發(fā)現(xiàn)最新版本軟件在通信性能優(yōu)勢更明顯、通信設(shè)備離線次數(shù)更少。試驗(yàn)結(jié)果表明,軟件版本的高低對癥結(jié)影響大,因此,判斷該因素為要因。
(4)掃描周期設(shè)置錯(cuò)誤。授權(quán)人員進(jìn)入ICC 組態(tài)軟件中,檢查通信掃描周期的參數(shù)值為0.5 s,同步對比其他第三方通信正常的系統(tǒng)其掃描周期均為0.5 s、同時(shí)廠家答復(fù)掃描周期設(shè)置
(5)超時(shí)時(shí)間短。授權(quán)人員檢查通信故障系統(tǒng)超時(shí)時(shí)間參數(shù)(T0)設(shè)置為默認(rèn)值0.5 s,并檢查其他三方通信正常的系統(tǒng)其超時(shí)時(shí)間參數(shù)值在2~3 s。因此懷疑通信設(shè)備離線與超時(shí)時(shí)間短有關(guān)。通過查閱資料、調(diào)研同行電廠、選取僅超時(shí)時(shí)間設(shè)置不同的通信設(shè)備進(jìn)行試驗(yàn)。試驗(yàn)結(jié)果表明,超時(shí)時(shí)間設(shè)置長短對通信設(shè)備離線次數(shù)有影響,當(dāng)超時(shí)時(shí)間設(shè)置越短時(shí),通信設(shè)備離線次數(shù)越多。因此,判斷該因素為要因。
(6)FBM233 故障。通過總結(jié)已往通信故障現(xiàn)象、經(jīng)驗(yàn)反饋,發(fā)現(xiàn)當(dāng)FBM233 出現(xiàn)故障時(shí)通信故障次數(shù)明顯增多。FBM233是DCS 側(cè)通信卡件,冗余配置。根據(jù)現(xiàn)象猜想:FBM233 故障對通信設(shè)備離線有影響。通過試驗(yàn)發(fā)現(xiàn)當(dāng)其中一個(gè)FBM233 出現(xiàn)故障時(shí),通信設(shè)備離線次數(shù)高達(dá)6.7 次/月,明顯高于兩個(gè)FBM233 無故障時(shí)的1.5 次/月。因此,判斷該因素為要因。
(7)FBM233 使用年限超期。經(jīng)檢查發(fā)現(xiàn)目前現(xiàn)場使用于DEH 與DCS 通信卡件FBM233 出廠時(shí)間分別2016 年10 月15日和2017 年01 月15 日,而該設(shè)備使用壽命一般為10 年,不存在FBM233 使用年限超期問題。因此,判斷該因素為非要因。
(8)FBM233 插針斷裂。對目前現(xiàn)場使用于DEH 與DCS 通信的兩塊FBM233 卡件進(jìn)行檢查,經(jīng)工作負(fù)責(zé)人、監(jiān)護(hù)人、QC 人員三方共同確認(rèn)。FBM233 插針未有斷裂現(xiàn)象,所有插針均完好無損。因此,判斷該因素為非要因。
(9)文件要求的FBM233 版本錯(cuò)誤。FBM233 廠家(FOXBORO)提供的用戶指南中要求FBM233 版本為最新版本,滿足技術(shù)規(guī)格書要求。因此,判斷該因素為非要因。
(10)DCS 通信機(jī)柜圖紙錯(cuò)誤。經(jīng)核實(shí),DCS 通信機(jī)柜圖紙均為最新版本D 版。同時(shí)對比電廠RGL(棒控棒位系統(tǒng))、其他第三方與DCS 通信的DCS 機(jī)柜圖紙,未發(fā)現(xiàn)DEH 與DCS 通信機(jī)柜圖紙錯(cuò)誤的情況,且其他第三方設(shè)備與DCS 通信未出現(xiàn)通信故障的情況。因此,判斷該因素為非要因。
(11)DCS 通信機(jī)柜溫度高。對現(xiàn)場DCS 通信機(jī)柜溫度實(shí)時(shí)測量,對一年內(nèi)通信機(jī)柜溫度測量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。結(jié)果表明,DCS 通信機(jī)柜環(huán)境溫度平均值、最高值、最低值均在5~35 ℃,均滿足通信機(jī)柜所要求的溫度(正常溫度范圍內(nèi)(5~35 ℃)規(guī)定。因此,判斷該因素為非要因。
(12)DCS 通信機(jī)柜濕度高。對現(xiàn)場DCS 通信機(jī)柜濕度實(shí)時(shí)測量,對一年內(nèi)通信機(jī)柜濕度測量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。結(jié)果表明,DCS 通信機(jī)柜環(huán)境濕度平均值、最高值、最低值均在45%~65%,均滿足通濕機(jī)柜所要求的濕度(正常濕度范圍內(nèi)(45%~65%)規(guī)定。因此,判斷該因素為非要因。
通過逐條要因驗(yàn)證確認(rèn),最終確定影響DCS 與DEH 通信設(shè)備離線故障要因有3 個(gè):①FBM233 軟件版本低;②超時(shí)時(shí)間短;③FBM233 故障報(bào)警。
(1)針對FBM233 軟件版本低:①先跟廠家溝通明確FBM233軟件對版本規(guī)定,做好版本升級前的工作準(zhǔn)備;②現(xiàn)場實(shí)施FBM233 軟件升級操作;③確認(rèn)已將FBM233 軟件升級到目標(biāo)版本;③跟蹤觀察軟件升級后通信故障次數(shù)是否減少。
(2)針對超時(shí)時(shí)間短。根據(jù)要求:超時(shí)時(shí)間設(shè)置需兼顧靈敏度(指通信出現(xiàn)故障時(shí),系統(tǒng)判斷故障的快速性、準(zhǔn)確性、穩(wěn)定性)。①通過試驗(yàn)發(fā)現(xiàn)靈敏度、超時(shí)時(shí)間、通信故障次數(shù)三者之間的內(nèi)在聯(lián)系;②綜合評估超時(shí)時(shí)間、靈敏度、通信故障次數(shù)三者關(guān)系,選擇最優(yōu)值超時(shí)時(shí)間數(shù)值;③現(xiàn)場實(shí)施超時(shí)時(shí)間參數(shù)修正;④跟蹤觀察超時(shí)時(shí)間參數(shù)修正后通信故障次數(shù)是否減少。
(3)針對FBM233 故障報(bào)警。通常消除FBM233 故障報(bào)警的方法有:①硬件重啟;②軟件重啟;③卡件更換。通過對三個(gè)要因的對策實(shí)施,昌江核電1#、2#機(jī)組DEH 與DCS 通信故障次數(shù)大幅度降低,達(dá)到≤1 次/月。提高設(shè)備運(yùn)行的可靠性,避免操縱員監(jiān)視畫面頻繁出現(xiàn)故障報(bào)警,減輕操縱員的壓力,為機(jī)組安全穩(wěn)定運(yùn)行提供有力支持。
為滿足操縱員能實(shí)時(shí)、準(zhǔn)確、可靠地對汽輪發(fā)電機(jī)的監(jiān)測、控制和操作,保障DEH 與DCS 之間大量的數(shù)據(jù)通信,因此,確保DEH 和DCS 之間網(wǎng)絡(luò)通信、數(shù)據(jù)收發(fā)暢通,就顯得尤為重要?;诓穗婍?xiàng)目,就Ovation 汽輪機(jī)保護(hù)控制系統(tǒng)與DCS系統(tǒng)通信故障次數(shù)高問題開展研究,對影響通信故障因素進(jìn)行要因驗(yàn)證及確認(rèn),根據(jù)要因癥結(jié)制定處理方案。