李鴻
摘要:本文通過對各種類型的計量自動化終端上行通信故障的診斷分析,探討如何幫助計量運維人員排查、處理因上行通信故障而造成計量自動化終端與主站無法正常通訊的現(xiàn)象,制定日常維護方案以保證終端上線率和減少故障率,介紹通過應(yīng)用故障排查方法,在日常維護中取得的成效。
關(guān)鍵詞:上行通信;故障;診斷;分析;應(yīng)用
引言
計量自動化終端與主站能否正常通訊的關(guān)鍵環(huán)節(jié)在于上行通信鏈路正常。由于計量自動化運維工作與通信知識密切相關(guān),針對部分計量運維人員對通信專業(yè)不了解的情況,無法排查調(diào)試過程中由于各種原因?qū)е陆K端無法與主站建立連接,造成調(diào)試工作的停滯,影響電能量數(shù)據(jù)的正常采集。本文通過深入分析各類終端上行通信故障,摸索總結(jié)出各類終端參數(shù)設(shè)置、通道故障排查、前置機排查的方法及分享經(jīng)驗和應(yīng)用成效。
1.計量自動化上行通信技術(shù)
目前可用于計量自動化終端與主站的遠(yuǎn)程通信技術(shù)主要有:PSTN電話撥號、4線音頻專線、數(shù)據(jù)網(wǎng)絡(luò)和GPRS/CDMA無線公網(wǎng)。其中負(fù)控終端、配變終端、低壓集抄(以下簡稱為無線公網(wǎng)終端)是采用GPRS/CDMA通信方式;廠站終端則采用電話線、專線、網(wǎng)線3種通信方式與主站通信。
2.計量自動化終端上行通信故障診斷分析
2.1無線公網(wǎng)終端通信故障分析
2.1.1無線公網(wǎng)終端撥號流程
GPRS(或CDMA)模塊初始化→開始撥號連接→撥號成功發(fā)送登陸幀→登陸成功→與主站正常通信。
2.1.2撥號故障分析
若終端撥號失敗,則說明終端尚未連接至無線運營商,需檢查SIM卡是否欠費、腐蝕或接觸不良、卡槽、模塊故障等;
若終端撥號成功,則說明終端已經(jīng)正常連接無線運營商基站或服務(wù)器,無線運營商基站或服務(wù)器至計量自動化主站的通道出現(xiàn)異常。
2.2廠站電能量采集終端通信故障分析
2.2.1上行通道故障:包括網(wǎng)絡(luò)通道、電話通道、四線專線通道故障。
2.2.2 設(shè)備故障:網(wǎng)卡、模塊、裝置故障等。
3.計量自動化終端上行通信故障排查方法
3.1 無線公網(wǎng)終端通信故障排查
3.1.1 檢查無線公網(wǎng)終端通信通道是否正常
所謂的公網(wǎng)終端通信通道也就是指無線通信運營商提供一條專給電力專網(wǎng)提供的數(shù)據(jù)專線,因此若出現(xiàn)無緣故大批量的終端掉線現(xiàn)象,則首先應(yīng)提供一批因這次故障而掉線的終端IP給通信運營商查找原因,分析到底是SIM卡數(shù)據(jù)未捆綁好需要重置數(shù)據(jù)還是因為通道故障需要處理。
3.1.2檢查終端參數(shù)設(shè)置是否不正確或未設(shè)置
(1)檢查APN設(shè)置:在新安裝或更換終端時,需在終端設(shè)置好APN(即登錄電力專網(wǎng)的身份通行證),沒有設(shè)置好(以湛江地區(qū)為例APN為ZJDLCB.GD)這個密碼,則所上傳的數(shù)據(jù)無法通過電力網(wǎng)關(guān)。
(2)檢查主站IP地址設(shè)置:需在終端設(shè)置好主站的服務(wù)器IP地址,(以湛江地區(qū)為例:負(fù)控服務(wù)器地址是192.168.2.30;配變是192.168.2.40),各類終端都有自己所屬的主站IP地址,否則數(shù)據(jù)無法到達(dá)指定的目的地。
(3)檢查通信協(xié)議及終端端口號(以湛江地區(qū)為例:TCP為5112、UDP為6112)。
3.2 廠站電能量采集終端通信故障排查
3.2.1 網(wǎng)絡(luò)通道故障排查
(1)檢查網(wǎng)絡(luò)連接情況(通過遠(yuǎn)程服務(wù)器ping交換機網(wǎng)關(guān)IP)。
(2)檢查裝置登錄情況(通過遠(yuǎn)程服務(wù)器ping終端IP,然后telnet終端)。
(3)通過終端調(diào)試軟件進行測試,(將網(wǎng)線接頭接入筆記本電腦,筆記本電腦的IP、端口號等設(shè)置與終端一致,通過模擬主站檢查能否遠(yuǎn)程鏈接到筆記本電腦上。)
(4)重啟終端(檢查有的終端是否處在死機狀態(tài))。
3.2.2電話通道故障排查
(1)使用手機撥通終端接入電話號碼,查看是否有moden音
(2)使用萬用表測量測量電話線電壓是否正常(直流50伏左右)
3.2.3 四線專線故障排查
(1)核對終端內(nèi)四線音頻專線MODEM 波特率、起止位、字節(jié)長度、校驗位與主站通信系統(tǒng)是否匹配。
(2)信號收發(fā)接線是否錯誤,局方四芯專線的發(fā)(TX)要接終端的收(RX),終端的發(fā)(TX)接局方的收(RX)如下圖3-1所示。
(3)檢查四芯專線上送頻率是否正確,四芯專線的中心頻率為1700Hz,頻偏:±400 Hz,發(fā)送“1”,頻率為1300Hz,發(fā)送“0”,頻率為2100Hz,可用萬用表測頻率是否為1(T+與T-間交流電壓約0.6V左右)。
(4)將四芯專線環(huán)測,主站發(fā)命令進行自發(fā)自收測試。
4.計量自動化主站設(shè)備故障排查方法
如下圖4-1所示為計量自動化系統(tǒng)數(shù)據(jù)傳遞流程,計量自動化終端將現(xiàn)場采集的電能量信息通過通訊模塊,經(jīng)由各種通信方式經(jīng)通道到達(dá)電力專用網(wǎng)絡(luò)登錄主站系統(tǒng)。這些數(shù)據(jù)首先經(jīng)過防火墻的安全認(rèn)證,投送目標(biāo)地址,這些數(shù)據(jù)包在經(jīng)過確認(rèn)安全之后再轉(zhuǎn)發(fā)給路由器,路由器對數(shù)據(jù)包的報文報頭進行解析,確定數(shù)據(jù)包交換機的轉(zhuǎn)發(fā)到達(dá)前置設(shè)備,前置設(shè)備對這些收到的數(shù)據(jù)進行解析和初步處理,再將處理后的數(shù)據(jù)發(fā)給主站服務(wù)器,再由主站進行后期處理和數(shù)據(jù)存儲等。其中交換機用來拓展網(wǎng)絡(luò)數(shù)量和劃分網(wǎng)絡(luò); 路由器主要起到網(wǎng)絡(luò)數(shù)據(jù)包的轉(zhuǎn)發(fā)和解析; 防火墻用來應(yīng)付整個網(wǎng)絡(luò)的攻擊。所以無論防火墻、路由器、交換機、前置機哪一環(huán)節(jié)出現(xiàn)問題,都會影響數(shù)據(jù)是否最后進入數(shù)據(jù)庫。通過多年來的運行維護統(tǒng)計,出現(xiàn)故障最多的還是在前置機是否正常工作、服務(wù)器的網(wǎng)絡(luò)連接是否正常這個環(huán)節(jié)。
4.1檢查是否為服務(wù)器無法啟動
主要原因為:①市電或電源線故障(斷電或接觸不良);②電源或電源模塊故障;③內(nèi)存故障(一般伴有報警聲);④CPU故障(一般也會有報警聲);⑤主板故障;⑥其它插卡造成中斷沖突。
4.2檢查系統(tǒng)是否頻繁重啟
主要原因為:①電源故障(替換法判斷解決);②內(nèi)存故障(可從BIOS錯誤報告中查出);③網(wǎng)絡(luò)端口數(shù)據(jù)流量過大(工作壓力過大);④軟件故障(更新或重裝操作系統(tǒng)解決)。
4.3檢查是否死機,進行前置機硬件和軟件檢查
4.4當(dāng)原硬盤壞了,檢查更換新硬盤時是否出現(xiàn)無法通過機器自檢現(xiàn)象
4.5將新的硬盤取下,檢查機器是否可以自檢通過
4.6檢查新增加的硬盤的ID號是否與原來的硬盤的ID號相同,如果硬盤的ID號相同的話,自檢將無法通過
5.終端本體或本體器件故障排查方法
無論是GPRS公網(wǎng)終端或廠站電能量采集終端,到現(xiàn)場首先第一步還是要檢查終端是否已死機,分析其故障原因.
5.1 看是否能夠重啟終端
5.2檢查GPRS模塊是否故障
5.3 檢查SIM卡或網(wǎng)線接口、網(wǎng)卡等其他模塊故障
6.基于計量自動化上行通信日常維護方案
人長時間工作,會出現(xiàn)勞損的現(xiàn)象,機器也不例外,所以需制定日常維護工作方案,做好日常維護工作,減少故障發(fā)生次數(shù)。
6.1做好前置機日常維護工作
前置設(shè)備是位于應(yīng)用系統(tǒng)服務(wù)器端(計量自動化系統(tǒng)主站)與客戶端之間的獨立處理設(shè)備,肩負(fù)數(shù)據(jù)格式轉(zhuǎn)換、連接管理、業(yè)務(wù)流管理外圍調(diào)度、外圍處理,報文認(rèn)證、個人密碼PIN變換、并把業(yè)務(wù)數(shù)據(jù)交后臺應(yīng)用服務(wù)系統(tǒng)處理等任務(wù)。因此,它是日常維護的一個核心部分。計量自動化班必須每天專人進行跟蹤檢查并做好日志記錄。
6.2做好通道的監(jiān)測維護工作
上行通道是終端數(shù)據(jù)的必經(jīng)之路,做好這方面的日常監(jiān)視維護工作至關(guān)重要。當(dāng)終端與主站無法正常連接可以首先考慮是否為通道的問題。如公網(wǎng)終端通道就與無線運營商聯(lián)系處理,廠站終端通道則采取通過遠(yuǎn)程服務(wù)器ping交換機網(wǎng)關(guān)IP, ping終端IP,然后telnet終端的方式。如果還是不通就到現(xiàn)場排查故障,如果是通道故障則需通知調(diào)通中心運維部門處理。
6.3 做好終端在線率監(jiān)測
每日做好終端在線監(jiān)測至關(guān)重要,將掉線的終端逐一篩選出來分析一遍,然后再進行主站故障排查、通道故障排查、終端本體故障及其他原因逐一排查。
6.3.1如果在線率與上日比較下降2%左右,查看停電終端是否有明顯增加,與各區(qū)縣局責(zé)任人聯(lián)系,核實是否存在線路停電或線路改造。
6.3.2由于通訊廠商業(yè)務(wù)升級導(dǎo)致在線下降。在計量自動化系統(tǒng)查看終端掉線清單,查看終端IP段屬于哪個通信運營商 (以湛江地區(qū)為例:192.168開頭是移動卡,192.169是電信卡,192.170是聯(lián)通卡)。掉線終端突然增多,聯(lián)系通訊廠商技術(shù)員查找原因。經(jīng)過多年的經(jīng)驗統(tǒng)計,移動主要是業(yè)務(wù)切換故障;聯(lián)通經(jīng)常為數(shù)據(jù)轉(zhuǎn)換器故障;電信常出現(xiàn)路由器故障。
6.3.3由于主站程序異常導(dǎo)致在線率不穩(wěn)定,突高突低,需檢查前置機運行程序。
6.3.4新安裝某終端廠家參數(shù)出廠問題導(dǎo)致在線率下降,應(yīng)去現(xiàn)場檢查故障終端,查看終端設(shè)置等情況。
6.3.5由于部分區(qū)域信號導(dǎo)致在線率下降或終端反復(fù)登陸主站。出現(xiàn)此類問,應(yīng)與通信運營商聯(lián)系。
7.故障排查應(yīng)用實例介紹
7.1 因公網(wǎng)終端上行通道故障導(dǎo)致批量掉線故障處理實例
2012年6月30日9點45分湛江計量自動化系統(tǒng)出現(xiàn)大批量終端掉線現(xiàn)象,其中配變終端掉線約3000臺,負(fù)控終端掉線約5000臺,共計約8000臺。由本人擔(dān)任工作負(fù)責(zé)人進行計量自動化緊急消缺處理。①首先排查前置機的運行狀態(tài):登陸管理員賬戶,核對系統(tǒng)應(yīng)用服務(wù)的運行情況,查驗是否有未知服務(wù)器開啟;查看所有管理員賬戶數(shù)量和賬戶ID,核對賬戶是否被修改或新添加的管理員賬戶,如有被修改或添加賬戶應(yīng)及時向賬戶持有人核對;檢查設(shè)備是否有新的服務(wù)端口開啟,如有新的端口開啟應(yīng)立即關(guān)閉,然后再核實新開端口的安全性;檢查有沒有病毒;檢查CPU性能好壞情況;檢查內(nèi)存是否滿足,確認(rèn)數(shù)據(jù)的存取空間是否滿足等。做完這些工作后,確認(rèn)前置機是正常工作的,服務(wù)器的網(wǎng)絡(luò)都是正常的,那就可以很肯定地排除了是前置設(shè)備異常導(dǎo)致的故障。②考慮到移動專線通道的問題,本人導(dǎo)出了所有掉線終端的IP地址發(fā)送給移動公司,并聯(lián)系移動公司工程師赴機房進行故障處理。6月30日11點15分,配合移動協(xié)維工程師檢查路由器,故障原因確診為RT互聯(lián)結(jié)構(gòu)2層改3層優(yōu)化實施時,廣州CR01/CR02與廣州RT01/RT02無法交互路由導(dǎo)致GZRT01/RT02下掛業(yè)務(wù)全阻和設(shè)備脫管,影響湛江局GPRS企業(yè)接入業(yè)務(wù)。協(xié)維工程師在兩臺CR上與RT所有互聯(lián)接口開啟OSPF點對點屬性,完成該節(jié)點工程優(yōu)化改造并檢查確認(rèn)業(yè)務(wù)正常。6月30日11點50分終端與主站上行通信恢復(fù)正常。
7.2應(yīng)用效果
在6月30日當(dāng)晚能及時排除和處理大批量掉線異?,F(xiàn)象,保證系統(tǒng)上線率正常,使7月1號抄表日數(shù)據(jù)采集、營銷收費不受故障影響。
8.結(jié)束語
本文通過多年來的工作經(jīng)驗,摸索分析了計量自動化各類型終端上行通信故障原因和總結(jié)出故障排查的各種方法,詳細(xì)描述了上行通信知識的原理,解決計量運維人員對通信專業(yè)不了解、無法排查終端與主站建立連接的故障現(xiàn)象,制定了日常維護工作方案以及達(dá)到持續(xù)提升終端上線率的實效。
參考文獻:
[1]肖勇,周尚禮,申妍華,伍少成.大規(guī)模大客戶負(fù)荷管理系統(tǒng)數(shù)據(jù)采集方案的研究.電測與儀表,2010,8
[2]肖勇,周尚禮.基于VxWorks實時嵌入式操作系統(tǒng)平臺的計量自動化遠(yuǎn)方監(jiān)控終端的設(shè)計.電測與儀表,2008,07
[3]關(guān)飛,吳小美,劉朝輝.基于GPRS通訊的配變監(jiān)測管理系統(tǒng).電測與儀表,2010,8
[4]肖勇,周尚禮,張新建,化振謙.電能計量自動化技術(shù).中國電力出版社,2011,11
[5]鐘仕超.惠州計量自動化系統(tǒng)的設(shè)計和應(yīng)用[J].中國高新技術(shù)企業(yè),2009,7