侯飆,韓書新,熊峰,薛風國,曲秉陽
(黑龍江省氣象數(shù)據(jù)中心,黑龍江哈爾濱150030)
新型自動站故障診斷系統(tǒng)的研究與設(shè)計
侯飆,韓書新,熊峰,薛風國,曲秉陽
(黑龍江省氣象數(shù)據(jù)中心,黑龍江哈爾濱150030)
隨著綜合氣象觀測業(yè)務(wù)現(xiàn)代化建設(shè)的飛速發(fā)展,第二代新型自動氣象站已經(jīng)在黑龍江省國家氣象站完成建設(shè)并投入業(yè)務(wù)運行,使地面自動觀測的數(shù)據(jù)密度、數(shù)據(jù)質(zhì)量和系統(tǒng)的穩(wěn)定性都有顯著提高。但由于新型自動氣象站觀測頻率的加大,使觀測數(shù)據(jù)呈指數(shù)增長,這對于通過分析探測數(shù)據(jù)質(zhì)量的方式診斷自動站氣象故障是一種嚴峻的考驗?,F(xiàn)在應(yīng)用的故障診斷系統(tǒng)是采用數(shù)據(jù)集中式處理方式,對系統(tǒng)的運算能力要求很高,而且數(shù)據(jù)在采集傳輸過程中容易造成數(shù)據(jù)缺失和數(shù)據(jù)錯誤,數(shù)據(jù)處理時間較長,影響故障診斷時效?;谶@種現(xiàn)狀,提出一種基于分布式數(shù)據(jù)處理技術(shù)的新型自動氣象站故障診斷系統(tǒng),在臺站完成新型自動氣象站的數(shù)據(jù)監(jiān)控和故障診斷,將故障診斷結(jié)果上傳至中心站,避免了數(shù)據(jù)集中處理和報文大量傳輸?shù)倪^程。通過該系統(tǒng)的設(shè)計可以提高新型自動站故障診斷的時效,對提升自動氣象站保障能力有很重要作用。
新型自動氣象站采用了當今成熟、穩(wěn)定和先進的電子測量、數(shù)據(jù)傳輸和控制系統(tǒng)技術(shù),基于總線技術(shù)和嵌入式系統(tǒng)技術(shù),實現(xiàn)了地面氣象觀測全要素自動觀測,具有高精度、高穩(wěn)定、易維護、低功耗、易擴展和實時遠程監(jiān)控的能力。整套系統(tǒng)按照“主采集器+外部總線+分采集器+傳感器+外圍設(shè)備”的設(shè)計結(jié)構(gòu),對主/分采集器、總線結(jié)構(gòu)、傳感器、外圍設(shè)備、軟件、現(xiàn)場標校設(shè)備的各個部分,從功能、結(jié)構(gòu)、通訊協(xié)議、數(shù)據(jù)采集、數(shù)據(jù)計算處理、數(shù)據(jù)存儲、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)傳輸、電氣接口標準、生產(chǎn)工藝等制定了嚴格規(guī)定[1]。
目前,新型自動氣象站故障的判斷是基于ASOM 2.0綜合氣象觀測系統(tǒng)運行監(jiān)控平臺[2],其核心是以探測數(shù)據(jù)的可用性來判斷設(shè)備的運行狀況。探測數(shù)據(jù)從臺站采集以后通過內(nèi)網(wǎng)傳送到省級服務(wù)器端,監(jiān)控平臺對獲得的數(shù)據(jù)內(nèi)部一致性、時間一致性、空間一致性以及氣候極值檢查,得到數(shù)據(jù)判定結(jié)果,最終形成全省所有自動氣象站當前時次的運行狀況,形成運行狀況序列圖和狀態(tài)圖等產(chǎn)品。但由于探測數(shù)據(jù)要通過全省各地的臺站上傳到省級服務(wù)器,數(shù)據(jù)鏈路層較多,出現(xiàn)數(shù)據(jù)錯誤或無法上傳數(shù)據(jù)的情況時有發(fā)生。例如臺站發(fā)生網(wǎng)絡(luò)通信故障,探測數(shù)據(jù)不能上傳至省級,而自動站設(shè)備運行正常,但監(jiān)控平臺會診斷自動氣象站出現(xiàn)故障,這與實際情況嚴重不符,不能真實反饋自動站運行情況。
通過對目前設(shè)備運行監(jiān)控和故障診斷方法的分析,現(xiàn)提出一種分布式數(shù)據(jù)處理方案。相對于目前應(yīng)用的自動站故障診斷方法主要有兩點創(chuàng)新:
(1)目前新型自動站的監(jiān)控和故障診斷,是通過對自動站報文的解析來完成,對解析的報文進行數(shù)據(jù)質(zhì)量控制,以報文中探測要素數(shù)據(jù)的可用性來衡量自動站的運行情況。這種方法是因為老型自動站將很多狀態(tài)文件封裝在內(nèi)部,沒有相關(guān)的通信協(xié)議、接口的波特率讀取老型自動站的狀態(tài)文件,使得老型自動站的監(jiān)控和故障診斷都基于對觀測數(shù)據(jù)的質(zhì)量控制方法上。
新型自動站在運行的過程中可以通過RS232接口與采集器直接通信,通信過程中有很多指令可以讀取采集器實時工作的狀態(tài),許多狀態(tài)文件直接反應(yīng)了自動氣象站運行過程中設(shè)備的運行狀態(tài),而不需要通過自動站的采集數(shù)據(jù)來判斷設(shè)備的狀態(tài),可以縮減監(jiān)控的步驟,這種方式也更加直接,準確度更高。
(2)綜合氣象觀測系統(tǒng)運行監(jiān)控平臺采取對全省自動氣象站的探測數(shù)據(jù)文件進行統(tǒng)計分析,得出全省自動氣象站的運行狀況。這種集中處理報文數(shù)據(jù)文件的方式,可以利用探測數(shù)據(jù)空間一致性的法則。但是,由于臺站在數(shù)據(jù)采集、封裝、傳輸、解碼等相關(guān)過程中,容易出現(xiàn)數(shù)據(jù)的缺失和損耗,而且數(shù)據(jù)在收集過程中要經(jīng)過很多鏈路,實時性較差。如果數(shù)據(jù)傳輸?shù)逆溌钒l(fā)生故障,同樣被判斷為自動站處于故障狀態(tài),不能客觀反映自動站的運行狀況。另外,數(shù)據(jù)集中處理對系統(tǒng)計算能力要求很高。
采用分布式數(shù)據(jù)處理的方案[3],在臺站安裝故障診斷軟件,實時對新型自動站的運行狀態(tài)進行監(jiān)控,如發(fā)生設(shè)備運行狀態(tài)異常,對自動站的故障類型進行判定,將判定的結(jié)果反饋至省級監(jiān)控部門和保障科室,同時通知臺站儀器設(shè)備管理員,讓相關(guān)業(yè)務(wù)人員在第一時間發(fā)現(xiàn)設(shè)備異常,在最短的時間對故障設(shè)備進行維護維修,能夠縮短故障排除時間,提高保障時效。分布式數(shù)據(jù)處理可以簡化數(shù)據(jù)處理流程,多線程同時完成故障診斷任務(wù),省級部門只負責接收故障診斷的結(jié)果,具有站點故障診斷自治性和邏輯整體性的特點。
5.1 技術(shù)路線
對于設(shè)備故障判斷的方式主要以探測設(shè)備的運行狀態(tài)文件為依據(jù),此方法可以作為監(jiān)控平臺的補充。在新型自動站的主采集器配置了一個RS232調(diào)試串口,使用串口調(diào)試線連接主采集器調(diào)試串口和PC機的RS232串口,設(shè)置相關(guān)串口通信參數(shù)即可實現(xiàn)PC機和主采集器通訊。然后在PC機上編寫相應(yīng)的應(yīng)用軟件,通過軟件定時向采集器發(fā)送命令來讀取主采集器和各個分采集器的工作狀態(tài)信息,如有自動站工作狀態(tài)異常,可通過短信發(fā)送模塊來提醒臺站值班員和省級保障人員,可以在第一時間發(fā)現(xiàn)故障并完成故障的診斷和處理。
軟件采用Client/Server(客戶機/服務(wù)器)結(jié)構(gòu)[4,5],通過將任務(wù)合理分配到臺站端和省級服務(wù)器端,降低了系統(tǒng)的通訊開銷,提高了整體的運行速度。故障診斷軟件采用C#面向?qū)ο笳Z言編寫,源代碼的可移植性強,適合編寫串口操作應(yīng)用程序,尤其是這種特定應(yīng)用的小型系統(tǒng)。
臺站端和服務(wù)器端的程序不同,數(shù)據(jù)的處理主要在客戶端,實現(xiàn)數(shù)據(jù)的分布式處理。省級服務(wù)器端主要提供數(shù)據(jù)管理、數(shù)據(jù)共享、數(shù)據(jù)及系統(tǒng)維護和并發(fā)控制等。臺站端程序主要完成故障診斷的具體的任務(wù),針對采集器返回的狀態(tài)值來判斷設(shè)備運行情況,如發(fā)生設(shè)備運行異常,將故障診斷結(jié)果反饋至省級服務(wù)器端。同時,可以向相應(yīng)的保障人員發(fā)送報警短信,短信內(nèi)容為相應(yīng)故障部件信息。省級服務(wù)器端設(shè)計相應(yīng)的狀態(tài)圖,利用地理信息系統(tǒng)來顯示全省自動氣象站的運行狀態(tài),每一個站點為坐標的坐標按鈕,按鈕默認狀態(tài)為綠色,綠色為某臺站設(shè)備運行正常,如某臺站端診斷出采集器有故障,臺站端應(yīng)用程序可以將診斷結(jié)果發(fā)送至省級服務(wù)器端,省級服務(wù)器端將顯示某臺站氣象站發(fā)生故障。
5.2 程序設(shè)計
故障診斷軟件與新型自動氣象站通信的過程中,主要通過對采集器定時發(fā)送串口指令,通過返回的狀態(tài)值來判定設(shè)備的運行情況。以讀取數(shù)據(jù)采集器電源電壓為例,在通信過程中,向采集器發(fā)送(PSS)指令,若數(shù)據(jù)采集器為蓄電池供電,其電壓值為12.8 V,正確返回值為<DC,12.8>,如果采集器返回的電壓值與這個值偏差較大,故障診斷軟件則判斷蓄電池電壓異常,接下來執(zhí)行報警程序,以短信形式通知相關(guān)業(yè)務(wù)人員。同樣,當故障診斷軟件向主采集器發(fā)送讀取主采集器工作狀態(tài)(STATMAIN)指令時,主采集器會返回主采集器運行狀態(tài),其中主要包括:主采集器主板溫度、主采集器AD模塊工作狀態(tài)、主采集器計數(shù)器模塊狀態(tài)、主采集器CF卡狀態(tài)、主采集器GPS狀態(tài)、主采集器門開關(guān)狀態(tài)、主采集器LAN狀態(tài)、主采集器RS232/RS485終端通信狀態(tài)、CAN總線狀態(tài)等,通過這些返回值來對采集器進行判定,可以更加直觀的了解設(shè)備的運行狀態(tài),避免了復(fù)雜的數(shù)據(jù)挖掘分析,直接通過物理量的變化進行結(jié)果判斷,可以更加直觀的反應(yīng)新型站的運行狀態(tài),判定結(jié)果穩(wěn)定可靠。
本文所設(shè)計的新型自動站故障診斷系統(tǒng),實現(xiàn)了通過自動氣象站的狀態(tài)文件來判斷自動站的運行狀況,填補只能通過報文解析來判斷設(shè)備運行狀態(tài)的空白。
同時增加了一種新的分布式數(shù)據(jù)處理方式,降低了數(shù)據(jù)集中處理的復(fù)雜性,簡化了整個監(jiān)控和故障診斷的流程,去除了系統(tǒng)的冗余度,縮短了發(fā)現(xiàn)故障的時間,提高了設(shè)備監(jiān)控和故障診斷的時效性,使新型自動站保障工作的反應(yīng)速度加快。通過該軟件的應(yīng)用,維護維修人員可以在第一時間了解自動站設(shè)備的運行情況,如有設(shè)備發(fā)生故障,保障人員可以在最短的時間了解設(shè)備故障的類型,根據(jù)故障類型制定相應(yīng)的維修方案,這樣就可以及時的解決故障,讓保障工作可以更加高效。
[1]陳冬冬,楊志彪,施麗娟,張鑫,韓承松.新型自動氣象站結(jié)構(gòu)特點及其優(yōu)越性[J].氣象水文海洋儀器.2011, (4):93-99.
[2]姜小云,吳俞,李靜.ASOM二次監(jiān)控平臺設(shè)計[J].氣象科技.2013,41(3):480-483.
[3]謝立,孫鐘秀.分布式數(shù)據(jù)處理[M].北京:國防工業(yè)出版社.1990.
[4]趙念強,邢桂芬,宋順林.CLIENT/SERVER結(jié)構(gòu)在農(nóng)電管理系統(tǒng)中的應(yīng)用[J].江蘇大學(xué)學(xué)報.1999, (6):65-68.
[5]章慧,王留洋,俞楊信.淺談Client/Server體系結(jié)構(gòu)及發(fā)展[J].淮陰工學(xué)院學(xué)報.2001,10(4):13-15.
1002-252X(2017)02-0028-02
2017-3-1
侯飆(1982-),男,黑龍江省哈爾濱市人,哈爾濱工程大學(xué),碩士生,工程師.