張艷飛,郭 洋,孫云飛
(內蒙古電力科學研究院,內蒙古 呼和浩特 010020)
火電機組金屬設備信息涵蓋設備制造、安裝、運行、檢修、壽命評估等過程[1-2]。金屬設備信息檢索系統(tǒng)在生命周期的不同階段均產生和積累大量的數(shù)據(jù),并具有來源渠道多、數(shù)據(jù)類型復雜、數(shù)據(jù)管理分散等特點,降低了數(shù)據(jù)的有效利用率,不利于設備安全性能監(jiān)督和設備可靠性評價工作的開展。不同型號和容量的火電機組,金屬設備信息檢索系統(tǒng)設備經常發(fā)生同類型模式的失效[3-5]。目前,采取信息化手段進行金屬監(jiān)督管理的研究和應用,主要針對某一個機組或者某類型部件,主要目的是實現(xiàn)本廠監(jiān)督設備的信息管理、檢修臺賬管理、高溫部件壽命評估和預測、機爐外管道管理等[6-7],未能提供多個電廠、多個機組和設備之間的交叉關聯(lián)和檢索、對比功能。
綜上,開發(fā)了金屬設備信息檢索系統(tǒng)。該系統(tǒng)面向技術監(jiān)督和技術服務,以金屬監(jiān)督設備信息為核心形成分布式架構,涵蓋了56個火電廠的120余臺機組金屬監(jiān)督設備生命周期內各階段的基本資料、監(jiān)督數(shù)據(jù)、檢測數(shù)據(jù)、失效數(shù)據(jù)等,通過云計算和云服務器實現(xiàn)數(shù)據(jù)管理和檢索。
金屬設備信息檢索系統(tǒng)采用Browser和Server分離的分布式結構,Browser端采用Face Book的React技術開發(fā),Server端采用目前安全性能高,擴展性好,框架技術最為完善的JAVA語言作為系統(tǒng)開發(fā)的語言。采用Spring框架技術,使系統(tǒng)能夠分層開發(fā),各層之間邏輯分明,層與層之間提供接口方式實現(xiàn)業(yè)務和數(shù)據(jù)的通信,使得系統(tǒng)具有極強的擴展性?;诮M件技術,力求將變化封裝在組件內部。
獨立的全文檢索系統(tǒng),基于Lucene技術開發(fā),可以為分布式客戶端提供服務,實現(xiàn)設備信息通過全文檢索或者關鍵詞檢索方式快速獲得目標數(shù)據(jù)。系統(tǒng)計算由云端服務器提供,數(shù)據(jù)存儲由云端數(shù)據(jù)庫提供。
金屬設備信息檢索系統(tǒng)架構見圖1。
按照檢索類型,電廠金屬設備信息檢索系統(tǒng)數(shù)據(jù)分為結構化數(shù)據(jù)和非結構化數(shù)據(jù)。結構化數(shù)據(jù)指具有固定格式或有限長度的數(shù)據(jù),如設備編碼。非結構化數(shù)據(jù)指不定長或無固定格式的數(shù)據(jù),如郵件和word文檔等。一般稱非結構化數(shù)據(jù)為全文數(shù)據(jù)。
1.2.1 全文檢索原理
對非結構化數(shù)據(jù)即全文數(shù)據(jù)的搜索主要有2種方法:一種是順序掃描法(Serial Scanning),對每個文檔依次掃描,直到選取出包含字符串的文檔,該方法速度較慢;另一種方法是將非結構化數(shù)據(jù)中的一部分信息提取出來,重新組織,使其變得有一定結構,然后對此有一定結構的數(shù)據(jù)進行搜索,從而達到搜索相對較快的目的。從非結構化數(shù)據(jù)中提取出重新組織的信息為索引,這種先建立索引再對索引進行搜索的過程為全文檢索。
全文檢索中,計算機索引程序對文檔中的每個詞進行掃描,并對其建立索引,指明該詞在文檔中出現(xiàn)的次數(shù)和位置,將這些信息保存在索引文件中。當用戶查詢時,檢索程序根據(jù)用戶輸入的檢索關鍵詞對已建立的索引文件進行搜索,然后將搜索結果返回給用戶。全文檢索包括索引過程和搜索過程。索引過程是將監(jiān)督設備的所有結構化和非結構化數(shù)據(jù)提出信息,創(chuàng)建索引的過程;搜索過程是得到用戶的查詢請求,搜索創(chuàng)建的索引,然后返回結果的過程。金屬設備信息檢索系統(tǒng)通過云計算和CDN技術快速實現(xiàn)后臺分詞、建立索引庫,并將結果返回用戶。
1.2.2 Lucene技術檢索過程
Lucene是用Java編寫的全文檢索引擎工具包,可以方便地嵌入到各種應用中,實現(xiàn)針對應用的全文索引/檢索功能。Lucene有兩個主要的服務:索引和檢索,兩者任務是相互獨立的。Lucene提供了豐富的API,可以方便地與存儲在索引中的信息交互,但其并不是完整的全文檢索應用,而是為應用程序提供索引和搜索功能。若想讓Lucene真正起作用,還需在其基礎上做一些必要的二次開發(fā),即實現(xiàn)本文所述設備數(shù)據(jù)和信息檢索,需要進行二次開發(fā)。開發(fā)中主要使用Lucene源碼中的7個子包,每個包完成特定的功能,具體如表1所示。
表1 Lucene源碼包對應功能表
Lucene全文檢索過程如圖2所示。1)創(chuàng)建文檔對象。為每個文件創(chuàng)建對應的Document對象,把文件的屬性都保存到Document對象中;為每個屬性創(chuàng)建一個Field(lucene中為域),把Field添加到文檔對象中;每個Document都有一個唯一的編號。2)分析文檔。針對Document中的域進行分析,例如分析文件名、文件內容兩個域,先把文件內容域中的字符串根據(jù)空格進行分詞,把單詞統(tǒng)一轉換成小寫;沒有意義的單詞為停用詞,把停用詞從詞匯列表中去掉,并去掉標點符號;最終得到一個關鍵詞列表,每個關鍵詞為一個Term,Term中包含關鍵詞及其所在的域,不同的域中相同的單詞是不同的Term。3)創(chuàng)建索引。創(chuàng)建索引是對語匯單元索引,通過詞語找文檔。索引的目的是為了搜索,最終要實現(xiàn)只搜索被索引的語匯單元從而找到Document。
圖2 Lucene技術的全文檢索過程
金屬設備信息檢索系統(tǒng)功能框架如圖3所示。
金屬設備信息檢索系統(tǒng)主要功能:1)監(jiān)督管理。實現(xiàn)技術監(jiān)督報表管理,技術監(jiān)督和服務報告管理,機組和設備基礎信息管理;根據(jù)不同用戶權限,實現(xiàn)對權限范圍內設備信息管理、報告管理和相應設備資料、報告調閱、維護等;提供火電,新能源,電網領域金屬相關規(guī)程標準的更新和查閱功能。2)設備管理。對設備進行縱向管理。3)業(yè)務管理。對設備基礎信息和生命周期各階段數(shù)據(jù)進行管理;同時提供了學習園地、規(guī)程標準和公告管理,主要用于技術交流和標準查詢。4)系統(tǒng)管理。數(shù)據(jù)安全管理,用戶賬號和權限、角色管理。
金屬設備信息檢索系統(tǒng)數(shù)據(jù)記錄、數(shù)據(jù)處理和數(shù)據(jù)檢索、分析均在云端進行,用戶登錄網站:http:∥www.nmjsjd.cn,在管理員分配的權限范圍內進行開展檢索和對比操作。
系統(tǒng)管理。用戶角色分為系統(tǒng)管理員 (系統(tǒng)維護、權限管理),監(jiān)督人員(可檢索全部火電機組設備信息),電廠專工(在本廠范圍內管理和使用設備信息)。數(shù)據(jù)安全管理采取了國內成熟的騰訊云數(shù)據(jù)庫管理平臺,并采取分層模塊開發(fā)技術,確保數(shù)據(jù)的安全性。
設備管理。設備信息管理包括設備所屬組織管理、機組管理、設備信息管理。其中機組的信息是和組織關聯(lián),每一個電廠都需要建立自己的機組,設備按照組織和機組號進行關聯(lián)。機組管理界面如圖4。設備數(shù)據(jù)錄入界面如圖5所示。設備數(shù)據(jù)不區(qū)分結構數(shù)據(jù)和非結構數(shù)據(jù),批量上傳至云端數(shù)據(jù)庫,由系統(tǒng)后臺調用分詞模塊,對設備數(shù)據(jù)進行處理,建立檢索索引庫。
監(jiān)督管理。監(jiān)督管理對象為監(jiān)督報告,監(jiān)督報表,設備資料。
設備資料為設備在各個階段產生的數(shù)據(jù)文件,含設計圖紙、質量證明書、檢修更換資料、失效分析資料等。監(jiān)督報告模塊是對各電廠對應某個設備的監(jiān)督報告進行管理,管理人員可以從瀏覽器端口上傳本廠的設備報告,并可以查詢本廠范圍的報告,用戶上傳報告后經系統(tǒng)管理員審批后進入數(shù)據(jù)庫存檔,該模塊支持批量上傳,報告管理界面如圖6所示。監(jiān)督報表模塊可對火電廠技術監(jiān)督報表進行管理和分析,不僅對數(shù)據(jù)進行簡單管理,通過積累的月度報表和季度報表可以分析設備超溫或者對缺陷進行跟蹤監(jiān)視,監(jiān)督報表界面如圖7所示。
圖3 系統(tǒng)功能框架
圖4 機組管理界面
圖5 設備數(shù)據(jù)錄入界面
全文搜索模塊用于檢索數(shù)據(jù)庫內的各項資料和設備信息,如報告、報表或者規(guī)程標準、工藝措施等。其核心技術為Lucene全文檢索引擎,并通過CDN(網站分發(fā)技術)提高檢索速度??梢圆扇∪臋z索或者精確檢索,以期獲得滿意結果。管理界面如圖8所示。
圖6 報告管理界面
圖7 監(jiān)督報表界面
圖8 全文檢索界面
金屬設備信息檢索系統(tǒng)可實現(xiàn)火電廠金屬監(jiān)督設備信息管理功能,以火電機組金屬監(jiān)督設備生命周期管理為主線,實現(xiàn)了金屬設備基本信息、設備故障信息和失效分析信息、金屬監(jiān)督重大缺陷處理信息、重大部件維修和更換信息等內容的檢索、統(tǒng)計和對比功能?;跈z索結果進行設備信息的統(tǒng)計和對比,為同類型機組或同類型部件提供失效預警,或針對性開展設備的檢驗檢測,提高設備運行可靠性。
基于Lucene全文檢索,系統(tǒng)可快速從多個火電廠同系列或同類型設備失效數(shù)據(jù)中提取目標信息,提供數(shù)據(jù)庫內所有同類型機組和設備的趨勢變化數(shù)據(jù)、性能老化數(shù)據(jù)及同類型失效的對比數(shù)據(jù),實現(xiàn)人工不可能完成的任務,為設備可靠性評價提供大數(shù)據(jù)指導。