高騰飛,門鳳臣,劉寶軍,宋敬霞
(國家電投集團(tuán)電站運(yùn)營技術(shù)(北京)有限公司,北京 102209)
電力企業(yè)安全生產(chǎn)和技術(shù)監(jiān)督是保證電力系統(tǒng)安全、可靠、經(jīng)濟(jì)運(yùn)行和準(zhǔn)確計(jì)量的重要技術(shù)手段[1-3],國家電力投資集團(tuán)有限公司每年定期組織火電企業(yè)開展春、秋季安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作。傳統(tǒng)評價(jià)工作模式存在信息共享度低、評價(jià)隨意性大、報(bào)告規(guī)范性差、“事中事后”缺乏實(shí)時(shí)監(jiān)控、數(shù)據(jù)綜合分析手段不足等弊端,難以滿足當(dāng)今工作節(jié)奏快、效率高、機(jī)制新的管理態(tài)勢,無法支撐實(shí)現(xiàn)自動(dòng)化、科學(xué)化和精細(xì)化的管理。
基于上述原因,擬采用信息化手段,實(shí)現(xiàn)安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作的數(shù)據(jù)采集記錄和傳輸存儲(chǔ)。另外,評價(jià)準(zhǔn)備階段需要對大量歷史數(shù)據(jù)進(jìn)行分析處理,以對最優(yōu)專家和重點(diǎn)評價(jià)內(nèi)容做出正確的預(yù)測和評估。數(shù)據(jù)挖掘技術(shù)正是以積累下來的歷史數(shù)據(jù)為研究對象,通過對數(shù)據(jù)的歸類、分析、處理,從而找出隱藏在其中的有用知識[4-5]。面對數(shù)據(jù)處理難度的增加,本文研發(fā)了基于數(shù)據(jù)挖掘的火電企業(yè)安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)系統(tǒng),為準(zhǔn)備、評價(jià)、監(jiān)督和決策提供數(shù)據(jù)基礎(chǔ)。
數(shù)據(jù)挖掘指知識發(fā)現(xiàn)的過程,通常包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換、模式發(fā)現(xiàn)、模式評估和知識表示。其采用數(shù)據(jù)源包括數(shù)據(jù)庫、數(shù)據(jù)倉庫、Web、其他信息存儲(chǔ)庫或動(dòng)態(tài)流入系統(tǒng)的數(shù)據(jù)[6-7]。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析)的本質(zhì)區(qū)別在于數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。所得到的信息(或知識)具有先前未知、有效和實(shí)用3 個(gè)特征[8-9]。
數(shù)據(jù)挖掘過程是以用戶為中心,開展人機(jī)交互的探索。包含數(shù)據(jù)準(zhǔn)備(data preparation)、數(shù)據(jù)挖掘以及結(jié)果的解釋評估(interpretation and evaluation)3 個(gè)階段,數(shù)據(jù)挖掘可以描述為這3 個(gè)階段的反復(fù)過程。
移動(dòng)智能終端包括智能手機(jī)、筆記本、PDA 智能終端、平板電腦等設(shè)備。其擁有獨(dú)立的操作系統(tǒng),功能的擴(kuò)展性極其靈活,當(dāng)前市場中的移動(dòng)智能終端支持?jǐn)?shù)據(jù)存貯、信息管理、多媒體、GPS、GIS、無線通信等功能,在電力行業(yè)有著廣泛的研究與應(yīng)用[10-12]。
傳統(tǒng)的火電企業(yè)評價(jià)工作模式中評價(jià)標(biāo)準(zhǔn)往往通過結(jié)構(gòu)化(Excel)或非結(jié)構(gòu)化(PDF)形式存儲(chǔ),不便于評價(jià)流程步驟的電子化,不利于指標(biāo)數(shù)據(jù)的量化體現(xiàn)。本文通過OCR 和POI 等相關(guān)數(shù)據(jù)獲取技術(shù)徹底解決了上述問題,采用OCR 技術(shù)將掃描文本或基于圖像內(nèi)容的文本轉(zhuǎn)換為可編輯的文本;采用POI 技術(shù),提取數(shù)據(jù)基礎(chǔ)信息進(jìn)行統(tǒng)一管理,通過定義個(gè)性化模板,以模板為基準(zhǔn),對不同要素進(jìn)行量化提取,使數(shù)據(jù)處理更加精細(xì)化、精準(zhǔn)化。
火電企業(yè)安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)系統(tǒng)研發(fā)遵循先進(jìn)、健壯、靈活、穩(wěn)定、開放、易維護(hù)、可擴(kuò)展、低成本等要求,采用以J2EE 為核心的多層分布式架構(gòu)[13-14],即在客戶端、應(yīng)用服務(wù)層、數(shù)據(jù)源層3 層結(jié)構(gòu)基礎(chǔ)上,將應(yīng)用服務(wù)層細(xì)分為Web 服務(wù)層、界面服務(wù)層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層。客戶端是通過移動(dòng)智能終端或?yàn)g覽器進(jìn)行系統(tǒng)訪問,實(shí)現(xiàn)人機(jī)交互;Web 服務(wù)層是通過HTTP 協(xié)議傳輸數(shù)據(jù),為客戶端提供對應(yīng)用程序的訪問,實(shí)現(xiàn)表現(xiàn)層邏輯封裝;界面服務(wù)層為Web 服務(wù)層提供瀏覽、處理等服務(wù),實(shí)現(xiàn)用戶界面與各業(yè)務(wù)功能的隔離;業(yè)務(wù)邏輯層實(shí)現(xiàn)系統(tǒng)業(yè)務(wù)處理;數(shù)據(jù)訪問層提供對數(shù)據(jù)庫的鏈接、讀寫等操作服務(wù);數(shù)據(jù)源層提供數(shù)據(jù)存儲(chǔ)。這種成熟的B/A/S 結(jié)構(gòu)不但有效縮短開發(fā)周期、降低系統(tǒng)維護(hù)成本、增強(qiáng)企業(yè)對象重復(fù)可用性,也大大提升了系統(tǒng)的延展性、執(zhí)行效率、容錯(cuò)能力和負(fù)載平衡能力。多層分布式架構(gòu)如圖1所示。
系統(tǒng)后臺及服務(wù)基于Java 開發(fā),支持跨平臺部署應(yīng)用,移動(dòng)端基于JavaScript 和html5 開發(fā),Web容器采用Tomcat,數(shù)據(jù)庫采用MySQL。人機(jī)交互界面簡潔美觀、功能命名直觀通俗,便于用戶自學(xué)習(xí)。
火電企業(yè)安全生產(chǎn)和技術(shù)監(jiān)督系統(tǒng)以集團(tuán)公司發(fā)布的相關(guān)標(biāo)準(zhǔn)為基礎(chǔ),以歷次電廠自查評價(jià)及集團(tuán)專家評價(jià)實(shí)踐經(jīng)驗(yàn)為指導(dǎo),以業(yè)務(wù)流轉(zhuǎn)及數(shù)據(jù)監(jiān)控為核心,提升公司安全生產(chǎn)和設(shè)備健康水平。
該系統(tǒng)根據(jù)評價(jià)工作需要,開發(fā)了PC 端和移動(dòng)端,PC 端包含系統(tǒng)全部功能;移動(dòng)端輔助PC 端,主要實(shí)現(xiàn)生產(chǎn)現(xiàn)場評價(jià)工作及業(yè)務(wù)流程審批工作。功能設(shè)計(jì)遵循科學(xué)的PDCA 循環(huán)管理思想[15],實(shí)現(xiàn)全方位、全過程動(dòng)態(tài)監(jiān)控管理以及閉環(huán)管理,系統(tǒng)功能模塊劃分如圖2所示,專家評價(jià)和問題整改流程如圖3所示。
圖2 系統(tǒng)功能模塊劃分Fig.2 The division diagram of system function modules
圖3 專家評價(jià)及問題整改流程Fig.3 The process of expert evaluation and problem rectification
實(shí)時(shí)的數(shù)據(jù)管理構(gòu)建了PC 端和移動(dòng)端的橋梁,利用數(shù)據(jù)挖掘技術(shù)提供強(qiáng)大的數(shù)據(jù)推送、檢測推薦、評價(jià)匹配功能,面向管理層提供了實(shí)時(shí)的數(shù)據(jù)監(jiān)控和管理手段,使管理者可以及時(shí)掌握現(xiàn)場工作及問題整改情況。系統(tǒng)的主要功能模塊如下。
1)基礎(chǔ)管理 對公司、資產(chǎn)、監(jiān)督類別、專業(yè)、人員、設(shè)備、參考文件、職稱、版本、參考標(biāo)準(zhǔn)等基礎(chǔ)信息進(jìn)行配置。
2)評價(jià)標(biāo)準(zhǔn) 對各個(gè)專業(yè)的查評項(xiàng)目、查評標(biāo)準(zhǔn)、評價(jià)指標(biāo)、評價(jià)方法、查證方法、查評依據(jù)、標(biāo)準(zhǔn)分等評價(jià)相關(guān)標(biāo)準(zhǔn)進(jìn)行統(tǒng)一管理。
3)任務(wù)執(zhí)行 主要包含項(xiàng)目管理、項(xiàng)目執(zhí)行、專家評價(jià)、自查評價(jià)、檢查報(bào)告、任務(wù)修改。實(shí)現(xiàn)電廠依據(jù)標(biāo)準(zhǔn)自行尋找問題、專家開展診斷與指導(dǎo)、報(bào)告自動(dòng)生成等功能。同時(shí),支持標(biāo)準(zhǔn)以外問題的錄入,發(fā)揮評價(jià)人員專業(yè)優(yōu)勢、彌補(bǔ)標(biāo)準(zhǔn)不足,也為后期標(biāo)準(zhǔn)升版奠定基礎(chǔ);移動(dòng)端支持在線數(shù)據(jù)同步、離線數(shù)據(jù)執(zhí)行、語音識別、現(xiàn)場照片同步上傳、二十五項(xiàng)重點(diǎn)要求條款模糊查詢等功能[16-18],增強(qiáng)現(xiàn)場實(shí)用性,提高評價(jià)效率,具有權(quán)限的管理者可實(shí)時(shí)跟蹤評價(jià)進(jìn)展與質(zhì)量。
4)問題整改 依據(jù)重要程度,對問題先定級后整改,問題分為一、二、三級,分別對應(yīng)集團(tuán)公司、二級單位、三級單位驗(yàn)收;手動(dòng)或自動(dòng)開始相應(yīng)整改驗(yàn)收流程。單位內(nèi)部或上級單位對已驗(yàn)收的問題進(jìn)行抽查,若不合格,則需重新整改。
5)統(tǒng)計(jì)分析 對評價(jià)報(bào)告中的數(shù)據(jù)進(jìn)行整理分析,展現(xiàn)評價(jià)數(shù)據(jù)趨勢圖,為監(jiān)督人員決策提供數(shù)據(jù)支持。
2.3.1 推薦專家規(guī)則排序算法
專家關(guān)聯(lián)關(guān)系往往表現(xiàn)的比較模糊,本文通過對大量專家規(guī)則排序進(jìn)行分析,發(fā)現(xiàn)在準(zhǔn)備階段新建項(xiàng)目設(shè)置小組時(shí),會(huì)根據(jù)專家的所學(xué)專業(yè)、工作經(jīng)驗(yàn)、職稱、評價(jià)過的單位、歷史發(fā)現(xiàn)的問題、整改建議、查評數(shù)據(jù)統(tǒng)計(jì)、整改方案有效率等,推薦最優(yōu)專家,便于決策者更準(zhǔn)確高效的決策。推薦專家規(guī)則排序算法流程如圖4所示。
圖4 推薦專家規(guī)則排序算法流程Fig.4 The process of recommended expert rule sorting algorithm
本文推薦專家規(guī)則排序算法大致包括以下幾個(gè)步驟。
1)數(shù)據(jù)預(yù)處理 首先對文本進(jìn)行關(guān)系詞標(biāo)注,其次對專家、任務(wù)、關(guān)系詞進(jìn)行識別,存入專家屬性標(biāo)簽和任務(wù)屬性標(biāo)簽中。
2)特征提取 建立特征庫,將專家和任務(wù)的顯著特征提取出來,便于后續(xù)規(guī)則匹配。
3)關(guān)聯(lián)關(guān)系 首先建立關(guān)聯(lián)關(guān)系規(guī)則庫,如相似經(jīng)驗(yàn)匹配規(guī)則、工作年限匹配規(guī)則、專業(yè)匹配規(guī)則等;其次,利用關(guān)聯(lián)關(guān)系規(guī)則對特征提取過程產(chǎn)生的顯著特征進(jìn)行匹配;專家顯著特征包含工作年限、崗位、專業(yè)、學(xué)歷、經(jīng)驗(yàn)等,任務(wù)顯著特征包含任務(wù)重要性、緊急性、難易度、進(jìn)度、專業(yè)、地域等,實(shí)現(xiàn)專家關(guān)系的初步匹配。
4)相似度匹配 對專家關(guān)系的初步結(jié)果放入容器中,并對該容器中的顯著特征加權(quán)平均進(jìn)行二次匹配,選取適合的專家。
5)最優(yōu)專家確定 通過大規(guī)模的數(shù)據(jù)抽取,得到專家之間的所有關(guān)系后,最終通過權(quán)重占比,計(jì)算得分排序,確認(rèn)最優(yōu)專家。
2.3.2 基于數(shù)據(jù)挖掘技術(shù)的評價(jià)數(shù)據(jù)分析
基于數(shù)據(jù)挖掘技術(shù)的評價(jià)數(shù)據(jù)分析模型如圖5所示。使用時(shí),首先建立大數(shù)據(jù)體系,以系統(tǒng)積累的基礎(chǔ)數(shù)據(jù)作為輸入。如:評價(jià)類型、評價(jià)單位、監(jiān)督專業(yè)、監(jiān)督標(biāo)準(zhǔn)、查評得分、問題數(shù)量、問題重要程度、問題產(chǎn)生原因、整改情況、風(fēng)險(xiǎn)項(xiàng)等,經(jīng)過評價(jià)數(shù)據(jù)分析模型,輸出安全監(jiān)督通病、關(guān)鍵評價(jià)單位、重點(diǎn)評價(jià)專業(yè)、專家服務(wù)能力評價(jià)、評價(jià)周期頻次等信息。根據(jù)這些信息,在下一次監(jiān)督評價(jià)工作中,可優(yōu)先推薦重點(diǎn)關(guān)注的問題、重點(diǎn)關(guān)注的單位、重點(diǎn)關(guān)注的專業(yè)等信息,便于有效指導(dǎo)后續(xù)安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作。
圖5 基于數(shù)據(jù)挖掘技術(shù)的評價(jià)數(shù)據(jù)分析模型Fig.5 The evaluation data analysis model based on data mining technology
基于數(shù)據(jù)挖掘技術(shù)的評價(jià)數(shù)據(jù)分析模型,將基礎(chǔ)數(shù)據(jù)從單位評價(jià)水平、專業(yè)評價(jià)水平和其他相關(guān)水平3 個(gè)維度進(jìn)行劃分。
1)單位評價(jià)水平(U)
單位評價(jià)水平指待評單位存在隱患數(shù)量的多少、整改情況好壞的程度。其參考的基礎(chǔ)輸入要素有查出問題數(shù)量、查評得分、整改情況,由查出問題數(shù)量評分、得分率、整改率等數(shù)據(jù)進(jìn)行衡量。查出問題數(shù)量計(jì)算公式為
式中,x為問題數(shù)量,y為問題數(shù)量對應(yīng)的評分,系數(shù)b為評價(jià)滿分標(biāo)準(zhǔn),系數(shù)c為問題數(shù)量上限。其中系數(shù)a的絕對值越大,表示問題數(shù)量與得分的相關(guān)性越強(qiáng)。當(dāng)x>c時(shí),不得分。如可以設(shè)定評價(jià)標(biāo)準(zhǔn)為100 分,問題數(shù)量上限為50 個(gè),當(dāng)問題數(shù)量為0 個(gè)時(shí),得分最高100 分,依次遞減,問題數(shù)量超過50 個(gè)時(shí),不得分。
得分率定義為所選評價(jià)項(xiàng)得分情況與所選評價(jià)項(xiàng)總分之比。整改率定義為累計(jì)整改問題項(xiàng)數(shù)與累計(jì)查出問題項(xiàng)數(shù)之比。單位評價(jià)水平高低由查出問題數(shù)量評分、得分率、整改率最終確定,計(jì)算公式為
式中d為累計(jì)整改問題項(xiàng)數(shù)。
單位評價(jià)水平U按照數(shù)值大小進(jìn)行等級評定:≥85%為A,75%~85%為B,<75%為C。
2)專業(yè)評價(jià)水平(P)
專業(yè)評價(jià)水平指評價(jià)結(jié)果好壞的程度。依據(jù)問題的重要程度,評價(jià)結(jié)果可分為嚴(yán)重問題(含告警問題)、普通問題、輕微問題(及時(shí)整改)等。專業(yè)評價(jià)水平以累計(jì)查出問題數(shù)量評分為主要依據(jù),以嚴(yán)重問題數(shù)量評分和普通問題數(shù)量評分稍作權(quán)重,共同決定。其計(jì)算公式為
式中,t為累計(jì)查出問題數(shù)量評分,g為嚴(yán)重問題數(shù)量評分,n為普通問題數(shù)量評分。
按照數(shù)值大小進(jìn)行等級評定:≥85%為A,75%~85%為B,<75%記為C。
3)其他相關(guān)水平(O)
其他相關(guān)水平高低由專家對此次整體情況評價(jià)確定,如被評價(jià)單位對本次評價(jià)準(zhǔn)備程度、配合程度等,屬于靈活調(diào)整偏差值,同樣設(shè)置A、B、C 3 個(gè)等級。
4)綜合評價(jià)水平(S)
綜合評價(jià)水平由單位評價(jià)水平、專業(yè)評價(jià)水平、其他相關(guān)水平三要素共同決定。設(shè)定三要素權(quán)重比為5:3:2,綜合評價(jià)水平計(jì)算公式為
綜合評價(jià)水平等級表現(xiàn)形式設(shè)定為AAA,其中,第1 個(gè)字母表示單位評價(jià)水平等級為A,第2個(gè)字母表示專業(yè)評價(jià)水平等級為A,第3 個(gè)字母表示其他評價(jià)水平等級為A,以此類推。綜合評價(jià)水平如圖6所示:橫向維度(從左往右),當(dāng)單位評價(jià)水平等級相同時(shí),綜合評價(jià)水平隨著專業(yè)評價(jià)水平的降低而降低;縱向維度(從上往下),當(dāng)專業(yè)評價(jià)水平等級相同時(shí),綜合評價(jià)水平隨著單位評價(jià)水平的降低而降低。
圖6 綜合評價(jià)水平Fig.6 The comprehensive evaluation level
從大量的歷史評價(jià)數(shù)據(jù)中,可以挖掘出相關(guān)評價(jià)規(guī)則,評價(jià)數(shù)據(jù)分析模型可依據(jù)這些屬性,對評價(jià)工作進(jìn)行分類和預(yù)測,系統(tǒng)智能推送安全監(jiān)督通病、關(guān)鍵評價(jià)單位、重點(diǎn)評價(jià)專業(yè)、評價(jià)周期頻次等,無需投入大量精力進(jìn)行人工分析,加強(qiáng)了評價(jià)工作的針對性,有效提升了評價(jià)效率,提高了運(yùn)行設(shè)備的安全性和可靠性。
本系統(tǒng)已在多家火電企業(yè)開展自查評價(jià)和專家評價(jià),指導(dǎo)生產(chǎn)運(yùn)行,也成功支撐了國家電力投資集團(tuán)有限公司2019年秋季安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作。涉及93 家火電企業(yè)三級單位、20 個(gè)監(jiān)督專業(yè)、60 名專家成員,報(bào)告審批由線下改為線上,評價(jià)耗時(shí)由6~7 d/廠縮短至4~5 d/廠,效率提升20%以上,錯(cuò)誤率低于1%,形成自查評價(jià)與專家評價(jià)報(bào)告近百份。
根據(jù)2019年秋季評價(jià)工作數(shù)據(jù)分析,系統(tǒng)應(yīng)用前后的各項(xiàng)指標(biāo)對比見表1。系統(tǒng)投入使用后報(bào)告自動(dòng)生成,評價(jià)問題自動(dòng)生成問題庫且實(shí)時(shí)跟蹤,加強(qiáng)了問題的閉環(huán)管理;實(shí)現(xiàn)監(jiān)督過程流程化、現(xiàn)場操作電子化、數(shù)據(jù)管理信息化、問題治理閉環(huán)化,提升了工作效率,成為安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作有效輔助工具,受到使用人員的一致好評。
表1 系統(tǒng)應(yīng)用前后的各項(xiàng)指標(biāo)對比Tab.1 Comparison of indicators before and after the system application
本文利用數(shù)據(jù)挖掘、移動(dòng)協(xié)同、數(shù)據(jù)獲取技術(shù),設(shè)計(jì)推薦專家規(guī)則排序算法,構(gòu)建評價(jià)數(shù)據(jù)分析模型,開發(fā)了火電企業(yè)安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)系統(tǒng)。該系統(tǒng)有效規(guī)范了火電企業(yè)安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作,實(shí)現(xiàn)了提質(zhì)增效,確保評價(jià)任務(wù)新建、任務(wù)執(zhí)行、報(bào)告自動(dòng)生成、問題整改驗(yàn)收的全過程監(jiān)控及閉環(huán)管理,相關(guān)數(shù)據(jù)查詢、統(tǒng)計(jì)分析工作更為方便,形式更為靈活、直觀,能夠?yàn)榛痣娖髽I(yè)的安全生產(chǎn)和技術(shù)監(jiān)督評價(jià)工作管理、企業(yè)決策提供有力數(shù)據(jù)支撐。同時(shí),有效降低了人力物力財(cái)力,保障了機(jī)組安全、可靠、經(jīng)濟(jì)運(yùn)行,產(chǎn)生了較大的直接與間接經(jīng)濟(jì)效益、安全效益。