佘佳林,馬永春,林捷
(廣東電網(wǎng)有限責(zé)任公司汕頭供電局,廣東汕頭,515041)
圖紙是電力行業(yè)技術(shù)工作中不可或缺的工具。一般使用的圖紙有紙質(zhì)和電子化兩種形式。紙質(zhì)圖紙不便于存放、管理和使用。電子圖紙數(shù)量繁多、批次不一、新舊混雜、格式不統(tǒng)一、不能攜帶重要附加信息,給后續(xù)圖紙的使用增添了不必要的麻煩。為解決目前圖紙管理的上述缺陷,設(shè)計(jì)開發(fā)一套圖紙智能管理系統(tǒng)成為必要。
通過計(jì)算機(jī)編程,主要包括端技術(shù)(Vue 3+elementplus),后端技術(shù)(Java、spring、springMvc、mybatis以及MySQL)、OCR 文字識(shí)別技術(shù)(Tesseract OCR),使用B/S 架構(gòu)構(gòu)筑一個(gè)變電站圖紙智能管理系統(tǒng),將圖紙文件存放于服務(wù)器端,用戶可隨時(shí)隨地通過網(wǎng)頁端,對圖紙進(jìn)行管理、查閱及維護(hù)。該系統(tǒng)一方面可實(shí)現(xiàn)智能導(dǎo)入處理圖紙庫,以替代大量人工維護(hù)工作,另一方面可通過優(yōu)化的搜索技術(shù),提高圖紙的查找、使用效率。系統(tǒng)的整體設(shè)計(jì)框圖如圖1 所示,變電站圖紙智能管理系統(tǒng)主界面如圖2 所示。下面對系統(tǒng)的核心功能及開發(fā)技術(shù)進(jìn)行介紹。
圖1 變電站圖紙智能管理系統(tǒng)整體設(shè)計(jì)框圖
圖2 變電站圖紙智能管理系統(tǒng)主界面
管理用戶可按需自行新增文件夾,也可以在系統(tǒng)引導(dǎo)下進(jìn)行圖紙導(dǎo)入操作。在引導(dǎo)模式下(如圖3 所示),系統(tǒng)提示指引用戶按照建設(shè)工程名稱、所屬巡維中心、變電站名、圖紙類別等格式要求,逐步創(chuàng)建、命名各級(jí)文件夾、導(dǎo)入圖紙文件,從而保障了圖紙文件命名存放的正確性和規(guī)范性。
圖3 引導(dǎo)模式示例圖
前端使用Vue 3+element-plus 技術(shù)實(shí)現(xiàn)。Vue 3 作為一個(gè)漸進(jìn)式JavaScript 框架,避免了直接使用JavaScript操作DOM 以及由此產(chǎn)生的瀏覽器兼容問題。element-plus則是由餓了么前端團(tuán)隊(duì)開發(fā)的UI 庫,封裝了大量的UI 組件,少量開發(fā)即可使用,且樣式可隨意調(diào)整,可大大提高開發(fā)效率、和美觀程度。后端使用Java 技術(shù),進(jìn)行上傳文件請求的處理,接收文件和解析存入數(shù)據(jù)庫等后續(xù)操作。
導(dǎo)入完成后圖紙被上傳至服務(wù)器端后,系統(tǒng)將通過OCR 文字識(shí)別技術(shù)對圖紙中的文字內(nèi)容進(jìn)行識(shí)別和提取,并建立索引,以供檢索使用,從而實(shí)現(xiàn)對圖紙的智能化存儲(chǔ)和管理,提高圖紙的管理效率[1]。
比如,圖紙的標(biāo)題欄(圖4)中包括有工程名稱、圖紙名稱、圖號(hào)、日期、設(shè)計(jì)單位等信息,在進(jìn)行OCR文字識(shí)別時(shí),這些信息將被識(shí)別為關(guān)鍵信息[1]。
圖4 圖紙標(biāo)題欄
其中OCR 文字識(shí)別功能是通過Google 提供的開源類庫Tesseract OCR 來實(shí)現(xiàn)。該類庫包含OCR 引擎(libtesseract)和命令行程序(tesseract)。它支持多種輸出格式,比如純文本,hOCR(HTML),PDF,TSV 等等。Tesseract 4 新增基于OCR 引擎的新神經(jīng)網(wǎng)絡(luò)(LSTM),可通過訓(xùn)練提高對特定類型圖片的識(shí)別效率,因此除了安裝和少量的開發(fā)工作外,還需通過一定量的樣本圖片對其進(jìn)行訓(xùn)練。
利用智能處理功能識(shí)別提取出來的圖紙名稱、圖號(hào)等信息,可對圖紙文件進(jìn)行自動(dòng)命名,并即時(shí)更新目錄,從而構(gòu)建一個(gè)實(shí)時(shí)更新的圖紙庫。
具體實(shí)現(xiàn)方式是通過編寫Java 程序,根據(jù)人工規(guī)定的自動(dòng)命名邏輯,利用圖紙名稱、圖號(hào)等信息對圖片進(jìn)行重新命名。其中自動(dòng)命名邏輯通過XML 配置文件進(jìn)行配置,管理人員可直接通過修改配置文件來規(guī)定自動(dòng)重命名規(guī)則,從而避免寫死在程序中所導(dǎo)致的規(guī)則更改困難。
關(guān)鍵詞功能,包括關(guān)鍵詞提取模塊和關(guān)鍵詞設(shè)置模塊。關(guān)鍵詞提取為程序自動(dòng)處理,關(guān)鍵詞設(shè)置為人工通過系統(tǒng)進(jìn)行設(shè)置。系統(tǒng)可以自動(dòng)將工程名稱、日期、設(shè)計(jì)單位設(shè)置為關(guān)鍵詞并關(guān)聯(lián)到圖紙文件,維護(hù)人員可以根據(jù)需要手動(dòng)將定置信息、設(shè)備間隔、設(shè)備雙編、屏柜編號(hào)等關(guān)鍵信息設(shè)置為關(guān)鍵詞。關(guān)鍵詞將被用作索引,供檢索使用。
關(guān)鍵詞自動(dòng)提取是通過Tesseract OCR 類庫來實(shí)現(xiàn)。關(guān)鍵詞設(shè)置功能則通過前文所述Vue 3+element-plus 技術(shù)進(jìn)行前端開發(fā),構(gòu)建維護(hù)人員操作界面,以及使用Java編寫對應(yīng)的后端處理程序,對維護(hù)人員提交的關(guān)鍵詞進(jìn)行存入索引庫的操作。
當(dāng)現(xiàn)場設(shè)備發(fā)生變動(dòng),圖紙未能及時(shí)變更時(shí),或者發(fā)現(xiàn)圖紙內(nèi)容不全時(shí),可以增加額外的注釋信息。新增的注釋僅本人及管理員可見,角色權(quán)限管理進(jìn)行可見授權(quán)。注釋內(nèi)容可以是文字、圖形、照片、附件等多種類型。新建注釋時(shí),將自動(dòng)添加時(shí)間、編輯人等必要信息,并將注釋標(biāo)題自動(dòng)生成為關(guān)鍵詞。
注釋功能的實(shí)現(xiàn)同時(shí)需要前端程序和后端程序。前端程序通過Vue 3+element-plus 技術(shù)進(jìn)行開發(fā),管理員可通過前端界面進(jìn)行圖片注釋的增、刪、改、查。后端程序即接收處理請求,對數(shù)據(jù)庫進(jìn)行對應(yīng)的增、刪、改、查操作,代碼可完全復(fù)用Java 編寫的后端處理程序。
基于文字識(shí)別功能、自動(dòng)命名功能、關(guān)鍵詞功能、注釋功能,系統(tǒng)的用戶可通過輸入檢索詞可獲得如圖紙內(nèi)容信息、存放路徑、卷冊名稱、文件名稱、自定義關(guān)鍵詞、注釋信息等大量與圖紙高度相關(guān)的信息。
檢索功能同樣需要前后端配合實(shí)現(xiàn)。前端采用Vue 3 +element-plus 技術(shù)進(jìn)行前端檢索程序和界面以及前端展示程序和界面的開發(fā)。前端開發(fā)時(shí)主要需要注意對檢索詞的校驗(yàn),從前端避免用戶輸入非法檢索詞。后端程序使用原生Java 進(jìn)行開發(fā),進(jìn)行檢索請求的接收,數(shù)據(jù)庫查詢,最后返回檢索結(jié)果給前端程序。
圖紙資料有數(shù)據(jù)保密的需求,并涉及審批流程,故本系統(tǒng)設(shè)置有完整的權(quán)限管理功能,將賬戶分為三種類型:普通用戶,管理用戶,高級(jí)管理用戶。普通用戶有瀏覽圖紙、新增注釋的權(quán)限;管理用戶有普通用戶的全部權(quán)限,還可以錄入、作廢圖紙文件;高級(jí)管理用戶可以對新增注釋、作廢圖紙等申請進(jìn)行審批[2]。
權(quán)限管理功能的開發(fā),包括前端和后端。前端程序使用Vue 3+element-plus 技術(shù)開發(fā)。后端程序使用Java 和Apache Shiro 進(jìn)行開發(fā)。Apache Shiro 是一個(gè)強(qiáng)大且易用的Java 安全框架,用它進(jìn)行身份驗(yàn)證、授權(quán)、密碼等的管理。Apache Shiro 內(nèi)置的Realm 可連接海量的安全數(shù)據(jù)源(又名目錄),如LDAP、關(guān)系數(shù)據(jù)庫(JDBC)、類似INI的文本配置資源以及屬性文件等。
基于上述各功能模塊,變電站圖紙智能管理系統(tǒng)提供了一種創(chuàng)新的圖紙管理、使用模式。其流程圖如圖5 所示。
圖5 圖紙管理使用流程圖
圖紙管理員只需在系統(tǒng)引導(dǎo)下導(dǎo)入圖紙文件,之后系統(tǒng)將自動(dòng)完成文件處理、上傳至服務(wù)器、文字識(shí)別、提取關(guān)鍵信息、自動(dòng)命名文件、生成關(guān)鍵詞、實(shí)時(shí)更新目錄等一系列流程,既便捷高效,又可以滿足規(guī)范化管理的要求。
例如,對于圖4 所示的圖紙,假設(shè)我們預(yù)設(shè)的命名規(guī)則是圖號(hào)+圖紙名稱,則其文件會(huì)被自動(dòng)命名為“B0616 1J-D204-15 110kV 線路間隔1G 隔離開關(guān)端子排圖”。系統(tǒng)還將自動(dòng)識(shí)別提取出關(guān)鍵信息:“工程名稱:110kV XX變電站工程”、“日期:2015.04”、“設(shè)計(jì)單位:汕頭電力設(shè)計(jì)院”,并設(shè)為3 個(gè)關(guān)鍵詞。
當(dāng)運(yùn)維人員、施工人員等用戶需要使用圖紙時(shí),只需登陸內(nèi)網(wǎng)的網(wǎng)頁端,輸入檢索詞,利用檢索功能,即可快速、準(zhǔn)確地找到相關(guān)的圖紙,較之以往手動(dòng)查找、翻閱的形式,可以節(jié)省大量時(shí)間,也可以降低對使用者的技術(shù)、經(jīng)驗(yàn)要求。
在使用圖紙的過程中,發(fā)現(xiàn)圖實(shí)不符,使用不便等情況時(shí),可以增加關(guān)鍵詞,或在圖紙中附上注釋信息,及時(shí)對相關(guān)情況進(jìn)行補(bǔ)充說明。例如,對于圖4 所示的圖紙,僅從圖紙名稱“110kV 線路間隔1G 隔離開關(guān)端子排圖”,使用者無法確認(rèn)這份圖紙對應(yīng)的是哪個(gè)線路間隔,哪一把刀閘,通過將“間隔:110kV 新陳I 線,新陳II 線”、“設(shè)備:1741刀閘,1752 刀閘”設(shè)置為關(guān)鍵詞,即可將圖紙和現(xiàn)場設(shè)備對應(yīng)起來,減少查找圖紙的時(shí)間,避免不熟悉設(shè)備的人員使用錯(cuò)誤的圖紙。若將紙質(zhì)圖紙的定置信息設(shè)置為關(guān)鍵詞,可以將電子圖紙和紙質(zhì)圖紙的位置進(jìn)行關(guān)聯(lián),從而提高紙質(zhì)圖紙查找的效率。關(guān)鍵詞及注釋信息相關(guān)示例如圖6 所示。
圖6 關(guān)鍵詞及注釋信息示例
關(guān)鍵詞和注釋信息都可隨時(shí)增加、刪減、修改,為了保證圖紙內(nèi)容的準(zhǔn)確性,變更過的關(guān)鍵詞和注釋信息只對編輯者和審批人員可見,系統(tǒng)根據(jù)變更情況自動(dòng)生成審批通知,設(shè)計(jì)單位、繼保專業(yè)人員登陸高級(jí)管理賬戶,即可查看該通知并對相關(guān)變更進(jìn)行審批,審批不通過的變更會(huì)被回退至編輯者賬號(hào)再次修改,審批通過的變更及其審批流程信息將對所有人可見。
本文介紹了一種變電站圖紙智能管理系統(tǒng),提出了一種創(chuàng)新的圖紙管理使用模式,該系統(tǒng)已開始投入使用,以往電力工程圖紙的錄入工作效率較低,因?yàn)橛胁鸱治募⒏袷睫D(zhuǎn)化、創(chuàng)建文件夾、文件命名、更新目錄清冊等諸多流程,每處理一份100 頁的圖紙文件至少需花費(fèi)兩個(gè)小時(shí)的時(shí)間。而使用圖紙智能系統(tǒng),導(dǎo)入圖紙只需3 分鐘,其后的上傳、處理工作都由服務(wù)器在后臺(tái)自動(dòng)完成,整個(gè)流程不會(huì)超過10 分鐘,不僅效率大大提高,統(tǒng)一處理文件還可以保證其錄入的正確性和規(guī)范性。實(shí)踐證明,變電站圖紙智能管理系統(tǒng)可以有效提高圖紙管理、查找、使用和維護(hù)的效率,降低相關(guān)作業(yè)的難度,為變電站的各項(xiàng)運(yùn)維工作提供有力的支持。