石 磊
(上海宏力達信息技術(shù)股份有限公司)
隨著社會的發(fā)展,人們對電力需求不斷增加,配電網(wǎng)規(guī)模也隨之變大,電力用戶數(shù)量不斷增長[1]。配網(wǎng)生產(chǎn)指揮中心作為配網(wǎng)業(yè)務(wù)樞紐,一方面接入的信息化系統(tǒng)眾多,信息數(shù)據(jù)日益增加而利用效率不斷降低[2];另一方面因配網(wǎng)生產(chǎn)指揮面廣,存在大量簡單重復(fù)串行的機械流程,不僅指揮效率低,易造成配網(wǎng)生產(chǎn)指揮業(yè)務(wù)“樞紐擁堵”效應(yīng)[3]。因此配網(wǎng)生產(chǎn)指揮業(yè)務(wù)迫切需要流程再造,利用人工智能技術(shù)提升效率[4]。
在此領(lǐng)域,部分學(xué)者已經(jīng)率先開展了研究工作。文獻[5]提出電網(wǎng)調(diào)控操作智能助手的方案,通過態(tài)勢感知電網(wǎng)異常和事故點,為操作人員提供智能輔助決策。文獻[6]研究了基于DNN-HMM神經(jīng)網(wǎng)絡(luò)的原理和特點,通過聲學(xué)模型訓(xùn)練和語料制作,應(yīng)用于D5000廠區(qū)提高工作效率。文獻[7]基于電網(wǎng)調(diào)控業(yè)務(wù)現(xiàn)狀和痛點,提出“虛擬調(diào)度員”概念,但僅對相關(guān)技術(shù)進行研究,缺少實際案例的設(shè)計和驗證過程。
本文提出通過機器學(xué)習(xí)配網(wǎng)線路調(diào)度規(guī)程、專家經(jīng)驗、電網(wǎng)業(yè)務(wù)數(shù)據(jù)后,利用語音識別、語義理解、多輪人機對話等技術(shù),實現(xiàn)“虛擬調(diào)度指揮員”。并將研究成果應(yīng)用于國網(wǎng)某省級公司配網(wǎng)分支線計劃檢修和配網(wǎng)主干線計劃檢修的生產(chǎn)環(huán)境中。
配網(wǎng)生產(chǎn)指揮中心主要工作分布于配網(wǎng)主干線和配網(wǎng)分支線。配網(wǎng)主干線調(diào)度工作過程包括調(diào)度員根據(jù)計劃檢修開具主干線操作票,依照工作步驟通過與現(xiàn)場人員電話交互完成配網(wǎng)主干線的調(diào)度指揮工作。配網(wǎng)分支線調(diào)度涉及的過程相對簡單,但調(diào)度員還需面對業(yè)務(wù)規(guī)則更加復(fù)雜,智能化、安全化水平要求更高的調(diào)度指揮業(yè)務(wù),因此需研究引入更加穩(wěn)定、安全、可靠的AI智能引擎,徹底實現(xiàn)配網(wǎng)調(diào)度的智能化指揮。
配網(wǎng)生產(chǎn)指揮中心作為配網(wǎng)業(yè)務(wù)樞紐涉及到調(diào)度自動化、配電自動化、PMS、OMS、配網(wǎng)管控平臺、現(xiàn)場電話等諸多信息。每日處理的故障、異常信息達到千條以上,并在日益增加中。以人口超過1000萬的某超大型城市為例,配網(wǎng)生產(chǎn)指揮中心一年至少處理500余起故障,以及上千萬條缺陷信息,指揮人員每天需要查看至少3000條以上自動聲光報警信息,其中有大量、單一的重復(fù)性工作。
本文通過利用語音識別、NLP自然語言處理、多輪人機對話等技術(shù)構(gòu)建一套能夠自主理解配網(wǎng)調(diào)度規(guī)程、專家經(jīng)驗、電網(wǎng)業(yè)務(wù)數(shù)據(jù)的配網(wǎng)智慧生產(chǎn)指揮AI引擎。
在電力配網(wǎng)領(lǐng)域,目前還沒有直接可用的語音模型,所以需要針對具體的電力業(yè)務(wù)進行專門模型訓(xùn)練。語音識別模型訓(xùn)練優(yōu)化功能包括聲學(xué)模型訓(xùn)練和語言模型訓(xùn)練兩個組成部分[6]。
(1)聲學(xué)模型訓(xùn)練
聲學(xué)模型訓(xùn)練需通過大量的音頻數(shù)據(jù)幫助引擎訓(xùn)練模型。由于電力配網(wǎng)工作環(huán)境的特殊性,需要在現(xiàn)場噪音下對基本音素識別,語音數(shù)據(jù)為PCM格式,采樣率8k,對每一個音頻文件進行人工標(biāo)注,標(biāo)注出音頻中的文字內(nèi)容,以及文字的對應(yīng)時間信息。
(2)語言模型訓(xùn)練
電網(wǎng)調(diào)度指揮語音識別語言模型采用BERT模型,調(diào)度語句的每個輸入切分單元共包含4個類別的特征,即語義特征、位置特征、關(guān)鍵字特征和命名實體特征,如圖1所示。通過此方法,可提升模型對調(diào)度指揮生產(chǎn)過程中語言的適應(yīng)性[8]。
圖1 語言模型結(jié)構(gòu)
語言訓(xùn)練模型需要提供大量的調(diào)配工作中的文檔文件,如日常工作記錄、對話記錄、專業(yè)術(shù)語,并將所有文檔整理成指定格式,通過引擎的訓(xùn)練接口上傳并訓(xùn)練,優(yōu)化已有的語言模型[9]。
電力行業(yè)有其專業(yè)性,不能完全復(fù)用通用的NLP,需要針對電力行業(yè)特性進行技術(shù)校準和調(diào)整,讓AI可以真正理解現(xiàn)場人員的電力特性的用語表達。
NLP類算法主要包括分詞(含詞性標(biāo)注)、實體識別和語義相似度模型[10-11],來自語音識別轉(zhuǎn)為文字后的文本,經(jīng)過分詞算法和實體識別算法的處理后,將文本中的“班組、姓名、設(shè)備名稱、工作內(nèi)容、收發(fā)令時間”等關(guān)鍵信息抽取出,與操作票中對應(yīng)的“班組、姓名、設(shè)備名稱、工作內(nèi)容、收發(fā)令時間”進行相似度比對,在達到一定閾值的情況下,則給出“是/否”匹配的信號到對話引擎,由其通過預(yù)置好的對話模板給出回應(yīng)文字,并由語音合成后通過電話語音告知對方。語義理解數(shù)據(jù)打標(biāo)實現(xiàn)過程詳見圖2。
圖2 數(shù)據(jù)打標(biāo)實現(xiàn)過程
虛擬調(diào)度指揮人機對話模式屬于人機對話技術(shù)發(fā)展的第三階段,是從第一代語音助手,第二代機器人聊天模式,逐步發(fā)展到當(dāng)前的人機場景化任務(wù)執(zhí)行模式。AI配網(wǎng)生產(chǎn)指揮體系能充分理解含有“指代、省略”等復(fù)雜語境與現(xiàn)場工作人員的意圖,并對不理解的信息主動發(fā)問。
人機多輪對話引擎主要是實現(xiàn)流程的控制,即現(xiàn)場配網(wǎng)人員與機器人溝通的流程控制,是整個機器人的大腦,可以理解用戶的通話內(nèi)容,給出正確的應(yīng)答。多輪人機對話引擎之間的模塊交互設(shè)計如圖3所示。
圖3 模塊交互圖
多輪人機業(yè)務(wù)對話技術(shù)替代人工進行電話指揮,實現(xiàn)多線程、多任務(wù)的并行處理工作,打破業(yè)務(wù)高峰期人工接派單遲緩、許可等待“樞紐堵塞”的問題。
本系統(tǒng)已在國網(wǎng)某省級公司開展試點,應(yīng)用于配網(wǎng)分支線計劃檢修和配網(wǎng)主干線計劃檢修的生產(chǎn)環(huán)境中。
AI智能引擎功能模塊部署在配電自動化主站中,作為整個配電自動化主站中的一項子模塊,與配電自動化主站、電話交換系統(tǒng)、調(diào)控云系統(tǒng)實現(xiàn)業(yè)務(wù)數(shù)據(jù)集成交互。通過語音識別、語義意圖理解、機器學(xué)習(xí)專家?guī)斓燃夹g(shù)構(gòu)建調(diào)度及搶修業(yè)務(wù)智能虛擬指揮。配網(wǎng)生產(chǎn)指揮總體技術(shù)架構(gòu)如圖4所示。
圖4 總體技術(shù)架構(gòu)圖
配網(wǎng)調(diào)度對話過程,由于施工現(xiàn)場的環(huán)境吵雜音、電力專屬名詞、維修工人的行業(yè)對話習(xí)慣、現(xiàn)場語速和方言夾雜等問題。同時電力業(yè)務(wù)不同于傳統(tǒng)客戶服務(wù)咨詢,要求的準確率非常高,不能出現(xiàn)識別錯誤,否則帶來操作風(fēng)險。
(1)數(shù)據(jù)采集與處理
為了提高語音識別準確度,首先需要采集大量電網(wǎng)調(diào)配人員在真實工作環(huán)境下的語音數(shù)據(jù),并對每一個音頻文件進行人工標(biāo)注,標(biāo)注出音頻中的文字內(nèi)容,以及文字的對應(yīng)時間信息。音頻數(shù)據(jù)轉(zhuǎn)寫主要由人工完成,包括對音頻數(shù)據(jù)校對、標(biāo)注屬性和轉(zhuǎn)寫內(nèi)容、質(zhì)檢、音頻任務(wù)管理等多個重要流程,詳見圖5。
圖5 語音標(biāo)注流程圖
(2)模型訓(xùn)練與部署
在通用語音模型基礎(chǔ)上,結(jié)合生產(chǎn)調(diào)度領(lǐng)域相關(guān)數(shù)據(jù)進行訓(xùn)練,為虛擬調(diào)度提供“聽覺”能力[12]。將工作人員的通話語音信息實時轉(zhuǎn)換成文字記錄,大幅減少工作人員的人工通話內(nèi)容記錄工作,以提高工作效率[13]。AI虛擬調(diào)度指揮系統(tǒng)語音識別模型訓(xùn)練技術(shù)過程如圖6所示。
圖6 模型訓(xùn)練技術(shù)過程
具體的工作包含以下三個部分。
(1)電話系統(tǒng)區(qū)
電話系統(tǒng)區(qū)主要處理兩項工作,一是通過電話錄音系統(tǒng)將人工調(diào)度錄音傳到服務(wù)器中,在將錄音數(shù)據(jù)拷貝給AI訓(xùn)練工程師進行訓(xùn)練;二是AI引擎將合成的語音流傳回到電話系統(tǒng),滿足現(xiàn)場人員與“虛擬調(diào)度員”通話條件。
(2)語音識別模型訓(xùn)練區(qū)
在訓(xùn)練區(qū)中需要處理和收集兩類數(shù)據(jù),一類是電力專業(yè)領(lǐng)域語料數(shù)據(jù),包含人名、地名、線路名和過去的調(diào)度操作票等文本數(shù)據(jù);第二類是通過電話系統(tǒng)拷貝的語音數(shù)據(jù),通過AI訓(xùn)練師利用工具進行標(biāo)注并審核,得到訓(xùn)練語言模型的訓(xùn)練數(shù)據(jù)。
(3)模型部署運行&后處理區(qū)
模型訓(xùn)練后,語音合成模型部署到生產(chǎn)區(qū),并提供調(diào)用API的服務(wù)。當(dāng)虛擬調(diào)度員跟現(xiàn)場進行通話時,實時語音流通過調(diào)度電話軟交換系統(tǒng),以SIP協(xié)議的方式傳輸?shù)紸I引擎,AI引擎將語音流數(shù)據(jù)調(diào)用語音識別API,獲取識別文本。識別文本傳輸給AI引擎,AI引擎反饋調(diào)度對話文本,調(diào)用語音合成模型,得到語音流文件,最后傳輸給調(diào)度電話軟交換系統(tǒng)。
通過以上三個作業(yè)步驟,完成了語音從訓(xùn)練到生產(chǎn)使用的完整過程,實現(xiàn)智能化的計劃檢修調(diào)度語音人機交互。
在試點項目中,AI引擎技術(shù)進行專門的電力操作票識別和語音訓(xùn)練,電力操作票識別學(xué)習(xí)不少于1000張,調(diào)度指令不少于40000條。系統(tǒng)可對不理解的信息主動發(fā)問,正確下達指揮命令。
系統(tǒng)運行后,在故障搶修生產(chǎn)方面,可避免誤報事故、提升搶修效率、降低故障報修量等。項目價值見下表。
表 項目價值體現(xiàn)
在配電網(wǎng)運行方面,“虛擬調(diào)度指揮員”可以并行許可同時開展的現(xiàn)場作業(yè),緩解配網(wǎng)調(diào)度“樞紐堵塞”問題,縮短停電時間,可多向用戶供電:
式中,N為停電項目數(shù);T為停電時間,min;Q為停電項目應(yīng)供電量。由式(1)可知,減少停電項目越多,挽回經(jīng)濟損失越多。
以某一個中大型城市為例,平均每天約有150個停電作業(yè)項目,以每個項目縮短停電時間10min計算,平均每天可多供電43250kWh,每年多供電約1578萬kWh,挽回因停電造成的經(jīng)濟損失在千萬元以上。
本設(shè)計研究成果應(yīng)用于國網(wǎng)某省級公司配網(wǎng)分支線計劃檢修和配網(wǎng)主干線計劃檢修的生產(chǎn)環(huán)境中,其中配調(diào)業(yè)務(wù)一半以上人工由配電AI負責(zé)完成。通過對配調(diào)業(yè)務(wù)流程優(yōu)化調(diào)整,將生產(chǎn)指揮虛擬坐席角色擴展到配網(wǎng)生產(chǎn)指揮全部專業(yè),預(yù)計1~2年時間可代替絕大部分的人力流程性工作,釋放的人力可以進行更多有價值的高級業(yè)務(wù)工作,提升配網(wǎng)調(diào)度工作能效。