王林信,余向前,歐陽燕,陳元楷,張曉慶
(國網(wǎng)甘肅省電力公司,蘭州 730030)
新冠肺炎疫情在全世界快速蔓延[1—2],對世界各國產(chǎn)生影響,導致全球經(jīng)濟增長動能不足,進出口貿易及全球供應鏈、產(chǎn)業(yè)鏈受到?jīng)_擊和制約[3—4]。中國作為全球產(chǎn)業(yè)鏈的核心國家之一,國內的進出口行業(yè)受到疫情沖擊[5],導致部分上下游企業(yè)資金鏈斷裂,無力支付電費,給供電企業(yè)的電費回收帶來了極大困擾[6—8]。因此,亟需采用有效的方法來進行電費回收風險分析,并采用相應的措施進行電費催繳,提高電費回收率。
國內外許多學者對新冠疫情形勢下的電費回收風險分析做了研究。文獻[9]提出了一種基于閉環(huán)管控的新冠疫情形勢下的電費回收方法,通過日動態(tài)跟蹤和風險閉環(huán)清單來進行電費回收風險分析。文獻[10]提出了一種基于風險方法的疫情下電費回收風險分析方法,通過疫情下的“六保”應收賬款分析,對電費回收進行預測。文獻[11]提出了一種基于ε-SVR模型的電費回收風險識別方法,通過特征識別與特征構造,在多個學習器上對用戶電費回收風險進行綜合識別。文獻[12]提出了一種基于大數(shù)據(jù)分析的用戶電費回收風險預測方法,通過構建用戶用電行為、繳費行為等相關矩陣,運用邏輯回歸算法預測用戶電費回收風險。文獻[13]提出了一種基于隨機森林的的電費回收風險分析方法,通過隨機森林評判電費的多個風險等級來預測用戶電費回收風險。由此可見,新冠疫情形勢下的電費回收風險分析方法多樣,且取得了一定的成果。但預測方法對用戶多時間尺度的數(shù)據(jù)分析不足,電費回收風險分析準確性較差,同時對于欠費用戶分析不足,電費催費針對性較差。
針對新冠疫情形勢下電費回收風險分析準確性差、催費針對性不強的問題,本文提出了一種基于長短期記憶網(wǎng)絡的電費回收風險分析方法,該方法能在建立用戶分級分類體系的基礎上,進行用戶的信用評估,并結合歷史繳費情況、用電特性等因素進行用戶電費回收的預測。最后,將本方法應用于某地區(qū)供電公司,其應用結果,驗證了本方法的可行性。
文中提出了基于長短期記憶網(wǎng)絡的電費回收風險分析方法,該方法重點考慮了用戶多時間尺度數(shù)據(jù)綜合分析的問題,電費回收框架如圖1 所示。該框架主要包括用電客戶分類、信用評估、電費回收風險分析3個環(huán)節(jié)。
圖1 電費回收風險分析Fig.1 Risk analysis of electricity tariff recovery
(1)在用電客戶分類分級環(huán)節(jié),首先結合用戶的檔案數(shù)據(jù)、歷史用電數(shù)據(jù),采用AP 聚類方法對用電客戶進行分類。其次,根據(jù)用戶的用電特征屬性進行用戶的用電級別劃分。
(2)在信用評估環(huán)節(jié),通過熵權法建立用戶信用評估矩陣,結合用戶征信、司法裁判等信息綜合對供電用戶的信用進行評估。
(3)在電費回收風險分析方面,首先結合國內、國際經(jīng)濟形勢對行業(yè)趨勢變化進行分析,其次,通過長短期記憶網(wǎng)絡,結合用戶的歷史的繳費信息和用戶信用,對用戶的繳費行為評估分析,從而獲得用戶的電費回收風險分析結果,最后,方法生成用戶電費催繳建議策略。
基于長短期記憶網(wǎng)絡的電費回收風險分析方法是一種充分考慮多時間尺度數(shù)據(jù)特性,并采用長短期記憶網(wǎng)絡進行電費回收風險分析的方法[14—15],該方法可提高電費回收風險分析準確度,并生成電費催繳建議。
受新冠疫情的影響,用戶在繳納電費時呈現(xiàn)的特征差別較大,通過對用電客戶的分級分類,可以精準掌握用戶的繳費特性。
近鄰傳播聚類(affinity propagation clustering,AP)是一種多維度、多類別的快速聚類方法,該方法具有無需指定聚類數(shù)目和計算準確的特點,可有效的提高聚類的運行效率與準確度[16—17]。
用電電費繳費相似度矩陣K(as,bs)為
式中:Las、Lbs分別為用電客戶as與用電客戶bs繳納電費時間離散特征到指標中心聚類點z 的歐化距離;?為離散特征值權重。
選用多次迭代的F指標作為近鄰傳播聚類的偏向函數(shù)和收斂依據(jù),聚類后,相似度矩陣K(as,bs)更新為
式中:Ca為用戶電費繳費相似度矩陣的對角線中位數(shù);Δf為迭代檢索閾值;Fmin為多次迭代的最小值。通過式(2),可獲得用電客戶的電費回收分類。
用電客戶信用評估是電費回收預測的重要因素,用戶的信用評估越好,電費繳費越及時;用戶的信用評估越長,則越可能存在電費欠費的行為。針對不同區(qū)域的用戶,信用評估指標的權重會存在差異,因此,在對用電客戶進行分級分類后,通過熵權法[18—20]建立用電用戶信用評估矩陣,通過用戶征信、司法裁判等信息綜合對供電用戶的信用進行評估,評估矩陣選取指標如表1所示。
表1 用電客戶信用評估Table 1 Electricity customer credit evaluation
通過熵權法建立用戶信用評估矩陣的權重本文的評估矩陣指標選擇數(shù)量為6個,標準數(shù)據(jù)Va為
式中:n為給定的指標個數(shù);U為指標標準化前的值;V為指標標準化后的值。
電費回收的每個指標的權重為Wi=(W1,W2,…,W6)為
式中:λ為電費回收的每個指標的信息熵;p為標準中心值。通過指標權重,可計算出用電客戶的信用評估。
長短期記憶網(wǎng)絡(long short term memory network,LSTM)是一種在時間維度的循環(huán)網(wǎng)絡。LSTM網(wǎng)絡在循環(huán)神經(jīng)網(wǎng)絡的基礎上進行了改進,可以處理多時間尺度特征數(shù)據(jù)依賴關系的問題[21—24]。因此,文中采用LSTM網(wǎng)絡進行電費回收風險分析。
輸入的數(shù)據(jù)合集Za為
式中:Ga為輸入的用電客戶信用評價數(shù)據(jù);Sa為用電客戶的歷史繳費數(shù)據(jù);Qa為用電客戶的行為特征數(shù)據(jù)。
輸入的隱含信息合計Lm為
式中:Lg為設輸入的信用評價的隱含信息;Ls為用電客戶歷史繳費數(shù)據(jù)隱含信息;Lq為用電客戶行為特征的隱含數(shù)據(jù)。
用電客戶的回收風險分析數(shù)據(jù)To為
式中:Δa為長短期記憶網(wǎng)絡的輸入激活函數(shù);tanh為遺忘門存儲激活函數(shù)。
由式(7)可見,可通過LSTM網(wǎng)絡獲得的電費回收風險分析數(shù)據(jù),在此基礎上,依據(jù)供電公司的電費回收風險評估分值等級,生成催繳建議清單,催繳建議如表2所示。
表2 電費催繳建議Table 2 Proposal for electricity charge collection
在電費催繳建議表中,一級用戶為高風險用戶,存在無力支付電費的風險,需供電公司營銷部門增大催繳力度。二級用戶是用電用戶資金鏈運轉正常,但該類用戶有經(jīng)常拖欠電費的歷史,需供電公司營銷部門進行催繳。三級用戶是用電用戶存在資金鏈風險,需供電公司營銷部門對該類用電用戶進行電費催繳提醒。四級用戶是用電用戶繳費正常、無拖欠的用戶,無需供電公司營銷部門進行關注。
基于長短期記憶網(wǎng)絡的電費回收風險分析仿真流程步驟如下。
步驟1:根據(jù)輸入的用電客戶歷史繳費信息、用戶征信信息進行用電客戶的分類分級。
步驟2:使用信用評估矩陣對用電客戶的信用進行評估。
步驟3:在用電客戶的行業(yè)發(fā)展趨勢特征、用電客戶繳費行為特征分析的基礎上進行用電客戶電費回收風險分析。
步驟4:針對有風險的用電客戶,生成催繳建議清單。
采用本文所提的基于長短期記憶網(wǎng)絡的電費回收風險分析方法,某地區(qū)供電公司進行實例運行,使用操作系統(tǒng)環(huán)境為win10,CPU 為INTEL 至強2.4 G,內存為32 G,硬盤為2 TB。
文中用于比對的是文獻[25]中的Stacking 模型,該模型在供電公司電費回收領域廣泛運用,具有電力行業(yè)的通用性。
(1)電費回收風險分析性能
電費回收風險分析性能是指模型運行的速度,該指標是衡量模型優(yōu)劣的重要指標之一,文中所用模型電費回收風險分析模型的運行時長來衡量模型的性能,運行時長越短,說明電費回收風險分析模型性能越好。
采用本文所提的基于長短期記憶網(wǎng)絡的電費回收風險分析方法與Stacking融合模型進行電費回收運行性能測試,選擇的用電客戶數(shù)據(jù)分別為100、200、500、1 000、5 000、10 000,2 種模型比較的結果如表3所示。
表3 電費回收風險分析性能Table 3 Risk analysis and performance of electricity tariff recovery
由表3 可見,基于長短期記憶網(wǎng)絡的電費回收風險分析方法模型的電費預測處理性能優(yōu)于Stacking融合模型。
(2)電費回收風險整體分析準確性
電費回收風險整體分析的準確性是衡量文中所提模型的核心關鍵指標。該指標是電費回收風險分析是否有效的關鍵因素,文中所提的正確電費回收風險預測用電客戶為分析模型判斷該用戶欠費,當月繳費中,該用戶實際欠費即為準確。采用模型風險分析正確的用電客戶數(shù)量比電費回收分析用電客戶總數(shù)的比值,該指標越大電費回收風險分析的準確性就越好。
采用本文所提的基于長短期記憶網(wǎng)絡的電費回收風險分析方法與Stacking融合模型進行電費回收風險預測準確性測試,訓練樣本數(shù)據(jù)選用某地區(qū)供電公司50 000個用戶2019年的電費回收數(shù)據(jù),驗證集數(shù)據(jù)選用采用10 000 個用電客戶2020 年的電費回收風險分析數(shù)據(jù)與實際數(shù)據(jù)進行比較。2種算法的電費回收風險分析的準確性如表4所示。
表4 電費回收風險分析準確度Table 4 Accuracy for risk analysis of electricity tariff recovery%
由表4 可見,按供電公司月應回收電費10 億元計算,基于長短期記憶網(wǎng)絡的電費回收風險分析方法模型電費回收較Stacking 融合模型提高了1 120萬元收入,因此,基于長短期記憶網(wǎng)絡的電費回收風險分析方法模型的電費回收分析準確性優(yōu)于Stacking融合模型。
(3)歷史正常繳費用電客戶電費回收風險分析準確性
供電公司營銷工作人員往往能根據(jù)經(jīng)驗能判斷出經(jīng)常欠電費的用戶,并進行催收。但之前月份正常繳費的用電客戶突然無法正常繳費的情況,供電公司營銷人員往往不能正確判斷。歷史正常用電客戶電費回收風險分析準確性,是衡量電費回收風險的重要指標之一,該分析是模型判斷出歷史正常繳費客戶出現(xiàn)欠費的用電客戶數(shù)量與歷史正常客戶總數(shù)量之比。
采用本文所提的基于長短期記憶網(wǎng)絡的電費回收風險分析方法與Stacking融合模型進行歷史正常繳費用電客戶電費回收風險分析準確性測試,選擇2021 年1—6 月某供電公司的10 000 個歷史繳費正常用戶數(shù)據(jù)。兩種算法的電費回收風險分析的準確性如表5所示。
表5 歷史正常繳費用電客戶電費回收風險分析準確度Table 5 Accuracy for risk analysis of tariff recovery of historical normal paying customers%
由表5 可見,基于長短期記憶網(wǎng)絡的電費回收風險分析方法在歷史正常繳費用電客戶電費回收風險分析準確性方面優(yōu)于Stacking融合模型。
(4)電力催費分析
電力催費分析是為了評估電力用戶定向催費有效性的指標,該指標的計算方式為選擇相同數(shù)量的用戶進行催費,催費后,供電公司電費收入金額增長越多,就說明催費效果越好。
選擇催費的用戶數(shù)為100、200、300、400、500戶,采用文中所提基于長短期記憶網(wǎng)絡的電費回收風險分析方法與Stacking融合模型比較電費催費后供電公司收入增加值,比較結果如表6所示。
表6 催費后電費收入增加Table 6 Electricity tariff income increase after urging
由圖6可見,在不同的催費數(shù)量情況下,文中所提基于長短期記憶網(wǎng)絡的電費回收風險分析方法電費收入均比Stacking融合模型高。
為解決新冠疫情形勢下電費回收風險分析準確性差的問題,本文提出了一種基于長短期記憶網(wǎng)絡的電費回收風險分析方法,設計了一種基于長短期記憶網(wǎng)絡的電費回收風險分析模型,通過AP聚類方法,實現(xiàn)了用電客戶的分類和分級,然后,通過熵權法建立用電客戶信用評估矩陣,采用用電用戶征信、司法裁判等信息進行用電客戶信用評價,再次,通過長短期記憶網(wǎng)絡,結合用戶的歷史繳費信息和用戶信用進行電費回收風險分析。最后,將本方法在某地區(qū)的供電企業(yè)進行運行應用,其結果表明本方法可行,且性能、準確率均優(yōu)于Stacking融合模型電費回收風險分析方法。
下一步,將結合電費回收的考核機制,對電費回收風險分析做進一步優(yōu)化。D