国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型

2019-04-26 08:56:24李撈扒鄒陽曾曉勤
微型電腦應(yīng)用 2019年4期
關(guān)鍵詞:電費(fèi)決策樹軌跡

李撈扒, 鄒陽, 曾曉勤

(河海大學(xué) 計算機(jī)與信息學(xué)院,南京 211100)

0 引言

電費(fèi)資金回收是電網(wǎng)企業(yè)的生命線,電費(fèi)收取的風(fēng)險不僅會影響電網(wǎng)企業(yè)的持續(xù)健康發(fā)展,也勢必會影響整個國民經(jīng)濟(jì)的穩(wěn)定性[1]。隨著國家電網(wǎng)公司建設(shè)的一體化繳費(fèi)管理平臺逐漸開始支持電網(wǎng)企業(yè)、金融機(jī)構(gòu)和非金融機(jī)構(gòu)等多種繳費(fèi)渠道的接入,為客戶提供了便捷靈活的繳費(fèi)方式,同時也增加了電費(fèi)資金在從客戶到第三方繳費(fèi)渠道再到電網(wǎng)企業(yè)的流動過程中的收取風(fēng)險。那么如何加強(qiáng)電費(fèi)資金安全管理技術(shù)應(yīng)用,系統(tǒng)性梳理電費(fèi)流轉(zhuǎn)各環(huán)節(jié)風(fēng)險點(diǎn),防范各環(huán)節(jié)資金安全風(fēng)險,確保電費(fèi)顆粒歸倉,已成為電網(wǎng)企業(yè)營銷管理部門的重要任務(wù)。

目前,關(guān)于電費(fèi)資金安全風(fēng)險監(jiān)控的研究主要集中在防范客戶層面上的拖、欠費(fèi)風(fēng)險,且通常采用的是基于數(shù)學(xué)和統(tǒng)計學(xué)的方法,少部分研究者已經(jīng)開始嘗試將機(jī)器學(xué)習(xí)方法引入到拖、欠費(fèi)風(fēng)險評估中。對于客戶層面的風(fēng)險監(jiān)控研究已經(jīng)取得了很多實質(zhì)性的成果并有部分信用評價系統(tǒng)、風(fēng)險評估系統(tǒng)和欠費(fèi)預(yù)警系統(tǒng)進(jìn)入實際上線運(yùn)行階段[2],但隨著電力體制改革的不斷深化,繳費(fèi)渠道存在的風(fēng)險被逐漸暴露出來,然而,目前對繳費(fèi)渠道風(fēng)險的研究屈指可數(shù),且仍主要是套用客戶風(fēng)險研究方法。由于客戶只是電費(fèi)資金流轉(zhuǎn)過程中的一個環(huán)節(jié),而目前的電費(fèi)風(fēng)險監(jiān)控系統(tǒng)又缺乏對繳費(fèi)渠道存在的風(fēng)險進(jìn)行系統(tǒng)梳理、有效識別和精準(zhǔn)防控,所以現(xiàn)有的風(fēng)險監(jiān)控策略不能形成輻射全過程的風(fēng)險防范預(yù)案。

經(jīng)過長期對電力客戶繳費(fèi)行為軌跡的跟蹤觀測研究,發(fā)現(xiàn)除電網(wǎng)企業(yè)本身繳費(fèi)渠道外,其他繳費(fèi)渠道均隱藏著潛在的資金流異常,主要表現(xiàn)為收取電費(fèi)后攜款外逃、使用充值卡套取多重手續(xù)費(fèi)、不定時長截留電費(fèi)、查繳比偏高、重復(fù)扣款和對賬不及時等風(fēng)險。本文在已明確第三方繳費(fèi)渠道存在的風(fēng)險類型、成因機(jī)理和表現(xiàn)形式的基礎(chǔ)之上,提出了一個基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型。首先對客戶的繳費(fèi)記錄進(jìn)行定性分析,通過分析客戶的繳費(fèi)記錄追蹤到其繳費(fèi)行為軌跡,進(jìn)而根據(jù)風(fēng)險類型識別模型判斷出該客戶潛在的風(fēng)險類型;然后確定各風(fēng)險評估指標(biāo),建立渠道風(fēng)險評估指標(biāo)體系,定量統(tǒng)計渠道不同風(fēng)險類型的各評估指標(biāo)值;最后通過風(fēng)險評估模型得到渠道各風(fēng)險類型的風(fēng)險指數(shù)和風(fēng)險排名。該模型將機(jī)器學(xué)習(xí)方法引入到風(fēng)險類別識別模型和風(fēng)險評估模型中,同時將定性指標(biāo)和定量指標(biāo)分開考慮,解決了傳統(tǒng)方法中魯棒性較差和機(jī)器學(xué)習(xí)方法中解釋性較差的問題,且獲得了可信度較高的風(fēng)險評估結(jié)果。

1 相關(guān)研究

我國電力行業(yè)于本世紀(jì)初開始引入風(fēng)險監(jiān)控研究,經(jīng)過近些年對電費(fèi)收取風(fēng)險監(jiān)控的研究與探索,相繼從不同角度分別提出了一些值得借鑒的風(fēng)險評估方法和思想。

起初,風(fēng)險評估主要是采用基于數(shù)學(xué)和統(tǒng)計學(xué)的方法,其中,基于數(shù)據(jù)統(tǒng)計特征的熵權(quán)法(entropy weight method, EWM)[3],由于忽略了不同評估指標(biāo)間存在的關(guān)系,所以通常作為評估指標(biāo)的計量方法,而不適合作為風(fēng)險評估方法;層次分析法(analytic hierarchy process, AHP)[4]是應(yīng)用最廣泛的風(fēng)險評估方法,其本質(zhì)是主觀經(jīng)驗的客觀標(biāo)量轉(zhuǎn)化,然而由于不同的應(yīng)用場景對判斷矩陣的一致性要求不同,直接使用CR<0.1缺乏科學(xué)依據(jù)[5],所以實際評估效果一般;改進(jìn)了AHP中CR值不確定問題的模糊層次分析法(fuzzy analytic hierarchy process, FAHP)[6]是將模糊數(shù)學(xué)理論與AHP相結(jié)合,把判斷矩陣改造成模糊一致矩陣,使用檢驗行間對應(yīng)元素差是否為同一常數(shù)代替判斷矩陣的一致性檢驗,但FAHP仍需要Delphi專家調(diào)研法和EM標(biāo)度法的支持,計算復(fù)雜度較高。

后來,隨著人工神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的研究熱潮再次掀起,這些方法也逐漸被應(yīng)用到電力行業(yè)風(fēng)險監(jiān)控的相關(guān)預(yù)測研究中。文獻(xiàn)[7]利用SVM和BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)了對客戶按風(fēng)險程度分類,但由于風(fēng)險評估指標(biāo)體系中既有定性指標(biāo)又有定量指標(biāo),而此類方法只能進(jìn)行定量分析,所以導(dǎo)致其評估結(jié)果的解釋性較差,限制了其工程應(yīng)用;文獻(xiàn)[8]嘗試使用決策樹算法預(yù)測客戶欠費(fèi)風(fēng)險類型,但文中并未屏蔽與風(fēng)險預(yù)測無關(guān)的指標(biāo),造成得出的決策樹結(jié)構(gòu)較復(fù)雜;文獻(xiàn)[9-11]將機(jī)器學(xué)習(xí)中的K-Means聚類算法、Logistic回歸分析法和遺傳算法等應(yīng)用到電費(fèi)收取風(fēng)險評估中,但對于數(shù)據(jù)量較少的渠道風(fēng)險,預(yù)測的精度往往不是很理想。

為了解決上述方法中存在魯棒性和解釋性較差的問題,同時為了提高預(yù)測的準(zhǔn)確率和降低模型的復(fù)雜度,應(yīng)盡量選取與繳費(fèi)行為相關(guān)且客觀可統(tǒng)計的評估指標(biāo)。根據(jù)所選的評估指標(biāo),先使用改進(jìn)的決策樹算法將客戶按定性指標(biāo)分類,然后定量統(tǒng)計渠道各風(fēng)險類型的評估指標(biāo)值,最后使用回歸分析法(regression analysis)尋求風(fēng)險評估指標(biāo)與渠道風(fēng)險指數(shù)間的關(guān)系。為了解決回歸模型在求解輸入向量與目標(biāo)輸出間的多元函數(shù)表達(dá)式組時可能出現(xiàn)異方差性問題,嘗試使用加權(quán)最小二乘法(weighted least square method, WLS)[12]對原模型進(jìn)行修正,使得到的參數(shù)估計量同時具有無偏性和有效性。

2 構(gòu)建渠道風(fēng)險監(jiān)控模型

電費(fèi)資金的流轉(zhuǎn)過程可以簡單地描述為:用戶通過第三方渠道繳納電費(fèi),第三方渠道定期將收到的電費(fèi)轉(zhuǎn)給電網(wǎng)企業(yè)。針對繳費(fèi)渠道在收取電費(fèi)過程中、收繳時間差內(nèi)、與電網(wǎng)企業(yè)對賬時存在的諸多風(fēng)險點(diǎn),現(xiàn)通過構(gòu)建基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型,以期及時發(fā)現(xiàn)潛在的風(fēng)險類型并對其進(jìn)行有效識別和精準(zhǔn)預(yù)測,為制定相應(yīng)的防范措施提供決策依據(jù)。

2.1 追蹤繳費(fèi)行為軌跡

客戶繳費(fèi)行為軌跡是分析電費(fèi)資金流轉(zhuǎn)各環(huán)節(jié)風(fēng)險的最直接依據(jù),也是本模型的研究出發(fā)點(diǎn)。如表1所示。

表1 原始格式的數(shù)據(jù)記錄

在電費(fèi)營銷管理系統(tǒng)中,繳費(fèi)記錄包含渠道號、網(wǎng)點(diǎn)號、用戶號、費(fèi)用周期、賬單編號、交易流水號、交易時間、收費(fèi)類型、繳費(fèi)方式、結(jié)算方式、收費(fèi)金額、滯納金等字段,所以可通過數(shù)據(jù)庫中的繳費(fèi)記錄追蹤到客戶的繳費(fèi)行為軌跡,進(jìn)而判斷其可能存在的風(fēng)險類型。以下將以沖正套現(xiàn)風(fēng)險點(diǎn)為例對模型進(jìn)行描述,沖正套現(xiàn)是指第三方渠道以某種手段將客戶繳納電費(fèi)的操作從電力公司的營銷管理系統(tǒng)中撤回,電費(fèi)資金將回流到第三方渠道賬戶。

2.1.1 數(shù)據(jù)格式轉(zhuǎn)換

為方便追蹤客戶在一個費(fèi)用周期內(nèi)的繳費(fèi)行為軌跡,需要將其在一個費(fèi)用周期內(nèi)的所有繳費(fèi)操作歸納成一條記錄,具體的做法是先將數(shù)據(jù)庫中原始數(shù)據(jù)記錄轉(zhuǎn)換成單條數(shù)據(jù)格式,如表2所示。然后以客戶為單位,按時間先后排序,最后將單條數(shù)據(jù)格式歸并為單戶數(shù)據(jù)格式,如表3所示。同時對收費(fèi)類型、繳費(fèi)方式和結(jié)算方式字段重新編碼,其中,單條數(shù)據(jù)格式包括渠道號rcv_org_no、網(wǎng)點(diǎn)號branch、用戶號cons_id、賬單年月charge_ym、繳費(fèi)時間charge_date、收費(fèi)類型type_mode、繳費(fèi)方式pay_mode、結(jié)算方式settle_mode和收費(fèi)金額rcv_amt 9個屬性;單戶數(shù)據(jù)格式包括用戶號cons_id、賬單年月charge_ym、單條數(shù)據(jù)個數(shù)refer_id_num、單條數(shù)據(jù)集合refer_id_list 4個字段,其中的refer_id_list由單條數(shù)據(jù)標(biāo)識refer_id順序排列并以逗號分隔而成;編碼策略是將以01開頭的0101~0116分別映射到A~P,以02開頭的0201~0216分別映射到a~p。

表2 單條數(shù)據(jù)格式的數(shù)據(jù)記錄

表3 單戶數(shù)據(jù)格式的數(shù)據(jù)記錄

2.1.2 簡化繳費(fèi)行為軌跡序列

由2.1.1可知,每次繳費(fèi)行為可用收費(fèi)類型、繳費(fèi)方式和結(jié)算方式3個字段組成的編碼組表示。由于客戶繳費(fèi)行為具有較大的隨意性,所以數(shù)據(jù)中反映出來的繳費(fèi)軌跡復(fù)雜多樣,因此有必要對繳費(fèi)行為軌跡進(jìn)行簡化,提取出關(guān)鍵行為節(jié)點(diǎn)。經(jīng)過對沖正套現(xiàn)業(yè)務(wù)的深入分析,得到如下簡化規(guī)則:

1)與前一步相同的操作不再加入整體軌跡序列。

2)反復(fù)進(jìn)行沖正和充值卡繳費(fèi)的操作,合并后僅保留一組序列。

3)任意一種繳費(fèi)操作和預(yù)收結(jié)轉(zhuǎn)電費(fèi)操作聯(lián)合發(fā)生時,合并后保留其中一個編碼組。

4)如果在沖正操作之后發(fā)生預(yù)收結(jié)轉(zhuǎn)電費(fèi),則忽略該條轉(zhuǎn)賬記錄。

經(jīng)過上述兩步處理后,可得到簡化的某客戶在指定費(fèi)用周期內(nèi)有時序特征的繳費(fèi)行為軌跡序列。那么上例對應(yīng)簡化的繳費(fèi)行為軌跡序列為:AAKIAKCAF。

2.1.3 風(fēng)險類別識別

風(fēng)險類型識別是根據(jù)簡化的客戶繳費(fèi)行為軌跡序列判斷其潛在的風(fēng)險類型,是定性分析的核心內(nèi)容。在創(chuàng)建風(fēng)險類型識別模型之前,需要明確的是沖正套現(xiàn)風(fēng)險點(diǎn)包含了三種風(fēng)險類型,如表4所示。

表4 風(fēng)險類型

創(chuàng)建風(fēng)險類型識別模型,首先需要構(gòu)造數(shù)據(jù)集。從某省2017年6月到10月的每個月份中抽取5000個典型用戶的所有繳費(fèi)記錄,將其軌跡序列作為特征屬性,使用Delphi專家調(diào)研法標(biāo)注對應(yīng)的風(fēng)險類型。為了保證樣本占用的存儲空間相等,文中采用稀疏矩陣存儲樣本特征,并使用0來填充空缺位置,同時設(shè)置最后一列為目標(biāo)分類結(jié)果。假設(shè)稀疏矩陣的長度為10,那么上例轉(zhuǎn)化為樣本時對應(yīng)的數(shù)據(jù)格式如表5所示。

表5 數(shù)據(jù)集中的樣本

由于繳費(fèi)行為軌跡序列具有較強(qiáng)的時序性,所以選擇機(jī)器學(xué)習(xí)方法中基于信息熵增益的ID3決策樹算法對軌跡序列進(jìn)行分類,每次劃分子樹前,先計算下一個編碼組的信息增益,然后選擇信息增益最大的編碼組進(jìn)行分裂,直到遍歷完所有編碼組,其中,信息增益如式(1)。

(1)

式中:H表示信息熵,S表示全部樣本,value(i)是第i組樣本的所有取值集合,v是第i組樣本的一個取值,Sv表示S中第i組值為v的全部樣本,|Sv|表示Sv中包含的樣本數(shù)。

由于無法預(yù)知客戶未來繳費(fèi)行為軌跡序列的最大長度,所以為了提高識別模型的精度和決策樹的泛化能力,使用正則表達(dá)式對決策樹進(jìn)行模式匹配和邏輯補(bǔ)充。從數(shù)據(jù)集的每個月份中隨機(jī)選取4 000條數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練得到如圖1所示的風(fēng)險類型識別模型,其中:“0”代表是否存在后續(xù)操作,即繳費(fèi)行為軌跡是否到此終止;“01”、“02”、“03”、“04”分別對應(yīng)表4中的風(fēng)險類型編號。

2.2 建立風(fēng)險評估指標(biāo)體系

風(fēng)險評估指標(biāo)體系是定量統(tǒng)計的依據(jù),也是風(fēng)險評估的前提,將直接影響評估結(jié)果的合理性。如圖1所示。

圖1 風(fēng)險類型識別模型

在選取風(fēng)險評估指標(biāo)時,應(yīng)遵循精簡可靠、滿足需求、縱向可比性高且客觀統(tǒng)計特征強(qiáng)等原則。如前所述,為降低風(fēng)險類型識別模型的結(jié)構(gòu)復(fù)雜度、提高定性識別的準(zhǔn)確率,應(yīng)盡量選取與繳費(fèi)行為相關(guān)度較高的特征屬性,通過追蹤客戶的繳費(fèi)行為軌跡可判斷出其潛在的風(fēng)險類型,進(jìn)而可得到某渠道下存在每種風(fēng)險的風(fēng)險次數(shù)、風(fēng)險金額、風(fēng)險次數(shù)比、風(fēng)險金額比、風(fēng)險總時長、平均風(fēng)險時長和風(fēng)險高峰時段等統(tǒng)計指標(biāo)。

參考目前在企業(yè)信用管理中廣泛使用的5C理論和AHP中關(guān)于指標(biāo)體系的討論,結(jié)合電力行業(yè)特點(diǎn)及渠道風(fēng)險評估需要,本文建立了一套基于風(fēng)險類型的、多層次遞階的渠道風(fēng)險評估指標(biāo)體系,如圖2所示。

2.3 渠道風(fēng)險評估

在定性分析確定客戶風(fēng)險類型和定量統(tǒng)計得到渠道各風(fēng)險評估指標(biāo)值的基礎(chǔ)之上,可使用機(jī)器學(xué)習(xí)方法對渠道風(fēng)險進(jìn)行評估預(yù)測,這樣就可以解決由直接對原始數(shù)據(jù)使用機(jī)器學(xué)習(xí)方法造成的評估結(jié)果解釋性較差的問題,實現(xiàn)分類評估。由渠道風(fēng)險評估指標(biāo)體系可知,對于目標(biāo)層1、2、3、4、5和6,其決策層之間是相互獨(dú)立的,所以可使用回歸分析法構(gòu)建自動化的風(fēng)險評估模型,計算各風(fēng)險類型的風(fēng)險指數(shù)值,進(jìn)而可得到統(tǒng)計推斷下的渠道各風(fēng)險排名。由于不同的風(fēng)險類型對應(yīng)著不同的風(fēng)險評估模型,但其創(chuàng)建過程大同小異,所以以下將以截留電費(fèi)風(fēng)險為例,對風(fēng)險評估模型的創(chuàng)建過程進(jìn)行描述。

圖2 渠道風(fēng)險評估指標(biāo)體系

由于Delphi專家調(diào)研法得到的評估結(jié)果最直接、最具有參考意義,所以通常將其作為回歸分析的參考依據(jù)。本文選取連續(xù)3個費(fèi)用周期內(nèi)的500個存在截留電費(fèi)風(fēng)險的典型渠道作為回歸樣本,為了弱化主觀經(jīng)驗對回歸結(jié)果的影響,使用具有相對關(guān)系的排名代替具體的風(fēng)險指數(shù)值。設(shè)樣本P=[p1,…,p500],權(quán)重向量X=[x1,…,x6],風(fēng)險指數(shù)Y=[y1,…,y500],且yi已按從大到小排序,根據(jù)回歸分析的思想,yi=X·pi,那么yi-yi+1≥0恒成立,故存在多元回歸函數(shù)不等式組成立式(2)。

(2)

解出該多元不等式方程組即可得出權(quán)重向量X。

由于直接求解不等式組難度較大,所以可將上述不等式轉(zhuǎn)化為形式上的等式,即yi-yi+1=ξi,其中ξi為常數(shù)。那么式(2)可寫成式(3)。

(3)

用D-1對原模型進(jìn)行加權(quán),得到式(4)。

D-1·Y=D-1·X·A+D-1·B

(4)

通過變量替換,令Y*=D-1·Y,X*=D-1·X,B*=D-1·B,式(4)可寫成式(5)。

Y*=X*·A+B*

(5)

此時(5)的協(xié)方差

Cov(B*,B*)=E(D-1·B·B·(D-1)T)=

所以新模型不存在異方差性,再對新模型使用LSM得到參數(shù)估計量XWLS=(AT·W-1·A)-1·AT·W-1·Y,此時的XWLS同時具有無偏性和有效性。

如何求解參數(shù)估計量XWLS,可以歸結(jié)為如何確定加權(quán)矩陣W的值。首先對原模型X·A=b運(yùn)用最小二乘法得到誤差項的近似估計量ei,然后由ei組成加權(quán)矩陣W,那么基于WLS的回歸分析基本流程如下:

1)求出原模型的最小二乘解(AT·A)-1·AT·b,并計算誤差項的近似估計量ei。

2)利用ei構(gòu)造合適的加權(quán)矩陣W=D·DT。

3)將D-1左乘原模型的兩邊得到新模型,再求出新模型的最小二乘解(AT·W-1·A)-1·AT·W-1·b。

綜上,可得到基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型的算法,偽代碼描述如下:

算法1:基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控算法

Algorithm1: ChannelMonitor()

Input: 費(fèi)用周期區(qū)間[t1,t2],截留和延遲時長閾值x1

Output: Map;//String存儲渠道號c,

RiskRank包含風(fēng)險類型t,風(fēng)險指數(shù)i和風(fēng)險排名r 3個屬性

1)List monthList=splitDate(t1,t2);

2)foreachpmonthinmonthListdo

3) String info=getOriRecord(pmonth.getStartDate(),

pmonth.getEndDate());//獲取原始數(shù)據(jù)

4) Map userMap=formatData(info); //格式化成單戶數(shù)據(jù)格式

5)foreach(id,user)inuserMapdo

6) String paySeq=getPaySeq(user);//追蹤繳費(fèi)行為

軌跡序列

7) String keyPaySeq=simplePaySeq(paySeq);//簡化

軌跡序列,提取出關(guān)鍵行為節(jié)點(diǎn)

8) user.setRiskType(cognRiskType(keyPaySeq,x1));

//根據(jù)簡化的軌跡序列識別潛在的風(fēng)險類型

9) userMap.put(id,user);

10)endforeach

11) Map channelStatsMap= statsData (userMap);//統(tǒng)計每個渠道各風(fēng)險類型的指標(biāo)值

12)foreachXRiskinRISKTYPELISTdo

13) XRiskTable channelXRiskData = getXRiskData

(channelStatsMap);//獲取渠道某風(fēng)險的數(shù)據(jù)

14) Map stdXRiskData= preDealData(channelXRiskData);//對數(shù)據(jù)進(jìn)行過濾、標(biāo)準(zhǔn)化、做差等預(yù)處理

15) Map channelXRisk= mXRisk (stdXRiskData);//調(diào)用某風(fēng)險類型對應(yīng)的評估模型

16) Map channelXRiskRank= rankStgy (channelXRisk);//調(diào)用排序策略

17)returnchannelXRiskRank;

18)endforeach

19)endforeach

3 實驗結(jié)果及分析

本部分將對上述文中提出的基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型進(jìn)行實驗驗證,對比分析風(fēng)險類型識別模型的準(zhǔn)確率和風(fēng)險評估模型的合理性,并進(jìn)一步探討其工程實用性。

由于精確地預(yù)測客戶潛在的風(fēng)險類型是實現(xiàn)渠道風(fēng)險監(jiān)控的前提和必要條件,所以為了驗證使用ID3決策樹算法與正則表達(dá)式結(jié)合的方法創(chuàng)建的風(fēng)險類型識別模型的準(zhǔn)確率,分別使用ID3決策樹算法、正則表達(dá)式和ID3決策樹算法與正則表達(dá)式相結(jié)合的方法創(chuàng)建沖正套現(xiàn)風(fēng)險類型識別模型和查繳比異常風(fēng)險類型識別模型,將數(shù)據(jù)集中每個月份剩下的1000條數(shù)據(jù)作為測試集,對比不同方法創(chuàng)建的風(fēng)險類型識別模型的準(zhǔn)確率,得到每組實驗的準(zhǔn)確率如表6所示。

表6 風(fēng)險類型識別模型的準(zhǔn)確率

由表6可知,將ID3決策樹算法與正則表達(dá)式相結(jié)合創(chuàng)建的風(fēng)險類型識別模型的準(zhǔn)確率超過0.987,比單獨(dú)使用ID3決策樹算法提高了約1.9%,且當(dāng)分類模型越復(fù)雜,準(zhǔn)確率提升越明顯,同時,引入正則表達(dá)式還可以降低風(fēng)險類型識別模型的結(jié)構(gòu)復(fù)雜度。

圖3 渠道排名誤差的絕對值之和

表7 渠道排名誤差統(tǒng)計表

由表7可知,約96.72%的樣本排名誤差在3個名次之內(nèi),僅有約0.33%的樣本排名誤差超過10個名次,評估精確度能夠滿足實際需求,所以引入加權(quán)最小二乘法不僅可以解決回歸模型的異方差性問題,還可以提升模型的可信度與合理性。

為進(jìn)一步探討基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型的實用性,分析在不同費(fèi)用周期內(nèi)同一渠道的某風(fēng)險類型排名變化情況。通過本模型獲得某省所有第三方渠道在2017年6月到10月連續(xù)5個費(fèi)用周期內(nèi)的截留電費(fèi)風(fēng)險相對排名,然后使用滑動窗口法[14]計算每個渠道的排名變化,經(jīng)分析發(fā)現(xiàn),渠道的截留電費(fèi)風(fēng)險排名變化情況整體上符合較為規(guī)則的統(tǒng)計分布,如圖4所示。

由圖4可知,大部分渠道的風(fēng)險排名變化較小,只有少數(shù)渠道的排名變化超過了20個名次,這一結(jié)果說明部分渠道確實存在潛在的電費(fèi)收取風(fēng)險,所以構(gòu)建渠道風(fēng)險監(jiān)控模型是非常有必要的,同時也說明本模型具有一定的實用性。

圖4 渠道排名變化分布情況

4 總結(jié)

針對目前電費(fèi)資金流轉(zhuǎn)過程中的第三方繳費(fèi)渠道仍存在風(fēng)險監(jiān)控漏洞問題,文中提出了一個基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險監(jiān)控模型,并以沖正套現(xiàn)風(fēng)險點(diǎn)和截留電費(fèi)風(fēng)險類型為例,對模型的追蹤繳費(fèi)行為軌跡、構(gòu)建風(fēng)險評估指標(biāo)體系和渠道風(fēng)險評估三大核心步驟進(jìn)行了討論。實驗驗證了使用決策樹算法與正則表達(dá)式相結(jié)合的方法創(chuàng)建風(fēng)險類型識別模型可以獲得更高的準(zhǔn)確率,以及回歸分析時引入WLS可以提高風(fēng)險評估模型的合理性。模型將定性分析與定量統(tǒng)計分離,實現(xiàn)了分類評估,取得了可靠性較高的風(fēng)險評估結(jié)果。

將來隨著研究的進(jìn)一步深入和模型的不斷完善,會有更多機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)挖掘方法與技術(shù)被用于風(fēng)險類型識別和風(fēng)險評估方面,可進(jìn)一步提升電網(wǎng)企業(yè)風(fēng)險監(jiān)控水平。

猜你喜歡
電費(fèi)決策樹軌跡
基于ε-SVR模型的日電費(fèi)回收預(yù)測
吉林電力(2022年1期)2022-11-10 09:20:40
軌跡
軌跡
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
軌跡
進(jìn)化的軌跡(一)——進(jìn)化,無盡的適應(yīng)
中國三峽(2017年2期)2017-06-09 08:15:29
基于大用戶電費(fèi)回收的風(fēng)險管控
基于決策樹的出租車乘客出行目的識別
關(guān)于縣級供電企業(yè)電費(fèi)對賬的研究
甘孜县| 新民市| 大方县| 红河县| 福贡县| 城口县| 肥城市| 关岭| 仙游县| 望都县| 夏津县| 当雄县| 辽阳市| 金湖县| 登封市| 儋州市| 赤城县| 绥化市| 平江县| 郓城县| 利川市| 英山县| 平潭县| 肇州县| 西藏| 工布江达县| 崇礼县| 永登县| 武夷山市| 南投县| 沙坪坝区| 商河县| 永济市| 青川县| 北宁市| 溆浦县| 格尔木市| 邵东县| 建始县| 广东省| 南漳县|