国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于邏輯回歸模型的電力客戶停電敏感度評(píng)分卡研究與實(shí)現(xiàn)

2018-06-06 07:08:38耿俊成張小斐袁少光萬(wàn)迪明
電力需求側(cè)管理 2018年3期
關(guān)鍵詞:敏感度分值邏輯

耿俊成,張小斐,袁少光,萬(wàn)迪明

(國(guó)網(wǎng)河南省電力公司 電力科學(xué)研究院,鄭州 450052)

電網(wǎng)公司客戶規(guī)模大,生產(chǎn)經(jīng)營(yíng)情況復(fù)雜,長(zhǎng)期以來(lái)在故障處理、客戶服務(wù)方面面臨較大壓力。通過(guò)對(duì)近年來(lái)客戶咨詢、投訴記錄的統(tǒng)計(jì)分析,發(fā)現(xiàn)客戶的訴求主要集中在“停電”、“電能質(zhì)量”、“服務(wù)態(tài)度”等方面。對(duì)停電有著強(qiáng)烈反應(yīng),進(jìn)而通過(guò)95598服務(wù)熱線、營(yíng)業(yè)廳、在線客服等方式進(jìn)行報(bào)修、咨詢或者投訴的客戶,可稱其為停電敏感客戶。開展電力客戶停電敏感度分析,準(zhǔn)確識(shí)別停電高敏感客戶,及時(shí)做好用電服務(wù),既可以提升客戶滿意度,也有助于減少95598服務(wù)熱線的呼入量。

目前,針對(duì)電力客戶咨詢、投訴行為的分析預(yù)警,一些專家學(xué)者提出了較好的研究思路。文獻(xiàn)[1]、文獻(xiàn)[2]提出采用數(shù)據(jù)挖掘技術(shù)中的邏輯回歸算法模型構(gòu)建客戶停電敏感度分析模型,并對(duì)客戶停電敏感度進(jìn)行分析預(yù)測(cè),但是邏輯回歸模型輸出結(jié)果比較復(fù)雜,營(yíng)銷業(yè)務(wù)人員不容易理解與應(yīng)用。本文提出基于邏輯回歸模型構(gòu)建電力客戶停電敏感度評(píng)分卡,通過(guò)表格形式直觀展示停電敏感度主要影響因素以及影響程度,方便計(jì)算每個(gè)客戶停電敏感度評(píng)分以預(yù)測(cè)其敏感程度。該方法在某地市公司營(yíng)銷服務(wù)工作中進(jìn)行了試點(diǎn)應(yīng)用,取得了良好效果。

1 基于邏輯回歸模型評(píng)分卡實(shí)施原理

1.1 邏輯回歸模型

邏輯回歸模型是當(dāng)前業(yè)界比較常用的機(jī)器學(xué)習(xí)方法,用來(lái)估計(jì)某種事物發(fā)生的可能性。例如:某用戶購(gòu)買某種商品的可能性;某病人患有某種疾病的可能性。它源于多元線性回歸,是一種研究目標(biāo)變量Y與一系列影響因素X1,X2,...,Xm之間關(guān)系的多變量分析方法。邏輯回歸的目標(biāo)變量Y是二值變量,表示事件的發(fā)生或不發(fā)生,通常編碼為1和0。用邏輯回歸模型計(jì)算事件發(fā)生的概率為

式中:e為自然數(shù),約等于2.718 28;β0,β1,...,βm為模型參數(shù),β0也稱為截距。

對(duì)公式(1)進(jìn)行簡(jiǎn)單轉(zhuǎn)換,可以得到

邏輯回歸模型學(xué)習(xí)時(shí),對(duì)于給定的訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),...,(xn,yn)},通常應(yīng)用最大似然估計(jì)法計(jì)算模型參數(shù)值,即β0,β1,...,βm,從而得到邏輯回歸模型[3—4]。

電網(wǎng)公司營(yíng)銷業(yè)務(wù)人員根據(jù)邏輯回歸模型輸出結(jié)果計(jì)算某個(gè)客戶發(fā)生停電投訴的概率時(shí),公式(1)計(jì)算過(guò)程仍然比較復(fù)雜。

1.2 證據(jù)權(quán)重轉(zhuǎn)換

證據(jù)權(quán)重轉(zhuǎn)換(weight of evidence,WOE)用于衡量同一屬性變量的各個(gè)取值對(duì)分類結(jié)果的貢獻(xiàn)。它可以將分類屬性變量轉(zhuǎn)化為數(shù)值型變量,以降低建模過(guò)程的復(fù)雜性,其計(jì)算公式如下

式中:p(Y=yk|Xi=xij)、p(Y≠yk|Xi=xij)表示屬性變量Xi=xij時(shí),樣本類別分別為Y=yk及Y≠yk的概率值??梢钥闯?,WOE越大,Y=yk實(shí)例越多,權(quán)重越大。因此可以使用WOE作為判斷屬性的某種取值對(duì)分類結(jié)果導(dǎo)向性的一種度量[5]。

假設(shè)分類變量Xi可以分為ni類,對(duì)Xi進(jìn)行WOE轉(zhuǎn)換,可得

式中:δi1,...,δini為二元虛擬變量,即對(duì)于所有的j=1,...,ni,如果Xi的取值為第j類即Xi=xij,則δij=1,否則δij=0。

采用經(jīng)WOE轉(zhuǎn)換后WOE(X1),...,WOE(Xm)替代原變量X1,X2,...,Xm,公式(2)可表示為

接著,合并公式(4)和公式(5)可得

公式(6)表現(xiàn)形式就是評(píng)分卡。首先,賦予每個(gè)客戶一個(gè)基礎(chǔ)分值β0;接著,如果X1取值為x11將增加β1WOE(x11)分;如果X1取值為X12將增加β1WOE(X12)分,依次類推。

經(jīng)過(guò)WOE轉(zhuǎn)換,分類變量被轉(zhuǎn)化為數(shù)值型變量,同時(shí)可以將邏輯回歸模型輸出結(jié)果轉(zhuǎn)變?yōu)樵u(píng)分卡形式,以利于后續(xù)模型結(jié)果的理解與應(yīng)用。

1.3 評(píng)分卡實(shí)施原理

評(píng)分卡是一種對(duì)邏輯回歸模型輸出結(jié)果進(jìn)行轉(zhuǎn)化的技術(shù)。通過(guò)制作評(píng)分卡,邏輯回歸模型輸出結(jié)果變得容易理解與應(yīng)用。

評(píng)分卡的分值刻度可以通過(guò)將分值表示為比率對(duì)數(shù)的線性表達(dá)式來(lái)定義,具體形式如下

式中:Sbase、K為常數(shù)??梢酝ㄟ^(guò)將2個(gè)已知或假設(shè)的分值代入公式計(jì)算得到。通常假設(shè):①在某個(gè)特定比率設(shè)置特定的預(yù)期分值;②制定比率翻番的分?jǐn)?shù)(Sdouble)。

首先,設(shè)定比率為θ0的特定點(diǎn)的分值為Sθ0,比率 2θ0的分值為Sθ0+Sdouble。代入式(7)可以得到如下2個(gè)方程

解上述2個(gè)方程中的常數(shù)Sbase和K,可得到

例如:如果設(shè)定評(píng)分卡比率為(某電網(wǎng)公司停電敏感客戶與非敏感客戶的實(shí)際比率)時(shí)的分值為60分,且Sdouble=10,則計(jì)算出的K=14.43,Sbase=91.84。

合并公式(6)和公式(7),基于邏輯回歸的評(píng)分卡形式如下

式中:Sbase+Kβ0稱為基準(zhǔn)點(diǎn)。可以通過(guò)給每一個(gè)評(píng)分卡變量都增加將基準(zhǔn)點(diǎn)分值平均分配到各變量之間,以消除基礎(chǔ)分值,從而得到零基準(zhǔn)點(diǎn)的評(píng)分卡。具體形式如表1。

表1 零基準(zhǔn)點(diǎn)評(píng)分卡

2 電力客戶停電敏感度評(píng)分卡的實(shí)施

依據(jù)停電敏感客戶的定義,提取某省級(jí)電網(wǎng)公司6.3萬(wàn)戶高壓客戶2016年全年敏感客戶及全量正??蛻舻南嚓P(guān)數(shù)據(jù)構(gòu)建停電敏感度評(píng)分卡??紤]到高壓客戶、低壓非居民客戶、低壓居民客戶在停電敏感度影響因素差異顯著,在停電敏感度評(píng)分卡實(shí)施時(shí)分別對(duì)它們進(jìn)行建模。電力客戶停電敏感度評(píng)分卡實(shí)施的流程如圖1。

圖1 電力客戶停電敏感度評(píng)分卡實(shí)施流程

2.1 客戶停電敏感相關(guān)數(shù)據(jù)獲取

從電網(wǎng)公司營(yíng)銷業(yè)務(wù)系統(tǒng)、95598系統(tǒng)提取客戶停電敏感相關(guān)屬性數(shù)據(jù)。以高壓客戶停電敏感度分析為例,主要數(shù)據(jù)包括以下幾類。

(1)基本屬性:用電類型、行業(yè)分類、立戶日期、供電電壓、城農(nóng)網(wǎng)標(biāo)志、城鄉(xiāng)類別、供電單位等。

(2)用電行為:停電次數(shù)、停電時(shí)長(zhǎng)、停電通知方式、用電量、電價(jià)等。

(3)95598信息:咨詢、報(bào)修、投訴、舉報(bào)記錄等。

獲取數(shù)據(jù)后,首先需要對(duì)數(shù)據(jù)記錄的離群點(diǎn)、缺失值、異常值進(jìn)行清洗;其次是構(gòu)建衍生變量,即對(duì)原始數(shù)據(jù)進(jìn)行處理和加工以獲取更有預(yù)測(cè)力和解釋性的變量,例如:歷史撥打95598次數(shù)等。

2.2 模型變量篩選

模型的變量篩選是比較復(fù)雜的過(guò)程,需要考慮的因素很多,例如:變量的預(yù)測(cè)能力,變量之間的相關(guān)性,變量在業(yè)務(wù)上的可解釋性等,其中最主要和最直接的衡量標(biāo)準(zhǔn)是變量的預(yù)測(cè)能力。通??梢酝ㄟ^(guò)輸入變量與輸出變量之間的關(guān)聯(lián)分析篩選出最有預(yù)測(cè)力的變量。

信息值(Information value,IV)是衡量2個(gè)分類變量Xi和Y(其中變量Y為二元變量)之間關(guān)聯(lián)性的指標(biāo)[6],它的定義如下

式中:n為變量Xi的類別數(shù);pj=p(Y=yk|Xi=xij)表示屬性變量Xi=xij時(shí)樣本類別為Y=yk的概率值;qj=(Y≠yk|Xi=xij)表示屬性變量Xi=xij時(shí),樣本類別為Y≠yk的概率值。高壓客戶模型各變量的IV值如表2所示。

表2 高壓客戶模型各變量的IV值

一般情況下,若某個(gè)屬性與目標(biāo)屬性之間信息值小于0.02,可認(rèn)為該屬性不具備預(yù)測(cè)能力,因此舍棄電壓等級(jí)和客戶重要性等級(jí)2個(gè)屬性變量。

2.3 計(jì)算各屬性的證據(jù)權(quán)重轉(zhuǎn)換值

篩選出模型變量后,需要將數(shù)值變量轉(zhuǎn)化為分類變量以進(jìn)行證據(jù)權(quán)重轉(zhuǎn)換。通??梢圆捎玫阮l/等距直方圖分析方法將數(shù)值變量轉(zhuǎn)化為分類變量。以“平均停電時(shí)長(zhǎng)”為例,該變量區(qū)間為[0,422](單位:h),采用等距直方圖分析方法,以0.5為步長(zhǎng)構(gòu)建該變量的等差數(shù)列,共有845個(gè)分組[7]。該變量分組數(shù)量過(guò)多,將會(huì)導(dǎo)致模型計(jì)算復(fù)雜度急劇增長(zhǎng),還需要將其分組合并以減少屬性類別數(shù)量;若將其類別縮減至9個(gè)類別,共有種合并方式,可按照信息值計(jì)算公式(13)計(jì)算每一種方式的信息值,最終選擇信息值最大的合并方式。

將各數(shù)值變量轉(zhuǎn)換為分類變量后,依據(jù)公式(3)計(jì)算各屬性變量的證據(jù)權(quán)重轉(zhuǎn)換值?!捌骄k姇r(shí)長(zhǎng)”的變量類別以及證據(jù)權(quán)重轉(zhuǎn)換值如表3所示。

2.4 構(gòu)建客戶停電敏感度分析模型

計(jì)算每個(gè)樣本用戶分析時(shí)間范圍內(nèi)各個(gè)屬性的證據(jù)權(quán)重轉(zhuǎn)換值,運(yùn)用邏輯回歸模型構(gòu)建客戶停電敏感度模型,形式如下

表3 平均停電時(shí)長(zhǎng)分組情況及WOE值

模型訓(xùn)練時(shí)采用最大似然估計(jì)法計(jì)算β0和各屬性模型參數(shù)值,其中β0=-4.089 4,各屬性模型參數(shù)即β1,...,βm如表4所示。

表4 高壓客戶各屬性模型參數(shù)值

2.5 構(gòu)建客戶停電敏感度評(píng)分卡

基于客戶停電敏感度模型輸出的模型參數(shù)和各屬性證據(jù)權(quán)重轉(zhuǎn)換值構(gòu)建客戶停電敏感度評(píng)分卡。通過(guò)將分值表示為比率對(duì)數(shù)的線性表達(dá)式來(lái)定義評(píng)分卡的分值刻度,具體形式如下

設(shè)(0.47%是高壓用戶中停電敏感客戶的實(shí)際占比)時(shí),時(shí),Score=65;代入公式(7)得Sbase=98.67;K=7.21。

參照表1電力客戶停電敏感度零基準(zhǔn)點(diǎn)評(píng)分卡形式,最終可得到高壓用戶停電敏感度的評(píng)分卡如表5所示。

基于高壓客戶停電敏感度評(píng)分卡,在獲取某一高壓客戶相關(guān)信息后,營(yíng)銷業(yè)務(wù)人員可以很方便計(jì)算出該客戶的敏感度評(píng)分。

表5 高壓客戶停電敏感度模型評(píng)分卡

3 電力客戶停電敏感度評(píng)分卡評(píng)估

依據(jù)停電敏感客戶的定義,提取某省級(jí)電網(wǎng)公司6.3萬(wàn)戶高壓客戶2016年全年敏感客戶及全量正??蛻舻南嚓P(guān)數(shù)據(jù)構(gòu)建客戶停電敏感度評(píng)分卡,然后根據(jù)其2017年1月停電敏感客戶實(shí)際數(shù)據(jù)驗(yàn)證模型準(zhǔn)確性。模型驗(yàn)證結(jié)果如下圖2所示。

圖2 客戶停電敏感度評(píng)分卡評(píng)估

圖2中命中率為模型判斷為敏感客戶且實(shí)際為敏感客戶數(shù)與模型判斷為敏感客戶數(shù)的比值;覆蓋率為模型判斷為敏感客戶且實(shí)際為敏感客戶數(shù)與全量實(shí)際停電敏感客戶數(shù)的比值;提升度為命中率與停電實(shí)際敏感客戶占比的比值。

1月份高壓客戶中,實(shí)際產(chǎn)生的、有戶號(hào)可查的有關(guān)停電的咨詢、投訴客戶占比是2.71%。停電敏感度評(píng)分在前5%的客戶中高敏感客戶的命中率31%,覆蓋率為57.0%,提升度為11.4。

依據(jù)該停電敏感度評(píng)分卡,該電網(wǎng)公司可以更精準(zhǔn)的定位停電高敏感客戶,針對(duì)不同程度的敏感客戶采取個(gè)性化的措施,以降低客戶投訴,提升客戶滿意度。

4 結(jié)束語(yǔ)

針對(duì)當(dāng)前基于邏輯回歸的客戶敏感度分析模型輸出結(jié)果復(fù)雜、不易理解與應(yīng)用問(wèn)題,本文提出了一種基于邏輯回歸模型的客戶停電敏感度評(píng)分卡實(shí)施方法。首先,從電網(wǎng)公司營(yíng)銷業(yè)務(wù)系統(tǒng)、95598系統(tǒng)提取客戶停電敏感相關(guān)屬性數(shù)據(jù),通過(guò)信息值篩選出具有高預(yù)測(cè)力的屬性;接著,計(jì)算各屬性的證據(jù)權(quán)重轉(zhuǎn)換值,運(yùn)用邏輯回歸模型構(gòu)建客戶停電敏感度分析模型;最后,基于停電敏感度分析模型的輸出參數(shù)和各屬性證據(jù)權(quán)重轉(zhuǎn)換值構(gòu)建客戶停電敏感度評(píng)分卡。通過(guò)客戶停電敏感度評(píng)分卡電網(wǎng)公司營(yíng)銷業(yè)務(wù)人員可以方便地計(jì)算每一個(gè)客戶的停電敏感度,進(jìn)而為精準(zhǔn)營(yíng)銷和差異化服務(wù)提供數(shù)據(jù)支撐。D

[1] 嚴(yán)宇平,吳廣財(cái).基于數(shù)據(jù)挖掘技術(shù)的客戶停電敏感度研究與應(yīng)用[J].新技術(shù)新工藝,2015(9):89-93.

[2] 鄭芒英.用電客戶停電敏感度分析[D].廣州:華南理工大學(xué),2014.

[3] 涂瑩,林士勇,歐陽(yáng)柳,等.基于市場(chǎng)細(xì)分的邏輯回歸模型在電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用研究[J].電力需求側(cè)管理,2016,18(4):46-49.

[4] 趙永良,秦萱,吳尚遠(yuǎn),等.基于數(shù)據(jù)挖掘的高壓用戶電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)[J].電力信息與通信技術(shù),2015,13(9):57-61.

[5] Mamdouh Refaat.信用風(fēng)險(xiǎn)評(píng)分卡研究:基于SAS的開發(fā)與實(shí)施[M].王松奇,林治乾,譯.北京:社會(huì)科學(xué)文獻(xiàn)出版社,2013:181-191.

[6] 楊秋潔.基于Ⅳ屬性選擇的隨機(jī)森林模型研究[D].合肥:合肥工業(yè)大學(xué),2010.

[7] 劉業(yè)政,焦寧,姜元春.連續(xù)屬性離散化算法比較研究[J].計(jì)算機(jī)應(yīng)用研究,2007,24(9):28-30.

猜你喜歡
敏感度分值邏輯
刑事印證證明準(zhǔn)確達(dá)成的邏輯反思
法律方法(2022年2期)2022-10-20 06:44:24
一起來(lái)看看交通違法記分分值有什么變化
邏輯
創(chuàng)新的邏輯
全體外預(yù)應(yīng)力節(jié)段梁動(dòng)力特性對(duì)于接縫的敏感度研究
電視臺(tái)記者新聞敏感度培養(yǎng)策略
新聞傳播(2018年10期)2018-08-16 02:10:16
女人買買買的神邏輯
37°女人(2017年11期)2017-11-14 20:27:40
在京韓國(guó)留學(xué)生跨文化敏感度實(shí)證研究
Diodes高性能汽車霍爾效應(yīng)閉鎖提供多種敏感度選擇
宿遷城鎮(zhèn)居民醫(yī)保按病種分值結(jié)算初探
卢龙县| 惠水县| 区。| 通河县| 清苑县| 嘉禾县| 买车| 庆元县| 邛崃市| 武邑县| 通化市| 建昌县| 莱西市| 浮梁县| 启东市| 海盐县| 赞皇县| 行唐县| 和政县| 甘孜| 赫章县| 西华县| 海宁市| 南和县| 惠东县| 航空| 扎鲁特旗| 冕宁县| 寻乌县| 蓬安县| 文安县| 霍山县| 鲁甸县| 禄劝| 抚远县| 鱼台县| 怀集县| 沈丘县| 东丰县| 和硕县| 夏津县|