国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于樸素貝葉斯分類器的電力系統(tǒng)信譽(yù)評(píng)級(jí)研究

2016-04-27 07:49丁浩安徽工商職業(yè)學(xué)院國(guó)際貿(mào)易系安徽合肥231131
關(guān)鍵詞:電力系統(tǒng)

丁浩 (安徽工商職業(yè)學(xué)院國(guó)際貿(mào)易系,安徽 合肥 231131)

張磊,范生萬(wàn) (安徽工商職業(yè)學(xué)院網(wǎng)絡(luò)信息中心,安徽 合肥 231131)

?

基于樸素貝葉斯分類器的電力系統(tǒng)信譽(yù)評(píng)級(jí)研究

丁浩(安徽工商職業(yè)學(xué)院國(guó)際貿(mào)易系,安徽 合肥 231131)

張磊,范生萬(wàn)(安徽工商職業(yè)學(xué)院網(wǎng)絡(luò)信息中心,安徽 合肥 231131)

[摘要]目前電力企業(yè)普遍面臨的一個(gè)難題是客戶的巨額欠費(fèi)。為此,電力公司每年都需要投入大量的精力進(jìn)行電費(fèi)催繳工作,但問題至今仍難以得到根本解決。通過從電力系統(tǒng)大規(guī)模的繳費(fèi)數(shù)據(jù)中提取訓(xùn)練樣本,利用樸素貝葉斯算法進(jìn)行學(xué)習(xí),得到分類規(guī)則,將這些規(guī)則應(yīng)用于對(duì)用電客戶的信譽(yù)進(jìn)行評(píng)級(jí),建立客戶信譽(yù)評(píng)級(jí)系統(tǒng),可以幫助電力企業(yè)更好地管理客戶繳費(fèi)行為,并為其運(yùn)營(yíng)管理提供數(shù)據(jù)支持。結(jié)果表明,對(duì)于不同的分類樣本甚至不同的指標(biāo)體系,都可以獲得較好的分類效果。

[關(guān)鍵詞]電力系統(tǒng);樸素貝葉斯分類器;信譽(yù)評(píng)級(jí)

電費(fèi)的及時(shí)回收是供電企業(yè)保證正常經(jīng)營(yíng)的前提,同時(shí)電費(fèi)也是電力基礎(chǔ)設(shè)施建設(shè)維護(hù)的主要資金來源。供電企業(yè)為確保其自身的正常經(jīng)營(yíng)和持續(xù)發(fā)展,當(dāng)然希望用電者都能按時(shí)繳納電費(fèi),更傾向于將電力商品銷售給需要用電且信譽(yù)好的客戶,從而使得供電企業(yè)可以持續(xù)經(jīng)營(yíng)。近年來,電力公司為解決拖欠電費(fèi)問題付出了很大的努力,但實(shí)際效果卻并不樂觀[1]。因而如何對(duì)用電客戶的信譽(yù)等級(jí)進(jìn)行評(píng)估并對(duì)其信用風(fēng)險(xiǎn)進(jìn)行有效管控,就成為供電企業(yè)降低經(jīng)營(yíng)風(fēng)險(xiǎn)、提高經(jīng)營(yíng)管理水平所面臨的一個(gè)十分重要而迫切的問題。研究電力客戶信用風(fēng)險(xiǎn)的特點(diǎn),建立客戶信譽(yù)評(píng)級(jí)模型,用以精確地定量地分析客戶的信用,實(shí)施有效的風(fēng)險(xiǎn)管理,是當(dāng)前電力企業(yè)實(shí)現(xiàn)可持續(xù)發(fā)展的最基本、最迫切的要求。

1樸素貝葉斯分類器

圖1 樸素貝葉斯分類器模型

貝葉斯分類是基于統(tǒng)計(jì)學(xué)的一種分類法,是數(shù)據(jù)挖掘中使用頻率最高的分類方法之一,其最大特點(diǎn)是用概率來表示所有形式的不確定性,推理或?qū)W習(xí)都用概率規(guī)則來進(jìn)行。常用的貝葉斯分類算法有樸素貝葉斯、貝葉斯網(wǎng)絡(luò)等。樸素貝葉斯基于貝葉斯定理,有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ),其應(yīng)用前提是獨(dú)立性假設(shè),即在給定類別C的條件下,所有的屬性xi(i=1,2,…,n)相互獨(dú)立。如圖1所示,各屬性變量xi獨(dú)立地作用于類變量C。

樸素貝葉斯分類的過程可簡(jiǎn)要描述如下[2]:

1)對(duì)數(shù)據(jù)樣本X,用n維特征向量X={x1,x2,…,xn}來描述其n個(gè)屬性(A1,A2,…,An)的取值;

2)設(shè)有m個(gè)類C1,C2,…,Cm,待分類樣本X已知,則X屬于后驗(yàn)概率最大的類,即將待分類樣本X歸類到Cj,當(dāng)且僅當(dāng):

P(Cj|X)>P(Ci|X)?1≤i≤mj≠i

3)由貝葉斯定理:

(1)

4)顯然直接計(jì)算P(X|Ci)的開銷太大。為了對(duì)P(X|Ci)進(jìn)行有效估算,假設(shè)各類別相互獨(dú)立。于是有:

(2)

可根據(jù)訓(xùn)練樣本估算P(x1|Ci),P(x2|Ci),…,P(xn|Ci)值,方法如下:

②Ak為連續(xù)型,設(shè)服從正態(tài)分布,概率密度為:

(3)

式中, μCi和σCi為訓(xùn)練樣本中類別為Ci的屬性Ak的均值和方差。

然后根據(jù)式(2)計(jì)算出P(X|Ci),i=1,2,…,m。再代入式(1),計(jì)算出每個(gè)P(Ci|X),i=1,2,…,m。

5)根據(jù)上述計(jì)算結(jié)果,把樣本X歸類到后驗(yàn)概率最大的類別Cj,即:

P(Cj|X)=max{P(Ci|X)}i=1,2,…,m

(4)

與其他分類器相比,樸素貝葉斯分類器從理論上講具有最小的錯(cuò)誤率,或者說是在預(yù)先給定代價(jià)的情況下平均風(fēng)險(xiǎn)最小的分類器[3,4]。

從數(shù)據(jù)挖掘的角度,把樸素貝葉斯分類算法運(yùn)用到對(duì)用電客戶信用評(píng)價(jià)的實(shí)例中,從而實(shí)現(xiàn)對(duì)用電客戶的信譽(yù)情況進(jìn)行分類預(yù)測(cè)。

2電力客戶信譽(yù)評(píng)級(jí)系統(tǒng)設(shè)計(jì)

2.1信用等級(jí)評(píng)估方法

傳統(tǒng)的信用評(píng)估方法主要包括5C評(píng)估法和綜合評(píng)估法。5C評(píng)估法也稱專家法,是由專家根據(jù)自己的經(jīng)驗(yàn)、知識(shí)和技能,對(duì)影響客戶信用的5個(gè)關(guān)鍵要素進(jìn)行分析評(píng)估。綜合評(píng)估法是由專業(yè)的信用評(píng)估部門對(duì)能夠反映被評(píng)估對(duì)象信用的所有要素成分進(jìn)行全面的、綜合的分析考察,進(jìn)而對(duì)被評(píng)估對(duì)象做出信用評(píng)價(jià)。與5C法相比,綜合評(píng)估法能夠全面、細(xì)致、完整地反映客戶企業(yè)的實(shí)際狀況,但對(duì)評(píng)估中不易量化的因素則需要評(píng)級(jí)人員“藝術(shù)地去把握”,因此必然會(huì)帶有一定的主觀色彩[1]。

為淡化主觀因素,筆者采用一種改進(jìn)的綜合評(píng)估法,即運(yùn)用數(shù)據(jù)挖掘技術(shù)、數(shù)理統(tǒng)計(jì)等數(shù)學(xué)方法來進(jìn)行相關(guān)的處理,如指標(biāo)間的相關(guān)性分析、制衡性分析,對(duì)定性指標(biāo)進(jìn)行定量考察,用層次分析法(AHP)來科學(xué)地確定指標(biāo)權(quán)重等,從而使得指標(biāo)選取和指標(biāo)權(quán)重設(shè)置更加科學(xué)合理,確保這種價(jià)值判斷的客觀性。

2.2建立電力客戶信譽(yù)評(píng)級(jí)指標(biāo)體系

圍繞電力客戶信譽(yù)評(píng)級(jí)的功能目標(biāo),從電力企業(yè)已掌握的客戶信息和繳費(fèi)數(shù)據(jù)中深入分析影響客戶信用評(píng)價(jià)的可能因素,最終確立電力客戶信譽(yù)評(píng)級(jí)指標(biāo)體系如下:把品德、能力和環(huán)境作為3個(gè)Ⅰ級(jí)指標(biāo),并進(jìn)一步選取以下12個(gè)Ⅱ級(jí)指標(biāo),即社會(huì)信譽(yù)、前一季度評(píng)價(jià)、經(jīng)濟(jì)狀況、繳費(fèi)性質(zhì)、預(yù)交情況、繳費(fèi)及時(shí)性、有無(wú)陳欠、補(bǔ)繳情況、有無(wú)卡表、用電量波動(dòng)、有無(wú)用電和有無(wú)違規(guī)用電。

2.3確定電力客戶信譽(yù)等級(jí)劃分標(biāo)準(zhǔn)

確定指標(biāo)體系以后,接下來以定性分析與定量計(jì)算相結(jié)合的方式,采用一種層次權(quán)分析法(AHP)來設(shè)定指標(biāo)權(quán)重。對(duì)于定性指標(biāo)采取量化處理,依據(jù)指標(biāo)分析結(jié)果的不同情況相應(yīng)地設(shè)置得分。評(píng)出每一個(gè)客戶各項(xiàng)指標(biāo)分值后再相加,就可得到該客戶的評(píng)價(jià)總分。然后按總分高低劃分客戶信譽(yù)等級(jí)。根據(jù)實(shí)際需要,該系統(tǒng)實(shí)際采用了6級(jí)分類標(biāo)準(zhǔn),即把所有用戶劃分為6個(gè)級(jí)別:AAA、AA、A、B、C和D。級(jí)別越高信譽(yù)越好,越低信譽(yù)越差(見表1)。

表1 信譽(yù)等級(jí)評(píng)定標(biāo)準(zhǔn)

3電力客戶信譽(yù)評(píng)級(jí)算法實(shí)現(xiàn)流程

圖2 算法實(shí)現(xiàn)流程圖

算法實(shí)現(xiàn)過程大致可分成5個(gè)步驟,即選取建模數(shù)據(jù)集、創(chuàng)建初始模型、進(jìn)行模型驗(yàn)證、生成預(yù)測(cè)模型以及進(jìn)行模型評(píng)價(jià)等。其中建模數(shù)據(jù)集的選取是對(duì)數(shù)據(jù)源進(jìn)行采樣,選取出一個(gè)盡可能地包含有全部業(yè)務(wù)數(shù)據(jù)源的信息且大小適中的數(shù)據(jù)集。訓(xùn)練集和測(cè)試集的選取到目前還是數(shù)據(jù)挖掘中有待研究的問題,現(xiàn)在比較通用的方法是K-次交叉驗(yàn)證[5],該系統(tǒng)采用10次交叉驗(yàn)證方法,經(jīng)反復(fù)訓(xùn)練、測(cè)試、修改后生成最終的預(yù)測(cè)模型。系統(tǒng)算法實(shí)現(xiàn)流程如圖2所示。

4系統(tǒng)實(shí)現(xiàn)

從具體開發(fā)操作層面用樸素貝葉斯分類器來實(shí)現(xiàn)對(duì)電力客戶的信譽(yù)評(píng)級(jí),包括系統(tǒng)實(shí)現(xiàn)環(huán)境、數(shù)據(jù)的組織與存儲(chǔ)以及系統(tǒng)實(shí)現(xiàn)的基本過程等。

4.1系統(tǒng)實(shí)現(xiàn)環(huán)境

在設(shè)計(jì)的過程中,考慮到系統(tǒng)應(yīng)在Windows環(huán)境下使用,主要采用Visual C++ 2010來開發(fā)可視化界面以及完成算法實(shí)現(xiàn)。

4.2數(shù)據(jù)的組織與存儲(chǔ)

該系統(tǒng)數(shù)據(jù)處理過程和結(jié)果輸出都是在VC環(huán)境下完成的。其中算法實(shí)現(xiàn)部分分成數(shù)據(jù)訓(xùn)練、數(shù)據(jù)測(cè)試和實(shí)現(xiàn)評(píng)價(jià)3個(gè)模塊,每個(gè)模塊實(shí)現(xiàn)一個(gè)功能。同時(shí)在各個(gè)模塊內(nèi)大量使用局部變量,從而節(jié)省了內(nèi)存空間,并使程序調(diào)試起來更加方便容易。

1)使用了大量的文件數(shù)據(jù),在Source類中實(shí)現(xiàn)了讀文件;

2)把讀出的數(shù)據(jù)存入一個(gè)二維數(shù)組**head中,然后對(duì)這個(gè)二維數(shù)組進(jìn)行數(shù)據(jù)的處理;

3)在訓(xùn)練樣本數(shù)據(jù)統(tǒng)計(jì)每個(gè)分類的樣本個(gè)數(shù)時(shí),采用了hash表的方式存儲(chǔ)每個(gè)類,然后得出每個(gè)類的樣本個(gè)數(shù);

4)在讀樣本文件的數(shù)據(jù)時(shí)就先記錄了樣本的總數(shù),最后得出分類的先驗(yàn)概率存入數(shù)組pc[]中;

5)計(jì)算每個(gè)屬性在各個(gè)分類中的概率得出所有屬性的先驗(yàn)概率;

6)給定一個(gè)待評(píng)樣本數(shù)據(jù),計(jì)算在各個(gè)分類中的后驗(yàn)概率,取后驗(yàn)概率最大的那個(gè)分類作為該樣本的類標(biāo)號(hào)。

4.3系統(tǒng)實(shí)現(xiàn)的基本過程

圖3 系統(tǒng)實(shí)現(xiàn)過程

整個(gè)系統(tǒng)的實(shí)現(xiàn)分為4個(gè)步驟(見圖3):第1步,建立系統(tǒng)架構(gòu),利用Visual C++ 2010開發(fā)可視化界面;第2步,從可視化界面進(jìn)入數(shù)據(jù)訓(xùn)練模塊,獲得可行的分類規(guī)則;第3步,獲得分類規(guī)則后,進(jìn)入數(shù)據(jù)測(cè)試模塊,測(cè)試分類規(guī)則錯(cuò)誤率;第4步,進(jìn)入實(shí)現(xiàn)評(píng)價(jià)模塊,完成實(shí)現(xiàn)評(píng)價(jià)的最后功能,并把評(píng)價(jià)結(jié)果寫入文件。其中,第2、3、4步均是在窗體控件中通過調(diào)用函數(shù)實(shí)現(xiàn)的,而且結(jié)果也均在控件中顯示,對(duì)用戶來說一目了然,操作簡(jiǎn)單便捷。

5試驗(yàn)結(jié)果分析

利用樸素貝葉斯算法進(jìn)行信譽(yù)評(píng)級(jí)會(huì)受多方面的因素的影響,如指標(biāo)選取的科學(xué)性,訓(xùn)練數(shù)據(jù)的多少,訓(xùn)練屬性的變動(dòng)等。為進(jìn)一步優(yōu)化指標(biāo)體系,發(fā)現(xiàn)關(guān)鍵指標(biāo)和干擾指標(biāo),筆者進(jìn)行了大量的有針對(duì)性的訓(xùn)練和測(cè)試,并用3個(gè)模型加以比較說明。表2是使用所有的指標(biāo)對(duì)電力客戶進(jìn)行等級(jí)評(píng)定,在不同數(shù)據(jù)樣本下所得到的模型A的預(yù)測(cè)準(zhǔn)確率,表3是在使用部分指標(biāo)(剔除干擾指標(biāo))在不同數(shù)據(jù)樣本下所得到的模型B的預(yù)測(cè)準(zhǔn)確率,表4是樣本數(shù)量相同情況下剔除干擾指標(biāo)后,為發(fā)現(xiàn)關(guān)鍵指標(biāo)而進(jìn)行有針對(duì)性的試驗(yàn)所得到的模型C的預(yù)測(cè)準(zhǔn)確率。

表2 模型A的評(píng)價(jià)指標(biāo)和結(jié)果(打√的為指標(biāo))

表3 模型B的評(píng)價(jià)指標(biāo)和結(jié)果(打√的為指標(biāo))

表4 模型C的評(píng)價(jià)指標(biāo)和結(jié)果(打√的為指標(biāo))

圖4 不同指標(biāo)體系下基于樸素貝葉斯分類器的模型準(zhǔn)確率比較

從表2、表3的試驗(yàn)結(jié)果及模型A和模型B的比較分析(見圖4)可看出,經(jīng)濟(jì)狀況、有無(wú)用電和用電量波動(dòng)等指標(biāo)并不能反映電力客戶信譽(yù),反而對(duì)信譽(yù)評(píng)級(jí)的準(zhǔn)確率有所干擾,因此在實(shí)際應(yīng)用中應(yīng)當(dāng)從指標(biāo)體系中剔除。

此外,為發(fā)現(xiàn)關(guān)鍵指標(biāo),在剔除干擾指標(biāo)后,對(duì)試驗(yàn)指標(biāo)進(jìn)行依次缺省(見表4)。結(jié)果表明,前一季度評(píng)價(jià)、有無(wú)卡表、繳費(fèi)及時(shí)性等評(píng)價(jià)指標(biāo)對(duì)預(yù)測(cè)的準(zhǔn)確度影響較大,為關(guān)鍵指標(biāo)。這同時(shí)也說明所選擇的指標(biāo)體系是非??茖W(xué)的。

6結(jié)語(yǔ)

通過分析研究電力客戶信用風(fēng)險(xiǎn)的特點(diǎn),運(yùn)用數(shù)據(jù)挖掘的方法和技術(shù),建立用以度量信用風(fēng)險(xiǎn)的客戶信譽(yù)評(píng)級(jí)系統(tǒng),精確定量地分析客戶的信用狀況。通過對(duì)電力客戶信譽(yù)等級(jí)的評(píng)定,可以幫助電力企業(yè)對(duì)客戶進(jìn)行欠費(fèi)預(yù)測(cè),針對(duì)不同信譽(yù)等級(jí)的客戶采取不同的繳費(fèi)措施,從而安全及時(shí)地回收電費(fèi),防范和減少惡意拖欠或拒交電費(fèi)。同時(shí),該系統(tǒng)的使用也可為電力企業(yè)實(shí)施科學(xué)的內(nèi)部管理提供科學(xué)依據(jù)和決策支持。從更長(zhǎng)遠(yuǎn)的角度來看,可以促進(jìn)供電企業(yè)提高經(jīng)營(yíng)管理水平,降低經(jīng)營(yíng)風(fēng)險(xiǎn),實(shí)現(xiàn)可持續(xù)發(fā)展。

[參考文獻(xiàn)]

[1] 鄭樂.電力客戶信用評(píng)估方法的應(yīng)用[J].制造業(yè)自動(dòng)化,2011,33(4):71~72.

[2] Jiawei H,Micheline Kamber(加).數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰等譯.北京:機(jī)械工業(yè)出版社,2001:197~198.

[3] Hernndez-Lobato J M,Hernndez-Lobato D,Surez A. Network-based sparse Bayesian classification. Pattern Recognition,2010,44 (4):886~900.

[4]丁浩.數(shù)據(jù)挖掘中常用分類算法的分析比較[J].菏澤學(xué)院學(xué)報(bào),2015,37(5):47~50.

[5]Jae H M.Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications,2006,28(2):603~614.

[編輯]辛長(zhǎng)靜

[文獻(xiàn)標(biāo)志碼]A

[文章編號(hào)]1673-1409(2016)04-0056-05

[中圖分類號(hào)]TP391

[作者簡(jiǎn)介]丁浩(1974-),男,碩士,講師,現(xiàn)主要從事人工智能與數(shù)據(jù)挖掘、應(yīng)用數(shù)學(xué)方面的教學(xué)與研究工作; E-mail:dinghao1225@126.com。

[基金項(xiàng)目]安徽高校自然科學(xué)研究一般項(xiàng)目(KJ2016B005);安徽高校人文社會(huì)科學(xué)研究重點(diǎn)項(xiàng)目(SK2016A013);安徽省人文社會(huì)科學(xué)研究一般項(xiàng)目(SK2015B010)。

[收稿日期]2015-10-27

[引著格式]丁浩,張磊,范生萬(wàn).基于樸素貝葉斯分類器的電力系統(tǒng)信譽(yù)評(píng)級(jí)研究[J].長(zhǎng)江大學(xué)學(xué)報(bào)(自科版),2016,13(4):56~60.

猜你喜歡
電力系統(tǒng)
并聯(lián)電抗器在高壓電網(wǎng)中的應(yīng)用
信息時(shí)代的電力系統(tǒng)信息化經(jīng)驗(yàn)談
關(guān)于智能變電站繼電保護(hù)技術(shù)優(yōu)化探討
探討電力系統(tǒng)中配網(wǎng)自動(dòng)化技術(shù)
配網(wǎng)自動(dòng)化技術(shù)的應(yīng)用探討
一種新型高壓電纜頭制作方法
電力系統(tǒng)繼電保護(hù)技術(shù)常見問題及對(duì)策
電力系統(tǒng)的繼電保護(hù)與安全自動(dòng)控制
淺談電力系統(tǒng)繼電保護(hù)的作用及特性