閆華竹
[摘要]為了解決申請(qǐng)貸款問題,需要對(duì)客戶的審貸信用進(jìn)行評(píng)級(jí),此評(píng)級(jí)過程主要使用了數(shù)據(jù)挖掘中的聚類分析的方法。通過對(duì)客戶基本信息的挖掘和聚類分析,可以得出客戶申貸的信用級(jí)別,從而對(duì)客戶的審貸問題進(jìn)行分級(jí)處理。
[關(guān)鍵詞]信貸風(fēng)險(xiǎn) 聚類分析 數(shù)據(jù)挖掘
一、方法介紹:聚類分析
聚類分析能夠?qū)⒁慌鷺颖緮?shù)據(jù),在沒有先驗(yàn)知識(shí)的前提下,根據(jù)數(shù)據(jù)的諸多特征,按照其在性質(zhì)上的親疏程度進(jìn)行自動(dòng)分組,且使組內(nèi)個(gè)體的結(jié)構(gòu)特征具有較大相似性,組間個(gè)體的特征相似性較小。
K-Means聚類也稱作快速聚類,屬于覆蓋型數(shù)值劃分聚類算法。它得到的聚類結(jié)果,每個(gè)樣本點(diǎn)都唯一屬于一個(gè)類,而且聚類變量為數(shù)值型,并采用劃分原理進(jìn)行聚類。
二、數(shù)據(jù)挖掘——K-Means模型
搜集數(shù)據(jù)階段主要是對(duì)某銀行的客戶信息數(shù)據(jù)進(jìn)行整理和匯總,重點(diǎn)選取那些影響客戶申貸評(píng)級(jí)的那些指標(biāo),例如客戶的年齡、收入、資產(chǎn)、債務(wù)、貸款量、風(fēng)險(xiǎn)、信用等級(jí),按時(shí)還貸習(xí)慣等等。這些指標(biāo)都是筆者通過訪談銀行相關(guān)部門的工作人員,通過獲取相關(guān)經(jīng)驗(yàn)得出的指標(biāo),此外這也是國際通用的對(duì)客戶信用評(píng)級(jí)的常用指標(biāo)。通過對(duì)某銀行客戶信息進(jìn)行整理和匯總,得出20個(gè)典型客戶的申請(qǐng)貸款信息資料。
數(shù)據(jù)挖掘的過程中,首先需要構(gòu)建k-means模型,這就需要相關(guān)clementine軟件操作,對(duì)數(shù)據(jù)集進(jìn)行模型導(dǎo)入。經(jīng)過k-means模型分析后,這組數(shù)據(jù)被分為四組,數(shù)據(jù)集按組別重新排列。分析結(jié)果顯示了四類所包括的樣本數(shù)分別為6、1、7、6個(gè)樣本,以及各變量的均值和標(biāo)準(zhǔn)差。如果聚類變量是分類型的,則顯示各類別的百分比。對(duì)各類特征的描述是聚類分析結(jié)果中不可或缺部分,viewer卡以圖形矩陣的形式直觀顯示了各類各變量的特征。
在這些評(píng)判指標(biāo)中,重要指標(biāo)有五個(gè),分別是信用等級(jí)、年齡、結(jié)果、資產(chǎn)和風(fēng)險(xiǎn)。對(duì)重要指標(biāo)分別進(jìn)行分析,可以得出各組的重要客戶特征。
通過對(duì)各組“信用等級(jí)”情況比較分析中,我們發(fā)現(xiàn)cluster-3樣本的信用等級(jí)都是綠,cluster-1中5個(gè)樣本的信用等級(jí)是綠、1個(gè)是黃,cluster-4中3個(gè)樣本信用等級(jí)是紅、1個(gè)是綠、2個(gè)是黃,cluster-2樣本的信用等級(jí)都是黃,如圖2-5。同樣地,對(duì)各組“年齡”情況進(jìn)行比較分析,cluster-3樣本的4個(gè)中年3個(gè)老年人,cluster-1中6個(gè)樣本都是年輕人,cluster-4中6個(gè)樣本都是年輕人,cluster-2樣本的年齡是中年;再對(duì)各組 “結(jié)果”進(jìn)行比較分析,cluster-3和cluster-1的樣本都按時(shí)還款,cluster-4樣本中1個(gè)不履行還款、3個(gè)延時(shí)還款、2個(gè)按時(shí)還款,cluster-2的樣本都延時(shí)還款;對(duì)各組“資產(chǎn)”情況進(jìn)行比較分析,cluster-3樣本的資產(chǎn)平均值是513929.35,cluster-1樣本的資產(chǎn)平均值是25256.85,cluster-4樣本的資產(chǎn)平均值是37474.30,cluster-2樣本的資產(chǎn)平均值是91111.30。
針對(duì)四組樣本的情況,憑借以上五個(gè)重要指標(biāo),筆者對(duì)四組提出批貸建議,如表。對(duì)于cluster-3批準(zhǔn)貸款,對(duì)于cluster-4不批準(zhǔn)貸款,而對(duì)于cluster-1和cluster-2,銀行需要限額批準(zhǔn)貸款,以防控風(fēng)險(xiǎn)事件的發(fā)生。
三、 結(jié)論
通過聚類分析研究,把某銀行20個(gè)典型客戶情況進(jìn)行分類,分成了四組。然后針對(duì)五個(gè)重要指標(biāo)信用等級(jí)、年齡、結(jié)果、資產(chǎn)、風(fēng)險(xiǎn),對(duì)四組情況進(jìn)行比較分析。我們發(fā)現(xiàn)第三組的信用等級(jí)為綠、結(jié)果按時(shí)、風(fēng)險(xiǎn)低、資產(chǎn)量最大,對(duì)于這樣的客戶銀行可以放心的批準(zhǔn)其貸款;第四組的客戶風(fēng)險(xiǎn)高、年齡小、存在不履行還款現(xiàn)象、信用等級(jí)存在紅50%,對(duì)于這樣的高風(fēng)險(xiǎn)客戶銀行應(yīng)不予批準(zhǔn)貸款;對(duì)于第一、二組的客戶,他們存在延時(shí)還款現(xiàn)象、信用等級(jí)存在黃色,風(fēng)險(xiǎn)中、高現(xiàn)象,對(duì)其可以批準(zhǔn)貸款,但是貸款額度需要設(shè)定一定限制。
參考文獻(xiàn):
[1]《Clementine數(shù)據(jù)挖掘方法及應(yīng)用》,電子工業(yè)出版社.薛薇,陳歡歌.2012,9
[2] 聚類分析技術(shù)在中國移動(dòng)客戶消費(fèi)模式中的應(yīng)用研究.李穎慧.2010,3
[3] 高世光,基于模糊聚類的數(shù)據(jù)挖掘技術(shù)研究.國防科技大學(xué).2002,1