国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

住房貸款客戶信用狀況與個人信息的關(guān)聯(lián)分析

2017-09-05 10:18王國柏
大陸橋視野·下 2017年7期
關(guān)鍵詞:信用等級住房貸款關(guān)聯(lián)

王國柏

【摘 要】針對我國住房貸款擔(dān)保公司信貸資產(chǎn)質(zhì)量下降和風(fēng)險加大的客觀情況,本文利用Apriori算法對住房貸款擔(dān)保公司個人信貸數(shù)據(jù)進(jìn)行了關(guān)聯(lián)分析,分析和挖掘出客戶數(shù)據(jù)中屬性的頻繁模式和關(guān)聯(lián)關(guān)系。分析結(jié)果表明,收入、教育水平、職業(yè)和貸款利率是影響住房貸款客戶信用等級的四個重要依據(jù),擔(dān)保公司在評估一個新客戶的信用風(fēng)險等級時,要重點(diǎn)考慮和評估這四個因素。

【關(guān)鍵字】住房貸款;信用等級;風(fēng)險分析;關(guān)聯(lián)規(guī)則;Apriori算法

一、緒論

近年來,信貸資產(chǎn)質(zhì)量下降日趨成為住房貸款擔(dān)保行業(yè)一個亟待解決的重要問題。因而,針對我國住房貸款擔(dān)保公司信貸資產(chǎn)質(zhì)量下降和風(fēng)險加大的客觀情況,建立完善的信用風(fēng)險管控機(jī)制已成為刻不容緩的任務(wù)。大量研究表明,分析影響貸款客戶信用等級的因素,在貸款前對客戶進(jìn)行信用評估是降低住房貸款擔(dān)保公司風(fēng)險的有效方式。隨著科技的發(fā)展,住房置業(yè)擔(dān)保公司積累了大量的貸款客戶數(shù)據(jù),建立了相應(yīng)的數(shù)據(jù)倉庫。并基于該數(shù)據(jù)倉庫,利用數(shù)據(jù)挖掘、大數(shù)據(jù)分析和可視化等技術(shù),逐步展開分析,以期挖掘和分析出數(shù)據(jù)中隱含的、有價值的信息,并基于此建立客戶信用評估指標(biāo)和模型,以指導(dǎo)對未來貸款客戶信用的風(fēng)險評估和決策。

關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)的一種經(jīng)典方法,其可用于從大量數(shù)據(jù)中分析和挖掘出屬性之間的關(guān)聯(lián)和相關(guān)聯(lián)系。本文利用關(guān)聯(lián)規(guī)則分析方法:Apriori算法,對某住房貸款擔(dān)保公司個人信貸數(shù)據(jù)進(jìn)行分析,得出與信用等級最為相關(guān)的客戶信息。通過Apriori算法的關(guān)聯(lián)分析,本文從實(shí)際貸款客戶數(shù)據(jù)集中,挖掘、分析出信用等級和客戶屬性之間的關(guān)系特征;然后,基于這些規(guī)則建立風(fēng)險評估模型,并預(yù)測新的客戶樣本數(shù)據(jù)的信用風(fēng)險。由于規(guī)則來源于實(shí)際數(shù)據(jù),因此挖掘到的規(guī)則具有良好的客觀性和準(zhǔn)確性,可以作為預(yù)測和分析貸款客戶信用等級的決策依據(jù)。

二 、Apriori算法

數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則方法,主要是用于挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間的關(guān)聯(lián)或相關(guān)聯(lián)系。在現(xiàn)實(shí)世界中,一件事情的發(fā)生,在很大概率上,也會引起另外一件事情的發(fā)生?;蛘哒f,這兩件事情是是相互關(guān)聯(lián)的,在很多時候常常會一起發(fā)生。那么人們通過分析,可以發(fā)現(xiàn)得到相關(guān)兩件事情間的這種關(guān)聯(lián)規(guī)則。可以由一件事情的發(fā)生來,來推測另外一件事情的發(fā)生,從而更好地了解和掌握事物的發(fā)展、動向等等。這種過程就是關(guān)聯(lián)規(guī)則分析。常用的關(guān)聯(lián)規(guī)則的算法有算法、算法等。

本文主要是運(yùn)用算法實(shí)現(xiàn)對數(shù)據(jù)的分析:算法是一種最為常用的挖掘布爾關(guān)聯(lián)規(guī)則的算法。主要步驟如下:(1)輸入數(shù)據(jù)集,并計(jì)算含有一個元素的項(xiàng)目集出現(xiàn)的頻率,找出那些大于最小支持度的項(xiàng)目集,得到一維最大項(xiàng)目集,生成一維頻繁集。(2)進(jìn)行連接運(yùn)算,生成二維候選集;再根據(jù)預(yù)先給定的最小支持度,生成二維頻繁集。(3)重復(fù)上述過程,直到生成M維頻繁集,并且不能再生成滿足最小支持度的項(xiàng)目集。在以上過程中需要注意:若存在維候選集,其中某個元素的子集不是維頻繁集,則該候選集將被刪除。

本文中所涉及的通過算法所建立的住房置業(yè)客戶信用關(guān)聯(lián)模式,是通過對實(shí)際用戶的具體數(shù)據(jù)進(jìn)行分析,分析和建立客戶各個屬性與信用等級之間的關(guān)系,挖掘出對信用最用重要的指標(biāo)因素,建立貸款用戶信用等級的客觀評價指標(biāo)模型,以方便的為解決同樣的問題提供快速的分析結(jié)果,幫助住房置業(yè)擔(dān)保企業(yè)做出更科學(xué)、更合理的決策。

三、基于Apriori算法的客戶信用大數(shù)據(jù)關(guān)聯(lián)分析

就目前而言,在金融行業(yè)企業(yè)中,尤其是住房貸款擔(dān)保公司需要成功預(yù)測貸款客戶的信用等級。一旦獲得了用戶信用等級的準(zhǔn)確信息,住房貸款擔(dān)保公司就可以發(fā)現(xiàn)信用等級較低的用戶,從而改善自身的決策,拒絕為信用等級較低的客戶做信用擔(dān)保。從而規(guī)避由于客戶延期還款、惡意欠款而帶來的擔(dān)保公司的經(jīng)濟(jì)損失。目前市場上同類型的系統(tǒng)缺乏,應(yīng)用還不廣泛,住房擔(dān)保公司還是通過經(jīng)驗(yàn)來判斷客戶的信用等級,十分不科學(xué)。需要能夠判斷用戶信用等級的軟件來幫助住房貸款擔(dān)保公司來做出正確的決策。

(一)數(shù)據(jù)預(yù)處理

住房擔(dān)保數(shù)據(jù)挖掘系統(tǒng)需要實(shí)際應(yīng)用在住房置業(yè)擔(dān)保公司中,因此,本文所采用的數(shù)據(jù)集為擔(dān)保公司近十年來在經(jīng)營過程中所積累的用戶數(shù)據(jù)。該數(shù)據(jù)集的數(shù)據(jù)量規(guī)模較大,能夠真實(shí)的體現(xiàn)住房置業(yè)擔(dān)保公司客戶的實(shí)際信用情況。但是,由于實(shí)際經(jīng)營中獲取的數(shù)據(jù)存在一定程度的冗余信息,不是全部內(nèi)容都對關(guān)聯(lián)分析有意義,因此,一開始需要對數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理操作。數(shù)據(jù)預(yù)處理是一個關(guān)鍵而繁瑣的過程,處理結(jié)果的好壞直接影響后續(xù)關(guān)聯(lián)分析的運(yùn)行速度和準(zhǔn)確性。本文的數(shù)據(jù)預(yù)處理操作主要從以下幾個方面進(jìn)行。

1.去掉無關(guān)的屬性?,F(xiàn)有數(shù)據(jù)庫中客戶的屬性多達(dá)數(shù)十個,本文通過深入分析發(fā)現(xiàn),部分屬性與個人信用評估關(guān)系不大。例如,姓名、現(xiàn)住地址、購房地址、手機(jī)號碼、單位名稱、合同編號等屬性明顯對于數(shù)據(jù)分析意義不大。因此,為提高關(guān)聯(lián)分析的效率,本文把這些屬性直接從數(shù)據(jù)表中刪除。

2.選取屬性。根據(jù)用戶屬性與用戶信用等級的相關(guān)性,本文選取了性別、月收入、學(xué)歷、房屋價格、房源、貸款利息、還款方式、貸款時間、客戶級別八個屬性進(jìn)行關(guān)聯(lián)分析。

3.屬性量化。為減少計(jì)算的復(fù)雜程度,簡化系統(tǒng)的結(jié)果,要對有關(guān)屬性進(jìn)行量化處理。在上述八個屬性中,五個屬性為量化屬性,包括性別、學(xué)歷、房源、貸款利息、還款方式、客戶級別。為了方便進(jìn)一步分析,本文對月收入、房屋價格、貸款時間三個屬性根據(jù)以下條件進(jìn)行量化,具體如下:①月收入的量化。如果“月收入>=5000”,則量化結(jié)果為高;如果“月收入<5000”,則量化結(jié)果為低。②房屋價格量化。如果“房屋價格>200萬”,則量化結(jié)果為高;如果“100萬<房屋價格<200萬”,則量化結(jié)果為中;如果“房屋價格<100萬”,則量化結(jié)果為低。③貸款時間量化。如果“貸款時間>5年”,則量化結(jié)果為長;如果“1年<貸款時間<5年”量化結(jié)果為中;如果 “貸款時間<1年”,量化結(jié)果為短。endprint

4.數(shù)據(jù)抽取。本文進(jìn)行關(guān)聯(lián)分析所用的數(shù)據(jù)集,是住房置業(yè)擔(dān)保公司所提供的真實(shí)數(shù)據(jù),共包含65536條數(shù)據(jù)。每條數(shù)據(jù)包含多個屬性,具體如下:gender代表住房貸款擔(dān)??蛻舻男詣e;monthly_income2代表客戶的月收入;education代表客戶的受教育程度;house_totle_cost代表房屋的總花費(fèi),jf代表購買房源的類型;bank_loan_interest_rate代表銀行貸款利率;repayment_type代表還款方式;loan_duration代表貸款期限;kehujibie2代表客戶的信用級別。

(二)關(guān)聯(lián)分析

本文采用weka軟件系統(tǒng),對貸款客戶信用數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,運(yùn)行結(jié)果如圖1所示:

圖1關(guān)聯(lián)分析結(jié)果

從關(guān)聯(lián)分析結(jié)果可以得出以下結(jié)論。

1.貸款客戶的信用等級狀況與其收入狀況(主要是指收入水平、和收入穩(wěn)定性)密切相關(guān)。貸款人的收入水平越高、收入來源越穩(wěn)定,其所具有的信用等級越高??梢哉f,收入穩(wěn)定性和收入水平是衡量貸款客戶還款信用的最重要指標(biāo)。顯然,本文衡量客戶信用狀況的收入是指其合法的收入。

2.貸款客戶所受到的教育水平也是衡量其信用狀況的一個重要指標(biāo)。這時因?yàn)?,在一般情況下,一個人的道德素養(yǎng)在很大程度上取決于其所受到的教育水平。教育程度良好的人會非常注重維護(hù)個人的信譽(yù),更加遵守法律和道德規(guī)范。也就是說,這些人具備較高的自我約束能力,具有更好的信用度。相反,教育程度低的人往往會意識不到信用的重要性,繼而比較缺乏信用意識,其違約還款的可能性會比較大。

3.就職狀況與客戶的信用相關(guān)。一方面,貸款客戶所從事的職業(yè)的種類,直接決定著其收入的高低和收入的穩(wěn)定性。另一方面,從事職業(yè)也在很大程度上影響著一個人的誠信。從事不同的職業(yè),意味著其在住房公積金、福利、醫(yī)療失業(yè)保險、退休金等方面的待遇是不同的。因此,在客戶還款信用評估中,職業(yè)狀況也是一個重要指標(biāo)。在評估過程中,公務(wù)員、教師、事業(yè)單位的優(yōu)先級會比其它職業(yè)要高,這時因?yàn)檫@些行業(yè)的工資、待遇和工作穩(wěn)定性更加有保障。并且,從事這些行業(yè)的人會更加重視誠實(shí)和信譽(yù),具備更好的信用等級。除以上職業(yè)外,一般來說,從事壟斷行業(yè)和成長期行業(yè)職工的也屬于高收入水平且工作性質(zhì)也相對穩(wěn)定,因此在信用評估過程中,這些行業(yè)職工的信用等級也較高,

4.銀行利率與還款信用相關(guān)。從以上的關(guān)聯(lián)分析還可以看出,客戶的還款信用等級與住房貸款的利率成反比。貸款利率越高,貸款客戶的還款信用等級越低。反之,住房貸款的利率越低,貸款客戶的還款信用等級就越高。這是因?yàn)?,?dāng)貸款利率增加時,客戶在貸款期間需要償還的金額就越多,其償還能力有可能不能滿足償還的要求。然而銀行利率較低時,貸款客戶所需要償還的金額就比較少,信用等級會更高一些。

除上述的四個因素外,貸款客戶的還款信用等級還受到以下多個指標(biāo)的影響:總房價的高低、年齡、婚姻狀況、以及個人所處社會環(huán)境、信用履歷等。這些指標(biāo)也為住房貸款擔(dān)保公司做出決策起到一定的作用,在建立風(fēng)險模式時要給予考慮。

四、 結(jié)論

針對住房貸款風(fēng)險問題,本文利用算法對住房貸款擔(dān)保公司個人信貸數(shù)據(jù)進(jìn)行了分析,分析和挖掘出客戶數(shù)據(jù)中屬性的頻繁模式和關(guān)聯(lián)關(guān)系。分析結(jié)果表明:影響住房置業(yè)擔(dān)保企業(yè)客戶信用的最重要因素是貸款客戶收入狀況,主要是包括收入水平和收入穩(wěn)定性兩個指標(biāo)。收入越高、穩(wěn)定性越好的客戶,其違約的風(fēng)險越小,還款的信用等級會越高;其次,教育水平的高低是評估客戶信用狀況的一個重要因素,這是因?yàn)樗芙逃乃剑粌H決定了客戶收入狀況,還影響著其所具備的個人誠信觀念。貸款客戶所從事的職業(yè)也是評估貸款客戶信用等級的一個重要因素。另外,銀行的貸款利率水平也在一定程度上影響著客戶償還貸款的信用??梢哉f,收入、教育水平、職業(yè)和貸款利率是影響住房貸款客戶信用等級的四個重要依據(jù),擔(dān)保公司在評估一個新客戶的信用風(fēng)險等級時,要重點(diǎn)考慮和評估這四個因素。本文的數(shù)據(jù)關(guān)聯(lián)規(guī)則來源于實(shí)際數(shù)據(jù)分析,具有良好的客觀性和準(zhǔn)確性,可以作為預(yù)測和分析貸款客戶信用等級的決策依據(jù)。

參考文獻(xiàn):

[1]于卓. 應(yīng)用決策樹構(gòu)建個人住房貸款風(fēng)險評估模型[D]. 東北財(cái)經(jīng)大學(xué), 2007.

[2]劉順挺. 基于數(shù)據(jù)挖掘技術(shù)的個人信用評估模型[D]. 南京理工大學(xué), 2007.

[3]金豆. 數(shù)據(jù)挖掘技術(shù)在資產(chǎn)管理系統(tǒng)中的應(yīng)用[D]. 長春理工大學(xué), 2010.

[4]張翠翠, 阮樹驊. 用于短頻繁項(xiàng)的隱私保護(hù)關(guān)聯(lián)規(guī)則挖掘方法[J]. 電子科技, 2016(5):88-92.

[5]許麗莉, XuLili. 基于信用等級遷移和違約損失的貸款定價[J]. 湘南學(xué)院學(xué)報(bào), 2016, 37(2):7-11.endprint

猜你喜歡
信用等級住房貸款關(guān)聯(lián)
央行:2022年三季度末個人住房貸款余額38.91萬億元
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
●如何判斷住房貸款是否符合住房貸款利息專項(xiàng)附加扣除的條件?
武器裝備科研生產(chǎn)單位信用評價工作取得階段性成果
協(xié)會圓滿完成武器裝備科研生產(chǎn)單位信用等級評價擴(kuò)大試點(diǎn)工作
奇趣搭配
智趣
住房抵押信貸信用等級的灰色評價方案研究
財(cái)務(wù)信息對債券信用等級的解釋作用